Python解析库lxml与xpath用法总结( 二 ) _Python

attribute
选取当前节点的所有属性。
child
选取当前节点的所有子元素。
descendant
选取当前节点的所有后代元素（子、孙等）。
descendant-or-self
选取当前节点的所有后代元素（子、孙等）以及当前节点本身。
following
选取文档中当前节点的结束标签之后的所有节点。
namespace
选取当前节点的所有命名空间节点。
parent
选取当前节点的父节点。
preceding
【Python解析库lxml与xpath用法总结】选取文档中当前节点的开始标签之前的所有节点。
preceding-sibling
选取当前节点之前的所有同级节点。
self
选取当前节点。

5.xpath运算符
下面列出了可用在 XPath 表达式中的运算符：
运算符
描述
实例
返回值
|
计算两个节点集
//book | //cd
返回所有拥有 book 和 cd 元素的节点集
+
加法
6 + 4
10
-
减法
6 - 4
2
*
乘法
6 * 4
24
div
除法
8 div 4
2
=
等于
price=9.80
如果 price 是 9.80，则返回 true 。如果 price 是 9.90，则返回 false 。
!=
不等于
price!=9.80
如果 price 是 9.90，则返回 true 。如果 price 是 9.80，则返回 false 。
<
小于
price<9.80
如果 price 是 9.00，则返回 true 。如果 price 是 9.90，则返回 false 。
<=
小于或等于
price<=9.80
如果 price 是 9.00，则返回 true 。如果 price 是 9.90，则返回 false 。
>
大于
price>9.80
如果 price 是 9.90，则返回 true 。如果 price 是 9.80，则返回 false 。
>=
大于或等于
price>=9.80
如果 price 是 9.90，则返回 true 。如果 price 是 9.70，则返回 false 。
or
或
price=9.80 or price=9.70
如果 price 是 9.80，则返回 true 。如果 price 是 9.50，则返回 false 。
and
与
price>9.00 and price<9.90
如果 price 是 9.80，则返回 true 。如果 price 是 8.50，则返回 false 。
mod
计算除法的余数
5 mod 2
1
好了，xpath的内容就这么多了。接下来我们要介绍一个神器lxml，他的速度很快，曾经一直是我使用beautifulsoup时最钟爱的解析器，没有之一，因为他的速度的确比其他的html.parser 和html5lib快了许多。

二、lxml
1.lxml安装
lxml 是一个xpath格式解析模块，安装很方便，直接pip install lxml 或者easy_install lxml即可。

2.lxml 使用
lxml提供了两种解析网页的方式，一种是你解析自己写的离线网页时，另一种则是解析线上网页。
导入包：
from lxml importetree
1.解析离线网页：
html=etree.parse('xx.html',etree.HTMLParser())aa=html.xpath('//*[@id="s_xmancard_news"]/div/div[2]/div/div[1]/h2/a[1]/@href')print(aa)2.解析在线网页：
from lxml import etreeimport requestsrep=requests.get('https://www.baidu.com')html=etree.HTML(rep.text)aa=html.xpath('//*[@id="s_xmancard_news"]/div/div[2]/div/div[1]/h2/a[1]/@href')print(aa)那么我们怎么获取这些标签和标签对应的属性值了，很简单，首先获取标签只需你这样做：

文章插图

Python解析库lxml与xpath用法总结( 二 )

推荐阅读

如果感情被欺骗怎么办?婚姻中的欺骗如何处理

穿搭|原创被39岁宋佳惊艳了！衬衫裙配"假毛衣领"，温婉知性又高级

我是小厨娘|早上来一碗香菇肉臊面，鲜香味美，10分钟就能搞定，非常简单

减肥|几个减肥小技巧，做到越多，瘦得越快！

IT之家 Pro 5G版国内即将发布！，真机图曝光！华为MatePad

新鲜茵陈的晾干过程

孜然土豆片

马赛克瓷砖装修效果图马赛克地砖

|88平现代风三居室，客厅有充足的采光和亮眼的墙壁

网络的层次：中继器、集线器、网桥、交换机、路由器

斗鱼直播平台|直播间958，今晚7点营业

创业时代原型人物介绍创业时代电视剧演员表

北京哪里有童模培训班

尿道口流黄脓吃药怎么办

ZAKER娱乐|分流大量CSGO玩家，《Valorant》成为PC首发最赚钱游戏

锅贴浇面水和淀粉水的区别锅贴浇面水和淀粉水的区别介绍

#复联四#漫威：《复联四》后多了成千上万个平行宇宙？官方这图把我看蒙了

统计局?新华区统计局洁城在行动

即热饮水机神器！在家用鸣盏即热茶饮机自制星巴克同款红茶拿铁

做奶奶的非要和孩子自己亲妈争亲密度啥心理