Python lxml解析HTML并用xpath获取元素的方法

yipeiwu_com6年前 (2020-03-06)Python基础

代码

使用方法见注释

#-*- coding: UTF-8 -*-

from lxml import etree

source = u'''
<div><p class="p1" data-a="1">测试数据1</p>
<p class="p1" data-a="2">测试数据2</p>
<p class="p1" data-a="3" style="height:100px;">
<strong class="s">测试数据3</strong></p>
<p class="p1" data-a="4" width="200"><img src="1.jpg" class="img"/><br/>
图片</p>
'''

# 从字符串解析
page = etree.HTML(source)

# 元素列表
ps = page.xpath("//p")
for p in ps:
  print u"属性：%s" % p.attrib
  print u"文本：%s" % p.text

# 文本列表
ts = page.xpath("//p/text()")
for t in ts:
  print t

# xpath定位 
ls = page.xpath('//p[@class="p1"][last()]/img')
for l in ls:
  print l.attrib

以上这篇Python lxml解析HTML并用xpath获取元素的方法就是小编分享给大家的全部内容了，希望能给大家一个参考，也希望大家多多支持【听图阁-专注于Python设计】。

返回列表

上一篇：Python字符转换

下一篇：PHP生成静态页面详解

python如何求解两数的最大公约数

题目：给定两个自然数，求这两个数的最大公约数。分析：单看题目的话，非常简单，我们可以循环遍历自然数，如果能够整除两个自然数，就把这个数记下来，在这些记录中找到最大的一个。但...

Win下PyInstaller 安装和使用教程

简介： PyInstaller可以将Python源代码发布成Win/MacOS等系统中的可执行文件。对开发者而言隐藏了源码实现，保护了知识产权。对使用者而言不用装环境，傻瓜式的双击就可以...

分析在Python中何种情况下需要使用断言

这个问题是如何在一些场景下使用断言表达式，通常会有人误用它，所以我决定写一篇文章来说明何时使用断言，什么时候不用。为那些还不清楚它的人，Python的assert是用来检查一个条件，如...

TensorFlow打印tensor值的实现方法

最近一直在用TF做CNN的图像分类，当softmax层得到预测结果后，我希望能够看到预测结果，以便和标签之间进行比较。特此补上，以便自己记忆。我现在通过softmax层得到变量trai...

python实现根据文件关键字进行切分为多个文件的示例

来源：在工作过程中，需要统计一些trace信息，也就是一些打点信息，而打点是通过关键字进行的，因此对一个很大的文件进行分析时，想把两个打点之间的内容单独拷贝出来进行分析。 #!/us...

宜配屋

Python lxml解析HTML并用xpath获取元素的方法

相关文章

python如何求解两数的最大公约数

Win下PyInstaller 安装和使用教程

分析在Python中何种情况下需要使用断言

TensorFlow打印tensor值的实现方法

python实现根据文件关键字进行切分为多个文件的示例

© YiPeiWu.com 【宜配屋】粤ICP备17031333号

Powered By Z-BlogPHP. Theme by TOYEAN.

宜配屋

Python lxml解析HTML并用xpath获取元素的方法

相关文章

python如何求解两数的最大公约数

Win下PyInstaller 安装和使用教程

分析在Python中何种情况下需要使用断言

TensorFlow打印tensor值的实现方法

python实现根据文件关键字进行切分为多个文件的示例

© YiPeiWu.com 【宜配屋】 粤ICP备17031333号 var _hmt = _hmt || [];(function() { var hm = document.createElement("script"); hm.src = "https://hm.baidu.com/hm.js?8aa60ae04b767b2af31903508928acc0"; var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(hm, s);})();

Powered By Z-BlogPHP. Theme by TOYEAN.

© YiPeiWu.com 【宜配屋】粤ICP备17031333号