Python获取网页上图片下载地址的方法

yipeiwu_com6年前Python基础

本文实例讲述了Python获取网页上图片下载地址的方法。分享给大家供大家参考。具体如下:

这里获取网页上图片的下载地址是正在写的数据采集中的一段,代码如下:

复制代码 代码如下:
#!/user/bin/python3
import urllib2
from HTMLParser import HTMLParser
class MyHtmlParser(HTMLParser):
    links = []
    def handle_starttag(self, tag, attrs):
        if tag == "img":
            if len(attrs) == 0:
                pass
            else:
                for name, value in attrs:
                    if name == "src":
                        self.links.append(value)
if __name__ == "__main__":
    uri = "http://dy.163.com/v2/article/T1374483113516/AGSNE9L000964K4O"
    file = urllib2.urlopen(uri).read()
    # file = "<html><h1>Title</h1><p>I'm a paragraph!</p></html>"
    hy = MyHtmlParser()
    hy.feed(file)
    hy.close()
    print(hy.links)

希望本文所述对大家的Python程序设计有所帮助。

相关文章

Python 操作mysql数据库查询之fetchone(), fetchmany(), fetchall()用法示例

本文实例讲述了Python 操作mysql数据库查询之fetchone(), fetchmany(), fetchall()用法。分享给大家供大家参考,具体如下: demo.py(查询,...

python中文分词,使用结巴分词对python进行分词(实例讲解)

python中文分词,使用结巴分词对python进行分词(实例讲解)

在采集美女站时,需要对关键词进行分词,最终采用的是python的结巴分词方法。 中文分词是中文文本处理的一个基础性工作,结巴分词利用进行中文分词。 其基本实现原理有三点: 1.基于Tri...

Python简单检测文本类型的2种方法【基于文件头及cchardet库】

本文实例讲述了Python简单检测文本类型的方法。分享给大家供大家参考,具体如下: 1、根据文件头。 #是否为带BOM头的UTF8文件 def IsUtf8BomFile(pathf...

Python多线程编程(七):使用Condition实现复杂同步

目前我们已经会使用Lock去对公共资源进行互斥访问了,也探讨了同一线程可以使用RLock去重入锁,但是尽管如此我们只不过才处理了一些程序中简单的同步现象,我们甚至还不能很合理的去解决使用...

python中append实例用法总结

append()函数 描述:在列表ls最后(末尾)添加一个元素object 语法:ls.append(object) -> None 无返回值 例: a=[1,2,3] a....