Python获取网页上图片下载地址的方法

yipeiwu_com6年前Python基础

本文实例讲述了Python获取网页上图片下载地址的方法。分享给大家供大家参考。具体如下:

这里获取网页上图片的下载地址是正在写的数据采集中的一段,代码如下:

复制代码 代码如下:
#!/user/bin/python3
import urllib2
from HTMLParser import HTMLParser
class MyHtmlParser(HTMLParser):
    links = []
    def handle_starttag(self, tag, attrs):
        if tag == "img":
            if len(attrs) == 0:
                pass
            else:
                for name, value in attrs:
                    if name == "src":
                        self.links.append(value)
if __name__ == "__main__":
    uri = "http://dy.163.com/v2/article/T1374483113516/AGSNE9L000964K4O"
    file = urllib2.urlopen(uri).read()
    # file = "<html><h1>Title</h1><p>I'm a paragraph!</p></html>"
    hy = MyHtmlParser()
    hy.feed(file)
    hy.close()
    print(hy.links)

希望本文所述对大家的Python程序设计有所帮助。

相关文章

python使用Queue在多个子进程间交换数据的方法

本文实例讲述了python使用Queue在多个子进程间交换数据的方法。分享给大家供大家参考。具体如下: 这里将Queue作为中间通道进行数据传递,Queue是线程和进程安全的 fro...

python selenium 查找隐藏元素 自动播放视频功能

python selenium 查找隐藏元素 自动播放视频功能

在使用python做爬虫的过程中,有些页面的的部分数据是通过js异步加载的,js调用接口的请求中有时还带有些加密的参数很难破解无法使用requests这样的包直接爬取数据,因此需要借助s...

解决python web项目意外关闭,但占用端口的问题

问题描述 因为项目强制关闭,但是服务还在运行,导致重新运行项目时候 提示地址已经使用(端口被占用) /usr/bin/python3.5 python-login-demo/inde...

Django 限制用户访问频率的中间件的实现

一、定义限制访问频率的中间件 common/middleware.py import time from django.utils.deprecation import Mid...

python如何生成网页验证码

本文实例为大家分享了python生成网页验证码的具体代码,供大家参考,具体内容如下 验证码为pil模块生成,可直接应用于django框架当中。 首先需要安装Pillow模块 我们这里使用...