python抓取网页中的图片示例

yipeiwu_com6年前 (2020-03-06)Python爬虫

#coding:utf8
import re
import urllib
def getHTML(url):
    page = urllib.urlopen(url)
    html = page.read()
    return html

def getImg(html,imgType):
    reg = r'src="(.*?\.+'+imgType+'!slider)" '
    imgre = re.compile(reg)
    imgList = re.findall(imgre, html)
    x=0
    for imgurl in imgList:
        print imgurl
        urllib.urlretrieve(imgurl, '%s.%s' % (x, imgType))
        x =x+1

html= getHTML("//www.jb51.net")

getImg(html,'jpg')

返回列表

上一篇：Python字符转换

下一篇：PHP生成静态页面详解

Pyspider中给爬虫伪造随机请求头的实例

Pyspider 中采用了 tornado 库来做 http 请求，在请求过程中可以添加各种参数，例如请求链接超时时间，请求传输数据超时时间，请求头等等，但是根据pyspider的原始框...

python爬虫_微信公众号推送信息爬取的实例

问题描述利用搜狗的微信搜索抓取指定公众号的最新一条推送，并保存相应的网页至本地。注意点搜狗微信获取的地址为临时链接，具有时效性。公众号为动态网页(JavaScript渲染)，使用...

Python使用爬虫抓取美女图片并保存到本地的方法【测试可用】

本文实例讲述了Python使用爬虫抓取美女图片并保存到本地的方法。分享给大家供大家参考，具体如下：图片资源来自于www.qiubaichengren.com 代码基于Python 3....

零基础写python爬虫之urllib2中的两个重要概念：Openers和Handlers

在开始后面的内容之前，先来解释一下urllib2中的两个个方法：info / geturl urlopen返回的应答对象response(或者HTTPError实例)有两个很...

python实现的一只从百度开始不断搜索的小爬虫

文中用到了BeautifulSoup这个库，目的是处理html文档分析的，因为我只是提取了title的关键字，所以可以用正则表达式代替，还有一个库是jieba，这个库是中文分词的作用，再有一...

宜配屋

python抓取网页中的图片示例

相关文章

Pyspider中给爬虫伪造随机请求头的实例

python爬虫_微信公众号推送信息爬取的实例

Python使用爬虫抓取美女图片并保存到本地的方法【测试可用】

零基础写python爬虫之urllib2中的两个重要概念：Openers和Handlers

python实现的一只从百度开始不断搜索的小爬虫

© YiPeiWu.com 【宜配屋】粤ICP备17031333号

Powered By Z-BlogPHP. Theme by TOYEAN.

宜配屋

python抓取网页中的图片示例

相关文章

Pyspider中给爬虫伪造随机请求头的实例

python爬虫_微信公众号推送信息爬取的实例

Python使用爬虫抓取美女图片并保存到本地的方法【测试可用】

零基础写python爬虫之urllib2中的两个重要概念：Openers和Handlers

python实现的一只从百度开始不断搜索的小爬虫

© YiPeiWu.com 【宜配屋】 粤ICP备17031333号 var _hmt = _hmt || [];(function() { var hm = document.createElement("script"); hm.src = "https://hm.baidu.com/hm.js?8aa60ae04b767b2af31903508928acc0"; var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(hm, s);})();

Powered By Z-BlogPHP. Theme by TOYEAN.

© YiPeiWu.com 【宜配屋】粤ICP备17031333号