Python实现简单的获取图片爬虫功能示例

yipeiwu_com6年前 (2020-03-06)Python爬虫

本文实例讲述了Python实现简单的获取图片爬虫功能。分享给大家供大家参考，具体如下：

简单Python爬虫，获得网页上的照片

#coding=utf-8
import urllib
import re
def getHtml(url):
  page = urllib.urlopen(url)
  html = page.read()
  return html
def getImg(html):
  reg = r'src="(.+?\.jpg)" pic_ext'
  imgre = re.compile(reg)
  imglist = re.findall(imgre, html)
  return imglist
// 网站地址
url = "http://tieba.baidu.com/p/3368048910?pn=2"
html = getHtml(url)
listimg = getImg(html)
x = 0
for imgAddress in listimg:
  print imgAddress
  urllib.urlretrieve(imgAddress, 'image%s.jpg' % x)
  x+=1

更多关于Python相关内容可查看本站专题：《Python Socket编程技巧总结》、《Python数据结构与算法教程》、《Python函数使用技巧总结》、《Python字符串操作技巧汇总》、《Python入门与进阶经典教程》及《Python文件与目录操作技巧汇总》

希望本文所述对大家Python程序设计有所帮助。

返回列表

上一篇：Python字符转换

下一篇：PHP生成静态页面详解

利用python爬取软考试题之ip自动代理

前言最近有个软件专业等级考试，以下简称软考，为了更好的复习备考，我打算抓取www.rkpass.cn网上的软考试题。首先讲述一下我爬取软考试题的故（keng）事(shi)。现在我已经...

使用Python程序抓取新浪在国内的所有IP的教程

数据分析，特别是网站分析中需要对访问者的IP进行分析，分析IP中主要是区分来访者的省份+城市+行政区数据，考虑到目前纯真IP数据库并没有把这些数据做很好的区分，于是寻找了另外一个可行的方...

python爬虫框架scrapy实战之爬取京东商城进阶篇

前言之前的一篇文章已经讲过怎样获取链接，怎样获得参数了，详情请看python爬取京东商城普通篇，本文将详细介绍利用python爬虫框架scrapy如何爬取京东商城，下面话不多说了，来看...

Python探索之爬取电商售卖信息代码示例

网络爬虫（又被称为网页蜘蛛，网络机器人，在FOAF社区中间，更经常的称为网页追逐者），是一种按照一定的规则，自动的抓取万维网信息的程序或者脚本。下面有一个示例代码，分享给大家： #...

Python爬虫使用浏览器cookies：browsercookie过程解析

很多用Python的人可能都写过网络爬虫，自动化获取网络数据确实是一件令人愉悦的事情，而Python很好的帮助我们达到这种愉悦。然而，爬虫经常要碰到各种登录、验证的阻挠，让人灰心丧气（网...

宜配屋

Python实现简单的获取图片爬虫功能示例

相关文章

利用python爬取软考试题之ip自动代理

使用Python程序抓取新浪在国内的所有IP的教程

python爬虫框架scrapy实战之爬取京东商城进阶篇

Python探索之爬取电商售卖信息代码示例

Python爬虫使用浏览器cookies：browsercookie过程解析

© YiPeiWu.com 【宜配屋】粤ICP备17031333号

Powered By Z-BlogPHP. Theme by TOYEAN.

宜配屋

Python实现简单的获取图片爬虫功能示例

相关文章

利用python爬取软考试题之ip自动代理

使用Python程序抓取新浪在国内的所有IP的教程

python爬虫框架scrapy实战之爬取京东商城进阶篇

Python探索之爬取电商售卖信息代码示例

Python爬虫使用浏览器cookies：browsercookie过程解析

© YiPeiWu.com 【宜配屋】 粤ICP备17031333号 var _hmt = _hmt || [];(function() { var hm = document.createElement("script"); hm.src = "https://hm.baidu.com/hm.js?8aa60ae04b767b2af31903508928acc0"; var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(hm, s);})();

Powered By Z-BlogPHP. Theme by TOYEAN.

© YiPeiWu.com 【宜配屋】粤ICP备17031333号