简单实现Python爬取网络图片

yipeiwu_com6年前Python爬虫

本文实例为大家分享了Python爬取网络图片的具体代码,供大家参考,具体内容如下

代码:

import urllib
import urllib.request
import re
#打开网页,下载器
def open_html ( url):
 require=urllib.request.Request(url)
 reponse=urllib.request.urlopen(require)
 html=reponse.read()
 return html
#下载图片
def load_image(html):
 regx='http://[\S]*jpg'
 pattern=re.compile(regx)
 get_image=re.findall(pattern,repr(html))

 num=1
 for img in get_image:
  photo=open_html(img)
  
  with open(r'E:\Photo\%s.jpg'%num,'wb') as f:
   print('开始下载图片')
   f.write(photo)
   print('正在下载第%s张图片'%num)
   f.close()
  num=num+1
 if num>1:
  print('下载成功!!!')
 else:
  print('下载失败!!!')

url='http://www.qiqipu.com/'
html=open_html(url)
load_image(html)

执行结果:

注意:

  在运行之前,必须要有路径(文件夹):E:\Photo\

  如果网站是HTTPS可以将正则中的http换为HTTPS,可以再定义一个下载图片的函数

  如果想要下载jpg、png、gif等多种格式的图片可以将正则中的jpg换为对应格式,也可以使用元组定义多种格式后遍历

我这里只要jpg就可以,就不改了,大家可以自己改下。

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持【听图阁-专注于Python设计】。

相关文章

Python网络爬虫实例讲解

Python网络爬虫实例讲解

聊一聊Python与网络爬虫。 1、爬虫的定义 爬虫:自动抓取互联网数据的程序。 2、爬虫的主要框架 爬虫程序的主要框架如上图所示,爬虫调度端通过URL管理器获取待爬取的URL链接,若...

python 3利用BeautifulSoup抓取div标签的方法示例

前言 本文主要介绍的是关于python 3用BeautifulSoup抓取div标签的方法示例,分享出来供大家参考学习,下面来看看详细的介绍: 示例代码: # -*- coding:...

python3简单实现微信爬虫

使用ghost.py 通过搜搜 的微信搜索来爬取微信公共账号的信息 # -*- coding: utf-8 -*- import sys reload(sys) import dat...

urllib和BeautifulSoup爬取维基百科的词条简单实例

urllib和BeautifulSoup爬取维基百科的词条简单实例

本文实例主要实现的是使用urllib和BeautifulSoup爬取维基百科的词条,具体如下。 简洁代码: #引入开发包 from urllib.request import url...

Python实现简易Web爬虫详解

简介: 网络爬虫(又被称为网页蜘蛛),网络机器人,是一种按照一定的规则,自动地抓信息的程序或者脚本。假设互联网是一张很大的蜘蛛网,每个页面之间都通过超链接这根线相互连接,那么我们的爬虫小...