python使用自定义user-agent抓取网页的方法

yipeiwu_com6年前 (2020-03-06)Python爬虫

本文实例讲述了python使用自定义user-agent抓取网页的方法。分享给大家供大家参考。具体如下：

下面python代码通过urllib2抓取指定的url的内容，并且使用自定义的user-agent，可防止网站屏蔽采集器

import urllib2
req = urllib2.Request('http://192.168.1.2/')
req.add_header('User-agent', 'Mozilla 5.10')
res = urllib2.urlopen(req)
html = res.read()

希望本文所述对大家的Python程序设计有所帮助。

返回列表

本文实例讲述了Python3爬虫学习之应对网站反爬虫机制的方法。分享给大家供大家参考，具体如下：如何应对网站的反爬虫机制在访问某些网站的时候，网站通常会用判断访问是否带有头文件来鉴别...

前言之前的一篇文章已经讲过怎样获取链接，怎样获得参数了，详情请看python爬取京东商城普通篇，本文将详细介绍利用python爬虫框架scrapy如何爬取京东商城，下面话不多说了，来看...

本文实例讲述了Python3实现的爬虫爬取数据并存入mysql数据库操作。分享给大家供大家参考，具体如下：爬一个电脑客户端的订单。罗总推荐，抓包工具用的是HttpAnalyzerStd...

首先，需要获取任意知乎的问题，只需要你输入问题的ID，就可以获取相关的页面信息，比如最重要的合计有多少人回答问题。问题ID为如下标红数字编写代码，下面的代码用来检测用户输入的是否是...

本文实例为大家分享了python爬取足球联赛积分榜的具体代码，供大家参考，具体内容如下使用BeautifulSoup4解析爬取足球直播吧五大联赛积分榜信息； #! /usr/bi...

宜配屋