python3抓取中文网页的方法

yipeiwu_com6年前 (2020-03-06)Python爬虫

本文实例讲述了python3抓取中文网页的方法。分享给大家供大家参考。具体如下：

#! /usr/bin/python3.2
import sys
import urllib.request
req = urllib.request.Request('http://www.baidu.com')
response = urllib.request.urlopen(req)
the_page = response.read()
type = sys.getfilesystemencoding()
#转换成本地系统编码
print(the_page.decode(type))

希望本文所述对大家的Python程序设计有所帮助。

返回列表

上一篇：Python字符转换

下一篇：PHP生成静态页面详解

基于Python实现的百度贴吧网络爬虫实例

本文实例讲述了基于Python实现的百度贴吧网络爬虫。分享给大家供大家参考。具体如下：完整实例代码点击此处本站下载。项目内容：用Python写的百度贴吧的网络爬虫。使用方法：新...

Python爬虫获取图片并下载保存至本地的实例

1、抓取煎蛋网上的图片。 2、代码如下： import urllib.request import os #to open the url def url_open(url): r...

Python实现数据可视化看如何监控你的爬虫状态【推荐】

今天主要是来说一下怎么可视化来监控你的爬虫的状态。相信大家在跑爬虫的过程中，也会好奇自己养的爬虫一分钟可以爬多少页面，多大的数据量，当然查询的方式多种多样。今天我来讲一种可视化的方法。...

python爬取w3shcool的JQuery课程并且保存到本地

最近在忙于找工作，闲暇之余，也找点爬虫项目练练手，写写代码，知道自己是个菜鸟，但是要多加练习，书山有路勤为径。各位爷有测试坑可以给我介绍个啊，自动化，功能，接口都可以做。首先呢，我们明...

python2使用bs4爬取腾讯社招过程解析

目的：获取腾讯社招这个页面的职位名称及超链接职位类别人数地点和发布时间要求：使用bs4进行解析，并把结果以json文件形式存储注意：如果直接把python列表没有序列化为jso...

宜配屋

python3抓取中文网页的方法

相关文章

基于Python实现的百度贴吧网络爬虫实例

Python爬虫获取图片并下载保存至本地的实例

Python实现数据可视化看如何监控你的爬虫状态【推荐】

python爬取w3shcool的JQuery课程并且保存到本地

python2使用bs4爬取腾讯社招过程解析

© YiPeiWu.com 【宜配屋】粤ICP备17031333号

Powered By Z-BlogPHP. Theme by TOYEAN.

宜配屋

python3抓取中文网页的方法

相关文章

基于Python实现的百度贴吧网络爬虫实例

Python爬虫获取图片并下载保存至本地的实例

Python实现数据可视化看如何监控你的爬虫状态【推荐】

python爬取w3shcool的JQuery课程并且保存到本地

python2使用bs4爬取腾讯社招过程解析

© YiPeiWu.com 【宜配屋】 粤ICP备17031333号 var _hmt = _hmt || [];(function() { var hm = document.createElement("script"); hm.src = "https://hm.baidu.com/hm.js?8aa60ae04b767b2af31903508928acc0"; var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(hm, s);})();

Powered By Z-BlogPHP. Theme by TOYEAN.

© YiPeiWu.com 【宜配屋】粤ICP备17031333号