Python 爬虫之超链接 url中含有中文出错及解决办法

yipeiwu_com6年前 (2020-03-06)Python爬虫

Python 爬虫之超链接 url中含有中文出错及解决办法

python3.5 爬虫错误：

UnicodeEncodeError: 'ascii' codec can't encode characters

这个错误是由于超链接中含有中文引起的，超链接默认是用ascii编码的，所以不能直接出现中文，若要出现中文，

解决方法如下：

import urllib 
from urllib.request import urlopen

link="http://list.jd.com/list.html?cat=9987,653,655&ev=exbrand%5F9420&trans=1&JL=3_品牌_金立（Gionee）"  #含有中文的超链接

# 需要用 urllib.parse.quote 转换
link=urllib.parse.quote(link)

html=urlopen(link).read() #就可以访问了，不会报异常

以上就是 Python 爬虫出现错误解决办法的详解，如有疑问请留言或者到本站的社区交流讨论，感谢阅读，希望能帮助到大家，谢谢大家对本站的支持！

返回列表

上一篇：Python字符转换

下一篇：PHP生成静态页面详解

python3.X 抓取火车票信息【修正版】

代码是在源代码的基础上进行的修改。希望对你有所帮助！实现后如图所示：首先我们需要抓取一些基础的数据，各大火车站信息！ import urllib from urll...

python利用beautifulSoup实现爬虫

以前讲过利用phantomjs做爬虫抓网页 /post/55789.htm 是配合选择器做的利用 beautifulSoup(文档：http://www.crummy.com/sof...

Python爬虫抓取技术的一些经验

前言 web是一个开放的平台，这也奠定了web从90年代初诞生直至今日将近30年来蓬勃的发展。然而，正所谓成也萧何败也萧何，开放的特性、搜索引擎以及简单易学的html、css技术使得we...

python爬虫_自动获取seebug的poc实例

简单的写了一个爬取www.seebug.org上poc的小玩意儿~ 首先我们进行一定的抓包分析我们遇到的第一个问题就是seebug需要登录才能进行下载，这个很好处理，只需要抓取返回值2...

Python爬虫实例_城市公交网络站点数据的爬取方法

爬取的站点：http://beijing.8684.cn/ （1）环境配置，直接上代码： # -*- coding: utf-8 -*- import requests ##导入r...

宜配屋

Python 爬虫之超链接 url中含有中文出错及解决办法

相关文章

python3.X 抓取火车票信息【修正版】

python利用beautifulSoup实现爬虫

Python爬虫抓取技术的一些经验

python爬虫_自动获取seebug的poc实例

Python爬虫实例_城市公交网络站点数据的爬取方法

© YiPeiWu.com 【宜配屋】粤ICP备17031333号

Powered By Z-BlogPHP. Theme by TOYEAN.

宜配屋

Python 爬虫之超链接 url中含有中文出错及解决办法

相关文章

python3.X 抓取火车票信息【修正版】

python利用beautifulSoup实现爬虫

Python爬虫抓取技术的一些经验

python爬虫_自动获取seebug的poc实例

Python爬虫实例_城市公交网络站点数据的爬取方法

© YiPeiWu.com 【宜配屋】 粤ICP备17031333号 var _hmt = _hmt || [];(function() { var hm = document.createElement("script"); hm.src = "https://hm.baidu.com/hm.js?8aa60ae04b767b2af31903508928acc0"; var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(hm, s);})();

Powered By Z-BlogPHP. Theme by TOYEAN.

© YiPeiWu.com 【宜配屋】粤ICP备17031333号