解决python爬虫中有中文的url问题

yipeiwu_com6年前 (2020-03-06)Python爬虫

如果URL中存在中文，而你却不对它做任何处理，他不会达到你所想的那样，因此我们需要将中文部分进行处理，要用到urllib.parse模块中的quote将中文转化成URL所需的编码，url中的中文要单独处理，不能中英文全部合在一起处理（因为一部分的特殊字符也会被处理掉）。

import urllib.parse 
 
word='龙' 
word=urllib.parse.quote(word) 
url='https://baike.baidu.com/search/word?word=%s'%word 
print(url)

运行结果为：

以上这篇解决python爬虫中有中文的url问题就是小编分享给大家的全部内容了，希望能给大家一个参考，也希望大家多多支持【听图阁-专注于Python设计】。

返回列表

写爬虫是一项复杂、枯噪、反复的工作，考虑的问题包括采集效率、链路异常处理、数据质量(与站点编码规范关系很大)等。整理自己写一个爬虫程序，单台服务器可以启用1~8个实例同时采集，然后将数据...

环境：Ubuntu16.4 python版本：3.6.4 库：wordcloud 这次我们要讲的是爬取QQ音乐的评论并制成云词图，我们这里拿周杰伦的等你下课来举例。第一步：获取评论我...

注：1.本程序采用MSSQLserver数据库存储，请运行程序前手动修改程序开头处的数据库链接信息 2.需要bs4、requests、pymssql库支持 3.支持多线程 from...

除了C/C++以外，我也接触过不少流行的语言，PHP、java、javascript、python，其中python可以说是操作起来最方便，缺点最少的语言了。前几天想写爬虫，后来跟朋友...

本文实例讲述了Python使用爬虫抓取美女图片并保存到本地的方法。分享给大家供大家参考，具体如下：图片资源来自于www.qiubaichengren.com 代码基于Python 3....

宜配屋