Python抓取百度查询结果的方法

yipeiwu_com6年前 (2020-03-06)Python爬虫

本文实例讲述了Python抓取百度查询结果的方法。分享给大家供大家参考。具体实现方法如下：

#win python 2.7.x
import re,sys,urllib,codecs
xh = urllib.urlopen("http://www.baidu.com/s?q1=123&rn=100").read().decode('utf-8') 
rc = re.compile(r'<td class=f><h3 class="t"><a.*?>(?P<first>.*?)</h3>',re.I)
match = rc.finditer(xh)
rcr = re.compile(r'<[^>]+>',re.I)
f = codecs.open("xiaohei.txt", "w", "utf-8")
for i in rc.finditer(xh):
  ss = i.group(0)
  s1 = rcr.sub('',ss)
  print (s1)
  f.write(s1)
f.close()

希望本文所述对大家的Python程序设计有所帮助。

返回列表

上一篇：Python字符转换

下一篇：PHP生成静态页面详解

Python实现爬虫爬取NBA数据功能示例

本文实例讲述了Python实现爬虫爬取NBA数据功能。分享给大家供大家参考，具体如下：爬取的网站为：stat-nba.com，这里爬取的是NBA2016-2017赛季常规赛至2017年...

python爬取酷狗音乐排行榜

本文为大家分享了python爬取酷狗音乐排行榜的具体代码，供大家参考，具体内容如下 #coding=utf-8 from pymongo import MongoClient im...

Python爬虫 scrapy框架爬取某招聘网存入mongodb解析

创建项目 scrapy startproject zhaoping 创建爬虫 cd zhaoping scrapy genspider hr zhaopingwang.com...

Python如何爬取微信公众号文章和评论(基于 Fiddler 抓包分析)

背景说明感觉微信公众号算得是比较难爬的平台之一，不过一番折腾之后还是小有收获的。没有用Scrapy(估计爬太快也有反爬限制)，但后面会开始整理写一些实战出来。简单介绍下本次的开发环境...

利用Python爬虫给孩子起个好名字

前言相信每位家长都有所体会，因为要在孩子出生后两周内起个名字（需要办理出生证明了），估计很多人都像我一样，刚开始是很慌乱的，虽然感觉汉字非常的多随便找个字做名字都行，后来才发现真不是随...

宜配屋

Python抓取百度查询结果的方法

相关文章

Python实现爬虫爬取NBA数据功能示例

python爬取酷狗音乐排行榜

Python爬虫 scrapy框架爬取某招聘网存入mongodb解析

Python如何爬取微信公众号文章和评论(基于 Fiddler 抓包分析)

利用Python爬虫给孩子起个好名字

© YiPeiWu.com 【宜配屋】粤ICP备17031333号

Powered By Z-BlogPHP. Theme by TOYEAN.

宜配屋

Python抓取百度查询结果的方法

相关文章

Python实现爬虫爬取NBA数据功能示例

python爬取酷狗音乐排行榜

Python爬虫 scrapy框架爬取某招聘网存入mongodb解析

Python如何爬取微信公众号文章和评论(基于 Fiddler 抓包分析)

利用Python爬虫给孩子起个好名字

© YiPeiWu.com 【宜配屋】 粤ICP备17031333号 var _hmt = _hmt || [];(function() { var hm = document.createElement("script"); hm.src = "https://hm.baidu.com/hm.js?8aa60ae04b767b2af31903508928acc0"; var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(hm, s);})();

Powered By Z-BlogPHP. Theme by TOYEAN.

© YiPeiWu.com 【宜配屋】粤ICP备17031333号