Python抓取百度查询结果的方法

yipeiwu_com6年前 (2020-03-06)Python爬虫

本文实例讲述了Python抓取百度查询结果的方法。分享给大家供大家参考。具体实现方法如下：

#win python 2.7.x
import re,sys,urllib,codecs
xh = urllib.urlopen("http://www.baidu.com/s?q1=123&rn=100").read().decode('utf-8') 
rc = re.compile(r'<td class=f><h3 class="t"><a.*?>(?P<first>.*?)</h3>',re.I)
match = rc.finditer(xh)
rcr = re.compile(r'<[^>]+>',re.I)
f = codecs.open("xiaohei.txt", "w", "utf-8")
for i in rc.finditer(xh):
  ss = i.group(0)
  s1 = rcr.sub('',ss)
  print (s1)
  f.write(s1)
f.close()

希望本文所述对大家的Python程序设计有所帮助。

返回列表

上一篇：Python字符转换

下一篇：PHP生成静态页面详解

一步步教你用python的scrapy编写一个爬虫

介绍本文将介绍我是如何在python爬虫里面一步一步踩坑，然后慢慢走出来的，期间碰到的所有问题我都会详细说明，让大家以后碰到这些问题时能够快速确定问题的来源，后面的代码只是贴出了核心...

python爬虫之百度API调用方法

调用百度API获取经纬度信息。 import requests import json address = input('请输入地点：') par = {'address': add...

Python爬虫运用正则表达式的方法和优缺点

前言我看到最近几部电影很火，查了一下猫眼电影上的数据，发现还有个榜单，里面有各种经典和热映电影的排行榜，然后我觉得电影封面图还挺好看的，想着一张一张下载真是费时费力，于是突发奇想，好像...

Python HTML解析器BeautifulSoup用法实例详解【爬虫解析器】

本文实例讲述了Python HTML解析器BeautifulSoup用法。分享给大家供大家参考，具体如下： BeautifulSoup简介我们知道，Python拥有出色的内置HTML解...

Scrapy爬虫实例讲解_校花网

学习爬虫有一段时间了，今天使用Scrapy框架将校花网的图片爬取到本地。Scrapy爬虫框架相对于使用requests库进行网页的爬取，拥有更高的性能。 Scrapy官方定义：Scrap...

宜配屋

Python抓取百度查询结果的方法

相关文章

一步步教你用python的scrapy编写一个爬虫

python爬虫之百度API调用方法

Python爬虫运用正则表达式的方法和优缺点

Python HTML解析器BeautifulSoup用法实例详解【爬虫解析器】

Scrapy爬虫实例讲解_校花网

© YiPeiWu.com 【宜配屋】粤ICP备17031333号

Powered By Z-BlogPHP. Theme by TOYEAN.

宜配屋

Python抓取百度查询结果的方法

相关文章

一步步教你用python的scrapy编写一个爬虫

python爬虫之百度API调用方法

Python爬虫运用正则表达式的方法和优缺点

Python HTML解析器BeautifulSoup用法实例详解【爬虫解析器】

Scrapy爬虫实例讲解_校花网

© YiPeiWu.com 【宜配屋】 粤ICP备17031333号 var _hmt = _hmt || [];(function() { var hm = document.createElement("script"); hm.src = "https://hm.baidu.com/hm.js?8aa60ae04b767b2af31903508928acc0"; var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(hm, s);})();

Powered By Z-BlogPHP. Theme by TOYEAN.

© YiPeiWu.com 【宜配屋】粤ICP备17031333号