python3简单实现微信爬虫

yipeiwu_com6年前 (2020-03-06)Python爬虫

使用ghost.py 通过搜搜的微信搜索来爬取微信公共账号的信息

# -*- coding: utf-8 -*-
import sys
reload(sys)
import datetime
import time
sys.setdefaultencoding("utf-8")
 
from ghost import Ghost
ghost = Ghost(wait_timeout=20)
 
url="http://weixin.sogou.com/gzh?openid=oIWsFt8JDv7xubXz5E3U41T0eFbk"
page,resources = ghost.open(url)
result, resources = ghost.wait_for_selector("#wxmore a")
 
from bs4 import BeautifulSoup
c=0
while True:
  if c>=30:
    break
 
  soup = BeautifulSoup(ghost.content)
 
  for wx in soup.find_all("h4"):
    print wx
 
  page, resources = ghost.evaluate(
    """
    var div1 = document.getElementById("wxbox");
    div1.innerHTML = '';
    """)
  ghost.click("#wxmore a")
  result, resources = ghost.wait_for_selector(".wx-rb3")
 
  c=c+1
  pass

以上所述就是本文的全部内容了，希望对大家学习Python能够有所帮助

返回列表

上一篇：Python字符转换

下一篇：PHP生成静态页面详解

python使用tornado实现简单爬虫

本文实例为大家分享了python使用tornado实现简单爬虫的具体代码，供大家参考，具体内容如下代码在官方文档的示例代码中有,但是作为一个tornado新手来说阅读起来还是有点困难的...

python制作爬虫并将抓取结果保存到excel中

学习Python也有一段时间了，各种理论知识大体上也算略知一二了，今天就进入实战演练：通过Python来编写一个拉勾网薪资调查的小爬虫。第一步：分析网站的请求过程我们在查看拉勾网上的...

python爬取NUS-WIDE数据库图片

实验室需要NUS-WIDE数据库中的原图，数据集的地址为http://lms.comp.nus.edu.sg/research/NUS-WIDE.htm 由于这个...

零基础写python爬虫之urllib2使用指南

前面说到了urllib2的简单入门，下面整理了一部分urllib2的使用细节。 1.Proxy 的设置 urllib2 默认会使用环境变量 http_proxy 来设置 HTTP Pr...

Python爬虫获取整个站点中的所有外部链接代码示例

收集所有外部链接的网站爬虫程序流程图下例是爬取本站python绘制条形图方法代码详解的实例，大家可以参考下。完整代码： #! /usr/bin/env python #codi...

宜配屋

python3简单实现微信爬虫

相关文章

python使用tornado实现简单爬虫

python制作爬虫并将抓取结果保存到excel中

python爬取NUS-WIDE数据库图片

零基础写python爬虫之urllib2使用指南

Python爬虫获取整个站点中的所有外部链接代码示例

© YiPeiWu.com 【宜配屋】粤ICP备17031333号

Powered By Z-BlogPHP. Theme by TOYEAN.

宜配屋

python3简单实现微信爬虫

相关文章

python使用tornado实现简单爬虫

python制作爬虫并将抓取结果保存到excel中

python爬取NUS-WIDE数据库图片

零基础写python爬虫之urllib2使用指南

Python爬虫获取整个站点中的所有外部链接代码示例

© YiPeiWu.com 【宜配屋】 粤ICP备17031333号 var _hmt = _hmt || [];(function() { var hm = document.createElement("script"); hm.src = "https://hm.baidu.com/hm.js?8aa60ae04b767b2af31903508928acc0"; var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(hm, s);})();

Powered By Z-BlogPHP. Theme by TOYEAN.

© YiPeiWu.com 【宜配屋】粤ICP备17031333号