python3简单实现微信爬虫

yipeiwu_com6年前 (2020-03-06)Python爬虫

使用ghost.py 通过搜搜的微信搜索来爬取微信公共账号的信息

# -*- coding: utf-8 -*-
import sys
reload(sys)
import datetime
import time
sys.setdefaultencoding("utf-8")
 
from ghost import Ghost
ghost = Ghost(wait_timeout=20)
 
url="http://weixin.sogou.com/gzh?openid=oIWsFt8JDv7xubXz5E3U41T0eFbk"
page,resources = ghost.open(url)
result, resources = ghost.wait_for_selector("#wxmore a")
 
from bs4 import BeautifulSoup
c=0
while True:
  if c>=30:
    break
 
  soup = BeautifulSoup(ghost.content)
 
  for wx in soup.find_all("h4"):
    print wx
 
  page, resources = ghost.evaluate(
    """
    var div1 = document.getElementById("wxbox");
    div1.innerHTML = '';
    """)
  ghost.click("#wxmore a")
  result, resources = ghost.wait_for_selector(".wx-rb3")
 
  c=c+1
  pass

以上所述就是本文的全部内容了，希望对大家学习Python能够有所帮助

返回列表

上一篇：Python字符转换

下一篇：PHP生成静态页面详解

Python实现的文轩网爬虫完整示例

本文实例讲述了Python实现的文轩网爬虫。分享给大家供大家参考，具体如下： encoding=utf8 import pymysql import time import sys...

Python基于分析Ajax请求实现抓取今日头条街拍图集功能示例

本文实例讲述了Python基于分析Ajax请求实现抓取今日头条街拍图集功能。分享给大家供大家参考，具体如下：代码: import os import re import json...

检测python爬虫时是否代理ip伪装成功的方法

有时候我们的爬虫程序添加了代理，但是我们不知道程序是否获取到了ip，尤其是动态转发模式的，这时候就需要进行检测了，以下是一种代理是否伪装成功的检测方式，这里推介使用亿牛云提供的代码示例。...

Python HTML解析器BeautifulSoup用法实例详解【爬虫解析器】

本文实例讲述了Python HTML解析器BeautifulSoup用法。分享给大家供大家参考，具体如下： BeautifulSoup简介我们知道，Python拥有出色的内置HTML解...

通过selenium抓取某东的TT购买记录并分析趋势过程解析

最近学习了一些爬虫技术，想做个小项目检验下自己的学习成果，在逛某东的时候，突然给我推荐一个TT的产品，点击进去浏览一番之后就产生了抓取TT产品，然后进行数据分析，看下那个品牌的TT卖得最...

宜配屋

python3简单实现微信爬虫

相关文章

Python实现的文轩网爬虫完整示例

Python基于分析Ajax请求实现抓取今日头条街拍图集功能示例

检测python爬虫时是否代理ip伪装成功的方法

Python HTML解析器BeautifulSoup用法实例详解【爬虫解析器】

通过selenium抓取某东的TT购买记录并分析趋势过程解析

© YiPeiWu.com 【宜配屋】粤ICP备17031333号

Powered By Z-BlogPHP. Theme by TOYEAN.

宜配屋

python3简单实现微信爬虫

相关文章

Python实现的文轩网爬虫完整示例

Python基于分析Ajax请求实现抓取今日头条街拍图集功能示例

检测python爬虫时是否代理ip伪装成功的方法

Python HTML解析器BeautifulSoup用法实例详解【爬虫解析器】

通过selenium抓取某东的TT购买记录并分析趋势过程解析

© YiPeiWu.com 【宜配屋】 粤ICP备17031333号 var _hmt = _hmt || [];(function() { var hm = document.createElement("script"); hm.src = "https://hm.baidu.com/hm.js?8aa60ae04b767b2af31903508928acc0"; var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(hm, s);})();

Powered By Z-BlogPHP. Theme by TOYEAN.

© YiPeiWu.com 【宜配屋】粤ICP备17031333号