python爬虫教程之爬取百度贴吧并下载的示例

yipeiwu_com6年前 (2020-03-06)Python爬虫

测试url：http://tieba.baidu.com/p/27141123322?pn=
begin 1
end 4

import string ,urllib2

def baidu_tieba(url,begin_page,end_page):
    for i in range(begin_page, end_page+1):
        sName = string.zfill(i,5)+ '.html'
        print '正在下载第' + str(i) + '个网页，并将其存储为' + sName + '..........'
        f = open (sName,'w+')
        m = urllib2.urlopen(url + str(i)).read()
        f.write(m)
        f.close()

bdurl = str(raw_input('url： \n'))
begin_page = int(raw_input('begin :\n'))
end_page = int(raw_input('end : \n'))

baidu_tieba(bdurl,begin_page,end_page)

返回列表

上一篇：Python字符转换

下一篇：PHP生成静态页面详解

python爬虫-模拟微博登录功能

微博模拟登录这是本次爬取的网址：https://weibo.com/ 一、请求分析找到登录的位置，填写用户名密码进行登录操作看看这次请求响应的数据是什么这是响应得到的数据，保...

在scrapy中使用phantomJS实现异步爬取的方法

使用selenium能够非常方便的获取网页的ajax内容，并且能够模拟用户点击和输入文本等诸多操作，这在使用scrapy爬取网页的过程中非常有用。网上将selenium集成到scrap...

详解python3 + Scrapy爬虫学习之创建项目

最近准备做一个关于scrapy框架的实战，爬取腾讯社招信息并存储，这篇博客记录一下创建项目的步骤 pycharm是无法创建一个scrapy项目的因此，我们需要用命令行的方法新建一个s...

Python爬取读者并制作成PDF

学了下beautifulsoup后,做个个网络爬虫,爬取读者杂志并用reportlab制作成pdf.. crawler.py 复制代码代码如下: #!/usr/bin/env pyth...

Python网络爬虫实例讲解

聊一聊Python与网络爬虫。 1、爬虫的定义爬虫：自动抓取互联网数据的程序。 2、爬虫的主要框架爬虫程序的主要框架如上图所示，爬虫调度端通过URL管理器获取待爬取的URL链接，若...

宜配屋

python爬虫教程之爬取百度贴吧并下载的示例

相关文章

python爬虫-模拟微博登录功能

在scrapy中使用phantomJS实现异步爬取的方法

详解python3 + Scrapy爬虫学习之创建项目

Python爬取读者并制作成PDF

Python网络爬虫实例讲解

© YiPeiWu.com 【宜配屋】粤ICP备17031333号

Powered By Z-BlogPHP. Theme by TOYEAN.

宜配屋

python爬虫教程之爬取百度贴吧并下载的示例

相关文章

python爬虫-模拟微博登录功能

在scrapy中使用phantomJS实现异步爬取的方法

详解python3 + Scrapy爬虫学习之创建项目

Python爬取读者并制作成PDF

Python网络爬虫实例讲解

© YiPeiWu.com 【宜配屋】 粤ICP备17031333号 var _hmt = _hmt || [];(function() { var hm = document.createElement("script"); hm.src = "https://hm.baidu.com/hm.js?8aa60ae04b767b2af31903508928acc0"; var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(hm, s);})();

Powered By Z-BlogPHP. Theme by TOYEAN.

© YiPeiWu.com 【宜配屋】粤ICP备17031333号