python基于BeautifulSoup实现抓取网页指定内容的方法

yipeiwu_com6年前 (2020-03-06)Python爬虫

本文实例讲述了python基于BeautifulSoup实现抓取网页指定内容的方法。分享给大家供大家参考。具体实现方法如下：

# _*_ coding:utf-8 _*_
#xiaohei.python.seo.call.me:)
#win+python2.7.x
import urllib2
from bs4 import BeautifulSoup
def jd(url):
  page = urllib2.urlopen(url)
  html_doc = page.read()
  soup = BeautifulSoup(html_doc.decode('gb2312','ignore'))
  for i in soup.find_all('div', id="sortlist"):
    one = i.find_all('a')
    two = i.find_all('li')
    print ("%s %s" % (one,two))
jd("http://channel.jd.com/computer.html")

希望本文所述对大家的Python程序设计有所帮助。

返回列表

上一篇：Python字符转换

下一篇：PHP生成静态页面详解

Python爬虫爬取一个网页上的图片地址实例代码

本文实例主要是实现爬取一个网页上的图片地址，具体如下。读取一个网页的源代码： import urllib.request def getHtml(url): html=urll...

Python基于多线程实现抓取数据存入数据库的方法

本文实例讲述了Python基于多线程实现抓取数据存入数据库的方法。分享给大家供大家参考，具体如下： 1. 数据库类 """ 使用须知：代码中数据表名 aces ，需要更改该数据表名...

我用Python抓取了7000 多本电子书案例详解

安装安装很简单，只要执行： pip install requests-html 就可以了。分析页面结构通过浏览器审查元素可以发现这个电子书网站是用 WordPress 搭建的...

python爬取内容存入Excel实例

最近老师布置了个作业，爬取豆瓣top250的电影信息。按照套路，自然是先去看看源代码了，一看，基本的信息竟然都有，心想这可省事多了。简单分析了下源代码，标记出所需信息的所在标签，ok，开...

python爬虫系列Selenium定向爬取虎扑篮球图片详解

前言：作为一名从小就看篮球的球迷，会经常逛虎扑篮球及湿乎乎等论坛，在论坛里面会存在很多精美图片，包括NBA球队、CBA明星、花边新闻、球鞋美女等等，如果一张张右键另存为的话真是手都点...

宜配屋

python基于BeautifulSoup实现抓取网页指定内容的方法

相关文章

Python爬虫爬取一个网页上的图片地址实例代码

Python基于多线程实现抓取数据存入数据库的方法

我用Python抓取了7000 多本电子书案例详解

python爬取内容存入Excel实例

python爬虫系列Selenium定向爬取虎扑篮球图片详解

© YiPeiWu.com 【宜配屋】粤ICP备17031333号

Powered By Z-BlogPHP. Theme by TOYEAN.

宜配屋

python基于BeautifulSoup实现抓取网页指定内容的方法

相关文章

Python爬虫爬取一个网页上的图片地址实例代码

Python基于多线程实现抓取数据存入数据库的方法

我用Python抓取了7000 多本电子书案例详解

python爬取内容存入Excel实例

python爬虫系列Selenium定向爬取虎扑篮球图片详解

© YiPeiWu.com 【宜配屋】 粤ICP备17031333号 var _hmt = _hmt || [];(function() { var hm = document.createElement("script"); hm.src = "https://hm.baidu.com/hm.js?8aa60ae04b767b2af31903508928acc0"; var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(hm, s);})();

Powered By Z-BlogPHP. Theme by TOYEAN.

© YiPeiWu.com 【宜配屋】粤ICP备17031333号