Python提取网页中超链接的方法

yipeiwu_com6年前 (2020-03-06)Python基础

下面是最简单的实现方法，先将目标网页抓回来，然后通过正则匹配a标签中的href属性来获得超链接

代码如下：

import urllib2
import re
 
url = 'http://www.sunbloger.com/'
 
req = urllib2.Request(url)
con = urllib2.urlopen(req)
doc = con.read()
con.close()
 
links = re.findall(r'href\=\"(http\:\/\/[a-zA-Z0-9\.\/]+)\"', doc)
for a in links:
  print a

总结

以上就是这篇文章的全部内容，希望本文的内容对大家的学习或者工作能有所帮助，如果有疑问大家可以留言交流。

返回列表

上一篇：Python字符转换

下一篇：PHP生成静态页面详解

Python统计分析模块statistics用法示例

本文实例讲述了Python统计分析模块statistics用法。分享给大家供大家参考，具体如下：一计算平均数函数mean() >>>import statist...

全面了解Nginx, WSGI, Flask之间的关系

概览之前对 Nginx，WSGI（或者 uWSGI，uwsgi），Flask(或者 Django），这几者的关系一存存在疑惑。通过查阅了些资料，总算把它们的关系理清了。总括来说，客户...

Python Tkinter简单布局实例教程

本文实例展示了Python Tkinter实现简单布局的方法，示例中备有较为详尽的注释，便于读者理解。分享给大家供大家参考之用。具体如下： # -*- coding: utf-8 -...

python实现弹窗祝福效果

前言猪年除夕之夜在亲人群抢红包心血来潮，想用python做比较好玩的新年祝福给亲人们乐呵乐呵。奈何初学Python，底子比较薄，通过查阅相关博客，在一位网友的基础代码之下添加改进，使得...

PyCharm在新窗口打开项目的方法

File->Setting 找到Appearance & Behavior -->System Setting,在右边窗口中选择 Open project in new wi...

宜配屋

Python提取网页中超链接的方法

相关文章

Python统计分析模块statistics用法示例

全面了解Nginx, WSGI, Flask之间的关系

Python Tkinter简单布局实例教程

python实现弹窗祝福效果

PyCharm在新窗口打开项目的方法

© YiPeiWu.com 【宜配屋】粤ICP备17031333号

Powered By Z-BlogPHP. Theme by TOYEAN.

宜配屋

Python提取网页中超链接的方法

相关文章

Python统计分析模块statistics用法示例

全面了解Nginx, WSGI, Flask之间的关系

Python Tkinter简单布局实例教程

python实现弹窗祝福效果

PyCharm在新窗口打开项目的方法

© YiPeiWu.com 【宜配屋】 粤ICP备17031333号 var _hmt = _hmt || [];(function() { var hm = document.createElement("script"); hm.src = "https://hm.baidu.com/hm.js?8aa60ae04b767b2af31903508928acc0"; var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(hm, s);})();

Powered By Z-BlogPHP. Theme by TOYEAN.

© YiPeiWu.com 【宜配屋】粤ICP备17031333号