Python提取网页中超链接的方法

yipeiwu_com6年前 (2020-03-06)Python基础

下面是最简单的实现方法，先将目标网页抓回来，然后通过正则匹配a标签中的href属性来获得超链接

代码如下：

import urllib2
import re
 
url = 'http://www.sunbloger.com/'
 
req = urllib2.Request(url)
con = urllib2.urlopen(req)
doc = con.read()
con.close()
 
links = re.findall(r'href\=\"(http\:\/\/[a-zA-Z0-9\.\/]+)\"', doc)
for a in links:
  print a

总结

以上就是这篇文章的全部内容，希望本文的内容对大家的学习或者工作能有所帮助，如果有疑问大家可以留言交流。

返回列表

上一篇：Python字符转换

下一篇：PHP生成静态页面详解

浅析Python编写函数装饰器

编写函数装饰器本节主要介绍编写函数装饰器的相关内容。跟踪调用如下代码定义并应用一个函数装饰器，来统计对装饰的函数的调用次数，并且针对每一次调用打印跟踪信息。 class tr...

python使用paramiko实现远程拷贝文件的方法

本文实例讲述了python使用paramiko实现远程拷贝文件的方法。分享给大家供大家参考，具体如下：首先是安装paramiko库(其实现了SSH2安全协议)，ubuntu下可直接通过...

Python3 执行系统命令并获取实时回显功能

下面先给大家介绍下Python3 执行系统命令并获取实时回显最近在改造一些打包的逻辑，原来在 Windows 下是基于批处理制作的，由于批处理用起来不是很方便，一些实时的计算基本无法胜...

PyQT实现多窗口切换

最近做个软件，用PyQT写的，在实现菜单栏点击弹出新窗口的时候严重被卡壳，发现用WxPython的思想和方式来做完全无法实现。PyQT的中文资料实在是太少了。看了点英文资料和QT的资料，...

举例讲解Python中的死锁、可重入锁和互斥锁

一、死锁简单来说，死锁是一个资源被多次调用，而多次调用方都未能释放该资源就会造成死锁，这里结合例子说明下两种常见的死锁情况。 1、迭代死锁该情况是一个线程“迭代”请求同一个资源，直接...

宜配屋

Python提取网页中超链接的方法

相关文章

浅析Python编写函数装饰器

python使用paramiko实现远程拷贝文件的方法

Python3 执行系统命令并获取实时回显功能

PyQT实现多窗口切换

举例讲解Python中的死锁、可重入锁和互斥锁

© YiPeiWu.com 【宜配屋】粤ICP备17031333号

Powered By Z-BlogPHP. Theme by TOYEAN.

宜配屋

Python提取网页中超链接的方法

相关文章

浅析Python编写函数装饰器

python使用paramiko实现远程拷贝文件的方法

Python3 执行系统命令并获取实时回显功能

PyQT实现多窗口切换

举例讲解Python中的死锁、可重入锁和互斥锁

© YiPeiWu.com 【宜配屋】 粤ICP备17031333号 var _hmt = _hmt || [];(function() { var hm = document.createElement("script"); hm.src = "https://hm.baidu.com/hm.js?8aa60ae04b767b2af31903508928acc0"; var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(hm, s);})();

Powered By Z-BlogPHP. Theme by TOYEAN.

© YiPeiWu.com 【宜配屋】粤ICP备17031333号