python爬虫正则表达式之处理换行符

yipeiwu_com6年前 (2020-03-06)Python爬虫

刚开始学python，记录下问题。

代码如下：

#coding:utf-8
import re,urllib2
def getHTML(url):
  html=urllib2.urlopen(url)
  html=html.read()
  return html
if __name__=='__main__'：
  url='https://www.baidu.com'
  #处理换行符以及空格
  print getHTML(url).replace('\n','').replace('\t','').replace(' ','')

总结

以上所述是小编给大家介绍的python爬虫正则表达式之处理换行符，希望对大家有所帮助，如果大家有任何疑问请给我留言，小编会及时回复大家的。在此也非常感谢大家对【听图阁-专注于Python设计】网站的支持！

返回列表

上一篇：Python字符转换

下一篇：PHP生成静态页面详解

python小技巧之批量抓取美女图片

其中用到urllib2模块和正则表达式模块。下面直接上代码： [/code]#!/usr/bin/env python#-*- coding: utf-8 -*-#通过urllib(2)...

Python爬虫辅助利器PyQuery模块的安装使用攻略

Windows下的安装：下载地址：https://pypi.python.org/pypi/pyquery/#downloads 下载后安装： C:\Python27>ea...

python3爬取数据至mysql的方法

本文实例为大家分享了python3爬取数据至mysql的具体代码，供大家参考，具体内容如下直接贴代码 #!/usr/local/bin/python3.5 # -*- codin...

零基础写python爬虫之使用urllib2组件抓取网页内容

版本号：Python2.7.5，Python3改动较大，各位另寻教程。所谓网页抓取，就是把URL地址中指定的网络资源从网络流中读取出来，保存到本地。类似于使用程序模拟IE浏览器...

python利用beautifulSoup实现爬虫

以前讲过利用phantomjs做爬虫抓网页 /post/55789.htm 是配合选择器做的利用 beautifulSoup(文档：http://www.crummy.com/sof...

宜配屋

python爬虫正则表达式之处理换行符

相关文章

python小技巧之批量抓取美女图片

Python爬虫辅助利器PyQuery模块的安装使用攻略

python3爬取数据至mysql的方法

零基础写python爬虫之使用urllib2组件抓取网页内容

python利用beautifulSoup实现爬虫

© YiPeiWu.com 【宜配屋】粤ICP备17031333号

Powered By Z-BlogPHP. Theme by TOYEAN.

宜配屋

python爬虫正则表达式之处理换行符

相关文章

python小技巧之批量抓取美女图片

Python爬虫辅助利器PyQuery模块的安装使用攻略

python3爬取数据至mysql的方法

零基础写python爬虫之使用urllib2组件抓取网页内容

python利用beautifulSoup实现爬虫

© YiPeiWu.com 【宜配屋】 粤ICP备17031333号 var _hmt = _hmt || [];(function() { var hm = document.createElement("script"); hm.src = "https://hm.baidu.com/hm.js?8aa60ae04b767b2af31903508928acc0"; var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(hm, s);})();

Powered By Z-BlogPHP. Theme by TOYEAN.

© YiPeiWu.com 【宜配屋】粤ICP备17031333号