Python视频爬虫实现下载头条视频功能示例

yipeiwu_com6年前 (2020-03-06)Python爬虫

本文实例讲述了Python视频爬虫实现下载头条视频功能。分享给大家供大家参考，具体如下：

一、需求分析

抓取头条短视频

思路：

分析网页源码，查找解析出视频资源url（查看源代码，搜mp4）
对该url发起请求，返回二进制数据
将二进制数据保存为视频格式

视频链接：
http://video.eastday.com/a/170612170956054127565.html

二、代码实现

# encoding: utf-8
import sys
reload(sys)
sys.setdefaultencoding('utf-8')
import requests
import re
import time
time1=time.time()
main_url = 'http://video.eastday.com/a/170612170956054127565.html'
resp = requests.get(main_url)
#没有这行，打印的结果中文是乱码
resp.encoding = 'utf-8'
html = resp.text
link = re.findall(r'var mp4 = "(.*?)";', html)[0]
link = 'http:'+link
dest_resp = requests.get(link)
#视频是二进制数据流，content就是为了获取二进制数据的方法
data = dest_resp.content
#保存数据的路径及文件名
path = u'C:/赵丽颖.mp4'
f = open(path, 'wb')
f.write(data)
f.close()
time2 = time.time()
print u'ok,下载完成!'
print u'总共耗时：' + str(time2 - time1) + 's

"D:\Program Files\Python27\python.exe" D:/PycharmProjects/learn2017/testwechat.py
ok,下载完成!
总共耗时：3.20499992371s
Process finished with exit code 0

成功下载可以播放~

更多关于Python相关内容可查看本站专题：《Python Socket编程技巧总结》、《Python正则表达式用法总结》、《Python数据结构与算法教程》、《Python函数使用技巧总结》、《Python字符串操作技巧汇总》、《Python入门与进阶经典教程》及《Python文件与目录操作技巧汇总》

希望本文所述对大家Python程序设计有所帮助。

返回列表

上一篇：Python字符转换

下一篇：PHP生成静态页面详解

相关文章

Python爬虫利用cookie实现模拟登陆实例详解

Python爬虫利用cookie实现模拟登陆实例详解

Cookie，指某些网站为了辨别用户身份、进行session跟踪而储存在用户本地终端上的数据（通常经过加密）。举个例子，某些网站是需要登录后才能得到你想要的信息的，不登陆只能是游客模式...

Python爬取腾讯视频评论的思路详解

Python爬取腾讯视频评论的思路详解

一、前提条件安装了Fiddler了（用于抓包分析）谷歌或火狐浏览器如果是谷歌浏览器，还需要给谷歌浏览器安装一个SwitchyOmega插件，用于代理服务器有Py...

requests和lxml实现爬虫的方法

如下所示： # requests模块来请求页面 # lxml模块的html构建selector选择器(格式化响应response) # from lxml import html # i...

Python爬虫包BeautifulSoup异常处理（二）

面对网络不稳定，页面更新等问题，很可能出现程序异常的问题，所以我们要对程序进行一些异常处理。大家可能觉得处理异常是一个比较麻烦的活，但在面对复杂网页和任务的时候，无疑成为一个很好的代码习...

python编写简单爬虫资料汇总

python编写简单爬虫资料汇总

　　爬虫真是一件有意思的事儿啊，之前写过爬虫，用的是urllib2、BeautifulSoup实现简单爬虫，scrapy也有实现过。最近想更好的学习爬虫，那么就尽可能的做记录吧。这篇博客...