python 每天如何定时启动爬虫任务(实现方法分享)

yipeiwu_com6年前 (2020-03-06)Python爬虫

python2.7环境下运行

安装相关模块

想要每天定时启动，最好是把程序放在linux服务器上运行，毕竟linux可以不用关机，即定时任务一直存活；

#coding:utf8
import datetime
import time
def doSth():
 # 把爬虫程序放在这个类里
 print(u'这个程序要开始疯狂的运转啦')
# 一般网站都是1:00点更新数据，所以每天凌晨一点启动
def main(h=1,m=0):
 while True:
  now = datetime.datetime.now()
  # print(now.hour, now.minute)
  if now.hour == h and now.minute == m:
   break
  # 每隔60秒检测一次
  time.sleep(60)
 doSth()
main()

以上这篇python 每天如何定时启动爬虫任务(实现方法分享)就是小编分享给大家的全部内容了，希望能给大家一个参考，也希望大家多多支持【听图阁-专注于Python设计】。

返回列表

上一篇：Python字符转换

下一篇：PHP生成静态页面详解

python爬虫获取百度首页内容教学

由传智播客教程整理，我们这里使用的是python2.7.x版本，就是2.7之后的版本，因为python3的改动略大，我们这里不用它。现在我们尝试一下url和网络爬虫配合的关系，爬浏览器首...

Python爬虫运用正则表达式的方法和优缺点

前言我看到最近几部电影很火，查了一下猫眼电影上的数据，发现还有个榜单，里面有各种经典和热映电影的排行榜，然后我觉得电影封面图还挺好看的，想着一张一张下载真是费时费力，于是突发奇想，好像...

Scrapy爬虫实例讲解_校花网

学习爬虫有一段时间了，今天使用Scrapy框架将校花网的图片爬取到本地。Scrapy爬虫框架相对于使用requests库进行网页的爬取，拥有更高的性能。 Scrapy官方定义：Scrap...

python爬虫模拟浏览器的两种方法实例分析

本文实例讲述了python爬虫模拟浏览器的两种方法。分享给大家供大家参考，具体如下：爬虫爬取网站出现403，因为站点做了防爬虫的设置一、Herders 属性爬取CSDN博客 i...

python爬虫 Pyppeteer使用方法解析

引言 Selenium 在被使用的时候有个麻烦事，就是环境的相关配置，得安装好相关浏览器，比如 Chrome、Firefox 等等，然后还要到官方网站去下载对应的驱动，最重要的还需要安...

宜配屋

python 每天如何定时启动爬虫任务(实现方法分享)

相关文章

python爬虫获取百度首页内容教学

Python爬虫运用正则表达式的方法和优缺点

Scrapy爬虫实例讲解_校花网

python爬虫模拟浏览器的两种方法实例分析

python爬虫 Pyppeteer使用方法解析

© YiPeiWu.com 【宜配屋】粤ICP备17031333号

Powered By Z-BlogPHP. Theme by TOYEAN.

宜配屋

python 每天如何定时启动爬虫任务(实现方法分享)

相关文章

python爬虫获取百度首页内容教学

Python爬虫运用正则表达式的方法和优缺点

Scrapy爬虫实例讲解_校花网

python爬虫模拟浏览器的两种方法实例分析

python爬虫 Pyppeteer使用方法解析

© YiPeiWu.com 【宜配屋】 粤ICP备17031333号 var _hmt = _hmt || [];(function() { var hm = document.createElement("script"); hm.src = "https://hm.baidu.com/hm.js?8aa60ae04b767b2af31903508928acc0"; var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(hm, s);})();

Powered By Z-BlogPHP. Theme by TOYEAN.

© YiPeiWu.com 【宜配屋】粤ICP备17031333号