在进行爬虫系统开发的过程中遇到需要间隔一段时间就重复执行的任务的需求,就想实现一个线程服务在后台监控数据的抓取状态,要想实现定时循环任务的脚本可以使用linux下的crontab命令来执行,但是在一个常驻进程里不太适用于使用这种办法,所以想启动一个线程来处理这类的小需求。

在查找资料后发现可以使用 threading.Timer来实现这个

代码如下:

def func1():
  print('Do something.')
  global timer
  timer = threading.Timer(3, func1)
  timer.start()

有资料说一定要使用 global 这个关键字,不使用的话会造成线程堆积最终程序退出。

为了证实一下这个说法是否正确,我进行了以下实验:

import threading
def func1(a):
    #Do something
    print('Do something')
    a+=1
    print(a)
    print('当前线程数为{}'.format(threading.activeCount()))
    if a>5:
        return
    t=threading.Timer(5,func1,(a,))
    t.start()

a用来记录func1的执行次数

 

threading.activeCount() #用来显示当前活跃的进程数

结果显示为:

活跃线程数一直保持不变,说明并不会造成线程的堆积。所以使用global关键词是没有必要的。

GitHub 加速计划 / li / linux-dash
13
2
下载
A beautiful web dashboard for Linux
最近提交(Master分支:4 个月前 )
186a802e added ecosystem file for PM2 5 年前
5def40a3 Add host customization support for the NodeJS version 5 年前
Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐