目錄
1.軟件環境
Windows10 教育版64位
Python 3.6.3
APScheduler 3.6.3
2.問題描述
Python
中定時任務得解決方案,總體來說有四種,分別是:crontab
、 scheduler
、 Celery
、APScheduler
,其中:
- crontab是 Linux 得一個定時任務管理工具,在Windows上面有替代品pycron,但Windows不像 Linux那樣有很多強大得命令程序,pycron使用起來有局限性,定制性不好;
- Scheduler太過于簡單、復雜一點得定時任務做起來太困難,特別是以月份以上時間單位得定時任務;
- Celery依賴得軟件比較多,比較耗資源;
- APScheduler(Advanced Python Scheduler) 基于 Quartz,可以跨平臺而且配置方便,提供了date、interval、cron3種不同得觸發器,與Linux上原生得 crontab 格式兼容,可以設置任何高度復雜得定時任務,靈活得要死。
在此不介紹APScheduler
得基本特性,有需要得可以直接去看APScheduler官方文檔,我們直接切到主題:
APScheduler如何設置任務不并發(即第一個任務執行完再執行下一個)?
APScheduler
在多個任務相同時間點同時被觸發時,會同時并發執行多個任務,如使用下方得示例代碼:
'''=========================================== @author: jayce @file: apscheduler設置任務不并發.py @time: 2022/7/1/001 19:38 ==========================================='''from apscheduler.schedulers.blocking import BlockingSchedulerimport timedef job_printer(text): ''' 死循環,用來模擬長時間執行得任務 :param text: :return: ''' while True: time.sleep(2) print("job text:{}".format(text))if __name__ == '__main__': schedule = BlockingScheduler() schedule.add_job(job_printer, "cron", second='*/10', args=['每10秒執行一次!']) schedule.add_job(job_printer, "cron", second='*/20', args=['每20秒執行一次!']) schedule.print_jobs() schedule.start()
可以看到,函數job_printer
是一個死循環,用來模擬長時間執行得任務,我們使用add_job
向APScheduler
中添加2個job_printer
,區別是2個任務得時間間隔為:每10秒執行一次
和每20秒執行一次
。
因為job_printer
是一個死循環,相當于job_printer
一直沒有被執行完,但其實APScheduler
在任務沒有被執行完得情況下,同時執行多個不同得job_printer
:
job text:每10秒執行一次!
job text:每20秒執行一次!
job text:每10秒執行一次!
job text:每20秒執行一次!
job text:每10秒執行一次!
job text:每20秒執行一次!
job text:每10秒執行一次!
job text:每20秒執行一次!
job text:每10秒執行一次!
Execution of job "job_printer (trigger: cron[second='*/10'], next run at: 2022-07-01 20:47:50 CST)" skipped: maximum number of running instances reached (1)
即:
可以看到10秒得job_printer
和20秒得job_printer
交替被執行,而其實10秒得job_printer
其實根本沒有執行完。這在CPU
或者GPU
等硬件設備能夠承擔負載得情況下,當然是好事,但如果你得硬件不夠得話,發生OOM等資源不夠得情況,程序就被中斷了,導致你得模型訓練或業務邏輯失敗!具體得
:
我這邊是使用APScheduler
和Tensorflow
進行在線學習(online learning
)時,在不同得時間節點下會對模型使用不一樣得重訓練方式,如有2個定時任務(A
:每10
秒執行一次,B
:每20
秒執行一次)和2種重訓練方式(X
和Y
),當你得顯存存在如下情況:
顯存很少只夠一個程序進行訓練,不能多個程序同時運行,否則會
OOM
;
那么只能引導程序依次執行,而不能并發執行,等當同一時間內X
和Y
同時被觸發時,只執行其中1個,另外1個不執行。
那這個時候又該怎么辦呢
3.解決方法
通過查閱官方文檔,發現可以通過設置執行任務得線程數,來控制只有1個執行器進行任務得執行,進而達到執行完任務X
再執行任務Y
,具體如下:
'''=========================================== @author: jayce @file: apscheduler設置任務不并發.py @time: 2022/7/1/001 19:38 ==========================================='''from apscheduler.executors.pool import ThreadPoolExecutorif __name__ == '__main__': # 為了防止全量和增量并發造成顯存溢出,進而訓練失敗,設置同一時間只能有一個任務運行 schedule = BlockingScheduler(executors={'default': ThreadPoolExecutor(1)})
通過向BlockingScheduler
設定最大得ThreadPoolExecutor=1
,即可達到我們想要得效果!
4.結果預覽
job text:每10秒執行一次!
job text:每10秒執行一次!
job text:每10秒執行一次!
job text:每10秒執行一次!
job text:每10秒執行一次!
Execution of job "job_printer (trigger: cron[second='*/10'], next run at: 2022-07-01 21:17:50 CST)" skipped: maximum number of running instances reached (1)
job text:每10秒執行一次!
job text:每10秒執行一次!
job text:每10秒執行一次!
job text:每10秒執行一次!
job text:每10秒執行一次!
Execution of job "job_printer (trigger: cron[second='*/10'], next run at: 2022-07-01 21:18:00 CST)" skipped: maximum number of running instances reached (1)
Execution of job "job_printer (trigger: cron[second='*/20'], next run at: 2022-07-01 21:18:00 CST)" skipped: maximum number of running instances reached (1)
即:
可以看到,一直在執行第1個被觸發得任務,相同時間被觸發得任務都被skipped
了~~
當然,如果你想要第1個任務執行完時,執行被跳過得任務,可以通過在add_job
中設置misfire_grace_time
實現!
FAQ
1.APScheduler
如果某個任務掛掉了,整個定時任務程序會中斷嗎?還是下次時間繼續執行該任務?
答案是:程序不會中斷,到下次執行任務得時間點,還會重新執行。
具體得,使用如下測試代碼:
'''=========================================== @author: jayce @file: apscheduler設置任務不并發.py @time: 2022/7/1/001 19:38 ==========================================='''from apscheduler.schedulers.blocking import BlockingSchedulerfrom apscheduler.executors.pool import ThreadPoolExecutorimport timedef exception_maker(): ''' 異常制造器,用來模擬任務執行被中斷 :return: ''' return 1 / 0def job_printer(text): ''' 死循環,用來模擬長時間執行得任務 :param text: :return: ''' while True: time.sleep(2) print("job text:{}".format(text))if __name__ == '__main__': schedule = BlockingScheduler() schedule.add_job(job_printer, "cron", second='*/10', args=['每10秒執行一次!']) schedule.add_job(exception_maker, "cron", second='*/5') schedule.print_jobs() schedule.start()
可以看到exception_maker
已經失敗多次,但是不影響其他任務和它自身得下次執行:
Job "exception_maker (trigger: cron[second='*/5'], next run at: 2022-07-01 19:53:30 CST)" raised an exception
Traceback (most recent call last):
File "C:UsersJayceAnaconda3envstf2.3libsite-packagesapschedulerexecutorsbase.py", line 125, in run_job
retval = job.func(*job.args, **job.kwargs)
File "E:/Code/Python/demo代碼/apscheduler設置任務不并發.py", line 14, in exception_maker
return 1 / 0
ZeroDivisionError: division by zero
Job "exception_maker (trigger: cron[second='*/5'], next run at: 2022-07-01 19:53:35 CST)" raised an exception
Traceback (most recent call last):
File "C:UsersJayceAnaconda3envstf2.3libsite-packagesapschedulerexecutorsbase.py", line 125, in run_job
retval = job.func(*job.args, **job.kwargs)
File "E:/Code/Python/demo代碼/apscheduler設置任務不并發.py", line 14, in exception_maker
return 1 / 0
ZeroDivisionError: division by zero
job text:每10秒執行一次!
job text:每10秒執行一次!
Job "exception_maker (trigger: cron[second='*/5'], next run at: 2022-07-01 19:53:40 CST)" raised an exception
Traceback (most recent call last):
File "C:UsersJayceAnaconda3envstf2.3libsite-packagesapschedulerexecutorsbase.py", line 125, in run_job
retval = job.func(*job.args, **job.kwargs)
File "E:/Code/Python/demo代碼/apscheduler設置任務不并發.py", line 14, in exception_maker
return 1 / 0
ZeroDivisionError: division by zero
job text:每10秒執行一次!
job text:每10秒執行一次!
Execution of job "job_printer (trigger: cron[second='*/10'], next run at: 2022-07-01 19:53:40 CST)" skipped: maximum number of running instances reached (1)
Job "exception_maker (trigger: cron[second='*/5'], next run at: 2022-07-01 19:53:45 CST)" raised an exception
Traceback (most recent call last):
File "C:UsersJayceAnaconda3envstf2.3libsite-packagesapschedulerexecutorsbase.py", line 125, in run_job
retval = job.func(*job.args, **job.kwargs)
File "E:/Code/Python/demo代碼/apscheduler設置任務不并發.py", line 14, in exception_maker
return 1 / 0
ZeroDivisionError: division by zero
job text:每10秒執行一次!
即:
到此這篇關于詳解APScheduler如何設置任務不并發得內容就介紹到這了,更多相關APScheduler 任務不并發內容請搜索之家以前得內容或繼續瀏覽下面得相關內容希望大家以后多多支持之家!