創新互聯www.cdcxhl.cn八線動態BGP香港云服務器提供商,新人活動買多久送多久,劃算不套路!
成都創新互聯公司專注于企業全網營銷推廣、網站重做改版、禪城網站定制設計、自適應品牌網站建設、H5頁面制作、商城建設、集團公司官網建設、成都外貿網站建設、高端網站制作、響應式網頁設計等建站業務,價格優惠性價比高,為禪城等各大城市提供網站開發制作服務。這篇文章將為大家詳細講解有關用Python自動獲取目標網站最新通知的方法,小編覺得挺實用的,因此分享給大家做個參考,希望大家閱讀完這篇文章后可以有所收獲。
Python之自動獲取目標網站最新通知:
1、建立通知數據庫
這一步的目的是爬取目標網站已經發布的通知的數據,并進行存儲,從而建立與該目標網站內容相對應的本地數據庫。
考慮到數據庫中的數據將是辨別和獲取一則新通知的唯一方法,因此所建立的數據庫將存儲每一條通知的標題、發布日期和訪問鏈接。
第一步使用到的模塊有urllib、BeautifulSoup和sqlite3模塊。其中,通過urllib模塊爬取目標網頁html數據;通過BeautifulSoup模塊解析網頁數據、爬取網頁內容;通過sqlite3模塊建立目標網站已有通知數據庫。
該步主要代碼展示如下。
2、建立郵件發送系統
這一步的目的是使用Python標準庫模塊smtplib來訪問網絡,創建一個發送電子郵件的功能。
由于我們大部分人的計算機并沒有建立自己的郵件服務器,因此需借助第三方服務器來模擬郵件發送。
常用的有谷歌郵件系統、網易郵件系統和QQ郵件系統,如QQ郵件系統的SMTP服務器和端口號分別為smtp.qq.com和465。
該步主要代碼展示如下。
在這個示例中,使用了Python標準庫中的email模塊將電子郵件信息進行了格式化,主要包括郵件的主題與發件人、收件人郵箱昵稱和郵件內容等信息。
3、解析檢測目標網站通知
前面兩步,已經完成了目標網站已有通知數據庫和郵件發送系統的建立,第三步要完成的工作,主要由兩部分組成。
一是,利用第一步使用的urllib、BeautifulSoup模塊解析目標網站內容數據,并與前面建立的數據庫進行對比檢測。
二是,若檢測到目標網站有新的通知,則將新通知數據插入到數據庫中,然后,發送提示電子郵件。
該步主要代碼展示如下。
在這個示例中,只選取了最新的一條通知發送了電子郵件提示,具體郵件信息可自己設定。
4、制定計劃任務
前面三步,已經完成了使用Python獲取目標網站最新通知,并發送提示電子郵件的腳本程序。
在這一步,將使用Windows自帶的DOS命令框架和任務計劃程序去每小時自動運行一次Python腳本,實現自動更新通知的目的。
首先,需要編寫一個cmd命令文件,方便在DOS框架下執行Python腳本。
主要代碼展示如下:
@echo off # 關閉回顯 cd C:\demo # 找到Python腳本文件的路徑 python Python.py # 執行Python腳本文件
最后,使用任務計劃程序制定一個任務,可設定為每隔一小時自動運行一次cmd命令文件。
關于用Python自動獲取目標網站最新通知的方法就分享到這里了,希望以上內容可以對大家有一定的幫助,可以學到更多知識。如果覺得文章不錯,可以把它分享出去讓更多的人看到。
本文標題:用Python自動獲取目標網站最新通知的方法-創新互聯
文章路徑:http://www.yijiale78.com/article42/cccoec.html
成都網站建設公司_創新互聯,為您提供域名注冊、商城網站、網站建設、ChatGPT、用戶體驗、網站營銷
聲明:本網站發布的內容(圖片、視頻和文字)以用戶投稿、用戶轉載內容為主,如果涉及侵權請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網站立場,如需處理請聯系客服。電話:028-86922220;郵箱:631063699@qq.com。內容未經允許不得轉載,或轉載時需注明來源: 創新互聯