今天和大家談python爬網(wǎng)的小程序,希望給大家?guī)硪恍┍憷?/p>
項(xiàng)目背景:
作為程序媛的我,在疫情發(fā)生后就徹底宅了。沒事的時(shí)候就打打游戲,看看電視劇,學(xué)學(xué)當(dāng)大廚。
但在下載電視劇的時(shí)候發(fā)現(xiàn),一個(gè)一個(gè)下載太麻煩了。這不符合程序媛的習(xí)慣。我的口號(hào)是“能拿程序完成的,絕不用人工完成”。
分析需求:
程序媛的我現(xiàn)在要求希望一鍵下載,全部自動(dòng)完成,無需人工干預(yù)
大體規(guī)劃:
準(zhǔn)備采用python語言完成
代碼不超過30行,準(zhǔn)備搞定此事
項(xiàng)目實(shí)施:
1. 裝好迅雷軟件
2. 準(zhǔn)備開發(fā)環(huán)境
python 2.7
3.開發(fā)工具:pyCharm 2019.3
4. 開始編碼
a) 第一段依賴庫導(dǎo)入
re是正則表達(dá)式的庫,urllib是url操作模塊,Tk是剪貼板
b) 第二段獲取網(wǎng)頁的源碼
c) 第三段通過正則表達(dá)式的分組功能,開始獲取電視劇下載的URL地址,綠色部分可根據(jù)網(wǎng)站URL的結(jié)構(gòu)進(jìn)行正則表達(dá)式的調(diào)整
d) 將下載地址組織好后,拷貝到剪切板,并觸發(fā)迅雷的下載
e) 一個(gè)main方法,作為調(diào)用程序的入口點(diǎn),綠色部分可改為你想下載視頻的網(wǎng)站頁面地址
現(xiàn)在只需要run起來,就直接跳出迅雷下載了,所有的下載地址我們已經(jīng)都爬到了。點(diǎn)擊“立即下載”就OK了。
總結(jié):
1. python非常容易上手
2. 爬網(wǎng)是一個(gè)經(jīng)典的使用場(chǎng)景
3. 這個(gè)代碼不但可以用來爬視頻,略加修改我們以爬各種數(shù)據(jù),例如圖片,商品信息等,總之大有用處
最后附上完整代碼,希望對(duì)大家有幫助