使用Python爬蟲(chóng)怎么實(shí)現(xiàn)驗(yàn)證碼登錄?很多新手對(duì)此不是很清楚,為了幫助大家解決這個(gè)難題,下面小編將為大家詳細(xì)講解,有這方面需求的人可以來(lái)學(xué)習(xí)下,希望你能有所收獲。

import re
import urllib.request
import http.cookiejar
#from http.comkie import CookieJar 上面那句和這句等同
loginurl='https://www.douban.com/accounts/login'
cookie = http.cookiejar.CookieJar()
opener = urllib.request.build_opener(urllib.request.HTTPCookieProcessor)#在已存的Cookie下建立連接
params={}
params['form_email']='用戶名'
params['form_password']='密碼'#這里寫上已有的用戶名和密碼
params['source']='http://www.douban.com/accounts/login'
#從首頁(yè)提交登陸
response = opener.open(loginurl,urllib.parse.urlencode(params).encode('utf-8'))#urllib.parse.urlencode(params).encode('utf-8')這個(gè)是向服務(wù)
#器POST的內(nèi)容,可以打印一下response.geturl()請(qǐng)求的連接看一下
#print(response.geturl()[0:33])
#驗(yàn)證成功跳轉(zhuǎn)至登陸頁(yè)
if response.geturl()[0:33]=='https://accounts.douban.com/login':
html = response.read().decode('utf-8')
#print(html),可以先打印一下文件內(nèi)容,為了看到網(wǎng)頁(yè)元素更方便的寫正則,可以復(fù)制下來(lái),在需要獲取的地方用(.+?)表示,然后用group()元組來(lái)取得,
#驗(yàn)證圖片地址
imgurl=re.search('<img id="captcha_image" src="(.+?)" alt="captcha" class="captcha_image"/>',html)
if imgurl:
url=imgurl.group(1)
#print(url)
#將驗(yàn)證碼以v.jpg保存在本地,在輸入驗(yàn)證碼的時(shí)候可以手工輸入
res=urllib.request.urlretrieve(url,'v.jpg')
captcha = re.search('<input type="hidden" name="captcha-id" value="(.+?)"/>',html)
#print(captcha.group(1))
if captcha:
vcode=input('請(qǐng)輸入圖片上的驗(yàn)證碼:')
params["captcha-solution"] = vcode
params["captcha-id"] = captcha.group(1)#這個(gè)是動(dòng)態(tài)生成的,需要從網(wǎng)頁(yè)中獲得
params["user_login"] = "登錄"
#提交驗(yàn)證碼驗(yàn)證
response = opener.open(loginurl,urllib.parse.urlencode(params).encode('utf-8'))
if response.geturl()=="https://www.douban.com/":
print("login sucess")看完上述內(nèi)容是否對(duì)您有幫助呢?如果還想對(duì)相關(guān)知識(shí)有進(jìn)一步的了解或閱讀更多相關(guān)文章,請(qǐng)關(guān)注創(chuàng)新互聯(lián)行業(yè)資訊頻道,感謝您對(duì)創(chuàng)新互聯(lián)的支持。
當(dāng)前文章:使用Python爬蟲(chóng)怎么實(shí)現(xiàn)驗(yàn)證碼登錄-創(chuàng)新互聯(lián)
URL鏈接:http://www.yijiale78.com/article26/cdpccg.html
成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供網(wǎng)站建設(shè)、網(wǎng)頁(yè)設(shè)計(jì)公司、商城網(wǎng)站、做網(wǎng)站、服務(wù)器托管、定制開(kāi)發(fā)
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請(qǐng)盡快告知,我們將會(huì)在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如需處理請(qǐng)聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來(lái)源: 創(chuàng)新互聯(lián)
猜你還喜歡下面的內(nèi)容