selenium+python設(shè)置爬蟲動(dòng)態(tài)ip的方法

selenium+python設(shè)置爬蟲代理IP的方法
1.設(shè)置后臺(tái)
是使用selenium瀏覽器渲染技術(shù),當(dāng)我們爬取某個(gè)網(wǎng)站的信息時(shí) ,一般情況下,速度不是特別快。 另外,需要使用selenium瀏覽器渲染技術(shù)進(jìn)行爬取的網(wǎng)站,反爬蟲響應(yīng)技術(shù)都比較強(qiáng)大,對(duì)IP訪問的頻率有很大的限制。 因此,如果要提高selenium爬取數(shù)據(jù)的速度,可以從兩個(gè)方面入手: 
 
第一,爬取頻率要提高,出現(xiàn)的驗(yàn)證信息 破解一般是驗(yàn)證碼或者用戶登錄。  
 
第二個(gè)方面是使用多線程+代理IP。 這種方法需要電腦有足夠的內(nèi)存和足夠穩(wěn)定的代理IP。  
 
2。 為chrome
 
動(dòng)態(tài)IP模擬器設(shè)置代理IP
 
注意:
一、選擇一個(gè)穩(wěn)定固定的代理IP。 不要選擇動(dòng)態(tài)代理IP。 我們常用的爬蟲IP代理一般都是高度匿名的動(dòng)態(tài)IP,保密性高,通過撥號(hào)動(dòng)態(tài)生成,時(shí)效很短,一般3分鐘左右。 非常適合高并發(fā)不需要登錄的爬蟲,比如scrapy,但是不適合瀏覽器渲染的爬蟲。  
 
二、選擇更快的代理IP。 因?yàn)閟elenium爬蟲使用瀏覽器渲染技術(shù),這種瀏覽器渲染技術(shù)天生就慢。 如果選擇的代理IP較慢,則爬取時(shí)間會(huì)進(jìn)一步增加。  
 
三、必須有足夠的電腦內(nèi)存。 由于chrome占用大量?jī)?nèi)存,在高并發(fā)的情況下,很容易導(dǎo)致瀏覽器崩潰,即程序崩潰。  
 
四、程序最后調(diào)用browser.quit()清除瀏覽器緩存。  
 
3。 需要用戶名和密碼認(rèn)證的代理 
 
主站蜘蛛池模板: 亚洲男人的天堂在线播放| 久久久久久国产精品免费免费| 1024视频在线| 成人黄软件网18免费下载成人黄18免费视频 | 久久久久噜噜噜亚洲熟女综合| 男人操女人视频网站| 女人扒开裤子让男人捅| 亚洲av无码不卡在线播放| 精品亚洲欧美无人区乱码| 国产日韩成人内射视频| hkpic比思特区东方美人| 日韩欧美无线在码| 亚洲精品高清国产一久久| 被cao的合不拢腿的皇后| 国产羞羞视频在线播放| 中文字幕天天躁日日躁狠狠躁免费 | 日本护士xxxxwww| 亚洲日韩乱码中文无码蜜桃臀| 美女扒开胸罩露出奶了无遮挡免费| 国产精品久久国产精品99盘 | youjizzcom最新中国| 日本电影中文字幕| 久久综合伊人77777| 激情三级hd中文字幕| 国产123区在线视频观看| 两个人看的视频播放www| 女人被免费视频网站| 一级特级黄色片| 日本韩国视频在线观看| 亚洲欧美另类中文字幕| 精品区卡一卡2卡三免费| 国产又色又爽又黄刺激在线视频| 91精品欧美一区二区综合在线| 成人一级黄色片| 久久精品a亚洲国产v高清不卡| 欧美激情xxxx性bbbb| 免费现黄频在线观看国产| 视频免费1区二区三区| 国产理论在线观看| 97人妻无码一区二区精品免费| 成年性生交大片免费看|