爬蟲遇到ip被禁的處理方式

有時候爬蟲會遇到ip被禁的情況,這時候可以找代理網(wǎng)站,抓取ip,做動態(tài)輪詢。也可以使用別人做的第三方ip代理平臺,比如Crawler,就是利用代理IP地址池做分布式下載的第三方平臺,除了scrapy、普通java、php、python等。
 
 
現(xiàn)在我們可以總結(jié)所有步驟:
 
1.使用爬蟲腳本每天定時抓取代理網(wǎng)站上的免費(fèi)ip,或者購買一定量的ip,寫入MongoDB或其他數(shù)據(jù)庫。此表用作原始表。

2.在使用它之前,你需要做一個步驟測試,即測試ip是否有效。方法是用curl訪問網(wǎng)站檢查返回值,需要新建一個表,循環(huán)讀取原表并在有效時插入,驗(yàn)證后從原表中刪除。在驗(yàn)證的同時,您可以使用響應(yīng)時間來計(jì)算ip的質(zhì)量和最大使用次數(shù),有一種算法可以參考基于連接代理優(yōu)化管理的多線程網(wǎng)絡(luò)爬蟲處理方法。
 
3.將有效ip寫入IP模擬器代理的配置文件,并重新加載配置文件。
 
4.讓爬蟲程序去指定的服務(wù)ip和端口并抓取它。
 
主站蜘蛛池模板: 欧美日韩亚洲成人| 午夜欧美精品久久久久久久| 亚洲成a人片在线观看播放| avtt天堂在线| 最近中文字幕更新8| 免费视频中文字幕| 欧美浮力第一页| 夫前被强行侵犯在线观看| 么公的又大又深又硬想要| 精品久久久影院| 国产日韩精品欧美一区| 一本大道香蕉视频在线观看| 欧美国产亚洲精品高清不卡| 午夜无码A级毛片免费视频| 顶级欧美妇高清xxxxx| 国内自拍青青草| 中文字幕在线观看一区二区 | 美女被到爽羞羞漫画| 国产精品无码不卡一区二区三区 | 看AV免费毛片手机播放| 国产成人a大片大片在线播放| a级大片免费观看| 性欧美乱妇高清COME| 乱码在线中文字幕加勒比| 欧美激情第一区| 制服丝袜日韩欧美| 国产chinese91在线| 在线免费观看国产视频| 久久91精品久久91综合| 欧美三级不卡在线观看视频 | 99国产精品自在自在久久| 日本免费一区二区在线观看| 亚洲欧美一区二区三区二厂| 美女视频黄.免费网址| 国产日韩一区二区三区在线观看 | 久久亚洲精品中文字幕| 欧美成人精品第一区| 免费无码又爽又刺激毛片| 香港经典a毛片免费观看看| 国产成人精品午夜视频'| 99re6在线精品视频免费播放|