突破反爬蟲的利器——開源動態ip池

突破反爬蟲的常用方法是使用代理ip。對于初學者或個人來說,購買一些代理ip的成本略高。因此,最近編寫了一個開源項目IPProxys,為個人提供代理IP。
 
IpProxys原理:通過抓取各大代理網站提供的免費代理ip,進行去重,驗證ip的可用性,將有效IP存儲在sqlite中,為爬蟲獲取IP提供HTTP接口。
 
IPProxys項目已經上傳到github,鏈接是https://github.com/qiyeboy/IPProxys.以下是整個項目的描述。
 
Api包:主要實現http服務器,提供api接口(通過get請求返回json數據)。
 
數據文件夾:主要指數據庫文件和qqwry.dat的存儲位置(可以查詢ip的地理位置)。
 
Db包:主要封裝一些數據庫操作。
 
蜘蛛包是爬蟲的核心功能,在代理網站上抓取代理ip。
 
測試包:測試一些用例,不參與整個項目的運行。
 
Util包:提供一些工具類。其中ipAddress.py查詢IP的地理位置。
 
驗證包:用于測試ip地址是否可用。
 
Config.py:主要是配置信息(包括配置ip地址的解析方法和數據庫的配置)。
 
整個項目代碼量很小,大家可以根據自己的需要進行修改,也可以提出自己的想法和建議,幫助我完善這個項目。
 
如何使用IPProxys項目?
 
1.將項目目錄克隆到當前文件夾。
 
$ git克隆
 
2.切換項目目錄。
 
$ cd IPProxys
 
3.運行腳本。
 
python IPProxys.py
 
窗口運行效果如下圖所示:
 
 
項目依賴關系:
 
需要安裝Sqlite數據庫。
 
安裝請求庫:pip安裝請求。
 
install lxml:apt-get install python-lxml。
 
ipProxys運行時,外部爬蟲如何獲取IP?
 
外部爬蟲只需要向IPProxys所在主機的端口8000發送GET請求。獲取請求的參數
 
動態IP模擬器
 
 
 
 
主站蜘蛛池模板: 一女多男np疯狂伦交| 亚洲aaa视频| 精彩视频一区二区三区| 国产成人aaa在线视频免费观看| 99久久精品午夜一区二区| 性中国videossex古装片| 久久久久人妻一区精品色| 末成年美女黄网站色大片连接| 亚洲欧美日韩国产精品26u| 男女超爽视频免费播放| 四虎影视精品永久免费网站| 国产精品婷婷久青青原| 国产精品第十页| 亚洲欧美一区二区三区在线| 精品亚洲麻豆1区2区3区| 国产AV一区二区三区无码野战| 黄色三级免费看| 国产精品久久久久9999高清| 91精品国产色综合久久不卡蜜| 日本a级视频在线播放| 亚洲精品国产国语| 精品久久久无码人妻字幂| 四虎影院海外永久| 草莓视频污在线观看| 国产剧情在线播放| 黄大片a级免色| 国产成年无码久久久久毛片| 你懂的免费视频| 国产精品毛片一区二区| 91精品免费观看| 在线观看中文字幕码| a级毛片在线视频免费观看| 好吊妞欧美视频免费| 一区二区在线看| 婷婷开心深爱五月天播播| 一本一本久久aa综合精品| 成人免费v片在线观看| 中文字幕22页| 成人在线免费网站| 丰满岳乱妇一区二区三区| 无码国内精品人妻少妇蜜桃视频|