Selenium

破解geetest的拖动验证码

哈呜 / 2017年6月22日

最近有个项目需要爬取“国家企业信用信息公示系统”的数据，在该网站点击搜索按钮时，会弹出极验（geetest）的拖动式验证码。遂一番google之，发现果然有哥们已经破解了这套验证码系统，甚至放出源码来了。学以致用。原理很简单，首先定位缺口的位置，然后驱 […]

哈呜 / 2015年12月31日

上两周的时候，陈怡同学问我怎么通过程序自动化截屏浏览器页面，她说有篇论文用的是python与selenium。当时我的心理活动是这样的：“卧槽selenium是什么鬼，女博士果然是见多识广。” =。=# 然后查了一下，selenium大概可以理解成一个浏览 […]