破解geetest的拖动验证码

破解geetest的拖动验证码

最近有个项目需要爬取“国家企业信用信息公示系统”的数据,在该网站点击搜索按钮时,会弹出极验(geetest)的拖动式验证码。

屏幕快照 2017-06-22 12.01.22

遂一番google之,发现果然有哥们已经破解了这套验证码系统,甚至放出源码来了。学以致用。

原理很简单,首先定位缺口的位置,然后驱动浏览器将按钮移动到该位置。至于如何定位缺口位置,其实这个验证图是分上下两张的,底图是完整图,上一层则是有缺口的图,另外这两张图都是打散的,需要先还原出原图,然后再逐像素对比两张图片就可以得到缺口位置。移动按钮看似简单,但如果只是简单的将按钮设置到目标位置,极验后台会返回“怪物吃了拼图”,因为该验证码系统会将按钮的移动轨迹提交到极验后台,并验证该轨迹是否像一个人类的行为,所以我们需要尽可能模拟出人类的拖动行为。

代码示例:

8月-11-2017 16-17-41

参考:

http://blog.csdn.net/paololiu/article/details/52514504

http://gummary.github.io/slide-verify-code/

发表评论

电子邮件地址不会被公开。 必填项已用*标注