这是简单验证码识别((CSDN资源上传验证码识别率100%,久游网登陆90%))下载,工作需要接触python ,说实话,三年多的JAVA,一直在业务线上工作,这个python是什么玩意,一点概念没有,平常很难接触到,利用周末两天时间,抓紧突击了一下,感觉还不错,挺容易上手的,就是写法上,让人有点适应不了,不过,还好,上一个最简单的例子,为了突显真实性,我是直接获取的CSDN官网的验证码做的测试用例。
简单验证码识别((CSDN资源上传验证码识别率100%,久游网登陆90%))是对CSDN资源上传验证码识别率100%,对久游网登陆90%。
1.图片大小固定,默认80*20。数字个数固定,默认4,每个数字大小固定,默认20*20。
2.矢量随机角度值(默认随机量10°)和随机长度值(默认随机量10%比率)。最终图片根据随机后的点阵自动缩放大小调整。
3.有随机噪点。默认噪点比率:背景20%,数字10%。
4.噪点特征:Brightness > 50
5.数字可随机颜色。数字的Brightness均为50
1. 安装Python,选择3.X就可以(安装过程中别忘了选择PIP),选择32位的。
2. PIP方式安装Pillow(PIL没有支持Python3),网上一大堆都是安装PIL,太过时了
3. 安装pytesser,csdn上自己下载,反正好像就一个版本pytesser_v0.0.1,在python/lib/site-packages新建pytesser文件夹,并新建一个pytheeer.pth,内容就写pytesser,要不然找不到这个类库,然后解压下载的所有文件放进去,这里有一些注意的地方,在引入pytesser中的模块之后,项目中会出现Python语法不通过,不过没关系,Pytesser里面是Python2.X写法,只需要改成3.X写法就OK,如print(text);
注意:更改pytesser下的pytesser.py文件名为_init_.py,里面的tesseract_exe_name= 'C:\\Python35-32\\Lib\\site-packages\\pytesser\\tesseract’
4. PIP方式安装requests库
5. 安装Pymysql用于存储读取的验证码
6. 最后我用的开发环境是Pycharm
OK了,然后直接上测试结果,代码中有不规范的地方,误喷。