您的位置:首页 > 新闻资讯 >文章内容
Python怎么绕过验证码问题?
来源:互联网 作者:admin 时间:2019-03-05 17:07:56

  使用网络不可避免的会遇到验证码,或者在登录账号时出现验证码,或者在访问过快时出现验证码,实在是太烦恼了,能不能绕过验证码呢?可以利用Python实现吗?


  验证码被设计出来主要是用于验证你是一个真正的人还是机器,来防止电脑自动填写表单。但是随着深度学习和计算机视觉的兴起,它们现在往往很容易被攻破。下面来了解下Python怎么绕过验证码问题,以图形验证码为例:


  首先寻找测试网站,验证码一般如下:


Python怎么绕过验证码问题?


  1.可以看出有微弱的干扰线和较强的干扰点,如何处理呢?进行灰度处理,把彩色验证码图片转为灰色的图片。


  2.二值化处理,将图片处理为只有黑白两色的图片,这里发现干扰线没有了,这就意味着我们只需要处理干扰点即可。


Python怎么绕过验证码问题?


  3.降噪处理,去除小黑点,也就是孤立的黑色像素点,获得验证码。


  4.分割,我们可以看到,每一张验证码都有四个字符,通过观察收集的训练集,我们可以知道字符的类型。根据字符的类型,我们先新建几个文件夹,用于存储分割后的验证码图片。然后根据之前保存下来的验证码训练集的答案,对处理好的验证码图片进行分割并保存。


  5.选取特征值,首先我们要明白,并不能直接将图像与其对应的字符相匹配,而是将图像与图像的特征值相匹配,再将图像的特征值与相应的字符相匹配。所以要对图像里的文字进行识别,首先要提取出该图像中的特征值。每个图像可以有多个特征值,我们将图像的所有特征值组成一条向量,将图像与它的特征向量相匹配。


  但是,根据选取规则的不同,一个图像可以有不同的特征向量。例如:选取图像不同颜色点的个数组成特征向量、选取图像不同颜色像素点占总像素点的比例组成特征向量等。因此,我们需要先确定一个特征向量的选取规则,之后可根据识别效果对选取规则进行修改。


  在确定了选取规则后,我们便可以提取每张验证码的特征向量了。在此之后,我们可以再做一步工作,即将训练集中每张验证码的特征向量按照其对应字符存储下来,找到特征值并保存下来,以便之后的识别。


  6.简单的识别,按常规而言,完成特征向量的提取,我们应该要用这些特征向量,训练出一个模型。但事实上,得到了这些特征向量之后,我们就已经能够对验证码进行简单的识别了。


  对于一张新获得的验证码,我们需要对它进行与处理训练集相同的处理操作(灰度化、二值化、去噪、分割等),并用相同的规则得到它的特征向量(记为V)。之后我们只需要遍历训练集,找到与V最“接近”的向量,并得到该向量所对应的字符。


  以上介绍了关于Python怎么绕过验证码问题,仅供大家参考。若是认为此方法比较麻烦的,也可以选择使用其他的识别方法,或者是人工打码的。


 


相关文章内容简介
推荐阅读
  • 06 2020-07
    代理ip的需求十分庞大

    大家都说这是一个网络的新时代,自从网络在人们的工作、生活上广泛应用之后,我们与网络的连接就已经无时无刻建立起来了。

  • 01 2019-03
    搭建多线程代理ip池的思路

    大家选择代理IP,是根据哪些因素进行选择的?可以找免费的代理IP吗?这样比较省钱,有没有什么缺点?如何获取到免费的代理IP呢?

  • 26 2020-05
    高匿名代理ip的好处

    随着互联网的普及与高速发展,人们对于网络的依赖也愈加强。代理IP的用途也越来越广,很多人都喜欢在上网的时候使用代理IP,我们在使用代理IP的过程中发现代理IP也有着各种不同类型,这

  • 26 2020-04
    ip代理软件能顶替传统网线吗

    很多游戏工作室为了可以多开防封都会开通多条网线,通过不同的网线变换账号从而模拟出多个ip操作的假象,这样就不会被平台封禁了。但是这种方法的成本高昂,一条网线就要几百块,算下

  • 29 2019-10
    HTTP代理服务的好处

    我们访问互联网,是通过输入网站的网址开始的。输入正确的网址之后,就能够跳转到我们想要去的网战。"www"开头的网站使用的协议就是HTTP协议,它是网络中最普遍最常见的网络通信方式。今

  • 09 2020-09
    还能用IP代理软件刷单吗

    IP代理软件现在使用的用途很多,例如注册帐号、隐藏IP、营销群发等,最重要的还有换IP刷单了,刷单也分为很多种,淘宝、京东还有其他第三方平台。那么,刷单需要注意哪些问题呢?

在线咨询
大客户经理
大客户经理
1829380381
13316264505

大客户经理微信

微信公众号

微信公众号

回到顶部