您的位置:首页 > 新闻资讯 >文章内容
Python怎么绕过验证码问题?
来源:互联网 作者:admin 时间:2019-03-05 17:07:56

  使用网络不可避免的会遇到验证码,或者在登录账号时出现验证码,或者在访问过快时出现验证码,实在是太烦恼了,能不能绕过验证码呢?可以利用Python实现吗?


  验证码被设计出来主要是用于验证你是一个真正的人还是机器,来防止电脑自动填写表单。但是随着深度学习和计算机视觉的兴起,它们现在往往很容易被攻破。下面来了解下Python怎么绕过验证码问题,以图形验证码为例:


  首先寻找测试网站,验证码一般如下:


Python怎么绕过验证码问题?


  1.可以看出有微弱的干扰线和较强的干扰点,如何处理呢?进行灰度处理,把彩色验证码图片转为灰色的图片。


  2.二值化处理,将图片处理为只有黑白两色的图片,这里发现干扰线没有了,这就意味着我们只需要处理干扰点即可。


Python怎么绕过验证码问题?


  3.降噪处理,去除小黑点,也就是孤立的黑色像素点,获得验证码。


  4.分割,我们可以看到,每一张验证码都有四个字符,通过观察收集的训练集,我们可以知道字符的类型。根据字符的类型,我们先新建几个文件夹,用于存储分割后的验证码图片。然后根据之前保存下来的验证码训练集的答案,对处理好的验证码图片进行分割并保存。


  5.选取特征值,首先我们要明白,并不能直接将图像与其对应的字符相匹配,而是将图像与图像的特征值相匹配,再将图像的特征值与相应的字符相匹配。所以要对图像里的文字进行识别,首先要提取出该图像中的特征值。每个图像可以有多个特征值,我们将图像的所有特征值组成一条向量,将图像与它的特征向量相匹配。


  但是,根据选取规则的不同,一个图像可以有不同的特征向量。例如:选取图像不同颜色点的个数组成特征向量、选取图像不同颜色像素点占总像素点的比例组成特征向量等。因此,我们需要先确定一个特征向量的选取规则,之后可根据识别效果对选取规则进行修改。


  在确定了选取规则后,我们便可以提取每张验证码的特征向量了。在此之后,我们可以再做一步工作,即将训练集中每张验证码的特征向量按照其对应字符存储下来,找到特征值并保存下来,以便之后的识别。


  6.简单的识别,按常规而言,完成特征向量的提取,我们应该要用这些特征向量,训练出一个模型。但事实上,得到了这些特征向量之后,我们就已经能够对验证码进行简单的识别了。


  对于一张新获得的验证码,我们需要对它进行与处理训练集相同的处理操作(灰度化、二值化、去噪、分割等),并用相同的规则得到它的特征向量(记为V)。之后我们只需要遍历训练集,找到与V最“接近”的向量,并得到该向量所对应的字符。


  以上介绍了关于Python怎么绕过验证码问题,仅供大家参考。若是认为此方法比较麻烦的,也可以选择使用其他的识别方法,或者是人工打码的。


 


相关文章内容简介
推荐阅读
  • 25 2019-03
    scylla可作爬虫的代理IP池吗?搭建代理IP池方法

    网站平台出于各方面的考虑,都会有自己的一些保护措施,为了避免禁止恶意爬虫的大量采集给网站造成不好的影响,网站的反爬虫机制越加完善。这对于网络爬虫来说,这并不是一件好事,越

  • 19 2019-08
    代理IP的直接转发与隧道转发有什么区别?

    使用代理IP的时候,不知道你是否有留意过会出现直连IP、隧道IP,这两种形式。这两种形式有什么区别呢,在选用代理IP的时候又应该选择哪一种更方便呢?

  • 04 2019-08
    改变本地IP地址的几个方法

    改变本地IP地址的几个方法,为什么要换ip?简单的来说,就是工作和生活的需要,需要通过改变ip地址来突破对方的ip限制。现实中,每天上网的时候,我们的ISP,会为我们计算机分配一个IP地

  • 30 2019-09
    用代理IP怎么连接外网?

    windows系统如果需要访问外网,像是连接外部软件进行操作,应该怎么开展呢?如果你需要从本地PC端访问Redis实例进行数据操作,可以通过在ECS上配置端口映射或者端口转发实现。

  • 07 2019-11
    代理IP为什么移动IP资源少?

    代理IP中的IP地址是怎么来的?其实代理IP与我们普通使用的IP来源没有区别,都是通过通讯运营商来提供的。

  • 27 2019-02
    爬虫代理有哪些分类

    ​对于爬虫来说,由于爬虫爬取速度过快,在爬取过程中可能遇到同一个IP访问过于频繁的问题,此时网站就会让我们输入验证码登录或者直接封IP,这样会给爬取带来极大的不便。

在线咨询
大客户经理
大客户经理
1829380381
13316264505

大客户经理微信

微信公众号

微信公众号

回到顶部