您的位置:首页 > 新闻资讯 >文章内容
IP失效太多?怎么进行代理IP的有效性检测
来源:互联网 作者:admin 时间:2019-03-22 17:46:55

  在写网络爬虫时需要加入代理IP,若是不调用代理IP,其效果是非常差的,特别是使用免费的代理IP。这需要在使用之前,需要进行代理IP的有效性检测。


  因此,大家在做爬虫的时候,会事先爬取很多的代理ip作为备用,但是有些可能还用,有些可能就失效了。这会让程序会因此变得不甚稳定,最好可以在爬虫运行之前,保证代理IP的高可用性。比如,对这些代理IP进行清洗,找到有效的代理IP。


  我个人认为,测试代理IP有效性还是得从服务器端下手,毕竟代理IP是要去访问真正的服务器端的。所以在服务器端进行验证最合适不过了。服务器端验证完毕之后,将结果返回给客户端,如此“清洗”工作就可以据此完成。保留有效的代理IP,去除失效的代理IP。


  代码如下:


IP失效太多?怎么进行代理IP的有效性检测


  清洗效果:


IP失效太多?怎么进行代理IP的有效性检测


  另外有没有更简单的方法?怎样快速判断代理ip是否可用?可以尝试:


  在命令行下输入telnet XXX.XX.XX.XXX XX


  即 telnet ipaddress port


  例如: telnet 213.197.81.50 3128


  如果连接上,说明有效


  当然,测试代理IP有效性的方法有很多,仅供参考。要想提高爬取的效果,建议还是需要购买付费版的代理IP使用的(如:代理精灵),即使免费也耗费大量的时间,时间也是成本,这非常不划算。


相关文章内容简介
推荐阅读
  • 15 2019-06
    国外可以使用ip代理吗?

    国外可以使用ip代理吗?平常我们是可以翻墙的,这样即使身在国内也能看到国外的信息,那么反过来行不行呢?也就是说在国外看国内的信息。这到底可不可以啊!

  • 20 2019-03
    HTTP代理访问变慢的原因以及对策

    上文讲到HTTP代理动态转发,使用的优势比较多,但是也有缺点的,这些缺点的影响大不大?相信大家都非常关系这个问题的,下面我们去看看HTTP代理访问变慢的原因以及对策。

  • 28 2019-02
    爬虫代理:寻找可用代理ip

    假如我们高频率访问网页,会被网站发现被检测到IP,可能会导致IP被封,或者限制访问的。但为了任务,又不能放弃,这该怎么办呢?现在爬虫和反爬虫一直在斗争,这是不可避免的问题,但

  • 21 2019-03
    使用代理IP池伪装爬虫IP地址可以继续爬

    爬虫的IP地址如果没有伪装好,这是非常容易被封的,影响效率不说,还拿不到数据。因此,对于爬虫而言,代理IP池是非常重要的。如果爬虫使用了高质量的代理IP池,可以很好的伪装自己的IP

  • 02 2019-10
    独享IP的优势?如何判断独享IP代理?

    为什么有的时候用相同的爬虫策略去使用代理IP访问网站,有些IP能够成功,而有些IP却失败呢?明明都是选用的是同样的质量,但是不同的代理就在这个时候显示出差异。

  • 25 2019-09
    使用代理IP制作刷票系统(中)

    使用代理IP制作刷票系统(上)文章里面已经将系统的框架介绍完毕了,剩下的就是重头戏,代码部分了。由于代码部分的篇幅占据比较长,为了优化大家的阅读,机灵代理会划分为两个部分,这

在线咨询
大客户经理
大客户经理
1829380381
13316264505

大客户经理微信

微信公众号

微信公众号

回到顶部