您的位置:首页 > 新闻资讯 >文章内容
IP失效太多?怎么进行代理IP的有效性检测
来源:互联网 作者:admin 时间:2019-03-22 17:46:55

  在写网络爬虫时需要加入代理IP,若是不调用代理IP,其效果是非常差的,特别是使用免费的代理IP。这需要在使用之前,需要进行代理IP的有效性检测。


  因此,大家在做爬虫的时候,会事先爬取很多的代理ip作为备用,但是有些可能还用,有些可能就失效了。这会让程序会因此变得不甚稳定,最好可以在爬虫运行之前,保证代理IP的高可用性。比如,对这些代理IP进行清洗,找到有效的代理IP。


  我个人认为,测试代理IP有效性还是得从服务器端下手,毕竟代理IP是要去访问真正的服务器端的。所以在服务器端进行验证最合适不过了。服务器端验证完毕之后,将结果返回给客户端,如此“清洗”工作就可以据此完成。保留有效的代理IP,去除失效的代理IP。


  代码如下:


IP失效太多?怎么进行代理IP的有效性检测


  清洗效果:


IP失效太多?怎么进行代理IP的有效性检测


  另外有没有更简单的方法?怎样快速判断代理ip是否可用?可以尝试:


  在命令行下输入telnet XXX.XX.XX.XXX XX


  即 telnet ipaddress port


  例如: telnet 213.197.81.50 3128


  如果连接上,说明有效


  当然,测试代理IP有效性的方法有很多,仅供参考。要想提高爬取的效果,建议还是需要购买付费版的代理IP使用的(如:代理精灵),即使免费也耗费大量的时间,时间也是成本,这非常不划算。


相关文章内容简介
推荐阅读
  • 20 2019-06
    暴力爬取网站被封IP地址

    暴力爬取网站被封IP地址,毕竟这些网站又不是你家的,凭什么给你随便爬取信息啊!这么粗鲁,直接的爬取,这给对方带去了麻烦,服务器压力大,不封你封谁呢,是吧。

  • 28 2019-03
    ip怎么样才不会被检测到?这家高匿名代理好用

    当下这个网络时代,既方便了大家但也带来一定的影响,网络数据传得快,保密性不好,因此有些开始注意保护自己得信息,对于IP地址这一块,大家有什么想法呢?ip怎么样才不会被检测到?

  • 03 2019-06
    数据采集光有代理IP还不够

    数据采集光有代理IP还不够,还需要突破其他的反爬虫,例如伪造User-Agent和伪造cookies等等。本文就如何解决这个问题总结出一些应对措施,这些措施可以单独使用,也可以同时使用,效果更好

  • 15 2019-07
    用代理IP老是失败怎么回事?

    用代理IP老是失败怎么回事?估计大家在使用爬虫程序的时候,很容易遇到这个问题。做网络工作的朋友也会经常遇到这样得问题,例如说是在访问某个网站得时候加载得速度实在是太慢了,于

  • 10 2019-05
    免费代理IP到处有就是不好用

    免费代理IP到处有就是不好用,在网络上一搜索“免费代理IP”估计都出来好几页,还有些提供的免费IP资源非常多,定时发布出来,起码看起来是很多的。但是你试试去检测下,保证能用的非常

  • 23 2019-08
    用了代理IP 真实IP还是能被查到?

    为什么明明用了代理IP,IP地址还是能够被别人查到呢?你有可能使用的普通匿名代理,通过一定的解密,不法黑客以及犯罪份子就可以进行破解,盗取你的个人信息加以利用。

在线客服
大客户VIP渠道
点击这里给我发消息
讨论QQ群
HTTP代理IP爬虫
客服电话
13318873961