您的位置:首页 > 新闻资讯 >文章内容
代理IP检测:100个IP能用的仅有10个
来源:互联网 作者:admin 时间:2019-04-22 15:54:03

  大家知道代理IP检测方法吗?今天小编就来讲一讲代理IP检测问题,或许很多人都不知道为什么要对代理IP进行检测的,这是有原因的。要知道我们在网络中抓到的代理IP数量很大,但能用的往往连十之一二都不到,在使用前剔除掉不能用的IP就能提高我们的工作效率。


  首先说说思路:上次我们已经将抓到的IP和端口都放进了我们的MySQL数据表中,要验证肯定需要取出来,然后通过PHP中curl函数设置代理,再访问百度或者其他能访问到的网站,通过返回的状态码是否等于200来判断代理IP是不是可以正常使用的。


  由于代码太长,一些不必要的代码就不贴出来了,下面看看curl验证代理IP的核心代码。


  //代理IP验证方法 function GetHttpStatusCode($proxy){ $curl = curl_init(); curl_setopt ($curl, CURLOPT_PROXY, $proxy);//使用代理访问 curl_setopt($curl,CURLOPT_URL,"http://www.baidu.com");//获取内容url curl_setopt($curl,CURLOPT_HEADER,1);//获取http头信息 curl_setopt($curl,CURLOPT_NOBODY,1);//不返回html的body信息 curl_setopt($curl,CURLOPT_RETURNTRANSFER,1);//返回数据流,不直接输出 curl_setopt($curl,CURLOPT_TIMEOUT,5); //超时时长,单位秒 curl_exec($curl); $rtn= curl_getinfo($curl,CURLINFO_HTTP_CODE); curl_close($curl); return $rtn; }


  调用GetHttpStatusCode(代理IP地址:端口)方法就能返回该代理IP在访问百度首页时所返回的状态码,在需要的地方对状态码进行判断就能加以利用了。


代理IP检测:100个IP能用的仅有10个


  我在数据表中加入了抓取到代理IP的时间和代理IP被验证的时间,已经存活的时间,这样代理IP的稳定性就一目了然了。


代理IP检测:100个IP能用的仅有10个


  代理IP检测的结果,整整100个IP,最后就剩下10个左右,看来在使用之前对代理IP进行验证还是很有必要的。


  由上可见,其实免费的代理IP有效率是非常低的,建议在使用之前需要先进行坚持的,或者是使用机灵代理,95%以上的有效率,不需要检测也能直接使用。


相关文章内容简介
推荐阅读
  • 02 2019-07
    难道HTTP代理比SOCKS5代理好用?

    难道HTTP代理比SOCKS5代理好用?说起HTTP代理IP,很多朋友都知道,也知道怎么使用,然而说起SOCKS5代理IP,很多朋友都是一脸茫然,那是什么玩意,用来做什么的。很多朋友咨询代理IP时,看到机

  • 23 2019-05
    爬虫要了解代理IP等反反爬虫技术

    爬虫要了解代理IP等反反爬虫技术,学习爬虫,是需要了解关于代理IP的一些知识,当然了,仅仅是了解代理IP也是不够了,还有各种反爬虫,不然写的爬虫无法找到突破口进行抓取信息的。另外

  • 20 2019-06
    没有突破反爬虫是代理ip质量不行吗?

    没有突破反爬虫是代理ip质量不行吗?爬虫程序有时候突然不工作了,之前明明是可以的,哪里出问题了?

  • 04 2019-04
    下载图片最快的方法--用IP代理绕过限制爬取

    我们需要下载大量的资料时,人工下载不知得何年何月了。就比如下载图片,一个一个下载,操作繁琐,不停的重复,还没有休息,效率也没有见提上去,有没有更快的下载方法呢?

  • 24 2019-06
    爬虫代理怎么使用?

    爬虫代理怎么使用?换IP是个很常见的问题,不能自动获取,那就重启等等,如果需要使用代理呢?

  • 03 2019-06
    http代理辅助信息采集

    http代理辅助信息采集,起到的作用比较大。比如说,随着经济的不断增长,国家二胎政策的开放,教育机构,学校的开设可谓是增增日上。那么作为家长,如何在孩子的第一个学校-幼儿园的公

在线客服
大客户VIP渠道
点击这里给我发消息
讨论QQ群
HTTP代理IP爬虫
客服电话
13318873961