您的位置:首页 > 新闻资讯 >文章内容
爬虫代理有哪些分类
来源:本站 作者:admin 时间:2019-02-27 16:57:48

对于爬虫来说,由于爬虫爬取速度过快,在爬取过程中可能遇到同一个IP访问过于频繁的问题,此时网站就会让我们输入验证码登录或者直接封IP,这样会给爬取带来极大的不便。使用代理隐藏真实的IP,让服务器误以为是代理服务器在请求自己。这样在爬取过程中通过不断更换代理,就不会被封锁,可以达到很好的爬取效果。 


代理分类时,既可以根据协议区分,也可以根据其匿名程度区分。 


一、根据代理的协议,代理可以分为如下类别


1.FTP代理服务器:主要用于访问FTP服务器,一般有上传、下载以及缓存功能,端口一般为21、2121等。 


2.HTTP代理服务器:主要用于访问网页,一般有内容过滤和缓存功能,端口一般为80、8080、3128等。 


3.SSL/TLS代理:主要用于访问加密网站,一般有SSL或TLS加密功能(最高支持128位加密强度),端口一般为443。 


4.RTSP代理:主要用于访问Real流媒体服务器,一般有缓存功能,端口一般为554。 


5.Telnet代理:主要用于telnet远程控制(黑客入侵计算机时常用于隐藏身份),端口一般为23。 


6.POP3/SMTP代理:主要用于POP3/SMTP方式收发邮件,一般有缓存功能,端口一般为110/25。 7.SOCKS代理:只是单纯传递数据包,不关心具体协议和用法,所以速度快很多,一般有缓存功能,端口一般为1080。SOCKS代理协议又分为SOCKS4和SOCKS5,前者只支持TCP,而后者支持TCP和UDP,还支持各种身份验证机制、服务器端域名解析等。简单来说,SOCK4能做到的SOCKS5都可以做到,但SOCKS5能做到的SOCK4不一定能做到。


二、根据代理的匿名程度,代理可以分为如下类别


1.高度匿名代理:会将数据包原封不动地转发,在服务端看来就好像真的是一个普通客 户端在访问,而记录的IP是代理服务器的IP。 


2.普通匿名代理:会在数据包上做一些改动,服务端上有可能发现这是个代理服务器,也有一定几率追查到客户端的真实IP。代理服务器通常会加入的HTTP头有HTTP_VIA和HTTP_X_FORWARDED_FOR。 


3.透明代理:不但改动了数据包,还会告诉服务器客户端的真实IP。这种代理除了能用缓存技术提高浏览速度,能用内容过滤提高安全性之外,并无其他显著作用,最常见的例子是内网中的硬件防火墙。


4.间谍代理:指组织或个人创建的用于记录用户传输的数据,然后进行研究、监控等目的的代理服务器。


相关文章内容简介
推荐阅读
  • 20 2020-02
    代理ip刷阅读量可行吗

    网络推广是被线上产品提高知名度的一种宣传方式,那么就会发一些关于自己产品为中心的优势功能等的软网,还有一些作者写一些文章没有流量,阅读量太少,很多阅读者不会点击打开阅读文

  • 25 2019-03
    视频刷量原理,利用代理IP更换IP刷访问量

    近些年,我们的网络发展非常迅速,大家不管是娱乐还是工作,都离不开网络的。以前大家可能都是通过电视机看电视,但现在直接通过网络便能看到这些电视剧。不过有时候,大家可能对这些

  • 15 2019-04
    高匿代理IP用的好,不怕查水表!

    高匿代理IP用的好,不怕查水表!为什么这样讲呢?大家可能对代理的认识还不深,不太了解的。我们先去了解下代理。

  • 09 2019-10
    phantomjs怎么设置代理IP?

    java使用selenium,phantomjs进行模拟浏览器访问,请问如何在不重新启动phantomjs的情况下修改代理IP?查阅了相关资料,selenium 官方文档都没有说明,想必是不支持的,那么我们不妨考虑直接用 phantomjs

  • 18 2019-06
    筛选一款好用的企业IP代理

    筛选一款好用的企业IP代理,这可不容易呐,现在的IP代理市场混杂的,大大小小的IP代理商都有的,而且很多都夸大了,不少人都是趟过不少水才找到好用的。

  • 16 2019-12
    选择代理ip需要考虑什么?

    选择代理ip需要考虑什么?现在市面上代理ip软件​非常多,让大家真的是不好选择。那么我们在购买代理ip要考虑哪些因素来进行选择呢?今天机灵代理小编就来给大家介绍下:

在线咨询
大客户经理
大客户经理
1829380381
13316264505

大客户经理微信

微信公众号

微信公众号

回到顶部