您的位置:首页 > 新闻资讯 >文章内容
恶意“爬虫”的几个特征,租用IP代理也上黑名单
来源:互联网 作者:admin 时间:2019-04-18 14:43:11

  恶意“爬虫”的几个特征,租用IP代理也上黑名单。爬虫其实最早是用作搜索引擎的,但也可以作用批量收集信息,有些还被称为恶意“爬虫”,这是为何?


  所谓恶意“爬虫”,就是部分航空服务代理人通过“爬虫”非法抓取航空公司B2C网站或官方App等平台上的机票信息,然后非法倒卖给他人以牟取利益。部分代理人利用“爬虫”爬取下票务信息后,再利用虚假的身份信息预订机票,但不付款。在航空公司允许的订票账期付款内,转售给真正需要购票的用户。这就导致部分机票并未售出,但是用户在航空公司查看时却显示已售罄。该行为称之为“虚假占座”。


恶意“爬虫”的几个特征,租用IP代理也上黑名单


  恶意“爬虫”造成用户信息的泄露,浪费了航空公司带宽资源,白白消耗航空查询费用;而“虚假占座”不仅给航空公司和用户带来经济损失,损害了用户的合法权益,也扰乱航空公司的正常运营。更关键的是:由此带来订票量的波动导致航空公司收益管理系统算法产生误判,给出不符合实际情况的运价调整,损伤了用户权益以及平台的口碑。


  在国务院颁布五一劳动节假期安排后的72小时里内,多家航空公司网站的“爬虫”流量暴增。其中,虚假查票占总查询总量的36%以上,部分航空公司的虚假查票数字甚至高达99%。


  在长期反欺诈的攻防实战中,总结出了恶意“爬虫”的几个特征:


  1.同一设备上有规模化的访问和操作:“爬虫”的目的是最短时间内抓取最多信息,因此同一设备会有大量离散的行为,包括访问、浏览、查询等。


  2.访问来源IP地址异常:正常情况下用户在查询、购买时,用户的IP地址比较稳定,而且访问来源IP比较;“爬虫”、“虚假占座”等操作时,IP来源地址呈现不同维度上的聚集,而且浏览、查询、购票等操作时不停变化IP地址。


  3.访问的目标网页比较集中:“爬虫”代理人目标明确,主要是爬取班次、价格、数量等核心信息,因此只浏览访问几个固定页面,不访问其他页面。


  4.操作多集中非业务时间段:“爬虫”程序运行时间多集中在无人值守阶段。凌晨1-5点是恶意“爬虫”的运行高峰时段。此时系统监控会放松,而且平台的带宽等资源占用少,爬虫密集的批量爬取不会对带宽、接口造成影响。


  5.查询订票等行为很有规律:由于“爬虫”是程序化操作,按照预先设定的流程进行访问等,因此呈现出毫无思维、但很有规律、有节奏且持续的行为。


  6.设置UA模拟浏览器和频繁使用代理IP:很多“爬虫”程序伪装成浏览器进行访问,比如在程序头或者UA中默认含有类似python-requests/等固定字符串;并且通过购买或者租用的云服务、改造路由器、租用IP代理、频繁变更代理IP等进行访问。


  以上是介绍了关于恶意“爬虫”的几个特征,租用IP代理也上黑名单,如果租用的IP代理不好使用,被发现了,分分钟被拉进黑名单。


相关文章内容简介
推荐阅读
  • 18 2019-07
    免费代理ip适合谁用?

    免费代理ip适合谁用?完全免费的东西向来令人趋之若鹜,就算这东西没有多少价值甚至毫无用处,但是就凭这“免费”二字自身就散发着令人着迷的魅力。现在要说的是免费代理ip,它有效率

  • 20 2019-06
    数据收集遇到IP限制用爬虫代理

    数据收集遇到IP限制用爬虫代理,这是最有效的方法了。大数据时代的快速发展,数据收集也尤为重要,特别是对于迫切需要转型的传统企业和急需发展的中小企业。我们应该如何从大数据中挑

  • 04 2019-03
    爬虫代理IP的获取方式有哪些,该怎么选择呢

    ​随着互联网的迅猛发展,爬虫工作日益重要,而爬虫工作者一般都绕不过代理IP这个问题,为什么呢,这是因为在网络爬虫抓取信息的过程中,抓取频率高过了目标网站的设置阀值

  • 01 2019-05
    用代理服务器的好坏影响

    用代理服务器的好坏影响都有哪些?一般都是了解代理服务器使用的好处,但是对代理服务器的影响并没有怎么了解的,本文详细为大家介绍下。

  • 23 2019-04
    怎么找到合适的代理IP访问网站?

    怎么找到合适的代理IP访问网站?都知道现在是数据时代,而获取这些数据去分析的过程中,肯定是会遇到一些问题的,比如各种反爬虫机制,找个合适的代理IP是很重要的应对措施,关键是找

  • 22 2019-05
    代理IP配合移动网络营销效果更好

    代理IP配合移动网络营销效果更好,4G时代,碎片化时间越来越多,手机客户端占据了我们空余时间,君不见地铁上到处都是手机控,手机看书、手机微博、手机人人网、手机LBS、手机淘宝等等

在线客服
大客户VIP渠道
点击这里给我发消息
讨论QQ群
HTTP代理IP爬虫
客服电话
13318873961