您的位置:首页 > 新闻资讯 >文章内容
恶意“爬虫”的几个特征,租用IP代理也上黑名单
来源:互联网 作者:admin 时间:2019-04-18 14:43:11

  恶意“爬虫”的几个特征,租用IP代理也上黑名单。爬虫其实最早是用作搜索引擎的,但也可以作用批量收集信息,有些还被称为恶意“爬虫”,这是为何?


  所谓恶意“爬虫”,就是部分航空服务代理人通过“爬虫”非法抓取航空公司B2C网站或官方App等平台上的机票信息,然后非法倒卖给他人以牟取利益。部分代理人利用“爬虫”爬取下票务信息后,再利用虚假的身份信息预订机票,但不付款。在航空公司允许的订票账期付款内,转售给真正需要购票的用户。这就导致部分机票并未售出,但是用户在航空公司查看时却显示已售罄。该行为称之为“虚假占座”。


恶意“爬虫”的几个特征,租用IP代理也上黑名单


  恶意“爬虫”造成用户信息的泄露,浪费了航空公司带宽资源,白白消耗航空查询费用;而“虚假占座”不仅给航空公司和用户带来经济损失,损害了用户的合法权益,也扰乱航空公司的正常运营。更关键的是:由此带来订票量的波动导致航空公司收益管理系统算法产生误判,给出不符合实际情况的运价调整,损伤了用户权益以及平台的口碑。


  在国务院颁布五一劳动节假期安排后的72小时里内,多家航空公司网站的“爬虫”流量暴增。其中,虚假查票占总查询总量的36%以上,部分航空公司的虚假查票数字甚至高达99%。


  在长期反欺诈的攻防实战中,总结出了恶意“爬虫”的几个特征:


  1.同一设备上有规模化的访问和操作:“爬虫”的目的是最短时间内抓取最多信息,因此同一设备会有大量离散的行为,包括访问、浏览、查询等。


  2.访问来源IP地址异常:正常情况下用户在查询、购买时,用户的IP地址比较稳定,而且访问来源IP比较;“爬虫”、“虚假占座”等操作时,IP来源地址呈现不同维度上的聚集,而且浏览、查询、购票等操作时不停变化IP地址。


  3.访问的目标网页比较集中:“爬虫”代理人目标明确,主要是爬取班次、价格、数量等核心信息,因此只浏览访问几个固定页面,不访问其他页面。


  4.操作多集中非业务时间段:“爬虫”程序运行时间多集中在无人值守阶段。凌晨1-5点是恶意“爬虫”的运行高峰时段。此时系统监控会放松,而且平台的带宽等资源占用少,爬虫密集的批量爬取不会对带宽、接口造成影响。


  5.查询订票等行为很有规律:由于“爬虫”是程序化操作,按照预先设定的流程进行访问等,因此呈现出毫无思维、但很有规律、有节奏且持续的行为。


  6.设置UA模拟浏览器和频繁使用代理IP:很多“爬虫”程序伪装成浏览器进行访问,比如在程序头或者UA中默认含有类似python-requests/等固定字符串;并且通过购买或者租用的云服务、改造路由器、租用IP代理、频繁变更代理IP等进行访问。


  以上是介绍了关于恶意“爬虫”的几个特征,租用IP代理也上黑名单,如果租用的IP代理不好使用,被发现了,分分钟被拉进黑名单。


相关文章内容简介
推荐阅读
  • 18 2020-01
    代理ip在电商的应用

    经常使用网络的人都知道代理IP,在搜索引擎随便一搜索就可以找到很多的代理IP,那么是所有的代理IP都是可用的有效的吗?网络上充斥着各种免费代理IP,这里不是说免费的不好,有效的才是王

  • 08 2019-07
    拨号代理服务器找哪家好?

    拨号代理服务器找哪家好?当需要的经常更换IP,而且需求的IP量比较大的时候,可以考虑使用拨号代理服务器的,为什么呢?

  • 19 2019-03
    网站反爬虫遍布,代理IP是突破防线的好办法

    如今这个网络发达的时代,不管是反爬虫还是网络爬虫,都是遍布网络的每个角落,网站为了保护好自己的网站服务器,使用反爬虫拦截是自然的,若是要进行数据的采集,一般也是出动网络爬

  • 03 2019-06
    http代理辅助信息采集

    http代理辅助信息采集,起到的作用比较大。比如说,随着经济的不断增长,国家二胎政策的开放,教育机构,学校的开设可谓是增增日上。那么作为家长,如何在孩子的第一个学校-幼儿园的公

  • 02 2020-11
    自己搭建代理ip的好处

    代理ip池是由自己搭建的有什么好处?下面我们跟着机灵代理ip来一同看看。

  • 29 2019-04
    高效代理IP哪里找呢?

    高效代理IP哪里找呢?需要使用到代理IP的工作有点多,基本都是需要更换IP地址的,不过想更换个IP也不是那么容易的的,这对代理IP的质量有所要求。我们举个例子来看看。

在线咨询
大客户经理
大客户经理
1829380381
13316264505

大客户经理微信

微信公众号

微信公众号

回到顶部