您的位置:首页 > 新闻资讯 >文章内容
爬虫偶尔遇到301和302状态码,这是什么问题?
来源:互联网 作者:admin 时间:2019-04-08 17:02:00

  爬虫运行中是经常会遇到一些问题的,比如说,爬虫偶尔遇到301和302状态码,这是什么问题?对于这些问题,是如何解决的呢?


  其实301和302状态码都表示重定向,就是说浏览器在拿到服务器返回的这个状态码后会自动跳转到一个新的URL地址,这个地址可以从响应的Location首部中获取(用户看到的效果就是他输入的地址A瞬间变成了另一个地址B)。


  不过301和302状态码不太一样:


  301重定向/跳转一般,表示本网页永久性转移到另一个地址。301是永久性转移(Permanently Moved),SEO常用的招式,会把旧页面的PR等信息转移到新页面。


  302重定向表示临时性转移(Temporarily Moved ),当一个网页URL需要短期变化时使用。


爬虫偶尔遇到301和302状态码,这是什么问题?


  301和302状态码的区别:


  他们的不同在于,301表示旧地址A的资源已经被永久地移除了(这个资源不可访问了),搜索引擎在抓取新内容的同时也将旧的网址交换为重定向之后的网址;302表示旧地址A的资源还在(仍然可以访问),这个重定向只是临时地从旧地址A跳转到地址B,搜索引擎会抓取新的内容而保存旧的网址。


  通俗来讲,当一个网站或者网页24—48小时内临时移动到一个新的位置,这时候就要进行302跳转,打个比方说,我有一套房子,但是最近走亲戚去亲戚家住了,过两天我还回来的。而使用301跳转的场景就是之前的网站因为某种原因需要移除掉,然后要到新的地址访问,是永久性的,就比如你的那套房子其实是租的,现在租期到了,你又在另一个地方找到了房子,之前租的房子不住了。


  为什么要进行重定向:


  一般是由于网站调整(如改变网页目录结构);网页被移到一个新地址;网页扩展名改变(如应用需要把.php改成.Html或.shtml)。


  这种情况下,如果不做重定向,则用户收藏夹或搜索引擎数据库中旧地址只能让访问客户得到一个404页面错误信息,访问流量白白丧失;再者某些注册了多个域名的网站,也需要通过重定向让访问这些域名的用户自动跳转到主站点等。


  综上可知,爬虫偶尔遇到301和302状态码时不要惊慌,代理IP并没有失效,爬虫的身份也并没有被发现,只是这内容被转移了,还是可以继续爬取的。


相关文章内容简介
推荐阅读
  • 02 2019-12
    代理IP常见的两种使用出错及解决方案

    代理IP的使用场景非常广泛,但是在我们使用的过程中,难免会碰到代理IP出错的时候。有些问题我们可以通过搜索平台来找到解决教程,而有些问题比较服务无法一下子自己解决。下面我们跟

  • 18 2019-09
    代理IP爬虫资讯:Python 2将停止更新

    对于常用代理IP来进行爬虫的工作者来说,Python 2实在是太熟悉不过了。但是你知道这款编程语言即将要停止更新、维护了吗?官方的不再运营又会不会对使用带来什么影响?下面,机灵代理为大家

  • 03 2019-12
    使用代理服务器具有的好处

    代理服务器在互联网上发挥着非常关键的作用,不少用户就算用着代理服务器也不知道代理服务器能够帮助我们完成什么事项,下面我们来看看代理服务器的特性。

  • 18 2020-02
    代理ip的选择很重要

    代理IP是换IP的软件,有很多选择。但代理IP不是随便挑一个就可以,代理IP也有好有坏,想要使用好效果的,自然要好好挑选。

  • 27 2019-07
    理性认识使用爬虫代理

    爬虫代理虽然是可以突破网络的IP限制,但是这不代表使用了爬虫代理,就能无所不能了,我们需要理性认识使用爬虫代理。

  • 06 2019-12
    优秀的代理IP公司是什么样子的?

    网络上面我们可以看到很多不同的代理IP广告,点击进入可以看到不同的公司企业提供的服务,那么我们可以怎么去判断这些企业的资质呢?

在线咨询
大客户经理
大客户经理
1829380381
13316264505

大客户经理微信

微信公众号

微信公众号

回到顶部