网站被灌了垃圾信息如何更好的做404处理

 

今天在论坛上看到一篇帖子,觉得在今后工作中还能用得到的,是关于目前很多网站被垃圾信息灌的事情。现在很多网站经常会有一些垃圾信息的出现,给许多的版主带来了不小的麻烦,但是如何处理这些垃圾信息呢,仅仅简单的做一下删除处理吗?希望今天的文章能够帮助到有此困惑的网站管理员。

今天为什么要说一下404问题呢,近看case过程中发现个很有意思的网站,该网站被灌了大量的垃圾信息,被其发现后及时地进行了删除,这一点是值得肯定的。通常情况下,正常网站将自动返回404状态码,搜索引擎进行更新并删除,避免对网站用户及搜索引擎带来负面影响。但问题来了,该网站只删除了内容,没有任何主体内容的页面被保存了下来,未做404处理。当然,存在一类网站只删除内容后返回正常200状态码,提醒一句“该内容已删除”,但其都没有。可以发现目前这个搜藏中的url仍然正常返回200,造成的后果:搜索引擎将花费大量的资源在这种无效页面上,那么,同等耗损下用在重要页面上的资源将被大量挤占,可想而知,正常优质页面在搜索引擎的部分表现将受到影响。经过我们运营同学的多方沟通下至今仍未进一步处理。我觉得,21世纪第二个十年了,这种问题不应该再存在了的。

404状态码代表‘Not Found’,spider(蜘蛛)更新时会认为该页面已失效,此时呢将在索引库中删除,短期内spider再次发现该url不再会抓取。因此,出来了两类问题:,网页临时性打不开;第二,页面永远无法打开。针对类问题,我建议不要立刻返回404,而是使用503。503等同于告诉spider该页面临时访问不了,过段时间再来光临。关于503,spider会认为该网页临时无法访问,短期内会再光临。如果网页已经恢复,即刻正常抓取;如果继续返回503,短期内还会再光临几次,但如果该页面长时间返回503,该url仍会被认作失效链接,从索引库中删除。针对第二类问题,永远无法打开的页面,404,不用考虑。各种web2类页面删除后同样需要返回404告知搜索引擎该页面已失效。

 回归之前那个网站,删除内容后该页面没有任何价值。恰当的处理是:

 1、直接做死链处理并返回404;

2、在百度站长平台死链提交工具中提交死链sitemap。

 后呢,提醒一下各位站长朋友,当您的网站存在被发布大量垃圾信息时,请:

 1、及时删除相关垃圾页面,并做404处理;

 2、制作符合要求的死链sitemap;

3、登录百度站长平台,进入死链提交工具提交死链sitemap。

Sitemap是百度引入优质资源的入口,对于优质资源能够快速引入并呈现给用户,您可以通过Sitemap工具告知百度您的网站上有哪些可供抓取的优质网页。有助于百度Spider更了解您的网站,包括那些传统spider可能发现不了的网页。登录并添加网站即可使用。

广州网站建设公司-中之星(www.szweb.cn),确保您获得理想的网页设计服务,设计团队为您提供FLASH网站设计网页制作APP移动应用开发多媒体触摸屏展示设计

联系我们