网站被采集该怎么办

 

     采集已经成为了建站的规则。讲究点的会带上版权标记文章出处,不讲究的为了捏造一个伪原创来欺骗蜘蛛,甚至干脆乱改一通,往上一传。

一个地方网站在当地小有人气,每天分类信息都被好多个本地网站采集粘贴。更有甚者,有人竟用采集程序直接获取网站的内容。我不反对别人从我的网站复制内容来丰富他的网站。原因有三:

一、这是对我网站的认可,复制我网站的内容,说明他对我的网站信息和人气的认可。而这种认可和复制行为并无恶意。

  二、这种行为本身,也是我网站价值的一个提升:有助于站内信息的传播,对于到我网站里发布信息的人来说,可以达到更多的效果。

三、我们作为比较成功的站长,应该帮助后进的同学。要有个学长的样儿~!我的态度是:如果我们成功了,那就更要有一个成功者的风度~!

我特别厌恶采集程序,我的网站就曾多次被采集程序骚扰,它的可恶之处就在于没有人工参与,自动完成所有信息的复制。完全不尊重别人的劳动,而且时间全盘复制,实在太不厚道了。我也曾遇到这样的网站直接采集我的网站内容。针对其采集程序,我规纳了几种防采集的两种方法

一、加入干扰代码:写一个生成字母和数字的小程序,然后随机生成一串字符,将这段字符放于标题或内容文字的前一个html元素之中。举例说一下吧:

原码:这里是标题这里是要采集的内容

改后:这里是标题这里是要采集的内容

加入了id值这个干扰因素之后,采集程序基本就歇菜了。

二、封锁相关服务器的ip地址,这个比较狠,基本就是不允许访问了。但这个很有针对性,只有你知道某个网站在采集你的程序时有效。

关于防采集程序,有几种方法是在网上介绍的,比如判断一段时间内ip访问次数,这个千万不能用,会把搜索引擎的蜘蛛也给误伤到。还有诸如脚本加密,更不太适合,也不利于搜索引擎收录。总之一句话,不管是采集者和被采集者,做一个大家都喜欢的站长,才会做出人气,做大家都喜欢的站长,也一定是有风度的站长。不论你是采集者还是被采集者。

附:随机字符串生成代码

fcount为要生成的字符数量,引用时<%=Fcj(6)%>,即生成6个小写字母的字符串

Function Fcj(fcount)

 Ftemp=""

 For Fi=1 to fcount

Ftemp=Ftemp&Rnd_Chr()

 Next

 Fcj=Ftemp

End Function

Function Rnd_Chr()

Randomize

Rnd_Chr = Chr(Int((122 - 97 + 1) * Rnd + 97))

End Function,我们可以通过下面的方法对付他!

我们应该怪百度吗?我觉得不应该,这种算是比较人性化的一种权重辨别模式!当然也有一些站长利用这些来采集别人的文章,要知道任何事情都难以,有人利用这个漏洞是在正常不过的事情了。当然任何事情都会有解决的办法,关键是不要灰心丧气,我们的网站迟早也会有权重高的一天,那么我们是不是要去抄袭别人的文章了?作为一个有过这种遭遇的人我不会这样做!相信你们也不会。

联系我们