摘要:前几天遇到一件令人哭笑不得的事情,原创文章发出不到1分钟,就被人赤裸裸地采集了,搞得我很气愤,又无可奈何,把事件的过程写出来,让大家给评评理,一同帮忙出出主意。

前几天遇到一件令人哭笑不得的事情,搞得我很气愤,又无可奈何,拿他没什么办法,把事件的过程写出来,让大家给评评理,一同帮忙出出主意。

我写了篇博文:2020 百度年度关键词,你搜索过几个?然后在某个QQ交流群里推送了一下,结果有位叫“酷酷的零度”的网友,迅速把我的文章采集到了他的网站上,标题一样,内容一样,配图也一样,赤裸裸的暴力采集。而且没有注明来源及原文链接,却是去掉了我的内链,看着完全是他的原创一样。真是如他所说,最多1分钟,马上跑他网站上了。

我被这一幕搞得目瞪口呆,向他提出抗议,要求他至少添加上文章出处,友善的话回个链接到我网站。结果他的一席话,更让我大跌眼镜,觉得匪夷所思。他说:我没IP,就七八个而已,你权重2,不要和我斤斤计较。天哪,这是我斤斤计较吗?这是最起码的知识共享许可常识好吗!

后来再与他理论,他就装聋作哑,不理睬我了。我的好篇博文,现在还躺在他的博客里,一双泪眼无辜地看着我,我却一点办法也没有,徒添悲伤。

网站采集,其实并不是个新鲜的话题,在那个建垃圾站赚美元的时代,这是快速收益的有效方法。有人还开发了许多采集工具,如火车头采集器,因此网络上雷同的网站如雨后春笋般冒出来。这也倒逼搜索引擎推出许多反制措施,如权重的计算方法,鼓励网站原创发展。

我的网站之前曾被恶意镜像,而且可恨的是,恶意镜像网站竟比源站搜索排名靠前。后来采取了解决方法,终于归于正常,也再没被恶意镜像。这段经历让我心有余悸,一度对坚持更新博客失去信心。

对于工具采集,有些人在服务器访问规则上设限,也能达到反采集的目的。但对于手工采集,即我们平常所说的搬砖,还真没什么有效的限制办法。据我所知,有些站长是通过屏蔽鼠标右键功能,使不能复制网页内容,但也很容易被破解的。我一直觉得这种方式会降低访客浏览体验,并不喜欢。

对于此事,你们有什么看法或建议,欢迎留言评论。

题图来自 Pexels 上的 Andrea Piacquadio 拍摄的图片

历史上的今天: