最新公告
  • 欢迎您光临站库网,本站秉承服务宗旨 履行“站长”责任,销售只是起点 服务永无止境!立即加入我们
  • 网站被镜像了怎么办?

    查找引擎优化zac.com/blackhat/negative-查找引擎优化/” target=”_blank” style=”box-sizing:inherit;background-color:transparent;color:#0B65A1;outline:none;transition:all 0.35s ease 0s;opacity:0.8;text-decoration-line:none !important;”>常见负面SEO帖子里说到过,我这个小博客有几十个域名镜像我。有读者问我,怎样知道自己被镜像了,网站被镜像又改怎样处理。今日写个帖子聊一下。

    什么是歹意镜像网站?

    镜像网站指的是和你的网站基本相同、并且实时同步的其它网站。就像照镜子相同,所以名为镜像。

    有的镜像网站是没有歹意的,很或许是你自己设置的,为了便利用户能从多个域名拜访网站,被封了一个,还有其它的域名。比方著名的草榴社区,如同就有许多镜像能够拜访。

    有的镜像,也便是这里评论的镜像,是不怀好意的,一般是他人设置的,要么为了负面SEO你的网站,要么为了利用你的内容获得排名,然后把用户转向到敏感、不合法内容网站上去。

    网上有的文章把收集和镜像混在一起。虽然表现形式差不多,但严格来说,收集和镜像完成办法、表现形式是有差异的。

    收集的网站一般是提早抓取他人网站的内容,放入自己数据库,再用程序调用到页面上。被收集网站有新内容时,收集网站并不能实时同步更新,要再收集之后才能呈现。一旦被收集,内容已经在对方数据库里了,从技术上是无法阻挠收集网站显现这些内容的。这篇帖子说的不是这种。

    镜像网站并不事前抓取内容,而是有人拜访网站时,实时从被镜像的网站调取内容,做些处理(替换URL、文字,加文字、加JS等),然后实时显现。被镜像的网站有任何更新,镜像网站是实时同步的。

    网上有卖用于镜像网站的小偷程序的。小偷程序一般也能够用来做收集。为了不给他们做宣传,就不提姓名了。从他们的官网摘取几条程序功用,有助于理解后面的内容:

    • 全主动分析,内外链接主动转换、图片地址、css、js,主动分析CSS内的图片
    • 内置强壮替换和过滤功用,标签过滤、站内外过滤、字符串替换、等等
    • 伪原创,近义词替换有利于查找引擎优化
    • 添加URL路由,完成全站URL改换,个性化本站URL地址
    • 超级模板添加移动模板、自定义栏目功用
    • 添加主动获取301、302重定向的收集,解决跳WWW,跳https收集
    • 署理IP、假造IP、随机IP、假造user-agent、假造referer来路、自定义cookie,以便应对防收集措施

    其实我是挺迷惑,网信办为什么不责令封闭卖小偷程序的网站,这种网站才是真正该关的,而不是别的一些网站。

    被镜像有什么风险

    从SEO视点看,权重不高的小站、新站,被镜像意味着有其它网站和你的网站内容基本相同,查找引擎有或许以为你的网站不是原版,镜像网站才是,所以把排名、流量给了镜像网站。

    对有一定前史、权重的网站,镜像网站取代原版网站的或许性微乎其微。但从心情视点考虑,被他人镜像,内容被他人偷走,即使没有其它明显结果,也仍是挺烦人的一件事。

    另一个烦人的事是,镜像网站一般来说并不是要和你提供同样的产品或服务,而是把用户转到赌博、色情等服务上去。有的是经过JS把赌博、色情内容显现给用户,有的直接把用户转向到别的的网站上去。

    怎样发现自己网站被镜像了

    有时候注意到被镜像了是由于自己网站排名下降,怀疑有人负面SEO。有时候是查找品牌称号,看到镜像网站。已经知道自己被镜像了好办,直接看下面怎样处理部分。

    许多站长则完全不知道自己网站是否被镜像了。有几个我常用的检查办法。

    一是百度计算后台:

    受访域名部分列出了运用相同百度计算代码的域名。其间呈现快照、百度/谷歌翻译等是正常的,但呈现一些奇奇怪怪的域名就要检查一下了,比方上图里的第5、7、8个,拜访一下就知道都是镜像SEO每天一帖,引诱用户赌博的网站,然后站长把SEO每天一帖的计算代码也照抄过去了。

    看看上面列出的小偷呈现功用就知道,其实计算代码很简略替换或删去的。所以在受访域名只能看到一小部分镜像网站。

    第二是查找网站的特征语句。最简略想到的是网站品牌称号、首页标题等,确实能够发现一些镜像网站。但如前所述,品牌名绝大多数是会被替换的,所以我更喜爱查找一些页面上的特征语句,比方本博客最上面的副标题:Zac的SEO博客,坚持12年,优化成为生活。查找一下就会看到:

    看来我的博客很简略招引菠菜啊。

    一般我不查找帖子里的语句,由于那会返回很多转载、抄袭的页面,不是镜像的。

    从上图能够看到,镜像网站主动把title及正文中的品牌词或指定关键词替换了,拜访这类网站作用常常是这样的:

    上图镜像网站没有转向,也没有用JS显现很多菠菜内容,而是直接在正文中插入菠菜内容和链接。有的镜像网站用JS在页面上半部分显现很多内容,就像在典型赌博网站看到的相同,拉到下面才能看到镜像的内容。

    为了搜得更全,还经常需求多查找其它当地的特征文字。比方查找页脚的声明中的一句:“明明好久一贴,为什么声称“看到另一些镜像网站:

    为什么查找语句的一半,不是查找“明明好久一贴,为什么声称SEO每天一帖“呢?仍是由于品牌词或特征关键词经常是会被替换的,比方这样:

    一般我是用Google做这种查找,由于Google什么乱七八糟的都录入。

    网站被镜像了怎样办?

    首先,一些网上说到的解决办法并没有什么用。

    比方有的说页面上的链接用绝对地址有帮助,其实小偷程序都会主动替换网址,用相对地址仍是绝对地址没什么差别。

    还有的说页面上加上网站链接、网站称号、版权声明之类的,查找引擎会辨认哪个是正版。但镜像小偷程序连链接带文字都能够悉数主动替换,这么做并没有用。

    发现镜像网站后的处理准则便是让镜像网站不能在镜像域名上显现你的内容。考虑到镜像网站是要实时拜访和调用被镜像的页面的,所以能够考虑几个办法。

    比方用JS检测一下正在被打开的页面是不是在自己的域名上,是的话正常显现,不是的话(域名是镜像网站时)强迫转向到自己域名:

    if (window.location.hostname !== ‘www.查找引擎优化zac.com’){
    window.top.location.href = ‘https://www.查找引擎优化zac.com/’;
    }

    (声明:我对程序不熟,代码只是简略举例,详细怎样写,请问你的程序员。)

    不过这种办法只对用户有效,查找引擎不履行JS,仍是会抓取到镜像内容。也能够用PHP写脚本判断和转向。

    有时候由于种种原因,程序不起作用。另一个直接的办法是屏蔽镜像网站来拜访的IP地址。先查一下镜像网站服务器IP:

    把对方主机IP先屏蔽了。不过镜像网站来实时抓取用的IP大部分情况下不是域名主机IP,或许是CDN,或许是假造IP,也或许是多IP的服务器。要发现有必要屏蔽的IP,需求检查网站原始日志。我的一个小窍门是,拜访镜像网站上一个很少人会拜访的页面,比方翻页第70页,然后立刻检查日志,这个页面被拜访的IP便是应该屏蔽的IP:

    屏蔽了这个IP,再拜访镜像网站就变成403错误了:

    不知道页脚的友情链接是镜像网站自己加的?仍是卖程序的人强制加的?

    镜像网站经常是会假造或实时轮换IP地址的,假如屏蔽一个IP网站还能拜访,就再拜访翻页69页、68页等等,找到更多IP。屏蔽也能够屏蔽IP段。我的经历是,一般镜像网站不会运用超过10个IP地址。

    当然也能够写个简略的脚本放自己网站上,比方www.查找引擎优化zac.com/mirror.php:

    <?php
    echo $_SERVER[‘REMOTE_ADDR’];
    ?>

    脚本唯一功用便是显现拜访的IP,然后自己拜访一下小偷镜像网站的脚本网址,也便是www.bloody-thief.com/mirror.php,页面上就直接显现镜像网站拜访你服务器时的IP了。假如镜像网站替换了URL,这个办法就不好用了。无论怎样,日志中是一定有的。

    别的,发现镜像网站,能够向百度、域名注册商、主机服务商投诉,要求封闭网站或删去页面。投诉是否管用便是另一回事了,仍是先做好IP屏蔽和URL检测。

    发表评论

    你的前景,远超我们想象

    选择学么=选择高薪,选择=成功

    • 原创课程

      课程独家原创

    • 零基础

      人人都能轻松入门

    • 注重实战

      轻理论重实战讲实效

    • 高品质

      一对一在线答疑

    • 用心服务

      解除后顾之忧

    • 手机学习

      随时随地轻松学习