我的网站完全从 Google 上消失了:现在怎么办?众所周知,谷歌对他们的一些违规行为和相关处罚是无情的。被放入沙箱或被推到第二页、第三页或更深入的搜索是一回事。去谷歌,输入“site:www.myurl.com”并没有任何回报就足够了。
发生这种情况时,意味着您已完全从搜索索引中删除。哦,谷歌仍然对你的站点数据进行索引和保存,他们只是从实时索引中提取出来的。他们说“你做错了什么,我们会将你从搜索结果中删除,直到你解决问题为止。”
发生这种情况的原因有很多,您可以采取一系列措施来纠正这种情况。这是您可以用来恢复的过程,最好是快速恢复。如果你很好,你可以通过这个,并在短短 12 小时内恢复你的排名。
第 1 步:检查缺少什么
当您的排名下降时,您需要进行一些解释,而结果的恐慌可能会在争夺解决问题的过程中将逻辑抛诸脑后。您要做的第一件事是在整个页面上使用排名检查器和/或 Google 站点搜索(通过将 site:www.yoururl.com 放入搜索引擎)来查看出现和不出现的内容。
这里有三种可能的结果。
- 您的所有页面都显示在站点搜索中,但排名极低。这不在本文的讨论范围内;相反,您应该考虑从Panda 和 Penguin 等处罚中恢复过来。
- 您的某些页面存在,但其他页面不存在。这意味着该页面选择出现问题。如果您想解决该问题,您需要检查这些页面以了解它们从索引中删除的原因。
- 站点搜索中不存在您的任何页面。这意味着您的整个网站已被删除,这是一个更严重的惩罚。但是,这可能是一个简单的错误,并且很容易修复。
第 2 步:查找 NoIndex 问题
noindex 属性是一个元标记,它可以出现在两个不同的地方,从而导致从 Google 的搜索结果中删除一个页面。第一个位于给定页面的元数据部分。如果您发现只有某些页面已从索引中删除,这可能是您首先要检查的内容。如果您在删除之前正在编辑或更改这些页面,则尤其如此。您将在页面的头部部分找到该标签。它看起来像这样。
- <meta name=”robots” content=”noindex”/>
可能有更多的数据;没关系。如果名称为 robots 且内容为 noindex,则您是在告诉搜索机器人(例如 Google 的网络蜘蛛)不要将页面编入索引。下次 Google 看到该页面并读取该数据时,它会说“哦,网站所有者不希望将此页面编入索引,我最好将其从搜索结果中删除。”
如果您在不再编入索引的页面标题中发现此元指令,恭喜;你找到了问题所在。您需要做的就是删除 noindex 标签。如果需要,您可以通过 Google 网站管理员工具向页面提交 ping,或者提交一个新的站点地图,其中列出该页面的更改日期是最近的。无论哪种方式,谷歌很快就会发现该指令不再存在,并会很高兴地再次索引该页面。理想情况下,一旦站点恢复到索引,排名不会丢失。
您可能会发现 noindex 指令的另一个位置在您的 robots.txt 文件中。理想情况下,您会在根目录中找到此文件。可以有子目录robots.txt 文件,但如果有,您应该删除它们并将它们合并到您的主站点robots.txt 中。
robots.txt 文件是一个简单的文本文件,其中包含搜索引擎机器人的一些基本信息和指令。如果您看到类似“Disallow: /”的行,那么您就是在禁止搜索引擎机器人抓取您的网站。/ 是有问题的字符。如果你删除它,一切都会恢复。如果将 Disallow 更改为 Allow,也会发生同样的情况。如果您完全删除该行 – 或整个文件,如果其中没有其他导入内容 – 一切都将被允许。
通常,当您尝试进行站点改造并在实时环境中对其进行测试时,会出现此错误。您可能会禁止对文件编制索引,以防有人发现它们,因此您不必担心有人试图使用您的测试站点。这不是这样做的理想方式,但我已经看到它发生了。
幸运的是,您可以使用SEOBook 提供的类似工具轻松分析您的 robots.txt 文件。谷歌也提供了一个,假设你的网站在网站管理员工具中列出,你可以在这里找到它。
说到网站管理员工具……
第 3 步:检查网站站长工具数据
您要在 Google 的网站管理员工具中检查两个主要项目。第一个是手动操作部分。在这里,您会看到 Google 对您采取的非算法处罚。手动操作往往是全有或全无的删除,而算法惩罚是降低您的搜索排名但不会完全删除您的惩罚。如果您有任何手动操作,您将能够看到它们是什么,并且您将能够努力删除它们。
您应该检查的第二件事是删除 URL 功能。您可以在“Google 索引”>“删除网址”菜单中找到它。如果您有一个已被索引的页面并且您不希望它成为系统页面或类似的东西,您可以在此处请求将其从索引中删除。这有助于您隐藏关键文件或最大限度地减少后门对您网站的访问。理想情况下,您在这里看到的只是“没有 URL 删除请求”。如果您看到其他任何内容,您可能以某种方式要求对您网站上的某些页面取消索引。取消这些请求,你就可以开始了。
步骤 4:检查服务器停机时间
当服务器没有响应时,Google 无法抓取该页面。它会尝试,但它收到的只是超时。如果发生这种情况,Google 通常会从索引中删除该页面并抓取下一个页面。由于下一个可能是您网站上的另一个页面,因此它将确定您的整个网站都丢失了。在 404 上丢失页面、整个丢失站点或没有响应的服务器之间,Google 没有区别。它们都会导致站点不再可用,这意味着它们都可能导致您的页面从索引中删除。
原因很简单,而且是暂时的;Google 想要提供最好的结果,所以如果结果没有加载,那就不是最好的。它将被删除,直到它被再次检测为加载。值得庆幸的是,Google 知道停机是可能发生的,而且他们不会花数周时间回复您。通常,当页面没有响应时,他们会在一天内回来检查并再次索引。只有当第二次或第三次罢工时,他们才会更加认真地忽视你。
不幸的是,除非您的网络主机发布了正常运行时间记录,否则没有什么好方法可以在事后监控您的服务器响应。您必须让您的站点注册某种监控服务,例如 Pingdom。Pingdom 很棒,我建议您密切关注服务器的正常运行时间。
步骤 5:检查规范化错误
如果您以某种方式实施规范化并交叉了一些电线,这是一个可能会出现的错误。
规范化是一个重要的工具,可以在您的网站上保持 URL 奇偶校验,并在您通过产品搜索等动态内容生成时最大限度地减少可能的重复内容惩罚。
这个想法很简单;在任何可能被复制的页面中,您向元数据添加一个规范标签,指向该页面的真实版本。因此,例如,您的站点可能是 www.example.com。您可以添加规范化,以便每当有人访问 https://www.example.com 时,他们都会被重定向到正确的版本。这最大限度地减少了两者被视为不同的 URL 并分散您的页面排名能力的情况。
生成动态 URL 时使用相同的操作。每个唯一的 URL 都算作一个不同的页面,因此 Google 可能会看到 1,000 个共享相同内容的不同页面。您将其规范化,以便 Google 了解它们都是同一个页面,只是具有奇怪的动态 URL。
当您在添加规范化时指定错误的 URL时会出现问题。如果您的所有规范标签都指向一个不存在或不是您网站的 URL,它实际上会将您的网站从排名中删除,并将您的所有链接汁提供给声称它是原始来源的网站。这很少会成为真正的问题,但值得检查。
第 6 步:检查黑客攻击的迹象
现在,此时您可能已经看到被黑客入侵的迹象(如果有的话)。您的服务器访问日志中可能有奇怪的活动。你的头上可能有奇怪的混淆代码。您可能有不记得创建的全新页面。
无论如何,网站可能会被黑客入侵的方式有很多种。可能有人添加了页面并离开了您的网站;主站点很好,但附加页面用于垃圾邮件,这会让您被 Gmail 列入黑名单,从而完全被 Google 列入黑名单。您可能已将主页替换为垃圾邮件页面。您可能已经替换了子页面。您可能将白底白字的颜色匹配链接添加到您的主页或其他重要页面,从而从您的页面窃取 pagerank 并将其提供给垃圾邮件发送者。您可能正在提供恶意下载或将用户重定向到垃圾邮件链。
所有这些都是您的网站受到外力入侵的迹象,这是 Google 真正不喜欢的。您的网站充满恶意代码是 Google 将您从索引中删除的绝对理由。您将能够恢复您的排名,但这可能需要一些时间,因为谷歌希望确保它不会再次发生。
从黑客攻击中恢复的道路并不容易。您需要更改与您的网络主机相关联的任何帐户的名称和密码,包括社交媒体、电子邮件、其他网络登录以及使用类似信息的任何其他内容。同时,您需要检查以确保您没有将密码恢复电子邮件发送到不同的恢复地址。一些黑客会输入他们的虚拟信息,这样如果你尝试重置它,他们也可以重置它。
只有在您的网站安全后,您才能开始修复它。理想情况下,您将拥有最近的备份,并且不会从最近的更新中丢失太多或任何内容。恢复该备份,您的数据将被恢复。然后你必须 ping 谷歌让他们知道你的恢复已经结束。
不幸的是,这需要一些时间,并且意味着 Google 不会立即恢复您的排名。幸运的是,这是一个可恢复的错误,您很快就能修复它。
您可以在此处阅读有关重新纳入/重新考虑请求的更多信息,请访问Matt Cutts 的博客。他还有一个指向官方文档的链接。这是一个旧帖子,但它仍然相关,因为过程几乎没有改变。
如果您已经查看了所有这些内容,但仍然无法确定您的网站被删除的原因,您可能需要联系 Google 支持。他们可以查看您的网站并检查它是否受到软处罚或某种保留的影响。如果这仍然没有帮助,您的站点已陷入困境,唯一的出路就是前往山上的大圣,他可以为您提供永恒的智慧。
--- END ---