如何批量检查网站列表上的 SEO 统计数据

2021-06-16

如何批量检查网站列表上的 SEO 统计数据,收集有关网站的 SEO 信息可能是一个乏味的过程。看看您需要做多少工作才能获得有关某个站点的相关信息。如果您尝试检查多个站点,会发生什么?也许您需要查找有关六个竞争对手的信息。也许您的客户拥有一个由他们想要审核的十几个站点组成的网络。也许您正在收集前 500 名利基网站的信息以制作信息图。让我告诉你; 一次收集每个人的数据是烦人、乏味且低效的。必须有更好的方法,对吗?

答案当然是肯定的。有许多批量搜索引擎优化工具。问题是,他们中的大多数一次只检查一件事。因此,您的第一步是确定您要衡量的指标。然后你可以找到一个工具来批量测量它们。以下是一些最常见的。

Alexa排名

此工具来自适当命名的 Bulk SEO Tools 站点,可检查您插入的 URL 的 Alexa 全球排名、覆盖面和 3 个月的更改量。一次运行最多可支持 500 个域。这是您可以通过手动检查 Alexa 获得的所有信息,但在此处运行批量搜索会更快。完成后,如果您愿意,它可以播放警报,因为运行数百个域的搜索可能需要一点时间。

批量 Alexa 检查器

数据将显示在页面的表格中。它包含域的字符长度、域名、全球排名、范围、变更、原产国和国家排名(如果适用)。还将有一个导出到 CSV 按钮。需要注意的一点是,当您第一次单击提交时,它不会运行;它会扫描您的列表中是否有重复条目并删除它们。然后您可以再次单击它以运行搜索。

现在,我个人不喜欢 Alexa 排名。对于任何类型的客观衡量,这都不是一个真正可行或有价值的排名。不过,如果这是您想要监控的内容,请继续。

基本的现场搜索引擎优化

该工具会检查一系列不同的指标,并为您提供读数。这些包括页面元信息、元标签、alexa 排名、社交统计、图像元数据、H# 标签、链接标签、站点地图、robots.txt 和网站图标存在。它还具有内置的验证码系统,可在 Google 阻止机器人活动时帮助收集数据。

SEO URL 检查器

这个工具有两个缺点。首先是它不是免费的。许可证将花费您 19 美元,并且只包括开发人员六个月的支持。它也只在一次检查10的URL,因此,如果你有一个你需要检查100多个站点的列表,它仍然是单调乏味的,检查所有这些,只是1/10繁琐,因为它会通过一个可以做一个.

如果您希望对某个特定站点进行更详细的审核,则可以改用此工具。它分析了许多额外的现场 SEO 因素,包括元标题、描述、关键字和 H1/H2 标签、图像元数据、机器人元数据、Google 地球 KML 标签、规范化、样式表、脚本、网站图标、链接元数据、和压缩数据。

我喜欢这个工具的原因是它不仅为您提供有关您的网站如何处理这些问题的信息,而且还为您提供了为什么它们很重要的背景信息。作为一名 SEO,我已经知道这些信息,但它非常适合向可能不在球上的客户展示。

服务器响应代码

这个基于 Web 的免费工具会在您插入 URL 时检查服务器响应代码(404、301 等)。这有助于您确定页面是否成功显示、是否存在重定向,或者是否存在其他服务器代码抛出错误。例如,插入“huaqiutong.com”向我显示该 URL 上有一个 301 重定向到 https://www.huaqiutong.com,该站点的相应 URL。

您可以使用网络工具一次最多运行 50 个 URL,如果您想通过 WordPress 插件在您自己的网站上运行它,则可能会更多,链接在他们的帖子中。完成后,它还有一个“下载 excel”按钮,用于数据的电子表格版本。

此处的类似工具将向您显示相同的信息,但有一个技巧;它允许您指定要用于搜索的用户代理。通过这种方式,您可以假装使用不同的 Web 浏览器,甚至是不同的设备,这样您就可以查看相关站点是否根据用户代理重定向到不同的 URL。

关键字搜索排名

该工具基本上允许您选择一个关键字,然后运行 ​​site:yoururl.com 搜索该关键字,然后从您的站点中为该关键字提取排名靠前的页面。它使用 Google 的 API,因此您无需担心破坏搜索验证码,而且比手动完成所有操作要快得多。

这是一个“批量”工具,但它一次只能处理一个 URL。诀窍在于,它会在该 URL 上搜索您想要插入列表的任意数量的关键字。

Majestic FlowMetrics

自从最近 PageRank 的死亡和之前的长期缓慢下降以来,不同的指标已经出现作为尝试替代。Majestic 指标是最好的指标之一,具有最大的站点索引和对基本 SEO 的最大价值。它们是引文流和信任流。您通常可以从 Majestic 自己检查它们,但手动进行可能会很耗时。

信任流检查器

此工具检查两个指标并提取有关它们的基本数据,向您显示流量图表。不幸的是,有关更多详细信息,您必须单击图表才能转到站点的实际 Majestic 页面。出于这个原因,这不是一个非常强大的工具。

代码验证

可以杀死搜索排名但又很难从外部发现的两件事是无效的代码位。HTML 和 CSS 都需要有效才能获得高排名,但即使代码格式稍有错误或遵守旧的、过时的标准,它们也能正常工作。

验证标准是 W3C,但使用他们的验证器很慢,因为它是为您一次测试一个页面而设计的。这里有两种工具,一种用于 HTML,一种用于 CSS,您可以使用它们来验证两种类型的代码。

  • 批量 SEO 工具 W3C HTML 验证器
  • 批量 SEO 工具 W3C CSS 验证器

需要注意的一件事是 HTML 验证器对 HTML、HTML5 和 XHTML 的处理是一样的。您不必为每个工具找到一组不同的工具。

MozMetrics

当我提到当 PageRank 消失时会出现其他指标时,我没有提到所有这些。Majestic 是其中之一,它们是一个很好的链接分析,但有一个强大的竞争对手。SEO 巨头 Moz 长期以来一直保持着他们的域权限、页面权限和 MozRank 指标。因此,它们是非常有效的指标,并且与我们拥有的 PageRank 最接近。

莫兹检查器

这个工具很有趣,因为它检查四个指标;页面权限、域权限、MozRank 和页面上的链接总数。它自己使用 Moz API,允许您一次检查多达 200 个 URL。如果您碰巧有来自 Moz 的自己的 API 密钥,您可以在页面上插入您的信息并一次检查多达 1,000 个 URL。

您的数据将与域名、权限指标、反向链接数、链接数和 MozRank 一起显示。当然,您可以将数据下载为 CSV。

另一种工具是MozCheck。同样,一次最多可包含 200 个 URL,每月上限为 3,000 个。该站点还要求您创建一个免费的用户帐户,这可能比您想投入的工作要多。由您决定您喜欢哪种工具。

域索引检查

这是一个非常简单的工具,它只是检查一个 URL,看看它是否被 Google 和 Bing 索引。它并没有真正为您提供更多信息,但这很好。它不是为 SEO 使用而设计的,而是用于购买过期域名的研究。您想知道域在购买之前是否已被取消索引,有时您正在考虑批量购买。这有助于您做出明智的决定。

谷歌索引检查器

来自同一个人的相关研究工具是Domain Age checker。这是根据域名的注册信息检查域名。您将看到原始注册日期、当前到期日期和域名注册商的名称。如果您有兴趣购买该域名,您还可以使用域名过期检查器查看它何时会公开下降(除非当前所有者重新注册)。

一个类似但不相关的检查器是检查域是否列在 DMOZ 或 Open Directory 中。DMOZ 列表是很多网站都做的简单 SEO 提升,但很容易忘记。您可以在此处检查 DMOZ 中是否列出了某个站点。像往常一样,一次最多 500 个。

社交媒体分享

如果您无权访问相关帐户的分析 API,则跟踪社交指标可能会非常耗时。该工具通过收集数据并将其显示在一个漂亮的表格中来帮助您加快流程,因为始终可以以 CSV 格式下载。这个显示域名、Facebook 分享、喜欢和评论、Google Plus 分享、Twitter 和 Pinterest 分享、LinkedIn 分享和 StumbleUpon 点赞。

需要注意的一件事是 Twitter 不起作用。Twitter 不久前从他们的按钮中删除了分享计数,这个工具使用公共 API 来提取这些数据。因此,该工具始终在 Twitter 列中报告 0。如果您使用此工具并注意到它已更改,请告诉我,我会报告它已更新。

托管统计

我将添加到本节中的两个相关工具。第一个是WHOIS查询工具,记录域名WHOIS结果。这将向您显示所有者信息,包括姓名、地址、注册商、电话、电子邮件等。当然,如果信息受到保护,或者域名归注册公司或擅自占地者所有,则该信息将列在表中,而不是真正所有者的信息。

第二个是名称服务器查找工具。您很少需要查找数百个站点的名称服务器,但是如果您发现自己处于这种情况,您就会意识到拥有一个工具可以为您完成所有工作是多么宝贵。

有没有我错过的工具?我觉得我已经涵盖了几乎所有你想做的主要批量搜索,除了深入的关键字分析。不过,我认为您不能很容易地在多个站点上自动进行关键字分析;它通常需要进行健全性检查以防止重复或运行不必要的搜索。

如果您有我没有列出的最喜欢的工具,请随时告诉我。我会检查一下,看看它是否通过了集合。不过,我会这么说;我避免使用允许您抓取和旋转内容或链接的内容抓取工具。它们对我来说太黑了,无论如何它们实际上并没有给你带来太多好处。我不会将这些添加到这篇文章中。

--- END ---


( ! ) Warning: realpath(): open_basedir restriction in effect. File(/www/server/panel/tmp) is not within the allowed path(s): (/www/wwwroot/www.hqtweb.com/:/tmp/) in /www/wwwroot/www.hqtweb.com/wp-includes/functions.php on line 2124
Call Stack
#TimeMemoryFunctionLocation
11.053436892000shutdown_action_hook( ).../load.php:0
21.053436892000do_action( $hook_name = 'shutdown' ).../load.php:1260
31.053536892376WP_Hook->do_action( $args = [0 => ''] ).../plugin.php:517
41.053536892376WP_Hook->apply_filters( $value = '', $args = [0 => ''] ).../class-wp-hook.php:348
51.054136852920wpcf7_cleanup_captcha_files( ).../class-wp-hook.php:322
61.054136852920wpcf7_init_captcha( ).../really-simple-captcha.php:555
71.054136853208ReallySimpleCaptcha->__construct( ).../really-simple-captcha.php:396
81.054136854224path_join( $base = '/www/wwwroot/www.hqtweb.com/wp-content/plugins/really-simple-captcha', $path = 'tmp' ).../really-simple-captcha.php:46
91.054136854224path_is_absolute( $path = 'tmp' ).../functions.php:2154
101.054136854224realpath( $path = 'tmp' ).../functions.php:2124