预计Googlebot抓取会随着CDN的更改而增加

2020-02-26

每当您对网站的某些内容进行重大更改时,很自然地,您会看到Google的爬网量发生了重大变化,但网站上确实发生了变化。这是完全正常的并且是预期的。

当您将站点切换到CDN时也是如此。但是,如果您删除CDN或进行其他更改,则完成后,您还将在网站上看到相同类型的Googlebot活动。

Google的John Mueller通过推特证实了这一点。

爬网活动的增加仅仅是因为Google正在使用CDN的添加,删除或更改来重新索引这些页面。站点所有者在将站点移动或切换到HTTPS或对该站点进行其他重大更改时,也会看到相同的爬网活动。

话虽如此,网站所有者应该担心爬网的增加,如果爬网的增加会引起服务器问题,例如Google,但由于很难对网站进行爬网而导致服务器关闭。尽管这种情况很不常见,但是这种情况确实可能发生,特别是如果网站上有某些东西创建了无限的URL。因此,如果您对网站进行了重大更改,期望爬网活动有所增加,但是没有对网站进行任何相关更改,则有时它可以突出显示Googlebot遇到的问题,例如从网站上的日历中抓取的一百万个页面或参数狂野。

--- END ---


( ! ) Warning: realpath(): open_basedir restriction in effect. File(/www/server/panel/tmp) is not within the allowed path(s): (/www/wwwroot/www.hqtweb.com/:/tmp/) in /www/wwwroot/www.hqtweb.com/wp-includes/functions.php on line 2124
Call Stack
#TimeMemoryFunctionLocation
10.781249073984shutdown_action_hook( ).../load.php:0
20.781249073984do_action( $hook_name = 'shutdown' ).../load.php:1260
30.781249074360WP_Hook->do_action( $args = [0 => ''] ).../plugin.php:517
40.781249074360WP_Hook->apply_filters( $value = '', $args = [0 => ''] ).../class-wp-hook.php:348
50.781749034936wpcf7_cleanup_captcha_files( ).../class-wp-hook.php:322
60.781749034936wpcf7_init_captcha( ).../really-simple-captcha.php:555
70.781749035224ReallySimpleCaptcha->__construct( ).../really-simple-captcha.php:396
80.781749036240path_join( $base = '/www/wwwroot/www.hqtweb.com/wp-content/plugins/really-simple-captcha', $path = 'tmp' ).../really-simple-captcha.php:46
90.781749036240path_is_absolute( $path = 'tmp' ).../functions.php:2154
100.781749036240realpath( $path = 'tmp' ).../functions.php:2124