自然语言处理如何改变您的搜索方式

2021-11-05

自然语言处理如何改变您的搜索方式

Google 努力通过每次算法更新来增强搜索引擎结果页面 (SERP) 中显示的列表的相关性。SERP 的最新更新是 Google 的来自 Transformers 的双向编码器表示 (BERT),它利用了自然语言处理。BERT 被认为是 Google 在过去五年中引入的最重要的变化之一——直接影响了十分之一的搜索查询。

它旨在通过正确解释复杂的长尾搜索查询来显示更多相关结果。在这篇文章中,我们将讨论这意味着什么以及它如何改变您的搜索方式。

什么是BERT?

它是一种基于神经网络的 NLP 预训练技术,使 Google 能够更准确地识别给定搜索查询中的单词上下文。

例如,考虑短语“六到十”和“四分之一到六”,相同的介词“to”在每个短语中都有不同的含义,这对搜索引擎来说可能并不明显。然而,这就是 BERT 有用的地方,因为它可以有效地区分第一个短语中介词的上下文与第二个短语中介词的使用方式。通过对上下文的理解,它可以提供更相关的结果。

算法的神经网络有助于模式识别,而在数据集上训练的神经网络可以识别模式。其典型应用包括图像内容、预测金融市场趋势甚至识别手写。而自然语言处理 或 NLP 是处理语言学的人工智能 (AI) 的一小部分。 

  • NLP 使计算机能够理解人类如何自然地交流。
  • NLP 算法支持解释、理解和语言模式识别。
  • NLP 模型突出语法和单词,以在无穷无尽的文本和语音中找到意义。

NLP 促进了互联网用户和在线企业每天使用的进步,包括社交聆听工具、单词建议和聊天机器人

这是什么意思?

BERT 是一种 NLP 算法,它利用神经网络生成预训练模型。这些模型是使用网络上大量可用的数据进行训练的。预训练模型是通用 NLP 模型,经过进一步细化以执行特定的 NLP 任务。去年 11 月,谷歌开源了 BERT,声称它在 11 个 NLP 任务上提供了完整且相关的结果,包括斯坦福问答数据集。

BERT 的双向性使其有别于其他算法,因为这使其能够为单词提供上下文。它不仅可以通过考虑导致该单词的句子的一部分,而且还可以考虑它后面的部分来做到这一点。双向性使搜索引擎能够理解诸如“电影”之类的词的含义,该词在用于“窗膜”时与与“大片”一起使用时具有不同的含义。

在搜索中,BERT 有助于理解查询的关键细节,尤其是在涉及复杂的 会话查询或其中包含介词的查询时。例如,在查询“2021 年前往巴厘岛的印度旅行者需要签证”中,介词“to”表示该旅行者将从印度前往巴厘岛。通过更改介词,您可以完全更改句子,例如“2021 来自巴厘岛的印度旅行者需要签证”,这可能意味着旅行者来自巴厘岛并且需要印度签证。BERT 允许理解两个句子之间的上下文差异。

BERT 和 RankBrain 有什么区别?

RankBrain 是谷歌第一个应用于搜索的人工智能方法。它与有机搜索排名算法并行运行,并对这些算法计算的结果进行调整。RankBrain 根据历史查询调整算法提供的结果。

RankBrain 还有助于 Google 解释搜索查询,以便它可以显示可能与查询不完全相同的结果。例如,在查找“迪拜地标的高度”时,它会自动显示与哈利法塔相关的信息。

另一方面,BERT 的双向组件使其以非常不同的方式运行。传统算法通过查看页面中的内容来衡量相关性,而 NLP 算法则更进一步,通过查看单词之前或之后的内容以获得额外的上下文。由于人类交流通常是复杂和分层的,因此在处理自然语言方面的进步至关重要。

Google 使用 BERT 和 RankBrain 来处理和理解查询。BERT 不能替代 RankBrain,但可以与其他 Google 算法一起应用或与 RankBrain 结合使用,具体取决于搜索词。

改进更多语言的搜索

BERT能够将我们从一种语言中学到的知识应用到另一种语言中,从而使搜索结果与世界各地的互联网用户更相关。例如,我们从网络上使用最广泛的语言(如英语)中学到的知识,然后应用到其他语言中。因此,在人们也在搜索的其他语言中提供改进的结果。此外,BERT 模型还增强了特色片段跨国家和语言的相关性。

BERT 如何影响您的业务?

BERT 还通过触发 Google Assistant 提供受 BERT 更新影响的精选片段或网络结果来影响 Google Assistant。像 BERT 这样的 NLP 技术增强了机器理解能力,这种创新无疑对许多在线用户和企业有利。但是,关于 SEO,原则保持不变。如果您在营销策略中根深蒂固地采用了 SEO 最佳实践,那么您可以确信您的网络成功。持续产生高质量、相关和新鲜内容的网站将从此算法更新中受益最大。

根据关键字研究编写优质内容是一项练习,它将在搜索引擎中保持优先排名因素。专注于让用户获得他们期望的信息丰富且准确的内容的网站所有者最终会在 SERP 上获得良好的排名。监控页面的性能,同时创建出色的内容将有助于网站保持相关性。

NLP 能解决搜索意图吗?

使用 BERT,无论查询中使用的语言或单词如何,谷歌获得正确结果的机会都变得更高,但仍然不是 100%。例如,即使使用 BERT,任何搜索“内布拉斯加州以南是哪个州”的人,他们很可能会得到“南内布拉斯加州”而不是堪萨斯州的结果,这很可能是用户正在寻找的答案。 

帮助机器理解语言仍然是一项持续的努力,从任何给定的查询中得出明确的含义是一个复杂的过程。当 Google 将 NLP 应用于关键关键字列表时,显示的顶部结果可能不包含某些或什至仅包含一个必需的关键字,从而使这些结果变得无关紧要。借助 BERT,谷歌通过对其算法进行了复杂的更新来提升其竞争力,但由于人类语言的复杂性,搜索仍然是一个未解决的问题。

--- END ---


( ! ) Warning: realpath(): open_basedir restriction in effect. File(/www/server/panel/tmp) is not within the allowed path(s): (/www/wwwroot/www.hqtweb.com/:/tmp/) in /www/wwwroot/www.hqtweb.com/wp-includes/functions.php on line 2124
Call Stack
#TimeMemoryFunctionLocation
10.680849137896shutdown_action_hook( ).../load.php:0
20.680849137896do_action( $hook_name = 'shutdown' ).../load.php:1260
30.680849138272WP_Hook->do_action( $args = [0 => ''] ).../plugin.php:517
40.680849138272WP_Hook->apply_filters( $value = '', $args = [0 => ''] ).../class-wp-hook.php:348
50.681349098880wpcf7_cleanup_captcha_files( ).../class-wp-hook.php:322
60.681349098880wpcf7_init_captcha( ).../really-simple-captcha.php:555
70.681349099168ReallySimpleCaptcha->__construct( ).../really-simple-captcha.php:396
80.681349100184path_join( $base = '/www/wwwroot/www.hqtweb.com/wp-content/plugins/really-simple-captcha', $path = 'tmp' ).../really-simple-captcha.php:46
90.681349100184path_is_absolute( $path = 'tmp' ).../functions.php:2154
100.681349100184realpath( $path = 'tmp' ).../functions.php:2124