BERTとは?Googleが導入した最新技術の内容とSEOへの影響は?

2019年10月25日、GoogleはBERTと呼ばれる自然言語処理技術を活用した大規模なアップデートを行いました。
当初はアメリカのみの採用でしたが、同年12月10日に日本語を含む70言語以上のGoogle検索にも実施したことを、公式にアナウンスしました。

過去最大級と呼ばれているBERTアップデート、一体どのようなものなのでしょうか。
この記事では、BERTアップデートの特徴やSEOへの影響、対策方法をご紹介します。

BERTとは?どんな特徴がある?

BERTは「Bidirectional Encoder Representations from Transformers」の略で、一言でいうと人工知能(AI)を活用した自然言語処理技術のことです。
自然言語処理技術とは、

人間が日常的に使っている自然言語をコンピュータに処理させる一連の技術であり、人工知能と言語学の一分野である。

自然言語処理 – Wikipedia

BERTの採用により、「文脈理解」がより強化されます。
これにより、日常的に使っている会話や文章に近い検索クエリも的確に理解し、ニーズに応えるページを検索結果に表示できるようになりました。

皆さんも「免許 失効 更新」のように単語を組み合わせたクエリを使っているかと思います。
BERTの導入により、このようなクエリではなく、もっとナチュラルなクエリでも対応できるようになります。

GoogleはなぜBERTを採用したのか?

GoogleのBERT採用の背景には、「検索クエリの多様化・複雑化」が挙げられます。
スマートフォンの普及で、ネット上での情報収集は簡単になりました。
その結果、様々なユーザーが様々なクエリで検索するようになりました。

Googleで検索されるクエリのうち、全く新しい検索クエリは15%とも言われており、検索クエリの多様化と同時に複雑化も進んでいるのが現状です。

このようなユーザーの検索に対して適切な結果を表示させるため、GoogleはAIを活用した自然言語処理技術(BERT)を採用したと言われてます。

また、音声検索の普及もBERT導入に影響を与えていると考えられます。
アメリカの調査会社ComScoreは、 以下のような発表をしています。

「すべての検索の50%が、2020年までに音声検索になる」

Just say it: The future of search is voice and personal digital assistants

現時点での実際の数値は不明ですが、iPhoneのSiriやスマートスピーカーなどの登場により、音声検索は身近なものになってきてます。

音声検索は普通「話し言葉」で行われるため、クエリは複雑になります。
このような状況に対応するため、BERTを採用したと考えられるのではないでしょうか。

BERTの仕組み

実際にBERTはどのような仕組みで複雑化した検索クエリに対応しているのでしょうか。
通常の自然言語処理技術は、コンピューターに対して人が使う言語を理解させる技術です。
単語の分析だけではなく、その繋がりも分析し、文脈や文章としての意味を理解するものです。
この技術はすでに自動翻訳やチャットボットなどで活用されています。

BERTはこれに加えて「事前学習機能」も備えています。
事前学習機能は、特定のデータをAIに分析させ、その結果を他のデータの解析に役立たせる技術です。

これにより、BERTは定式化されたパターンだけではなく、インターネット上に存在する膨大なデータを事前に分析し、検索クエリの解析に役立てています。

BERTでできることは?

人が日常的に使う言語やインターネット上にある膨大な文章を事前学習で解析しているため、BERTは文章型の検索クエリと相性が良いと言われてます。
BERTアップデートの実施後、どのように検索結果が変化したかをご紹介します。

Understanding searches better than ever before

検索クエリ
「2019年のブラジルからアメリカへの旅行にはビザは必要か」

BERTアップデート以前の検索結果
「アメリカ国民がビザ無しでブラジルに旅行できるか」について説明したページ

BERTアップデート以後の検索結果
「ブラジルからアメリカへの旅行に必要なビザの情報」について説明したページ

上記のクエリにおいて、「to」は「ブラジルからアメリカへ」という意味を示してますが、BERTアップデート以前は、「アメリカからブラジルへ」と検索エンジンは解釈してます。

このようにBERTを導入したことにより、「to」などの接続詞(文脈)の理解度が上がり、検索結果の精度も向上しました。

つまり、BERTアップデートにより「ちゃんと質問に回答できるページ」が上位表されるようになったということです。
なお、アメリカでは検索の10回に1回はBERTアルゴリズムが活用されていると言われています。

BERTアップデートによるSEOの影響は?

まず、10回に1回( 10%)の検索に活用されているという数字は小さくありません。
検索結果への影響は割と大きめと言えそうです。

また、前述の通りBERTは「複雑なクエリの理解度」のためにアップデートされました。
シンプルで短いクエリではなく、長く複雑なクエリに対して、強く影響すると考えられます。
当然ですが、文脈理解の強化は音声検索にも活用できます。

影響は順位だけでなく、「検索結果の品質」への影響が強いように思えます。
本来表示されるべきページが評価されるわけなので、とても素晴らしいことです。

まとめると、長く複雑なクエリや音声検索に影響し、しっかりニーズに応えられるページが上位表示される。
BERTがSEOに与える影響は、上記のような内容と考えられます。

BERTアップデートの対策方法について

BERTには特別な対策は存在しません。
私の見解も含めてのお話にはなりますが、以下の2つのポイントを見直してみましょう。

  • 検索クエリに対してユーザーが求める情報を網羅しましょう。
  • コンテンツの内容を分かりやすい文章で作成しましょう。

ユーザーが求める情報の網羅

まず、(技術的観点無視でザックリ説明すると)検索は以下のように行われます。

①:クエリごとのニーズを抽出
②:ニーズを満たすページであるかどうかを判断する
③:検索結果を作る


BERT導入により、上記の②が強化されました。
つまり「本当にニーズを満たせるか」がわかるようになりました。

Googleは「ユーザーに役立つページ」を上位表示させたいわけですから、ニーズを把握して、答えているページ作りが大切になります。

例えばこのBERTの記事なら…

◯ BERTアップデートって何?
◯ どんな事が起こるの?
◯ 何か対応が必要?

のようなニーズが考えられます。
他のアップデートのことが書かれていたり、対策方法が書かれていなかったりしたら、ニーズを満たす情報を網羅しているとは言えません。

このように、検索クエリに対してユーザーが求めている情報をしっかりと用意することが重要なポイントです。

わかりやすいページにする

Webページの情報は、ただ詰め込めばいいわけではありません。
分かりやすくコンテンツを作成することが重要です。

せっかくの質の高い情報も、Googleに理解してもらえなければ意味がありません。
まずは、以下の項目を意識して、コンテンツを作成してみてください。

誤字脱字を無くしましょう。
誤字や脱字は、意味を正しく理解してもらえない原因になります。
コンテンツの作成後は必ず校閲をしましょう。

接続詞を正しく使いましょう。
BERTアップデートにより接続詞などの理解度は上がっていますが、使い方が間違っていては正しく理解してもらえません。
前後の文脈がきちんと合っているかを必ず確認しましょう。

文章は長くしすぎないようにしましょう。
文章が長くなればなるほど、その意味を理解するのは人間でも難しくなります。
必要以上にコンテンツを削る必要はありませんが、箇条書きの活用や、不要箇所の添削など、コンテンツを整備するようにしましょう。
ユーザー・Googleの双方が理解しやすい内容にすることを意識できればいいですね。

まとめ

最後に、これまでの内容をまとめます。

  • BERTアップデートは、自然言語処理技術を活用したもので、文脈の理解度が向上した
  • よりユーザーの意図にマッチしたページを上位表示できるようになった
  • 長いクエリや音声検索に影響が強いと思われる
  • 特別な対策はないが、情報の網羅とわかり易い内容を意識する

もともと、Googleは創業当初からユーザーファーストを掲げています。
「Googleが掲げる10の事実」

BERTにより、Googleが望む検索結果にまた一歩近づいたのではないでしょうか。
品質の高いコンテンツの発信は、Googleが望む「良い検索結果づくり」に協力することになりますね。
皆様もユーザーファーストを意識した、良いコンテンツを作り続けてくださいね。