共起語とは?

更新:2020年9月14日

 

共起語とは、あるキーワードが含まれた文章コンテンツの中に、そのキーワードと一緒に頻繁に出てくる単語、フレーズのことです。

 

例えば、「サッカー」というキーワードでコンテンツを作成すれば、その中には、「足」「ボール」「チーム」「11人」「ゴール」「ゴールキーパー」などの、関連するフレーズが含まれるはずです。これらの関連するフレーズを「共起語」といいます。

 

「サッカー」の共起語

出典: フリー百科事典『ウィキペディア(Wikipedia)』

 

LSIキーワードとは?

 

まず、LSIキーワードとは何なのか、「LSIとは」について明確に定義しておく必要があるでしょう。「LSIキーワード」と呼ぶ場合、多少ニュアンスが違ったり、使われる場所が異なる場合もありますので、その辺りも整理しておきましょう。ただ、どちらにしても「潜在的な需要を表すキーワード」だということは同じです。

 

まず、大きく一つ目の考え方です。

LSI(Latent Semantic Indexing)とは、Googleが取得している特許のひとつで単語同士の関連性に着目してコンテンツの内容を読み解くための技術です。(中略)

text-writing

「Latent Semantic Indexing」は直訳すると「潜在的な意味をインデックスする」といった意味です。

引用:DM SOLUTIONS

 

前述の例のように「サッカー」というキーワードに対して、「足」「ボール」などという関連するキーワードや、フレーズ等が頻繁に使用されます。これらをLSIキーワードと呼びます。

 

LSIを使ったアルゴリズムによって、これらの関連するキーワードやフレーズ等のコンテンツ内での出現頻度の情報を、データベースとしてインターネットの世界全体から収集し、蓄積します。そして出現頻度の高いものを関連性の高いキーワードやフレーズとして判断し、それらが多く含まれるコンテンツが評価される可能性が高まります。

 

上記のような捉え方が一つめの考え方です。一般的な「共起語」の考え方と共通しています。

 

二つ目の捉え方は、検索結果画面(SERP)に存在するLSIキーワードです。これにも2種類あります。

①検索結果(SERP)の一番下に表示される、関連キーワード

検索結果(SERP)の一番下に表示される、関連キーワード

 

②検索結果をクリックして、その後「戻る」ボタンをクリックして検索結果に戻ってきた場合にのみ表示されるキーワード

関連キーワードのうち「他の人はこちらも検索」。検索結果をクリックして戻った際に表示される。

 

どちらも、一般的に検索結果から拾うキーワードである「サジェストキーワード」とは異なり、検索窓に入力したキーワードを含まない複合キーワードも表示される場合があるのが特徴です。

 

そして、①にも②にも共通するのは検索ユーザーの「潜在的な需要」を表すキーワードであるという点です。

 

 

「共起語」と「LSIキーワード」は

同じなのか異なるのか?

 

「共起語」と「LSIキーワード」は同じなのか異なるのか?という点については、極、厳密な考え方をすれば異なると言えるかもしれません。取得する場所も異なります。

 

しかし、

  • 目標キーワードと関連性の強いキーワードである
  • 検索ユーザーの潜在的なニーズを表している

これらの共通する特徴から、ここでは「潜在的な需要を表すキーワードである」という意味でイコールであるとして取り扱っています。

 

そして、上記1つめの大きな意味である、コンテンツに含まれる共起語を抽出することでそのコンテンツの潜在的なキーワードを収集することが出来ますが、その収集元のコンテンツをどこにするか?ということで、収集できる共起語も異なります。

 

弊社のツールである「Q&A LSI Search」ではこの収集元としてQ&Aサイトのコンテンツに着目しました。

 

Q&Aサイトはユーザーの生の悩みから発生した質問やその回答が集まる場所です。それらユーザーのナマの声から共起語を抽出することで、ユーザーの悩みに”ごく近い”共起語が抽出出来るのです。

 

また、この共起語は、検索順位上位のサイトから抽出した共起語とは異なるものも多く含まれます。ユーザーの悩みに近いのに、現状の検索順位上位のサイトには含まれないキーワードです。

上位サイトからの共起語抽出や、無料のキーワードツールでは発見出来ないキーワードに出会えることも少なくありません。

 

Q&A LSI Searchはこちら

 

Googleが共起語を評価している

というエビデンス

 

そもそも共起語と聞いて、「何をいまさら共起語?」と思ったかもしれません。

 

共起語をコンテンツに含むことがSEO的に有利だと言われだしたのはすでに数年以上前のことです。そして、ある種の共起語ブームは過ぎ去り、今や共起語は古い、効果がないとさえ言われるようになってしまった。

 

でも、本当にそうでしょうか。SEOは流行りやブームでやるものではありません。

 

Googleは検索エンジンのアルゴリズムをアップデートするために何年もかけて、そのための理論を研究しています。そして、その理論について特許を取っています。その特許文書は公開されており、我々も簡単に見ることができます。そして、その特許の中でも重要なものは、Googleが頻繁に更新を続けており、何年も前に提出されたものでも、現在まで何度も何度も更新され続け、その理論は使われているのです。

 

そんな重要特許の中に、AIでコンテンツを認識する理論が含まれているものがあります。

 

この特許文書の中で、「関連するフレーズが多いページは、関連するフレーズが少ないページよりも上位にランク付けできる。」と記述されています。

 

PHRASE – BASED SEARCHING IN ANINFORMATION RETRIEVAL SYSTEM
(情報検索システムでのフレーズベースの検索)
2018年6月5日
Patent US9990421B2
発明者:アンナ・L・パターソン
出願人:Google Inc.

※Googleの関連フレーズ評価に関する特許文書より

出典:https://patentimages.storage.googleapis.com/23/06/7b/86d9c8ee166d11/US9990421.pdf

 

この「関連するフレーズ」こそ「共起語」です。

つまり、この特許文書を参考に考えれば、Googleに評価されるためにはコンテンツに共起語が競合より多く含まれている必要があると考えられるのではないでしょうか。

 

もちろんそのコンテンツは、人間である検索ユーザーが読むのですから、人間が読んで自然であるのは最低条件です。同時に、人間にとって、読みやすく、分かりやすく、ユーザーエンゲージメントの向上が望める、そんなコンテンツである必要もあります。

 

ですので、機械的に共起語だけ並べておけば良いというものではありません。ツールで抽出した共起語に縛られすぎて、おかしな文章になってしまったというのでは、本末転倒です。

 

ツールで抽出した共起語を参考にしながらも、しっかり熱のこもった、もしくは魂のこもった文章、コンテンツを作成していくことが重要です。

 

これが、「SEO」だけではダメ。

かといって「ユーザーのためになる記事を書く」だけでもダメ。

ということだと考えています。

 

TOPページに戻る

◆この記事を書いた人加藤 理人

Web Culture Service(ウェブ・カルチャー・サービス)CEO 加藤理人(みちひと)

SEO研究の専門家。様々なエビデンスから本質的なSEOの理論を考察する。

Twitter:https://twitter.com/webculture_s