• Google検索アップデートとSEOインサイト

グーグルの大規模な検索文書リークを解き明かす

  • Felix Rose-Collins
  • 10 min read
グーグルの大規模な検索文書リークを解き明かす

イントロ

Google検索ランキングの内部文書が大量に流出し、SEOコミュニティに衝撃が走っている。14,000以上の潜在的なランキング機能が暴露されたこのリークは、Googleの厳重に守られた検索ランキングシステムのボンネットを覗く前代未聞の機会を提供している。

リークの裏側

Erfan AzimiがGoogle APIの文書リークをSparkToroのRand Fishkinと共有し、その後iPullRankのMichael Kingに情報拡散の協力を依頼した。リークされたファイルは、"yoshi-code-bot /elixer-google-api "と題されたGoogle API文書のコミットから発信されたもので、ハッキングや内部告発の結果ではなく、むしろ内部文書のリリースであった。

漏洩の概要

このリークは、Googleのランキング要因の包括的なビューを提供し、PageRankのバリエーション、サイトオーソリティの指標、その他多くの洞察を明らかにする。詳細な内訳は以下の通り:

グーグル検索文書流出から得た主な洞察

ページランクとそのバリエーション

  • PageRank_NS:現在は非推奨。このアルゴリズムは文書理解に関連しており、従来のPageRankを修正し、シードノード周辺のネットワークの局所的なサブセットに焦点を当てる。

  • 7種類のPageRank:Googleは、有名なToolBarPageRankを含む7種類のPageRankについて言及しています。これらのバリエーションは、Googleがページの重要性を評価するために複数の方法を採用していることを示しています。

ビジネスモデルの特定

グーグルのアルゴリズムは、ニュースサイト、YMYL(Your Money or Your Life)サイト、個人ブログ、eコマース、動画サイトなど、さまざまなビジネスモデルを識別することができる。個人ブログを特別にフィルタリングしている理由は依然として不明であり、グーグルの広範な意図について疑問を投げかけている。

アルゴリズムの構成要素

  • ナブブースト:ユーザーの行動とクリックログに基づく再ランク付けメカニズムで、Chromeのデータに大きく影響される。

  • NSR(正規化サイトランク):ホスト・レベルのサイト・チャンクのサイト・ランクを計算するために使用される。

  • ChardScores:コンテンツに基づいてサイト/ページの品質を予測するサイトレベルのスコア

サイト・オーソリティ・メトリクス

Googleは、サイト全体のオーソリティ指標と、Chromeブラウザからのトラフィックを含むいくつかのシグナルを用いて、サイトのオーソリティを評価しています。このことは、全体的なサイトの品質と信頼性がランキングにおいて重要な役割を果たしていることを示唆している。

埋め込み技術と話題の権威

  • ページ埋め込みとサイト埋め込み:Googleは、ページ埋め込み、サイト埋め込み、サイトフォーカス、サイト半径をスコアリング機能で採用し、ウェブサイトのコンテンツの局所的な関連性と一貫性を理解しています。

  • トピックの境界線とトピックの権威:siteFocusScore、siteRadius、siteEmbeddings、pageEmbeddingsのような指標は、トピックのオーソリティを測定するために使用され、明確なトピック・フォーカスを維持することの重要性を強調している。

googleapi

クリックデータとユーザーエンゲージメント

  • NavBoost:NavBoostは、クリックデータとユーザー行動に基づいて検索結果を再ランク付けしており、ユーザーエンゲージメント指標の重要性を強調している。

  • クリックメトリクス:Googleは、バッドクリック、グッドクリック、最後のロングクリック、サイト全体のインプレッションなど、さまざまなタイプのクリックを測定します。

質の高いNSRデータの洞察

NSRのデータ文書からの主な採点要素は以下の通り:

  • titlematchScore:サイト全体のタイトルマッチスコアで、ユーザーのクエリとタイトルの一致度を示します。

  • site2vecエンベッディング:word2vecに似たサイト全体のベクトルで、包括的なサイトエンベッディングの重要性を強調する。

  • pnavClicks:ユーザーのクリックデータから得られるナビゲーション情報に関連する可能性が高い。

  • chromeInTotal:サイト全体のChromeビュー、サイト全体のシグナルの重要性を強調。

  • chardVarianceとchardScoreVariance:コンテンツに基づいてサイト/ページの品質を予測するスコアで、一貫性が鍵となる。

NSR Data Insights

SEOプロフェッショナルのための実践的留意点

  1. 優れたデザインのサイトに投資しましょう:ユーザーの行動とクリックログを検索結果の再順位付けに利用するNavBoostに最適化するために、直感的なアーキテクチャを採用してください。

  2. トピック的に関連性のないページを削除/ブロックする:トピックに関連性のないページを削除またはブロックする。目標とするトピックを設定し、各ページがこの分野で高いスコアを獲得できるようにする。

  3. 見出しとコンテンツの最適化:クエリを中心に見出しを最適化し、段落がクエリに明確に答えるようにすることで、ページの埋め込みと関連性を向上させる。

  4. クリックとインプレッションを重視する:ユーザーエンゲージメントを重視し、より多くのインプレッションとクリックを集めるコンテンツを書く。

  5. 定期的なコンテンツの更新:ユニークな情報、新しい画像、動画でコンテンツを定期的に更新することで、新鮮さを維持し、労力計算で高得点を獲得する。

  6. 質の高いコンテンツを維持する:質の高いコンテンツの一貫性が重要。Googleのサイトレベルのチャードスコアは、コンテンツに基づいてサイト/ページの品質を予測します。

  7. インプレッションの成長を評価する:インプレッションの増加は、サイトパフォーマンスのポジティブな兆候です。

  8. エンティティ・サリエンスの最適化: リークにあるように、エンティティのサリエンス・スコアの向上とトップ・エンティティの特定に重点を置く。

  9. パフォーマンスの悪いページを削除サイト全体の高スコアを維持するために、ユーザーメトリクスの低いページやバックリンクのないページを特定し、削除します。

panda

グーグルが記憶している古いバージョンの文書を削除する方法

このリークによると、グーグルはウェブページの全バージョンを記録し、ウェイバックマシンに似た内部ウェブアーカイブを管理している。しかし、グーグルが利用するのは文書の最後の20バージョンだけである。ページを更新し、クロールを待ち、そのプロセスを20回繰り返せば、ページの特定のバージョンを効果的にプッシュアウトすることができる。この戦術は、古いバージョンに関連する過去の重みとスコアを改善するのに役立つだろう。

グーグル検索ランキングシステム

Google Search Ranking System

リークから得られた興味深い推測の一つは、用語の重み(文字サイズ)の影響である。単語を太字にしたり、単語の大きさを調整したりすることで、ドキュメントのスコアに影響を与える可能性がある。さらに、グーグルのインデックス保管メカニズムでは、コンテンツの優先順位が異なる:

  • フラッシュ・ドライブ最も重要で定期的に更新されるコンテンツ用。

  • ソリッド・ステート・ドライブ重要度の低いコンテンツ用。

  • 標準的なハードディスク・ドライブ:不定期に更新されるコンテンツ用。

グーグルのインデクサーアレクサンドリア

Alexandria

グーグルのインデクサーは、有名な図書館にちなんでアレキサンドリアと名付けられた。他のインデクサーとしては、ドキュメントを階層に配置するSegIndexerや、長期メモリ保存を扱うTeraGoogleが挙げられる。

シード・サイトとサイトワイドの権威

このリークでは、isElectionAuthorityというファクターが言及されており、おそらくシードサイトやトピックの権威を示すものと思われる。これは、PageRankが9/10のような権威の高いサイトが大きな影響力を持っていることを示唆している。しかし、nsrIsElectionAuthorityは非推奨とされており、解釈に曖昧さを残している。

短いコンテンツでも上位表示

通説に反して、短いコンテンツ=薄いコンテンツではない。今回のリークは、異なる採点システムとはいえ、短いコンテンツでも上位にランクインできることを裏付けている。

フレッシュリンクと既存リンク

freshdocsのリンク価値倍率によると、新しいウェブページからのリンクは、古いコンテンツに挿入されたリンクよりも価値が高い。これは、ニッチな編集も効果的ではあるが、新鮮なリンクの方がインパクトが高いことを示している。

お気に入りの発見

ページクオリティ(PQ)

グーグルはLLMを使って記事ページの「努力」を推定し、そのページが簡単に複製できるかどうかを判断するのに役立てる。ツール、画像、動画、ユニークな情報、情報の深さは、努力の計算で高得点を得る方法です。

トピックの境界とトピックの権限

siteFocusScore、siteRadius、siteEmbeddings、pageEmbeddingsによってサポートされるトピックのオーソリティは非常に重要です。明確なトピックフォーカスを維持し、トピックからの逸脱を最小限に抑えることは、ランキングの向上に役立ちます。

画質

ImageQualityClickSignalsは、クリックデータ(有用性、プレゼンテーション、訴求力、エンゲージメント)に基づいて画像の品質を測定します。

ホストNSR

ホストNSRは、ホストレベルのサイトチャンクに対して計算されるサイトランクで、セグメント単位で品質を測定します。このチャンキングシステムは、Googleがサイトの品質を総合的に評価するのに役立ちます。

統一ランキング理論

このセクションでは、リークから得られた要因を数式に集約し、さまざまな指標とそれらが総合ランキングスコア®に与える影響を明らかにする。

定義と指標

formula

ユーザー・インタラクション・スコア(UIS):

formula

  • UgcScore:ユーザー生成コンテンツのエンゲージメント

  • タイトルマッチスコアユーザーのクエリに対するタイトルの関連性。

  • ChromeInTotal:Chrome経由でトラッキングされたインタラクションの合計。

  • SiteImpressions:総サイトインプレッション数

  • トピックインプレッショントピック別ページのインプレッション。

  • サイトクリック数:サイトのクリック率。

  • トピッククリックトピック別ページのクリック率。

コンテンツ品質スコア(CQS):

formula

  • ImageQualityClickSignals:画像クリックによる品質シグナル。

  • ビデオスコア動画コンテンツの品質とエンゲージメント

  • ショッピングスコアショッピング関連コンテンツのスコア。

  • ページ埋め込み:ページ内容の意味的埋め込み。

  • SiteEmbedding:サイトコンテンツの意味的埋め込み。

  • SiteRadius:サイト埋め込み内の偏差。

  • サイトフォーカス:トピックの焦点を示す指標。

  • テキストの信頼度:テキストの関連性と品質に対する自信。

  • エフォートスコアコンテンツ制作における努力と品質

リンクスコア(LS):

Link Scores

  • TrustedAnchors:インバウンドリンクの品質と信頼性。

  • SiteLinkIn:リンクの平均値。

  • PageRank:様々なPageRankスコア(0、1、2、ToolBar、NR)。

関連性ブースト(RB):

Relevance Boost

  • トピックの埋め込み:時間の経過に伴う関連性

  • QnA:ベースラインの品質指標。

  • STS:テキスト理解度、顕著性、エンティティに基づく総合スコア。

クオリティ・ブースト(QB):

Quality Boost

  • SAS:信頼性、信頼性、リンクオーソリティに関するサイトオーソリティスコア。

  • EFTS:テキスト、マルチメディア、コメントを含む努力スコア。

  • FS:更新日と元の投稿日に基づく鮮度スコア。

  • CSA:SERPとページ上の特徴に基づくコンテンツ固有の調整。

CSA

内容別調整(CSA):

  • CDS:サイト全体のインプレッションとクリックに焦点を当てたクロームデータスコア。

  • SDS:SERP経験値測定に基づくSERP降格スコア。

  • EQSS:実験変数のQスタースコア。

フル・フォーミュラ

R=(∑i=17wi・UISi)+(∑i=19vi・CQSi)+(∑i=13xi・LSi)×(RB+QB+X)-。

R=((w1​⋅UgcScore+w2​⋅TitleMatchScore+w3​⋅ChromeInTotal+w4​⋅SiteImpressions+w5​⋅TopicImpressions+w6​⋅SiteClicks+w7​⋅TopicClicks)+(v1​⋅ImageQualityClickSignals+v2​⋅VideoScore+v3​⋅ShoppingScore+v4​⋅PageEmbedding+v5​⋅SiteEmbedding+v6​⋅SiteRadius+v7​⋅SiteFocus+v8​⋅TextConfidence+v9​⋅EffortScore)+(x1​⋅TrustedAnchors+x2​⋅SiteLinkIn+x3​⋅PageRank))×(TopicEmbedding+QnA+STS+SAS+EFTS+FS)+(y1​⋅CDS+y2​⋅SDS+y3​⋅EQSS)

一般化された採点の概要

1.ユーザー・エンゲージメント:

  • UgcScore、TitleMatchScore、ChromeInTotal、SiteImpressions、Topic Impressions、サイトクリック、トピッククリック

2.マルチメディアスコア:

  • ImageQualityClickSignals、VideoScore、ShoppingScore

3.リンク

  • TrustedAnchors、SiteLinkIn(流入リンクの平均値)、PageRank(0、1、2、ToolBar、NR)

4.内容の理解:

  • PageEmbedding、SiteEmbedding、SiteRadius、SiteFocus、TextConfidence、EffortScore

結論

この文書リークは、Googleのランキングメカニズムに関する貴重な洞察を提供し、いくつかの俗説を覆し、検索結果に影響を与える複雑な要因を明らかにした。SEOの専門家は、この知識を活用し、ユーザーエンゲージメント、トピックの関連性、一貫したコンテンツの質に焦点を当て、戦略を洗練させることができる。SEOコミュニティがこの新事実を消化するにつれ、多くの人々がこの新情報を踏まえてアプローチを再考することになるだろう。

これらのインサイトを理解し、適用することで、SEO担当者はGoogleの複雑なランキングシステムをうまく利用することができ、最終的に検索結果におけるウェブサイトの可視性とパフォーマンスを向上させることができます。

Felix Rose-Collins

Felix Rose-Collins

Ranktracker's CEO/CMO & Co-founder

Felix Rose-Collins is the Co-founder and CEO/CMO of Ranktracker. With over 15 years of SEO experience, he has single-handedly scaled the Ranktracker site to over 500,000 monthly visits, with 390,000 of these stemming from organic searches each month.

Ranktrackerを無料で使いましょう。

あなたのWebサイトのランキングを妨げている原因を突き止めます。

無料アカウント作成

または認証情報を使ってサインインする

Different views of Ranktracker app