なんか公式がリークされたというか流出しちゃった内容については本物であると認めたらしいですね。所感です。

Googleが流出内容についてリアルなものである、と認めた@2024/05/30

ソースはThe Vergeから。

https://www.theverge.com/2024/5/29/24167407/google-search-algorithm-documents-leak-confirmation?s=09

ざっくり翻訳としては以下。

グーグルから流出した2,500件の内部文書には、同社が収集するデータに関する詳細が記載されており、その文書が本物であることを同社は今日確認しました。これまで、グーグルはこれらの資料についてコメントを拒否していました。

問題の文書には、グーグルが追跡しているデータの詳細が記載されており、その一部は同社が厳重に守っている検索ランキングアルゴリズムに使用されている可能性があります。この文書は、ウェブの形成において極めて重要なシステムの一端を、前例のない形で(ただし依然として曖昧な部分もありますが)明らかにしています。

「文脈から外れた情報、古い情報、不完全な情報に基づいて検索に関する誤った推測をすることには注意を促したい」と、グーグルのスポークスパーソン、デイビス・トンプソンはThe Vergeに対してメールで述べています。「我々は、検索がどのように機能するか、およびシステムが考慮する要素の種類について広範な情報を共有しており、結果の操作からその整合性を守るために取り組んでいます。」

流出資料の存在は、検索エンジン最適化(SEO)専門家のランド・フィシュキンとマイク・キングによって最初に明らかにされ、彼らは今週初めにそれぞれの文書とその内容の初期分析を発表しました。The Vergeは、流出の信憑性について昨日複数回コメントを求めましたが、グーグルからの返答はありませんでした。

そうなんだーという感じ。こういうリーク系とか、SEOツールベンダーによる大規模調査ってのはだいたい毎年あってワクワクテカテカなのだけど、この規模&公式が認めるってのは確かにほぼなかったんじゃないかな。ありゃりゃ。

ちなみに漏れちゃった内容のサマリーは以下。(筆者にて抜粋、意訳)

ランキングシステムと特徴:文書には、YouTube、アシスタント、ウェブドキュメントなどに関連する2,596のモジュールと14,014の属性が記載されています。これらのモジュールは一元化されたリポジトリの一部で、ネットワーク上のどのマシンからでもアクセス可能です。

Googleの誤解を招く声明:

  • ドメイン権威:「siteAuthority」という機能が存在し、サイト全体の権威を測定していることが明らかになっています。
  • ランキングのためのクリック:「NavBoost」などのシステムがクリックデータをランキングに使用していることが判明しています。
  • サンドボックス:「hostAge」属性が新しいサイトをサンドボックス化するために使用されていることが示されています。
  • Chromeデータ:Chromeデータがランキングアルゴリズムに使用されていることが文書に記載されています。

アーキテクチャ:Googleのランキングシステムは一連のマイクロサービスで構成されており、主要なシステムにはTrawler(クロール)、Alexandria(インデックス)、Mustang(ランキング)、SuperRoot(クエリ処理)があります。
ツイッドラー:これらは検索結果をユーザーに提示する前に再ランク付けする機能で、NavBoost、QualityBoost、RealTimeBoostなどが例として挙げられます。


SEOへの影響:

  • パンダアルゴリズム:ユーザーの行動や外部リンクに基づくスコア修正が適用されます。
  • 著者:Googleは著者情報を明示的に保存し、ランキングにおける著者の重要性を示しています。
  • 降格:アンカーミスマッチ、SERPの不満、完全一致ドメインなどに対するさまざまな降格が適用されます。
  • リンク:リンクは依然として重要であり、ページがインデックスされる場所に基づく値が示されています。
  • コンテンツ:短いコンテンツのオリジナリティを測定し、トークンをカウントすることで、重要なコンテンツを早期に配置することの重要性を強調しています。

ソースは以下など

https://web.swipeinsight.app/posts/google-search-algorithm-leak-internal-docs-reveal-secrets-of-ranking-clicks-and-more-6537

SEOをやってる身としてはどう思うか?

面白いけど、だから何?ではある

そこそこ長い間SEOとかをやっている身ではあり、担当していたサイトやビジネスの規模も個人のそれとは結構違ったものであり、それなりに最低限のいろいろはキャッチアップできているという自負もあるのだけど、今回の結果としては「へーおもろ」ではあるが、これによって明日から「SEOはやはり終わった」「Googleは死んだ」とは思っていない。

たしかに面白い情報はあったが、なんかほとんど界隈ではありとあらゆる検証において「公式はああ言ってるけど絶対このシグナル見てるよね」という仮説強度の高い話が蔓延していたし、SEOすごい人たちからしたらほぼ勝ち確な自己採点に近いものだったんじゃないかなと思っている。

あとそもそも既に(対競合観点で相対的に)完成度が高すぎて、いちプロダクトとして明日から利用者激減ですねとか、半年以内にGoogleを超えてくる代替サービスが出てきますね、とはならないのではと思っている。(自分の想像力不足もあるとは思うけど、世の中そんなもん、という理解)

明日からやることは変わらない

2500ものモジュールと、1.4万の指標が、複数のマイクロサービスに分散され蠢いている、というシステムの概観はわかったところで、今度はスコアリングなり、そのロジックのチューニングなりが時系列に応じて掛け合わされ、もはやどう考えても「わかったところで個別最適を効かせるような対応はできない」という次元なのは何も変わらない。

普段からSEOをやっていれば、デイリーでGoogleのアルゴリズムやWebの環境は揺らぎ続けて変化しているということは身を以って知っているはずで、特定タイミングのアルゴリズムやシグナルが公式から展開されたとて、明日からやることが変わるわけではない。(規模の大きなサイトであればあるほど未来を見て企画や実装をしている構造にある)

結局、多くの非SEOスペシャリストが想像するような1:1あるいは1:Nの施策を通した「SEOとアルゴリズムの対話」ではなく、Googleが描いていた「”良い検索体験”を目指す全体最適」でないとROIが合わないという環境はすでに出来上がっていたのだと思う。そういう意味ではある種すでに”人智(というか手動の小さな最適化)を超えたシステム”ではあったのかもしれない。

“人智(というか手動の小さな最適化)を超え”ることと、アルゴリズムの公開バランスの変化

大手プラットフォーマーは以前より開示に積極的である

そういえば、Twitter(現X)のアルゴリズムもわーわー言われるが、イーロンによって開示された。以下はそれに対する一般的なアルゴリズムのスコア解釈の一部だ。

  • ポストがいいねされる +0.5 加算上限+100
  • ポストがリポストされる +1.0 加算上限+100
  • ポストがリプライされる +13.5 加算上限+100
  • プロフィールが開かれる +ポストがいいね or リプライされる +12.0 加算上限+1,000,000
  • 動画の半分以上が視聴される +0.005 加算上限+100
  • リプライされたポストにポスト投稿者がエンゲージメントする +75.0 加算上限+200
  • ポストのスレッドがクリックされる +いいね or リプライされる +11.0 加算上限+1,000,000
  • ポストのスレッドがクリックされる +2分間以上滞在される …などなど

ソースはこのへん。

https://blog.x.com/engineering/en_us/topics/open-source/2023/twitter-recommendation-algorithm

そう考えるとやっぱりSEOに比べてTwitter(現X)の単純さってすごい。短期かつ局地戦であんまり責任とか伴わないタイプのトラフィックビジネスは、やっぱりXでimp稼いでプロフ誘導が鉄板っすね。(ちくちく言葉)

インスタグラムも結構ちゃんと広報していたりする。

https://about.instagram.com/ja-jp/blog/announcements/instagram-ranking-explained

https://creators.instagram.com/grow/algorithms-and-ranking?locale=ja_JP

「単純な対策はされない」という自信の表れっぽい

Googleのそれと同様に、クリエイターが手動で対応しようとすると限界があるため、システムを開示したところでハックされないという自信というか、確証がある際に、プラットフォーマーとして目指したい環境や世界観を共有し、その実現速度をドライブするために開示するのだろうなと思っている。

あとは開示することで取り締まりをしやすくなるっていう側面もきっとあるんだろうね、「こうしましょう」というのは、「こうしてくださいね」であり、「それ以外はすんなよ」でもあるのかもしれない。

「なんなら時期的にはベストなのでは」説

そして、この秘伝のタレを守り続けるのも結構厳しいと思っていた。インターネットというのはいろいろ漏れるものである、秘密というのもいつかは絶対バレるものである。そもそもあんなバカでかテックカンパニーで「アルゴリズム絶対外じゃ喋っちゃダメだぞ」なんてガバナンス、効き続けると思う方がどうかしている。この時点までなかなか騒がれなかったのがすごい。

そして中身を見ても、結局のところ「人為的にハッキングする」という心をまあまあ折ってくる内容ではあった。ちょっと背理法的な逆張りな考えも入っているけど、個別対策ができない&AIでこれからめちゃめちゃなブレイクスルーないし環境変化がありそうな今日この頃、「漏らすなら今」ではあったのかもしれない。

情報は増えども、マーケティングのやることはあまり変わらないし増えてない

結局ずっと答えは一緒

最近、特に世の中の情報は増え続けている、マーケティングに関するものも、こういったアルゴリズムのリークだったり、オープンソース化だったり、新技術だったり、成功事例、失敗事例など、入ってくる情報は増え続けている。

ただ、結局のところ、「ステークホルダーのためになるものを作りましょう、やりましょう」という一点について、「やっぱそうなるよね」の確認機会にしかなっていないとも感じる。

局所戦をメインにしているビジネスや、競合と常に鍔迫り合いに持ち込まれているような戦いにおいては、情報の差というのは勝ち負けにヒットするんだけど、ことマーケティングに関しては、そういったネット上でオープンになっている情報にはみんなアクセスしているだろうし、結局そこではあまり差に繋がらなかったりする。

自分達しか知り得ない事実をどれだけ知っているか、そしてそれをサービスや施策に落とし込んでデザインできるか、結局のところそういう話になってくる。

というわけで、昨日までと何も変わらない感じで、人様のお役に立てるよう今日もまた頑張っていきましょう。

何か変わるとしたら、SEO関係者たちとの飲み会がちょっと盛り上がるくらいかな。肴提供あざーすGoogleさん。

なんつって。