Google botの「2MB制限」とは?重要コンテンツが無視されるリスクと対策

Google botの「2MB制限」とは?重要コンテンツが無視されるリスクと対策

Googleの検索セントラルブログ(2026年3月末日公開)にて、Googlebotがページを読み込む際の「2MB制限」に関する詳細な仕様が公開されました。

一般的に、テキスト主体のHTMLファイルが2MB(全角文字で約100万文字相当)を超えることは稀です。しかし、リッチなデザインや多機能化が進む現代のサイトでは、「見えないコード」によってHTMLが急激に太り、この境界線を突破してしまう可能性がゼロではありません。

今回のアップデートは、SEOを「コンテンツの質(何を書くか)」だけで考えていた方にとって、非常に重要な警告となります。これからは「HTMLのどこに情報を置くか」という設計が、検索順位に直結することを強く意識する必要があります。

※本記事の内容は、2026年4月記事公開時点の情報にもとづいています。

Googlebotは「最初の2MB」までしか読み込まない

Googlebotは、無限にページを読んでくれるわけではありません。PDFを除き、1ページあたり最大2MBまでという取得制限があります。

ここで注意が必要なのは、2MBを超えた場合、Googlebotはそこで取得を完全に停止するという点です。「後で続きを読み直す」といった動作は行われず、2MB以降のテキストやコードは、クローリング、レンダリング、そしてインデックスの対象から完全に除外されます。

つまり、Googleにとっては「存在しないもの」として扱われてしまうのです。

2MB制限の細かな仕様は、次のとおりです。

  • 非圧縮時のサイズで判定
    サーバー側でGzip※等により圧縮して送信していても、Googlebotは展開後の(未圧縮の)バイト列で2MBを判定する
  • HTTPヘッダーも含まれる
    HTML本体だけでなく、HTTPリクエストヘッダー※のサイズもこの2MBに含まれまれる
  • PDFは例外
    PDFファイルに関しては、最大64MBまで取得対象となる

※Gzip
データの転送効率を高める「圧縮転送」の仕組み
※HTTPリクエストヘッダー
Webページを表示する際、ブラウザがサーバーへ送信する、通信条件やクライアント情報などの管理情報

HTMLが太る原因と「2MBの壁」による実害

「HTMLだけで2MBなんて、そうそう超えないのでは?」と思うかもしれません。

しかし、リッチなデザインや多機能なサイトでは、「見えないコード」によってHTMLが急激に太っています。

HTMLを太らせる「犯人」

HTMLの容量を増加させてしまう要因として、以下のような例が挙げられます。

  • 複雑なメニュー
    全ページで表示される複雑なナビゲーションや、長すぎるフッター
  • インラインCSS/JS
    デザインの指示(CSS)や動く仕組み(JS)を、別のファイルに分けず、HTMLの中に直接書き込んでしまうこと
  • Base64画像
    写真などの画像を、テキストデータに変換してHTMLに埋め込む手法
  • 過剰なDOM(ドム)要素
    ページのパーツを細かく分けすぎて、HTMLのタグが膨大になること

これらがページの上部に集中すると、本来Googleに読んでほしい「記事の本文」や「評価に直結するタグ」が2MBの境界線より後ろに押し出され、無視されてしまうのです。

JavaScript(ジャバスクリプト)サイトの落とし穴

最近増えている、JavaScriptで動的に中身を表示させるSPA※のようなサイトは、特に注意が必要です。

Googleには、JavaScriptを実行して画面を「描画」する仕組み(WRS※)がありますが、これも「最初の2MB」の範囲内にあるコードしか使いません。もし、ページを描くための大事な命令書が2MBより後ろにあった場合、Googleには「中身が真っ白なページ」として登録されてしまうリスクがあります。

※SPA(Single Page Application)
単一のHTMLページで構成され、動的にコンテンツを更新するWeb設計
※WRS(Web Rendering Service)
Googlebotが、ページをコードから絵として組み立てて確認するプロセス

実務で取り組むべき「SEO設計」のポイント

これからのSEOは、執筆と同じくらい「HTMLを軽く、効率的に保つこと」が求められます。

ここでは、具体的なSEO設計のポイントを紹介します。

1. 重要な情報は「最初の方」に書く

タイトル(title)や、検索結果に出る説明文(meta description)、ページの重要性を示すタグ(canonical)などは、必ずHTMLの冒頭に配置しましょう。

特に構造化データが2MBの地点で途切れると、構文エラーとして扱われ、リッチリザルト※等が表示されなくなります。

※リッチリザルト
検索結果に視覚的な拡張を加える表示形式(スニペットやレビュー、FAQなど)

2. 「埋め込み」を減らして「別出し」にする

デザインの指示(CSS)などは、できるだけHTMLの中に直接書かず、外部ファイルとして読み込むようにします。そうすることで、HTML本体の「2MB」という枠を節約できます。

なお、外部のCSSやJSファイル自体にもそれぞれ2MBの制限がありますが、HTMLとは別カウントで処理されます。Base64による画像の埋め込みも、HTMLを急激に太らせるため避けるべきです。

3. SSR(サーバーサイドレンダリング)を検討する

JavaScriptを多用するサイトでは、Googlebotが頑張って組み立てなくても済むように、サーバー側でページを完成させてから送る「SSR※」という仕組みの導入が安全です。

静的サイト生成を活用し、最初の2MB以内に主要なテキストコンテンツが含まれる状態を目指しましょう。

※SSR(サーバーサイドレンダリング)
ブラウザ(読み手側)で行うページの組み立てを、サーバー(送る側)が代わりに行って、完成品を届ける仕組み

まとめ

今回のニュースから言える本質は、「SEOはコンテンツ制作だけの勝負ではなく、情報の出し方の勝負でもある」ということです。

どんなに素晴らしい記事を書いても、技術的な「2MBの壁」に阻まれてGoogleに届かなければ、その努力は報われません。サイトのリニューアルや記事更新の際は、情報の「質」だけでなく、「HTMLの上から何番目に大事な話があるか」についても意識してみてください

CONTACT お問い合わせ

あらゆる分野のスペシャリストが、お客様と同じゴールを目指して
Web広告からCRM支援まで一気通貫で伴走します。

お問い合わせする

WRITING 執筆

LIFT編集部

LIFT編集部

LIFT編集部は、お客様との深いつながりを築くための実践的なカスタマーエンゲージメントのヒントをお届けしています。

RELATED 関連記事

SHOW CASE ゴンドラの事例

FIND ARTICLE 記事を探す