PerplexityやChatGPTに自分の記事を引用させる方法──東大研究発の”構造だけで差がつく”GEO戦略

「ChatGPTに引用されるコンテンツって、結局どう書けばいいの?」——AI検索が当たり前になった今、コンテンツ制作者なら誰もが一度は考えたはずの問いです。

この問いに対して、東京大学・筑波大学・広島大学の研究チームが2026年3月に興味深い論文を発表しました。タイトルは 「Structural Feature Engineering for Generative Engine Optimization: How Content Structure Shapes Citation Behavior」。日本語で言えば、「コンテンツの構造が、AIの引用行動をどう左右するか」を体系的に調べた研究です。

結論を先に言ってしまうと——文章の中身を変えなくても、構造を整えるだけで引用率が平均17.3%向上したという結果が出ています。今回はこの論文「GEO-SFE」を、実務目線で読み解いてみます。

そもそもGEOとは?

GEO(Generative Engine Optimization)は、ChatGPT、Perplexity、Google AI Overviews、ClaudeなどのAI検索エンジンに「引用されやすいコンテンツ」をつくる施策の総称です。SEOが「検索結果でクリックされる」ことを目指したのに対し、GEOは「AIの回答の中で言及される」ことがゴール。

従来のGEO研究は、「統計データを盛り込む」「権威ある引用を入れる」「断定的な言い回しにする」といった文章の意味的な改善に集中してきました。一方で、見出しの付け方、段落の長さ、太字の使い方といった構造的な要素がどれだけ引用率に影響するかは、ほとんど解明されていなかったのです。

提案された手法「GEO-SFE」

論文では、コンテンツの構造を3つの階層に分解して定量化し、それぞれを最適化するフレームワーク「GEO-SFE」を提案しています。

1. マクロ構造(文書全体の設計)

見出しの階層、セクション同士のつながり、内部リンクの密度など、文書全体のアーキテクチャを指します。論文の分析によると——

  • 見出しの階層は3〜5段がベスト(深すぎるとAIの注意が分散、浅すぎると整理されていないと判断される)
  • 内部リンクの密度は0.15〜0.20が理想
  • セクション間の意味的な連続性が高いほど引用されやすい

2. メソ構造(段落・セクションレベル)

段落の長さやリスト・表などの構造化要素の使い方です。ここがけっこう実務的に重要。

  • 段落の長さは150〜300語が最適(日本語で言えば概ね300〜600文字程度)
  • 300語を超えると、段落の中盤で注意力が31%低下するという別研究の知見と一致
  • 150語未満だと情報が分断され、引用確率が23%下がる
  • リスト・表・コードブロックなど構造化要素は全体の25〜35%を占めるのが理想
  • 構造化された情報は、プレーンな散文と比べてAIの抽出精度が43%高い

3. ミクロ構造(文・語レベル)

太字・イタリックなどの強調や、キーワードの配置位置です。

  • 強調マーカーはコンテンツ全体の5〜10%に絞る(多すぎると逆効果)
  • 強調の効果は 太字 > イタリック > 下線 の順
  • キーワードは文頭またはセクション境界に配置すると注意を集めやすい(文中の標準位置と比べて2倍の注意を引く)

AI検索エンジンによって「好み」が違う

面白いのは、論文がAI検索エンジンを3つのアーキテクチャに分類し、それぞれに最適な戦略が異なると指摘している点です。

アーキテクチャ 代表例 重視される構造
Search-then-Synthesize型 Google SGE、Bing Chat メタ構造の明確さ、冒頭の情報密度
Iterative Refinement型 Perplexity、Phind 相互参照の豊富さ、階層の幅
Integrated Search-Generation型 ChatGPT、Claude チャンクの独立性、フォーマットの多様性

つまり、ChatGPTやClaudeを意識するなら「各セクションが単独で意味を成すように書く」「リストや表を積極的に使う」が効きやすく、Perplexityを狙うなら「内部リンクや関連情報の網目を充実させる」のが効くということになります。

実験結果——どれくらい効果があったか

研究チームは、GEO-bench(GEO評価用の標準データセット)から200記事を抽出し、6つの主要AI検索エンジン上で、最適化前後の引用率を比較しました。総テスト件数は2,400件です。

主な結果

  • 全体の引用率が +17.3%(統計的に有意、p < 0.001)
  • Search-then-Synthesize型. :+19.2%
  • Iterative Refinement型. :+14.0%
  • Integrated Search-Generation型:+19.7%
  • 主観的な品質評価(G-Eval)でも平均 +18.5% の改善
  • 特に「影響力」(+32.0%)と「クリック確率」(+31.4%)の向上が顕著

3階層のうち、どこが効いたのか?

各階層を取り除いた実験(アブレーション分析)では、引用率向上への寄与は——

  • マクロ構造:44.9%
  • メソ構造 :39.7%
  • ミクロ構造:15.4%

つまり、太字やキーワード位置といったミクロな調整より、文書全体の見出し設計と段落構成のほうが圧倒的に効くということ。これは納得感があります。

明日から使える実践的なチェックリスト

論文の知見をそのまま記事制作に落とし込むと、こんな感じになります。

  • ✅ 見出し階層は3〜5段に収める(H2、H3、H4くらいまで)
  • ✅ 1段落は300〜600文字程度を目安に
  • ✅ リスト・表・引用ボックスを意識的に挟む(全体の1/4〜1/3が理想)
  • ✅ 太字は使いすぎず、5〜10%以内に抑える
  • ✅ キーワードは文頭やセクション冒頭に置く
  • ✅ 各セクションが単独でも意味が通るよう、文脈を補足する
  • ✅ 関連記事への内部リンクを適切な密度で配置する

論文を「使える」形にした──Claude Codeスキル「geo-sfe」を公開しました

……とはいえ、チェックリストを毎回手動で確認しながら記事を書くのは、正直しんどい。そこでハバスでは、このGEO-SFE論文の手法をClaude Codeのカスタムスキルとして実装し、GitHubで公開しました。


Claude Navi

こちらで紹介しています:https://claudenavi.com/app/geo-sfe

何ができるのか?

2つのスラッシュコマンドを追加するだけのシンプルなスキルです。

コマンド できること
/geo-analyze コンテンツの構造を3階層で分析し、改善提案をレポート(geo-report.md)として出力
/geo-optimize GEO-SFEフレームワークに基づいて、コンテンツの構造を自動最適化(意味は保ったまま)

インストール

Claude Codeが既に入っている環境なら、コマンド一発で導入できます。

git clone https://github.com/havaslabo/geo-sfe.git
cd geo-sfe
./install.sh

使い方

執筆中の記事ファイルがあるディレクトリでClaude Codeを起動し、スラッシュコマンドを叩くだけ。

# カレントディレクトリ以下の全記事を分析
/geo-analyze
 
# 特定のファイルだけ最適化
/geo-optimize article.md
 
# 狙うAI検索エンジンを指定して最適化
/geo-optimize article.md sts   # Google SGE / Bing Chat 向け
/geo-optimize article.md ir    # Perplexity / Phind 向け
/geo-optimize article.md isg   # ChatGPT / Claude 向け

論文に出てきた3つのアーキテクチャ(Search-then-Synthesize / Iterative Refinement / Integrated Search-Generation)に対応した最適化モードを用意しているので、どのAI検索エンジンでの引用を狙うかに応じて使い分けられます。

注意点として、/geo-optimizeは元ファイルを上書き保存します。実行前にGitでコミットしておくのを推奨します(というか、しないと痛い目を見ます)。

中身はシンプル

スキルの実体は、論文の手法を構造化したMarkdownファイル(Claude Codeのカスタムコマンド定義)です。Claude自身が論文の3階層ルールを読み込んで、文書を解析・最適化してくれる仕組み。Pythonの依存関係もAPIキーも不要で、Claude Codeさえあれば動きます。

実装を読めば「論文をどうプロンプトに落とし込んだか」も見られるので、GEOに興味がある方・Claude Codeのスキル開発に興味がある方にも参考になるかと思います。

まとめ——GEOは「中身」と「構造」の両輪へ

これまでGEOの議論は「何を書くか」に偏りがちでしたが、今回の論文は「どう構造化して見せるか」も同じくらい重要だと示しました。とくに、文書全体の設計(マクロ構造)が引用率の45%近くを左右するという発見は、コンテンツ制作の優先順位を見直すきっかけになります。

AI検索の比重がますます高まる2026年、コンテンツ制作者にとって「AIに読まれやすい構造」を意識することは、もはやオプションではなく前提になりつつあります。難しいことではありません。読者にとって読みやすい構造は、たいていAIにとっても読みやすいのです。

論文の原文はarXivで公開されていますので、より詳しく知りたい方はぜひ。


文:植田(ハバス合同会社 研究開発部)


参考文献:Junwei Yu, Yang MuFeng, Yepeng Ding, Hiroyuki Sato. “Structural Feature Engineering for Generative Engine Optimization: How Content Structure Shapes Citation Behavior.” arXiv:2603.29979, March 2026.