効果的な検索のためのヒント
このページは PageTurner AI で翻訳されました(ベータ版)。プロジェクト公式の承認はありません。 エラーを見つけましたか? 問題を報告 →
DocSearchはほぼ全てのウェブサイトで動作しますが、特定のサイト構造ではより関連性の高い結果や高速なインデックス作成が可能であることがわかっています。このページではDocSearchを最大限活用するためのヒントを紹介します。
sitemap.xmlの活用
設定でサイトマップを提供すると、DocSearchはインデックス対象ページを直接参照できます。ページは依然クロールされるため、適合する全てのリンクが抽出されます。
まだサイトマップをお持ちでない場合、sitemap.xmlの追加を強くお勧めします。これによりインデックス作成が高速化されるだけでなく、インデックス対象ページの制御も容易になります。
サイトマップはSEOなど他の観点でもベストプラクティスとされています(サイトマップの詳細)。
情報階層の構造化
DocSearchは構造化されたドキュメントでより効果的に機能します。検索結果の関連性はコンテンツの階層構造に基づいています。つまり、ページの<h1>~<h6>見出しを解析して情報階層を推定します。この階層構造によりレコードに文脈情報が付与されます。
ドキュメントは一般的な概念から始まり、徐々に詳細な説明へ進みます。これはHTMLマークアップにおける見出し階層で表現されます。例えば、同じページ内で<h4>タグ下の概念は<h2>タグ下の概念よりも詳細です。ページ内で早く出現する情報ほど高いランク付けされます。
DocSearchはこの構造を活用して結果の関連性を微調整し、フィルタリング機能を提供します。このパターンに沿ったドキュメントでは検索結果の関連性が向上します。
ドキュメントツリーの適切な深さの決定とコンテンツ分割は最も複雑な作業の一つです。大規模ページでは4階層(lvl0~lvl3)を推奨し、少なくとも3階層を確保してください。
<hX>タグを使用せずクラス(例: <span class="title-X">)で代替できる点に留意してください。