検索結果の上位にPDFファイルなどが表示されることがあります。
GoogleはHTML形式以外のファイルをどのようにインデックス登録しているのか、インデックス登録しない方法などを公開しております。
いくつか抜粋してご案内します。
●PDFファイルの扱い方
・PDFファイルがパスワード保護または暗号化されている場合を除き、インデックス登録する。
・PDF 文書内のテキストをコピーして、標準的なテキスト文書にペーストできるのであれば、そのテキストはインデックス登録が可能。
・PDFファイル内の画像はインデックス登録されない。
・PDFファイル内のリンクは HTML 内のリンクと同じように扱われる。
・PDFファイルを検索結果に表示させないようにするには、ファイル用の HTTP ヘッダーに X-Robots-Tag: noindex を追加する。
・既にインデックスに登録されている場合:X-Robot-Tag で noindex を指定すれば、しばらく時間が経つとインデックスから除外されていく。
・PDF ファイルでも検索結果の上位にランキングすることは可能。
・ページをHTMLとPDF形式と両方で提供しない。両方が必要な場合は、どちらを優先するか記載する。
各情報の詳細については、Google Webmaster Central Blogに掲載されていますので、ご確認ください。
【参考】Google Webmaster Central Blog: