お客さまへの大切なお知らせ:膨大なサポート情報を少しでも早くお客さまにお届けするため、本コンテンツの日本語版は人間の翻訳者を介さない自動翻訳で提供されております。正確な最新情報については本コンテンツの英語版をご覧ください。
Reports

検索エンジンによるページやブログ記事のインデックス化をブロックする

更新日時 January 17, 2019

対象製品

Marketing Hub
marketing-basic-pro-enterprise
Professional, Enterprise
Basic
HubSpot CMS
検索エンジンによるウェブサイトの特定ページのインデックス化を防ぐオプションがいくつか用意されています。検索エンジンで必要なページのみブロックされるよう、これらの各オプションを慎重に調べてから変更を実装することをお勧めします。

: "no index" メタタグ方法を使用する場合は、robots.txt テキストファイル方法と組み合わせることができません。検索エンジンが "no index" メタタグを認識するためにはページをクロールする必要がありますが、robots.txt ファイルはクロールを完全に阻止します。

Robots.txt ファイル

robots.txt ファイルは、インデックス化するページとしないページを確認するために検索エンジンクローラーが読み取るウェブサイト上のファイルです。HubSpot で robots.txt ファイルを設定する方法はこちらを参照してください。

Google などの検索エンジンでは、 robots.text ファイルを実装した後に、結果から過去に遡ってページを削除することができません。ボットによるページのクロールは禁止されますが、たとえば他のウェブサイトからページへのインバウンドリンクがある場合、検索エンジンはコンテンツをインデックス化できます。ページがすでにインデックス化されていて、過去に遡って検索エンジンから削除したい場合は、以下の "no index" メタタグ方法を使用してください。 

"no index" メタタグ

"no index" メタタグは、ページの HTML のヘッドセクションに入力されるコードの文字列で、ページをインデックス化しないことを検索エンジンに伝えます。

 

edit-head-html

 

Google ウェブマスターツール

Google ウェブマスターツールのアカウントをお持ちの場合は、Google 検索結果から削除する URL を送信することができます

: これは Google の検索結果にのみ適用されます。

検索エンジンにより PDF ドキュメントなどがインデックス化されないように HubSpot ファイルマネージャーでファイルをブロックする場合は、ファイルが接続されているサブドメインを選択し、クローラーからブロックするファイルの URL を使用します。

HubSpot でユーザーエージェントからのリクエストが処理される方法

ウェブサイトのテストクロールを行うためのユーザーエージェント文字列を設定していて、アクセス拒否のメッセージが表示される場合、これは予想される動作です。Google はまだクロールしており、サイトをインデックス化しています。

このメッセージが表示されるのは、HubSpot では、Google が所有する IP を発信元とする googlebot ユーザーエージェントからのリクエストのみが許可されるためです。HubSpot でホストされているサイトを攻撃者やなりすましから保護するために、他の IP アドレスからのリクエストは拒否されます。HubSpot は、BingBot、MSNBot、Baidusider などの検索エンジンクローラーにも対応しています。