お客さまへの大切なお知らせ:膨大なサポート情報を少しでも早くお客さまにお届けするため、本コンテンツの日本語版は人間の翻訳者を介さない自動翻訳で提供されております。正確な最新情報については本コンテンツの英語版をご覧ください。
Reports

検索エンジンによるページやブログ記事のインデックス化をブロックする

更新日時 2019年 3月 25日

対象製品

Marketing Hub  Professional, Enterprise
Basic
HubSpot CMS
検索エンジンによるウェブサイトの特定ページのインデックス化を防ぐオプションがいくつか用意されています。目的のページのみが検索エンジンに対してブロックされるよう、これらの各オプションを慎重に調べてから変更を実装することをお勧めします。

ご注意ください。"no index" メタタグを使用する場合、robots.txt テキストファイルを同時に使用することはできません。検索エンジンが "no index" メタタグを認識するためにはページをクロールする必要がありますが、robots.txt ファイルはクロールを完全に阻止します。

Robots.txt ファイル

robots.txt ファイルは、インデックス化するページとしないページを確認するために検索エンジンクローラーが読み取るウェブサイト上のファイルです。HubSpot で robots.txt ファイルを設定する方法をご確認ください。

Google などの検索エンジンでは、robots.text ファイルを実装した後に、結果から過去に遡ってページを削除することはできません。ボットによるページのクロールは禁止されますが、たとえば他のウェブサイトからページへのインバウンドリンクがある場合、検索エンジンはコンテンツをインデックス化できます。ページがすでにインデックス化されている場合、過去に遡って検索エンジンから削除するには、以下の "no index" メタタグの方法を使用してください。 

"no index" メタタグ

"no index" メタタグは、ページの HTML のヘッドセクションに入力されるコードの文字列で、ページをインデックス化しないよう検索エンジンに指示します。この方法を使用できるのは、ランディングページとウェブサイトページに対してのみです。ブログ記事には使用できません。

  • HubSpot アカウントで、ランディングページまたはウェブサイトページ移動します。
  • 特定のページの名前をクリックします。
  • コンテンツエディターで、ページ上部の [設定] タブをクリックします。
  • [詳細オプション] をクリックします。
  • 次のコードをコピーして、[ヘッド HTML] フィールドに貼り付けます。
 

edit-head-html

 

Google ウェブマスターツール

Google ウェブマスターツールのアカウントをお持ちの場合は、Google 検索結果から削除する URL を送信することができます。

ご注意ください。これは Google の検索結果にのみ適用されます。

検索エンジンにより PDF ドキュメントなどがインデックス化されないように HubSpot ファイルマネージャーでファイルをブロックする場合は、ファイルが接続されているサブドメインを選択し、クローラーからブロックするファイルの URL を使用します。

HubSpot でユーザーエージェントからのリクエストが処理される方法

ウェブサイトのテストクロールを行うためのユーザーエージェント文字列を設定していて、アクセス拒否のメッセージが表示される場合、これは予想される動作です。Google はまだクロールしており、サイトをインデックス化しています。

このメッセージが表示されるのは、HubSpot では、Google が所有する IP を発信元とする googlebot ユーザーエージェントからのリクエストのみが許可されるためです。HubSpot でホストされているサイトを攻撃者やなりすましから保護するために、他の IP アドレスからのリクエストは拒否されます。HubSpot は、BingBot、MSNBot、Baidusider などの検索エンジンクローラーにも対応しています。