HubSpot Knowledge Base

Impedire che i contenuti appaiano nei risultati di ricerca

Scritto da HubSpot Support | Jan 27, 2021 4:34:27 PM

È possibile evitare che i nuovi contenuti appaiano nei risultati aggiungendo lo slug dell'URL a un file robots.txt. I motori di ricerca utilizzano questi file per capire come indicizzare i contenuti di un sito web. I contenuti deidomini del sistema HubSpot contenenti siti hs sono sempre impostati come no-index in un file robots.txt.

Se i motori di ricerca hanno già indicizzato i vostri contenuti, potete aggiungere un meta tag "noindex" all'HTML del contenuto. In questo modo i motori di ricerca smetteranno di visualizzarlo nei risultati di ricerca.

Nota bene: solo i contenuti ospitati su un dominio collegato a HubSpot possono essere bloccati nel file robots.txt. Per saperne di più sulla personalizzazione degli URL dei file nello strumento File.


Utilizzare i file robot.txt

È possibile aggiungere i contenuti non ancora indicizzati dai motori di ricerca a un file robots.txt per evitare che vengano visualizzati nei risultati di ricerca.

Per modificare il file robots.txt in HubSpot:

  1. Nel menu della barra laterale sinistra, spostarsi su Contenuti > Pagine.

  2. Selezionare il dominio di cui si desidera modificare il file robots.txt:
    • Per modificare il file robots.txt per tutti i domini collegati, fare clic sul menu a discesa Scegli un dominio per modificare le sue impostazioni e selezionare Impostazioni predefinite per tutti i domini (selezionate per impostazione predefinita).
    • Per modificare il file robots.txt per un dominio specifico, fare clic sul menu a discesa Scegli un dominio per modificarne le impostazioni e selezionare il dominio. Se necessario, fare clic su Sovrascrivi impostazioni predefinite. In questo modo si sovrascriveranno le impostazioni predefinite di robots.txt per questo dominio.
  3. Fare clic sulla scheda SEO e Crawler.
  4. Nella sezione Robots.txt, modificare il contenuto del file. Il file robots.txt è composto da due parti:
    • User-agent: definisce il motore di ricerca o il bot web a cui si applica una regola. Per impostazione predefinita, viene impostato per includere tutti i motori di ricerca, indicati con un asterisco (*), ma è possibile specificare motori di ricerca specifici. Se si utilizza il modulo di ricerca del sito di HubSpot, è necessario includere HubSpotContentSearchBot come user-agent separato. Ciò consentirà alla funzione di ricerca di effettuare il crawling delle pagine.
    • Disallow: indica a un motore di ricerca di non eseguire il crawling e l'indicizzazione di file o pagine che utilizzano uno specifico slug URL. Per ogni pagina che si desidera aggiungere al file robots.txt, inserire Disallow: /url-slug (ad esempio, www.hubspot.com/welcome appare come Disallow: /welcome).
  5. Al termine, fare clic su Salva in basso a sinistra.

Per saperne di più sulla formattazione di un file robots.txt, consultare la documentazione per sviluppatori di Google.

Utilizzare i meta tag "noindex

Se il contenuto è già stato indicizzato dai motori di ricerca, è possibile aggiungere un meta tag "noindex" per indicare ai motori di ricerca di non indicizzarlo più in futuro.

Attenzione: questo metodo non deve essere combinato con il metodo robots.txt, in quanto impedisce ai motori di ricerca di vedere il tag "noindex".

Aggiungere il meta tag "noindex" a pagine e post

  1. Andate al vostro contenuto:

    • Pagine del sito web:
    • Pagine di destinazione:
    • Blog:
  2. Fare clic sul nome del contenuto.
  3. Nell'editor dei contenuti, fare clic su Impostazioni in alto a destra.
  4. Nella finestra di dialogo, fare clic su Avanzate nel menu della barra laterale sinistra.
  5. Nella sezione Snippet di codice aggiuntivi, inserire il seguente codice nel campo Head HTML : <meta name="robots" content="noindex">.

  1. Fare clic su X per chiudere la finestra di dialogo delle impostazioni.
  2. Per rendere effettive le modifiche, fare clic su Aggiorna o Pubblica in alto a destra.

Aggiungere i meta tag "noindex" agli articoli della knowledge base

  1. Fare clic sul nome del contenuto.
  2. Nell'editor dell'articolo, fare clic su Impostazioni in alto a destra.
  3. Nella finestra di dialogo, fare clic su Opzioni avanzate nel menu della barra laterale sinistra.
  4. Nella sezione Snippet di codice aggiuntivi, inserire il seguente codice nel campo Head HTML : <meta name="robots" content="noindex">.

  1. Fare clic su X per chiudere la finestra di dialogo delle impostazioni.
  2. Per rendere effettive le modifiche, fare clic su Aggiorna o Pubblica in alto a destra.

Se si dispone di un account Google Search Console, è possibile accelerare questo processo per i risultati di ricerca di Google con lo Strumento di rimozione di Google.