Nota bene: la traduzione in olandese di questo articolo è fornita solo per comodità. La traduzione viene creata automaticamente tramite un software di traduzione e potrebbe non essere stata revisionata. Pertanto, la versione inglese di questo articolo deve essere considerata come la versione di governo contenente le informazioni più recenti. È possibile accedervi qui.
SEO

Bloccare le pagine o i post del blog dall'essere indicizzati dai motori di ricerca

Ultimo aggiornamento: gennaio 27, 2021

Si applica a:

Marketing Hub  Professional, Enterprisee
CMS Hub  Professional, Enterprisee
Legacy Marketing Hub Basic
Ci sono alcuni modi per impedire ai motori di ricerca di indicizzare pagine specifiche sul tuo sito web. Si raccomanda di ricercare attentamente ognuno di questi metodi prima di implementare qualsiasi cambiamento per assicurarsi che solo le pagine desiderate siano bloccate dai motori di ricerca.

Nota: queste istruzioni bloccheranno l'URL di una pagina dall'essere indicizzata per la ricerca. Scopri come personalizzare l'URL di un file

nello strumento file per bloccarlo dai motori di ricerca.

File robots.txt

Il tuo file robots.txt è un file sul tuo sito web che i crawler dei motori di ricerca leggono per vedere quali pagine dovrebbero e non dovrebbero indicizzare. Scopri come impostare il tuo file robots.txt in HubSpot

.

Google e altri motori di ricerca non possono rimuovere retroattivamente le pagine dai risultati dopo aver implementato il metodo del file robots.txt. Mentre questo dice ai bot di non scansionare una pagina, i motori di ricerca possono ancora indicizzare il tuo contenuto (ad esempio, se ci sono link in entrata alla tua pagina da altri siti web). Se la tua pagina è già stata indicizzata e vuoi rimuoverla dai motori di ricerca in modo retroattivo, si raccomanda invece di utilizzare il metodo del meta tag "No Index".

"Meta tag "No index

Nota:

se scegliete di utilizzare il metodo del meta tag "No Index", sappiate che non deve essere combinato con il metodo del file robots.txt. I motori di ricerca devono iniziare la scansione della pagina per vedere il meta tag "No Index" e il file robots.txt impedisce la scansione del tutto.

Un meta tag " no index"

è una stringa di codice inserita nella sezione head dell'HTML di una pagina che dice ai motori di ricerca di non indicizzare la pagina. , copia e incolla il seguente codice:
 <meta name="robots" content="noindex">

edit-head-html

Google Search Console

Se hai un account Google Search Console,puoi inviare un URL per essere rimosso dai risultati di ricerca di Google. Nota che questo si applica solo ai risultati di ricerca di Google.

Se vuoi bloccare i file nel tuo file manager HubSpot (ad esempio, un documento PDF) dall'essere indicizzati dai motori di ricerca, devi selezionare un sottodominio collegato per il/i file e usare l'URL del file per bloccare i web crawler.

Come HubSpot gestisce le richieste di un agente utente

Se stai impostando una stringa di user agent per testare il crawling del tuo sito web e stai vedendo un messaggio di accesso negato, questo è un comportamento previsto. Google sta ancora scansionando e indicizzando il tuo sito.

Il motivo per cui vedi questo messaggio è che HubSpot permette solo le richieste dell'interprete googlebot provenienti da IP che sono di proprietà di Google. Per proteggere i siti ospitati da HubSpot da aggressori o spoofers,le richieste


da altri indirizzi IP saranno negate. HubSpot fa questo per altri crawler di motori di ricerca, come BingBot, MSNBot, e Baiduspider.