Nota: Este contenido se tradujo a través de un software y es posible que no haya sido revisado. La versión en inglés se considera, por tanto, la versión oficial y es posible que haya sido actualizada. Para acceder a la versión en inglés, haz clic aquí.
SEO

Bloquear páginas o publicaciones de blog para que no sean indexadas por los motores de búsqueda

Última actualización: noviembre 7, 2019

Requisitos

Marketing Hub  Professional, Enterprise
Básico
HubSpot CMS
Hay algunas opciones para impedir que los motores de búsqueda indexen páginas específicas en tu sitio web. Se recomienda investigar cuidadosamente cada una de estas opciones antes de implementar cualquier cambio, para garantizar que solo las páginas deseadas se bloqueen de los motores de búsqueda.

Nota: si eliges usar el método "Sin Índice", ten en cuenta que no debería combinarse con el método del archivo robots.txt. Los motores de búsqueda deben comenzar a realizar el crawling en la página para ver la etiqueta "No Índice" y el archivo robots.txt evita que se rastree completamente.

Archivo Robots.txt

Tu archivo robots.txt es un archivo en tu sitio web que los rastreadores de motores de búsqueda leen para ver qué páginas deberían ser indexadas y qué páginas deberían ser indexadas. Descubre cómo configurar tu archivo robots.txt en HubSpot.

Google y otros motores de búsqueda no pueden eliminar de manera retroactiva páginas de resultados después de implementar el método del archivo robots.txt. Si bien esto indica que los bots no rastrean una página, los motores de búsqueda aún pueden indexar tu contenido (por ejemplo, si hay enlaces inbound a tu página desde otros sitios web). Si tu página ya ha sido indexada y quieres eliminarla de manera retroactiva de los motores de búsqueda, se recomienda usar el método de meta etiqueta “Sin índice”.

Meta etiqueta "Sin índice"

Una meta etiqueta "sin índice" es una cadena de código introducida en la sección del encabezado del código HTML de una página que les indica a los motores de búsqueda no indexar la página. Este método solo se puede usar para páginas de destino y páginas de sitio web, no publicaciones de blog.

<meta name="robots" content="noindex">

edit-head-html

 

Google Search Console

Si tienes una cuenta Google Search Console, puedes enviar una URL para que sea eliminada de los resultados de búsqueda de Google. Nota: esto solo se aplicará a los resultados de búsqueda de Google.

Si deseas que ciertos archivos en tu administrador de archivos de HubSpot, como un documento PDF, no sea indexado por los motores de búsqueda, deberás seleccionar un subdominio conectado para los archivos y usar la URL del(los) archivos para que no sean detectados por los rastreadores.  

Cómo HubSpot administra solicitudes de un agente de usuario

Si estás configurando una cadena de agente de usuario para probar rastrear tu sitio web y ver un mensaje de acceso denegado, se espera este comportamiento. Google aún está realizando crawling y indexa tu sitio.

La razón por la que verás este mensaje es porque HubSpot solo permite solicitudes del agente de usuario de googlebot procedentes de IP que son propiedad de Google. Para proteger los sitios alojados de HubSpot de los atacantes o spoofers, se negarán las solicitudes de otras direcciones IP. HubSpot hace esto para otros rastreadores de motores de búsqueda también, como BingBot, MSDBot y Baiduspider.