Nota: Este contenido se tradujo a través de un software y es posible que no haya sido revisado. La versión en inglés se considera, por tanto, la versión oficial y es posible que haya sido actualizada. Para acceder a la versión en inglés, haz clic aquí.
Reports

Bloquear páginas o publicaciones de blog para que no sean indexadas por los motores de búsqueda

Última actualización: January 17, 2019

Requisitos

Marketing Hub
marketing-basic-pro-enterprise
Professional, Enterprise
Básico
HubSpot CMS
Hay algunas opciones para impedir que los motores de búsqueda indexen páginas específicas en tu sitio web. Se recomienda investigar cuidadosamente cada una de estas opciones antes de implementar cualquier cambio, para garantizar que solo las páginas deseadas se bloqueen de los motores de búsqueda.

Nota: Si eliges usar el método "Sin Índice", ten en cuenta que no debería combinarse con el método del archivo robots.txt. Los motores de búsqueda deben comenzar a rastrear la página para ver la etiqueta "No Índice" y el archivo robots.txt evita que se rastree completamente.

Archivo Robots.txt

Tu archivo robots.txt es un archivo en tu sitio web que los rastreadores de motores de búsqueda leen para ver qué páginas deberían ser indexadas y qué páginas deberían ser indexadas. Descubre cómo configurar tu archivo robots.txt en HubSpot.

Google y otros motores de búsqueda no pueden eliminar de manera retroactiva páginas de resultados después de implementar el método del archivo robots.txt. Si bien esto indica que los bots no rastrean una página, los motores de búsqueda aún pueden indexar tu contenido si, por ejemplo, hay enlaces inbound a tu página desde otros sitios web. Si tu página ya ha sido indexada y deseas que se elimine de manera retroactiva de los motores de búsqueda, probablemente querrás usar el método de la meta etiqueta "Sin Índice" a continuación. 

Meta etiqueta "sin índice"

Una meta etiqueta "sin índice" es una cadena de código introducida en la sección del encabezado del código HTML de una página que les indica a los motores de búsqueda no indexar la página.

  • En tu cuenta de HubSpot, navega a tus páginas de destino o páginas de sitio web.
  • Haz clic en el nombre de una página o post específico.
  • En el editor de contenido, haz clic en la pestaña Configuración en la parte superior de la página.
  • Haz clic en Opciones Avanzadas.
  • Copia y pega el siguiente código en el campo encabezado de HTML:
 <meta name="robots" content="noindex">

Herramientas para webmasters de Google

https://support.google.com/webmasters/answer/1663419

Nota
:
esto solo se aplicará a los resultados de búsqueda de Google.

/articles/kcs_article/cos-general/can-i-block-files-in-my-file-manager-from-being-indexed-by-search-engines

Cómo HubSpot administra solicitudes de un agente de usuario

Si estás configurando una cadena de agente de usuario para probar rastrear tu sitio web y ver un mensaje de acceso denegado, se espera este comportamiento. Google aún está rastreando y indexa tu sitio.

La razón por la que verás este mensaje es porque HubSpot solo permite solicitudes del agente de usuario de googlebot procedentes de IP que son propiedad de Google. Para proteger los sitios alojados de HubSpot de los atacantes o spoofers, se negarán las solicitudes de otras direcciones IP. HubSpot hace esto para otros rastreadores de motores de búsqueda también, como BingBot, MSDBot y Baiduspider.

La razón por la que verás este mensaje es porque HubSpot solo permite solicitudes del agente de usuario de googlebot procedentes de IP que son propiedad de Google. Para proteger los sitios alojados de HubSpot de los atacantes o spoofers, se negarán las solicitudes de otras direcciones IP. HubSpot hace esto para otros rastreadores de motores de búsqueda también, como BingBot, MSDBot y Baiduspider.