Nota: Este contenido se tradujo a través de un software y es posible que no haya sido revisado. La versión en inglés se considera, por tanto, la versión oficial y es posible que haya sido actualizada. Para acceder a la versión en inglés, haz clic aquí.
Reports

Bloquear páginas o publicaciones de blog para que no sean indexadas por los motores de búsqueda

Última actualización: marzo 25, 2019

Requisitos

Marketing Hub  Professional, Enterprise
Básico
HubSpot CMS
Hay algunas opciones para impedir que los motores de búsqueda indexen páginas específicas en tu sitio web. Se recomienda investigar cuidadosamente cada una de estas opciones antes de implementar cualquier cambio, para garantizar que solo las páginas deseadas se bloqueen de los motores de búsqueda.

Nota: si eliges usar el método "Sin Índice", ten en cuenta que no debería combinarse con el método del archivo robots.txt. Los motores de búsqueda deben comenzar a realizar el crawling en la página para ver la etiqueta "No Índice" y el archivo robots.txt evita que se rastree completamente.

Archivo Robots.txt

Tu archivo robots.txt es un archivo en tu sitio web que los rastreadores de motores de búsqueda leen para ver qué páginas deberían ser indexadas y qué páginas deberían ser indexadas. Descubre cómo configurar tu archivo robots.txt en HubSpot.

Google y otros motores de búsqueda no pueden eliminar de manera retroactiva páginas de resultados después de implementar el método del archivo robots.txt. Si bien esto indica que los bots no rastrean una página, los motores de búsqueda aún pueden indexar tu contenido si, por ejemplo, hay enlaces inbound a tu página desde otros sitios web. Si tu página ya ha sido indexada y deseas que se elimine de manera retroactiva de los motores de búsqueda, probablemente querrás usar el método de la meta etiqueta "Sin Índice" a continuación. 

Meta etiqueta "sin índice"

Una meta etiqueta "sin índice" es una cadena de código introducida en la sección del encabezado del código HTML de una página que les indica a los motores de búsqueda no indexar la página. Este método solo se puede usar para páginas de destino y páginas de sitio web, no publicaciones de blog.

  • En tu cuenta de HubSpot, navega hasta tus páginas de destino o páginas del sitio web.
  • Haz clic en el nombre de una página específica.
  • En el editor de contenido, haz clic en la pestaña Configuración en la parte superior de la página.
  • Haz clic en Opciones Avanzadas.
  • Copia y pega el siguiente código en el campo encabezado de HTML:
 

edit-head-html

 

Herramientas para webmasters de Google

Si tienes una cuenta de herramientas de Google Webmaster, puedes enviar una URL a los resultados de búsqueda de Google.

Nota: esto solo se aplicará a los resultados de búsqueda de Google.

Si deseas que ciertos archivos en tu administrador de archivos de HubSpot, como un documento PDF, no sea indexado por los motores de búsqueda, deberás seleccionar un subdominio conectado para los archivos y usar la URL del(los) archivos para que no sean detectados por los rastreadores.  

Cómo HubSpot administra solicitudes de un agente de usuario

Si estás configurando una cadena de agente de usuario para probar rastrear tu sitio web y ver un mensaje de acceso denegado, se espera este comportamiento. Google aún está realizando crawling y indexa tu sitio.

La razón por la que verás este mensaje es porque HubSpot solo permite solicitudes del agente de usuario de googlebot procedentes de IP que son propiedad de Google. Para proteger los sitios alojados de HubSpot de los atacantes o spoofers, se negarán las solicitudes de otras direcciones IP. HubSpot hace esto para otros rastreadores de motores de búsqueda también, como BingBot, MSDBot y Baiduspider.