Robots.txt

¿Qué es Robots.txt?

El archivo robots.txt es un archivo de texto ubicado en la raíz de tu sitio web que indica a los motores de búsqueda qué partes de tu sitio pueden rastrear. 

Funciona como una especie de «portero» digital, permitiendo a los propietarios de sitios web tener un cierto grado de control sobre el proceso de rastreo y la indexación de su contenido por parte de los motores de búsqueda.

¿Por qué es importante el archivo Robots.txt?

  • Control del rastreo: Permite a los propietarios de sitios web especificar qué páginas o secciones del sitio deben ser excluidas del rastreo, ayudando a prevenir el rastreo de contenido no deseado o confidencial.
  • Optimización de recursos del servidor: Al restringir el rastreo de páginas menos importantes, el archivo robots.txt puede ayudar a asegurar que los recursos del servidor se utilicen de manera eficiente, priorizando el contenido más relevante para el rastreo.
  • Mejora de la seguridad: Ayuda a proteger el contenido sensible de ser indexado y aparecer en los resultados de búsqueda.

 

¿Cómo configurar el Archivo Robots.txt?

  1. Creación del archivo: Crea un archivo de texto plano y nómbralo «robots.txt». Este archivo debe ser colocado en el directorio raíz de tu sitio web.
  2. Especificación de agentes de usuario: Utiliza la directiva «User-agent» para dirigirte a bots específicos (por ejemplo, «User-agent: Googlebot») o a todos los bots («User-agent: *») con tus instrucciones.
  3. Definir directivas de rastreo: Utiliza «Disallow» para indicar a los bots que no rastreen ciertas páginas o directorios. Por ejemplo, «Disallow: /privado/» impide el rastreo del directorio /privado.
  4. Permitir el rastreo: Aunque menos común, la directiva «Allow» se puede usar para especificar explícitamente qué contenido puede ser rastreado, útil principalmente para permitir el rastreo de contenido dentro de un directorio restringido.
  5. Uso de sitemaps: Puedes indicar la ubicación de tu sitemap en el archivo robots.txt con «Sitemap: http://www.tusitio.com/sitemap.xml» para ayudar a los motores de búsqueda a encontrar y rastrear tu contenido más eficientemente.

 

Otras consideraciones importantes sobre Robots.txt

  • Precisión: Un error en el archivo robots.txt puede impedir el rastreo de tu sitio completo, por lo que es crucial revisar las directivas cuidadosamente.
  • No es una medida de seguridad: Aunque el archivo robots.txt puede restringir el rastreo, no impide el acceso directo a las páginas especificadas, por lo que no debe usarse como una medida de seguridad.
  • Actualización y mantenimiento: Revisa y actualiza tu archivo robots.txt regularmente para asegurarte de que refleje cambios en la estructura de tu sitio y en tus objetivos de SEO.

Descarga el diccionario completo

En formato PDF

Para que lo puedas consultar en cualquier momento y lugar.

Gratis y a un solo click

No tienes que pagar nada. Simplemente pulsa el botón de aquí abajo y recibe el Diccionario SEO en tu email.

Diccionario SEO

De la A a la Z