Generador de robots.txt
Crea un archivo robots.txt a partir de un user-agent, rutas permitidas y bloqueadas, crawl-delay, una URL de sitemap y ajustes con un clic que bloquean rastreadores de IA comunes.
Generador de robots.txt — Introduce las rutas que quieras permitir o bloquear, define un crawl-delay y una URL de sitemap opcionales, y marca los ajustes de rastreadores de IA para obtener un robots.txt limpio y listo para subir. El archivo se construye en vivo mientras escribes y se puede copiar o descargar. Todo se ejecuta en tu navegador: ninguna de tus rutas ni reglas se envía a un servidor.
¿Qué es Generador de robots.txt?
El Generador de robots.txt es una herramienta gratuita que funciona en el navegador y escribe el archivo robots.txt que los rastreadores leen en la raíz de tu sitio para decidir qué pueden obtener. Defines el User-agent (por defecto *), enumeras una ruta Disallow por línea y las excepciones Allow, añades opcionalmente un Crawl-delay y una URL de Sitemap, y la herramienta lo convierte todo en las directivas correctas. También incluye un ajuste con casillas que bloquea rastreadores de IA conocidos —GPTBot, ClaudeBot, CCBot y Google-Extended— añadiendo un grupo independiente para cada uno. Propietarios de sitios, especialistas en SEO y desarrolladores lo usan al lanzar un sitio, ocultar rutas de administración o de pruebas a los buscadores, o renunciar al rastreo por IA. Copia el resultado en un archivo llamado robots.txt en la raíz de tu dominio, o usa el botón de descarga.
Cómo usar Generador de robots.txt
- Introduce el user-agent al que se aplican las reglas, o déjalo como * para todos los rastreadores.
- Escribe las rutas a bloquear en el cuadro Disallow, una por línea (por ejemplo /admin/ o /private/).
- Añade las excepciones Allow, una por línea, para volver a permitir subrutas dentro de una carpeta bloqueada.
- Opcionalmente define un crawl-delay en segundos y pega la URL completa de tu sitemap.
- Marca las casillas de rastreadores de IA (GPTBot, ClaudeBot, CCBot, Google-Extended) para impedir que extraigan tu contenido.
- Copia el robots.txt generado o pulsa Descargar y coloca el archivo en la raíz de tu sitio.
Ejemplos
Bloquear administración y pruebas
Entrada
User-agent: * Disallow: /admin/ Disallow: /staging/ Sitemap: https://example.com/sitemap.xml
Salida
User-agent: * Disallow: /admin/ Disallow: /staging/ Sitemap: https://example.com/sitemap.xml
Permitir dentro de una carpeta bloqueada
Entrada
User-agent: * Disallow: /downloads/ Allow: /downloads/public/
Salida
User-agent: * Disallow: /downloads/ Allow: /downloads/public/
Renunciar a los rastreadores de IA
Entrada
Bloquear GPTBot, ClaudeBot, CCBot, Google-Extended
Salida
User-agent: GPTBot Disallow: / User-agent: ClaudeBot Disallow: / User-agent: CCBot Disallow: / User-agent: Google-Extended Disallow: /
Preguntas frecuentes
- ¿Qué hace realmente robots.txt?
- Es un archivo de texto plano en la raíz de tu sitio que indica a los rastreadores que lo respetan qué rutas pueden o no pueden solicitar, mediante reglas Allow y Disallow agrupadas por User-agent. Es una petición, no una imposición: bots correctos como Googlebot lo respetan, pero no bloquea el acceso de herramientas que lo ignoran, así que nunca lo uses para ocultar datos realmente sensibles.
- ¿Cómo funcionan los ajustes para bloquear rastreadores de IA?
- Cada casilla añade un grupo dedicado como 'User-agent: GPTBot' seguido de 'Disallow: /', que pide a ese rastreador que no obtenga ninguna página. GPTBot es el rastreador de OpenAI, ClaudeBot el de Anthropic, CCBot es Common Crawl, y Google-Extended controla el uso de tu contenido para los modelos de IA de Google. Marcar una casilla añade su grupo; desmarcarla lo elimina.
- ¿Cuál es la diferencia entre Allow y Disallow?
- Disallow enumera prefijos de ruta que un rastreador no debería solicitar, mientras que Allow vuelve a permitir una subruta más específica dentro de una carpeta bloqueada. Por ejemplo, Disallow: /files/ con Allow: /files/public/ bloquea la carpeta pero mantiene rastreable la subcarpeta public. Introduce una ruta por línea en cada cuadro.
- ¿Dónde coloco el archivo generado?
- Guárdalo como un archivo llamado literalmente robots.txt y súbelo a la raíz de tu dominio para que sea accesible en https://tudominio.com/robots.txt. Los rastreadores solo miran ahí; un robots.txt en una subcarpeta se ignora. Usa el botón Descargar para guardarlo directamente.
- ¿Se envía algo de lo que escribo a un servidor?
- No. El robots.txt se genera por completo en tu navegador con JavaScript. Tus rutas, user-agent, URL de sitemap y opciones nunca se suben, almacenan ni transmiten, así que es seguro redactar reglas para sitios privados o previos al lanzamiento.
Herramientas relacionadas
Generador de etiquetas hreflang
Genera etiquetas link hreflang para una página multilingüe a partir de una lista de pares de idioma y URL, con un x-default opcional y una etiqueta autorreferencial.
Generador de JSON-LD
Genera datos estructurados JSON-LD válidos para los esquemas Article, Product, FAQPage, HowTo, LocalBusiness, Event, Recipe, BreadcrumbList y Organization desde un formulario sencillo.
Comprobador de densidad de palabras clave
Analiza cualquier texto para contar la frecuencia de palabras y la densidad de palabras clave como frases de 1, 2 o 3 palabras, con un aviso de sobreoptimización.
Generador de etiquetas meta
Genera etiquetas meta de SEO, Open Graph y Twitter Card para tu página a partir del título, la descripción, la URL canónica, la imagen y el nombre del sitio.