Question 1

Que fait réellement robots.txt ?

Accepted Answer

C'est un fichier en texte brut à la racine de votre site qui indique aux robots respectueux quels chemins ils peuvent ou non demander, à l'aide de règles Allow et Disallow groupées par User-agent. C'est une requête, pas une contrainte : les robots bien élevés comme Googlebot le respectent, mais il ne bloque pas l'accès des outils qui l'ignorent, ne l'utilisez donc jamais pour masquer des données vraiment sensibles.

Question 2

Comment fonctionnent les préréglages de blocage des robots d'IA ?

Accepted Answer

Chaque case ajoute un groupe dédié, par exemple 'User-agent: GPTBot' suivi de 'Disallow: /', qui demande à ce robot de ne récupérer aucune page. GPTBot est le robot d'OpenAI, ClaudeBot celui d'Anthropic, CCBot est Common Crawl, et Google-Extended contrôle l'utilisation de votre contenu pour les modèles d'IA de Google. Cocher une case ajoute son groupe ; la décocher le supprime.

Question 3

Quelle est la différence entre Allow et Disallow ?

Accepted Answer

Disallow liste les préfixes de chemin qu'un robot ne devrait pas demander, tandis qu'Allow réautorise un sous-chemin plus précis à l'intérieur d'un dossier interdit. Par exemple, Disallow: /files/ avec Allow: /files/public/ bloque le dossier mais garde le sous-dossier public explorable. Saisissez un chemin par ligne dans chaque champ.

Question 4

Où placer le fichier généré ?

Accepted Answer

Enregistrez-le sous un fichier nommé littéralement robots.txt et téléversez-le à la racine de votre domaine pour qu'il soit accessible à https://yourdomain.com/robots.txt. Les robots ne regardent que là ; un robots.txt dans un sous-dossier est ignoré. Utilisez le bouton Télécharger pour l'enregistrer directement.

Question 5

Ce que je saisis est-il envoyé à un serveur ?

Accepted Answer

Non. Le robots.txt est généré entièrement dans votre navigateur avec JavaScript. Vos chemins, votre user-agent, l'URL de votre sitemap et vos choix ne sont jamais téléversés, stockés ni transmis, ce qui permet de rédiger en toute sécurité des règles pour des sites privés ou en préparation.

Générateur de robots.txt

Qu'est-ce que Générateur de robots.txt ?

Comment utiliser Générateur de robots.txt

Exemples

Bloquer l'administration et la préproduction

Autoriser à l'intérieur d'un dossier bloqué

Refuser les robots d'IA

Questions fréquentes

Outils connexes

Générateur de balises hreflang

Générateur de JSON-LD

Vérificateur de densité de mots-clés

Générateur de balises meta