robots.txt-generator
Bouw een robots.txt-bestand op basis van een user-agent, toegestane en geblokkeerde paden, crawl-delay, een sitemap-URL en voorinstellingen met één klik die veelvoorkomende AI-crawlers blokkeren.
robots.txt-generator — Voer de paden in die je wilt toestaan of blokkeren, stel optioneel een crawl-delay en een sitemap-URL in, en vink de AI-crawler-voorinstellingen aan om een schone, direct te uploaden robots.txt te krijgen. Het bestand wordt live samengesteld terwijl je typt en kan worden gekopieerd of gedownload. Alles draait in je browser — geen van je paden of regels wordt naar een server gestuurd.
Wat is robots.txt-generator?
De robots.txt-generator is een gratis tool in de browser die het robots.txt-bestand schrijft dat webcrawlers in de root van je site lezen om te bepalen wat ze mogen ophalen. Je stelt de User-agent in (standaard *), zet één Disallow-pad per regel en eventuele Allow-uitzonderingen, voegt optioneel een Crawl-delay en een Sitemap-URL toe, en de tool zet het allemaal om in de juiste richtlijnen. Het bevat ook een voorinstelling met selectievakjes die bekende AI-trainingscrawlers — GPTBot, ClaudeBot, CCBot en Google-Extended — blokkeert door voor elk een aparte groep toe te voegen. Site-eigenaren, SEO-specialisten en ontwikkelaars gebruiken het bij het lanceren van een site, om beheer- of staging-paden te verbergen voor zoekmachines, of om af te zien van AI-scraping. Kopieer het resultaat naar een bestand met de naam robots.txt in de root van je domein, of gebruik de knop Downloaden.
robots.txt-generator gebruiken
- Voer de user-agent in waarop de regels van toepassing zijn, of laat het op * staan voor alle crawlers.
- Typ de te blokkeren paden in het Disallow-vak, één per regel (bijvoorbeeld /admin/ of /private/).
- Voeg Allow-uitzonderingen toe, één per regel, om subpaden binnen een geblokkeerde map weer toe te staan.
- Stel optioneel een crawl-delay in seconden in en plak de volledige URL van je sitemap.
- Vink de AI-crawler-selectievakjes aan (GPTBot, ClaudeBot, CCBot, Google-Extended) om te voorkomen dat ze je inhoud scrapen.
- Kopieer de gegenereerde robots.txt of klik op Downloaden en plaats het bestand vervolgens in de root van je site.
Voorbeelden
Beheer en staging blokkeren
Invoer
User-agent: * Disallow: /admin/ Disallow: /staging/ Sitemap: https://example.com/sitemap.xml
Uitvoer
User-agent: * Disallow: /admin/ Disallow: /staging/ Sitemap: https://example.com/sitemap.xml
Toestaan binnen een geblokkeerde map
Invoer
User-agent: * Disallow: /downloads/ Allow: /downloads/public/
Uitvoer
User-agent: * Disallow: /downloads/ Allow: /downloads/public/
AI-crawlers weigeren
Invoer
GPTBot, ClaudeBot, CCBot, Google-Extended blokkeren
Uitvoer
User-agent: GPTBot Disallow: / User-agent: ClaudeBot Disallow: / User-agent: CCBot Disallow: / User-agent: Google-Extended Disallow: /
Veelgestelde vragen
- Wat doet robots.txt eigenlijk?
- Het is een platte-tekstbestand in de root van je site dat compatibele crawlers met Allow- en Disallow-regels, gegroepeerd per User-agent, vertelt welke paden ze wel of niet mogen opvragen. Het is een verzoek, geen afdwinging: nette bots zoals Googlebot houden zich eraan, maar het blokkeert geen toegang voor tools die het negeren, dus gebruik het nooit om echt gevoelige gegevens te verbergen.
- Hoe werken de voorinstellingen om AI-crawlers te blokkeren?
- Elk selectievakje voegt een aparte groep toe, zoals 'User-agent: GPTBot' gevolgd door 'Disallow: /', die deze crawler vraagt geen enkele pagina op te halen. GPTBot is de crawler van OpenAI, ClaudeBot die van Anthropic, CCBot is Common Crawl, en Google-Extended bepaalt het gebruik van je inhoud voor de AI-modellen van Google. Een vakje aanvinken voegt de groep toe; uitvinken verwijdert die.
- Wat is het verschil tussen Allow en Disallow?
- Disallow somt padvoorvoegsels op die een crawler niet zou moeten opvragen, terwijl Allow een specifieker subpad binnen een geblokkeerde map weer toestaat. Bijvoorbeeld: Disallow: /files/ met Allow: /files/public/ blokkeert de map maar houdt de submap public crawlbaar. Voer in elk vak één pad per regel in.
- Waar plaats ik het gegenereerde bestand?
- Sla het op als een bestand met letterlijk de naam robots.txt en upload het naar de root van je domein, zodat het bereikbaar is op https://yourdomain.com/robots.txt. Crawlers kijken alleen daar; een robots.txt in een submap wordt genegeerd. Gebruik de knop Downloaden om het direct op te slaan.
- Wordt iets van wat ik typ naar een server gestuurd?
- Nee. De robots.txt wordt volledig in je browser met JavaScript gegenereerd. Je paden, user-agent, sitemap-URL en keuzes worden nooit geüpload, opgeslagen of verzonden, dus het is veilig om regels op te stellen voor privé- of pre-launch-sites.
Gerelateerde tools
Hreflang-taggenerator
Genereert hreflang-linktags voor een meertalige pagina op basis van een lijst met taal-URL-paren, met een optionele x-default en een zelfverwijzende tag.
JSON-LD-generator
Genereer geldige gestructureerde JSON-LD-gegevens voor de schema's Article, Product, FAQPage, HowTo, LocalBusiness, Event, Recipe, BreadcrumbList en Organization met een eenvoudig formulier.
Zoekwoorddichtheid-checker
Analyseer elke tekst om de woordfrequentie en zoekwoorddichtheid te tellen als woordcombinaties van 1, 2 of 3 woorden, met een waarschuwing voor overoptimalisatie.
Meta-taggenerator
Genereer SEO-, Open Graph- en Twitter Card-metatags voor je pagina op basis van een titel, beschrijving, canonieke URL, afbeelding, sitenaam en kaarttype.