Generator robots.txt
Zbuduj plik robots.txt na podstawie user-agenta, ścieżek dozwolonych i zablokowanych, crawl-delay, adresu URL mapy witryny oraz ustawień jednym kliknięciem, które blokują popularne roboty AI.
Generator robots.txt — Wpisz ścieżki, które chcesz zezwolić lub zablokować, ustaw opcjonalny crawl-delay i adres URL mapy witryny, a następnie zaznacz ustawienia robotów AI, aby uzyskać czysty, gotowy do wgrania plik robots.txt. Plik jest składany na żywo podczas pisania i można go skopiować lub pobrać. Wszystko działa w Twojej przeglądarce — żadna z Twoich ścieżek ani reguł nie jest wysyłana na serwer.
Czym jest Generator robots.txt?
Generator robots.txt to bezpłatne narzędzie działające w przeglądarce, które tworzy plik robots.txt odczytywany przez roboty sieciowe w katalogu głównym Twojej witryny w celu określenia, co mogą pobrać. Ustawiasz User-agent (domyślnie *), wymieniasz po jednej ścieżce Disallow w wierszu oraz ewentualne wyjątki Allow, opcjonalnie dodajesz Crawl-delay i adres URL Sitemap, a narzędzie przekształca to wszystko we właściwe dyrektywy. Zawiera również ustawienie z polami wyboru, które blokuje znane roboty trenujące AI — GPTBot, ClaudeBot, CCBot i Google-Extended — dołączając osobną grupę dla każdego z nich. Właściciele witryn, specjaliści SEO i deweloperzy używają go przy uruchamianiu witryny, do ukrywania ścieżek administracyjnych lub testowych przed wyszukiwarkami albo do rezygnacji ze scrapowania przez AI. Skopiuj wynik do pliku o nazwie robots.txt w katalogu głównym domeny lub użyj przycisku Pobierz.
Jak używać Generator robots.txt
- Wpisz user-agent, którego dotyczą reguły, lub zostaw * dla wszystkich robotów.
- Wpisz ścieżki do zablokowania w polu Disallow, po jednej w wierszu (na przykład /admin/ lub /private/).
- Dodaj wyjątki Allow, po jednym w wierszu, aby ponownie zezwolić na podścieżki wewnątrz zablokowanego folderu.
- Opcjonalnie ustaw crawl-delay w sekundach i wklej pełny adres URL swojej mapy witryny.
- Zaznacz pola wyboru robotów AI (GPTBot, ClaudeBot, CCBot, Google-Extended), aby uniemożliwić im scrapowanie Twojej treści.
- Skopiuj wygenerowany plik robots.txt lub kliknij Pobierz, a następnie umieść plik w katalogu głównym witryny.
Przykłady
Zablokuj administrację i środowisko testowe
Wejście
User-agent: * Disallow: /admin/ Disallow: /staging/ Sitemap: https://example.com/sitemap.xml
Wyjście
User-agent: * Disallow: /admin/ Disallow: /staging/ Sitemap: https://example.com/sitemap.xml
Zezwól wewnątrz zablokowanego folderu
Wejście
User-agent: * Disallow: /downloads/ Allow: /downloads/public/
Wyjście
User-agent: * Disallow: /downloads/ Allow: /downloads/public/
Zrezygnuj z robotów AI
Wejście
Zablokuj GPTBot, ClaudeBot, CCBot, Google-Extended
Wyjście
User-agent: GPTBot Disallow: / User-agent: ClaudeBot Disallow: / User-agent: CCBot Disallow: / User-agent: Google-Extended Disallow: /
Najczęściej zadawane pytania
- Co właściwie robi robots.txt?
- To zwykły plik tekstowy w katalogu głównym witryny, który za pomocą reguł Allow i Disallow pogrupowanych według User-agent informuje zgodne roboty, których ścieżek mogą, a których nie mogą żądać. To prośba, a nie wymuszenie: dobrze wychowane boty, takie jak Googlebot, jej przestrzegają, ale nie blokuje ona dostępu narzędziom, które ją ignorują, więc nigdy nie używaj jej do ukrywania naprawdę wrażliwych danych.
- Jak działają ustawienia blokowania robotów AI?
- Każde pole wyboru dołącza dedykowaną grupę, taką jak 'User-agent: GPTBot' i następujące po niej 'Disallow: /', która prosi danego robota, aby nie pobierał żadnej strony. GPTBot to robot OpenAI, ClaudeBot należy do Anthropic, CCBot to Common Crawl, a Google-Extended kontroluje wykorzystanie Twojej treści w modelach AI Google. Zaznaczenie pola dodaje jego grupę; odznaczenie ją usuwa.
- Jaka jest różnica między Allow a Disallow?
- Disallow wymienia prefiksy ścieżek, których robot nie powinien żądać, podczas gdy Allow ponownie zezwala na bardziej konkretną podścieżkę wewnątrz zablokowanego folderu. Na przykład Disallow: /files/ z Allow: /files/public/ blokuje folder, ale pozostawia podfolder public dostępny dla robotów. W każdym polu wpisz po jednej ścieżce w wierszu.
- Gdzie umieścić wygenerowany plik?
- Zapisz go jako plik o nazwie dokładnie robots.txt i wgraj do katalogu głównego swojej domeny, aby był dostępny pod adresem https://yourdomain.com/robots.txt. Roboty szukają tylko tam; plik robots.txt w podfolderze jest ignorowany. Użyj przycisku Pobierz, aby zapisać go bezpośrednio.
- Czy cokolwiek, co wpisuję, jest wysyłane na serwer?
- Nie. Plik robots.txt jest generowany w całości w Twojej przeglądarce za pomocą JavaScript. Twoje ścieżki, user-agent, adres URL mapy witryny i wybory nigdy nie są przesyłane, przechowywane ani transmitowane, więc bezpiecznie jest tworzyć reguły dla witryn prywatnych lub przed premierą.
Powiązane narzędzia
Generator tagów hreflang
Generuje tagi link hreflang dla strony wielojęzycznej na podstawie listy par lokalizacja-URL, z opcjonalnym x-default i tagiem autoreferencyjnym.
Generator JSON-LD
Generuj prawidłowe dane strukturalne JSON-LD dla schematów Article, Product, FAQPage, HowTo, LocalBusiness, Event, Recipe, BreadcrumbList i Organization z prostego formularza.
Narzędzie do sprawdzania gęstości słów kluczowych
Przeanalizuj dowolny tekst, aby policzyć częstotliwość słów i gęstość słów kluczowych jako frazy 1-, 2- lub 3-wyrazowe, z ostrzeżeniem o nadmiernej optymalizacji.
Generator metatagów
Wygeneruj metatagi SEO, Open Graph i Twitter Card dla swojej strony na podstawie tytułu, opisu, kanonicznego adresu URL, obrazu, nazwy witryny i typu karty.