Question 1

Cosa fa davvero robots.txt?

Accepted Answer

È un file di testo semplice nella radice del tuo sito che indica ai crawler conformi quali percorsi possono o non possono richiedere, tramite regole Allow e Disallow raggruppate per User-agent. È una richiesta, non un'imposizione: i bot ben educati come Googlebot la rispettano, ma non blocca l'accesso agli strumenti che la ignorano, quindi non usarlo mai per nascondere dati davvero sensibili.

Question 2

Come funzionano le preimpostazioni di blocco dei crawler di IA?

Accepted Answer

Ogni casella aggiunge un gruppo dedicato come 'User-agent: GPTBot' seguito da 'Disallow: /', che chiede a quel crawler di non recuperare alcuna pagina. GPTBot è il crawler di OpenAI, ClaudeBot quello di Anthropic, CCBot è Common Crawl e Google-Extended controlla l'uso dei tuoi contenuti per i modelli di IA di Google. Selezionare una casella aggiunge il suo gruppo; deselezionarla lo rimuove.

Question 3

Qual è la differenza tra Allow e Disallow?

Accepted Answer

Disallow elenca i prefissi di percorso che un crawler non dovrebbe richiedere, mentre Allow riconsente un sottopercorso più specifico all'interno di una cartella bloccata. Ad esempio, Disallow: /files/ con Allow: /files/public/ blocca la cartella ma mantiene scansionabile la sottocartella public. Inserisci un percorso per riga in ogni casella.

Question 4

Dove metto il file generato?

Accepted Answer

Salvalo come file chiamato letteralmente robots.txt e caricalo nella radice del tuo dominio, così da renderlo raggiungibile a https://yourdomain.com/robots.txt. I crawler guardano solo lì; un robots.txt in una sottocartella viene ignorato. Usa il pulsante Scarica per salvarlo direttamente.

Question 5

Qualcosa di ciò che digito viene inviato a un server?

Accepted Answer

No. Il robots.txt viene generato interamente nel tuo browser con JavaScript. I tuoi percorsi, lo user-agent, l'URL del sitemap e le tue scelte non vengono mai caricati, memorizzati o trasmessi, quindi è sicuro redigere regole per siti privati o non ancora pubblicati.

Generatore di robots.txt

Cos'è Generatore di robots.txt?

Come usare Generatore di robots.txt

Esempi

Bloccare amministrazione e staging

Consentire all'interno di una cartella bloccata

Rinunciare ai crawler di IA

Domande frequenti

Strumenti correlati

Generatore di tag hreflang

Generatore di JSON-LD

Verificatore di densità delle parole chiave

Generatore di meta tag