robots.txt जनरेटर
यूज़र-एजेंट, अनुमत और अवरुद्ध पथों, क्रॉल-डिले, साइटमैप URL और सामान्य AI क्रॉलर को ब्लॉक करने वाले एक-क्लिक प्रीसेट से robots.txt फ़ाइल बनाएँ।
robots.txt जनरेटर — जिन पथों को आप अनुमति देना या ब्लॉक करना चाहते हैं उन्हें दर्ज करें, वैकल्पिक रूप से क्रॉल-डिले और साइटमैप URL सेट करें, और एक साफ़, अपलोड के लिए तैयार robots.txt पाने के लिए AI क्रॉलर प्रीसेट पर टिक करें। फ़ाइल टाइप करते ही लाइव बनती है और इसे कॉपी या डाउनलोड किया जा सकता है। सब कुछ आपके ब्राउज़र में चलता है — आपका कोई भी पथ या नियम किसी सर्वर पर नहीं भेजा जाता।
robots.txt जनरेटर क्या है?
robots.txt जनरेटर एक मुफ़्त इन-ब्राउज़र टूल है जो वह robots.txt फ़ाइल लिखता है जिसे वेब क्रॉलर आपकी साइट की रूट पर पढ़कर यह तय करते हैं कि वे क्या ला सकते हैं। आप User-agent सेट करते हैं (डिफ़ॉल्ट *), प्रति पंक्ति एक Disallow पथ और कोई भी Allow अपवाद सूचीबद्ध करते हैं, वैकल्पिक रूप से Crawl-delay और Sitemap URL जोड़ते हैं, और टूल इन सबको सही निर्देशों में बदल देता है। इसमें एक चेकबॉक्स प्रीसेट भी है जो प्रसिद्ध AI ट्रेनिंग क्रॉलर — GPTBot, ClaudeBot, CCBot और Google-Extended — को प्रत्येक के लिए एक अलग समूह जोड़कर ब्लॉक करता है। साइट मालिक, SEO विशेषज्ञ और डेवलपर इसका उपयोग साइट लॉन्च करते समय, सर्च इंजन से एडमिन या स्टेजिंग पथ छिपाने, या AI स्क्रैपिंग से ऑप्ट आउट करने के लिए करते हैं। परिणाम को अपने डोमेन की रूट पर robots.txt नाम की फ़ाइल में कॉपी करें, या डाउनलोड बटन का उपयोग करें।
robots.txt जनरेटर का उपयोग कैसे करें
- जिस यूज़र-एजेंट पर नियम लागू होते हैं उसे दर्ज करें, या सभी क्रॉलर के लिए इसे * रहने दें।
- ब्लॉक करने वाले पथ Disallow बॉक्स में, प्रति पंक्ति एक, टाइप करें (उदाहरण /admin/ या /private/)।
- किसी ब्लॉक किए गए फ़ोल्डर के भीतर उप-पथों को फिर से अनुमति देने के लिए Allow अपवाद, प्रति पंक्ति एक, जोड़ें।
- वैकल्पिक रूप से क्रॉल-डिले सेकंड में सेट करें और अपना पूरा साइटमैप URL पेस्ट करें।
- अपनी सामग्री को स्क्रैप होने से रोकने के लिए AI क्रॉलर चेकबॉक्स (GPTBot, ClaudeBot, CCBot, Google-Extended) पर टिक करें।
- जेनरेट किया गया robots.txt कॉपी करें या डाउनलोड पर क्लिक करें, फिर फ़ाइल को अपनी साइट की रूट पर रखें।
उदाहरण
एडमिन और स्टेजिंग ब्लॉक करें
इनपुट
User-agent: * Disallow: /admin/ Disallow: /staging/ Sitemap: https://example.com/sitemap.xml
आउटपुट
User-agent: * Disallow: /admin/ Disallow: /staging/ Sitemap: https://example.com/sitemap.xml
ब्लॉक किए गए फ़ोल्डर के भीतर अनुमति दें
इनपुट
User-agent: * Disallow: /downloads/ Allow: /downloads/public/
आउटपुट
User-agent: * Disallow: /downloads/ Allow: /downloads/public/
AI क्रॉलर से ऑप्ट आउट करें
इनपुट
GPTBot, ClaudeBot, CCBot, Google-Extended ब्लॉक करें
आउटपुट
User-agent: GPTBot Disallow: / User-agent: ClaudeBot Disallow: / User-agent: CCBot Disallow: / User-agent: Google-Extended Disallow: /
अक्सर पूछे जाने वाले सवाल
- robots.txt असल में क्या करता है?
- यह आपकी साइट की रूट पर एक सादा-टेक्स्ट फ़ाइल है जो User-agent के अनुसार समूहीकृत Allow और Disallow नियमों का उपयोग करके अनुपालन करने वाले क्रॉलर को बताती है कि वे किन पथों का अनुरोध कर सकते हैं या नहीं। यह एक अनुरोध है, प्रवर्तन नहीं: Googlebot जैसे सुव्यवहारी बॉट इसका सम्मान करते हैं, लेकिन यह उन टूल की पहुँच नहीं रोकता जो इसे अनदेखा करते हैं, इसलिए वास्तव में संवेदनशील डेटा छिपाने के लिए इसका कभी उपयोग न करें।
- AI क्रॉलर ब्लॉक प्रीसेट कैसे काम करते हैं?
- प्रत्येक चेकबॉक्स एक समर्पित समूह जोड़ता है जैसे 'User-agent: GPTBot' के बाद 'Disallow: /', जो उस क्रॉलर से किसी भी पृष्ठ को न लाने का अनुरोध करता है। GPTBot OpenAI का क्रॉलर है, ClaudeBot Anthropic का, CCBot Common Crawl है, और Google-Extended यह नियंत्रित करता है कि आपकी सामग्री Google के AI मॉडलों के लिए उपयोग हो या नहीं। बॉक्स पर टिक करने से उसका समूह जुड़ता है; टिक हटाने से हट जाता है।
- Allow और Disallow में क्या अंतर है?
- Disallow उन पथ उपसर्गों को सूचीबद्ध करता है जिनका क्रॉलर को अनुरोध नहीं करना चाहिए, जबकि Allow किसी अवरुद्ध फ़ोल्डर के भीतर एक अधिक विशिष्ट उप-पथ को फिर से अनुमति देता है। उदाहरण के लिए, Disallow: /files/ के साथ Allow: /files/public/ फ़ोल्डर को ब्लॉक करता है लेकिन public उप-फ़ोल्डर को क्रॉल योग्य रखता है। प्रत्येक बॉक्स में प्रति पंक्ति एक पथ दर्ज करें।
- जेनरेट की गई फ़ाइल मैं कहाँ रखूँ?
- इसे अक्षरशः robots.txt नाम की फ़ाइल के रूप में सहेजें और अपने डोमेन की रूट पर अपलोड करें ताकि यह https://yourdomain.com/robots.txt पर पहुँच योग्य हो। क्रॉलर केवल वहीं देखते हैं; किसी उप-फ़ोल्डर में रखा robots.txt अनदेखा कर दिया जाता है। इसे सीधे सहेजने के लिए डाउनलोड बटन का उपयोग करें।
- क्या मैं जो टाइप करता हूँ वह किसी सर्वर पर भेजा जाता है?
- नहीं। robots.txt पूरी तरह आपके ब्राउज़र में JavaScript से जेनरेट होता है। आपके पथ, यूज़र-एजेंट, साइटमैप URL और विकल्प कभी अपलोड, संग्रहीत या प्रेषित नहीं किए जाते, इसलिए निजी या लॉन्च-पूर्व साइटों के लिए नियम तैयार करना सुरक्षित है।
संबंधित टूल
Hreflang टैग जनरेटर
लोकेल और URL जोड़ों की सूची से किसी बहुभाषी पृष्ठ के लिए hreflang link टैग बनाएँ, साथ ही वैकल्पिक x-default और एक स्व-संदर्भित टैग।
JSON-LD जनरेटर
एक सरल फ़ॉर्म से Article, Product, FAQPage, HowTo, LocalBusiness, Event, Recipe, BreadcrumbList और Organization स्कीमा के लिए मान्य JSON-LD संरचित डेटा बनाएं।
कीवर्ड डेंसिटी चेकर
किसी भी टेक्स्ट का विश्लेषण करके शब्दों की आवृत्ति और कीवर्ड डेंसिटी को 1, 2 या 3 शब्दों के वाक्यांश के रूप में गिनें, साथ ही अति-ऑप्टिमाइज़ेशन की चेतावनी पाएँ।
मेटा टैग जनरेटर
शीर्षक, विवरण, कैनोनिकल URL, छवि, साइट नाम और कार्ड प्रकार से अपने पेज के लिए SEO, Open Graph और Twitter Card मेटा टैग बनाएँ।