मैं एक साइट के लिए निम्नलिखित robots.txt फ़ाइल का उपयोग कर रहा हूं: लक्ष्य Googlebot और bingbot को पृष्ठ को छोड़कर साइट तक पहुंचने और साइट को /bedven/bedrijf/*
क्रॉल करने से अन्य सभी बॉट्स को ब्लॉक करने की अनुमति देता है ।
User-agent: googlebot
Disallow: /bedven/bedrijf/*
Crawl-delay: 10
User-agent: google
Disallow: /bedven/bedrijf/*
Crawl-delay: 10
User-agent: bingbot
Disallow: /bedven/bedrijf/*
Crawl-delay: 10
User-agent: bing
Disallow: /bedven/bedrijf/*
Crawl-delay: 10
User-agent: *
Disallow: /
क्या अंतिम नियम User-agent: * Disallow: /
सभी बॉट्स को साइट पर हर पेज को क्रॉल करने से रोकता है?
robots.txt
रास्ते को पूरी तरह से नजरअंदाज कर सकता है
robots.txt
, जो कम से कम Disallow: /
नियम का पालन करते हैं । यदि आपकी निजी वेबसाइट जमीन में धंसती जा रही है, क्योंकि एक बॉट प्रोग्रामर ने कभी नहीं माना कि सर्वर 256 राब्ड कनेक्शन के गलत छोर पर रास्पबेरी पाई हो सकता है, तो इस तरह एक कंबल बहिष्करण उपयोगी है।