सामान्य बॉट्स के दायरे में, यह सब इस बात पर निर्भर करता है कि आप क्या सराहना करते हैं और केवल आप ही यह तय कर सकते हैं। बेशक गूगल, बिंग / एमएसएन / याहू !, Baidu और यांडेक्स है। ये प्रमुख खोज इंजन हैं। विभिन्न एसईओ और बैकलिंक साइटें भी हैं। सही या गलत, मैं अनुमति देता हूं कि कुछ बड़े लोगों की मेरी साइट तक पहुंच है, लेकिन आम तौर पर, वे बेकार साइट हैं। मैं न केवल robots.txt में, बल्कि डोमेन नाम और आईपी पते से आर्काइव.ऑर्ग को ब्लॉक करता हूं। इसका कारण यह है कि वे robots.txt को बड़े समय तक अनदेखा करते हैं! यह एक ऐसी चीज है जिसके लिए आपको एक महसूस करने की आवश्यकता है। एजेंट नामों से मूर्ख मत बनो। अक्सर वे बुरे लोगों द्वारा जाली होते हैं। अब दिन, मुझे Baidu होने का दावा करने वाले स्रोतों से हजारों पृष्ठ अनुरोध मिल रहे हैं, लेकिन नहीं हैं। डोमेन नाम और आईपी एड्रेस ब्लॉक द्वारा इन मकड़ियों को जानें और उनसे उस स्तर पर निपटना सीखें। अच्छे लोग robots.txt को मानते हैं।
लेकिन मुझे आपको चेतावनी देनी चाहिए, वहाँ एक बॉट ऑफ स्टील्थ बॉट्स, बदमाश बॉट्स, स्क्रेपर्स हैं, और इसी तरह आप अपने लॉग विश्लेषण को बार-बार खोजना और ब्लॉक करना चाहेंगे। यह ५ पक ५! लेकिन इसे किया ही जाना है। इन दिनों उनसे सबसे बड़ा खतरा आपकी साइट पर कम गुणवत्ता वाले लिंक हैं। इस साल लागू किया गया मेरा अपडेटेड एंटी-बॉट सुरक्षा कोड 7700 कम गुणवत्ता वाले लिंक को स्वचालित रूप से गिरा दिया है। बेशक, मेरे कोड को अभी भी काम की आवश्यकता है, लेकिन आपको बिंदु मिल जाएगा। खराब बॉट अभी भी साइट की क्षमता को चुरा रहे हैं।
इससे पहले कि आप इसे लटका लें, यह लंबे समय तक नहीं होगा।