क्या किसी नियमित ब्राउज़र में उपयोगकर्ता एजेंट में 'बॉट' या 'क्रॉल' होता है?


11

क्या किसी नियमित ब्राउज़र में उपयोगकर्ता एजेंट में 'बॉट' या 'क्रॉल' होता है?

मैं अपनी साइट पर उपयोगकर्ता एजेंट को यह देखने के लिए देखता हूं कि यह बॉट से आ रहा है या नहीं। अगर यह है, तो मैं कुछ छोटे अनुकूलन कर सकता हूं क्योंकि वे लॉगिन नहीं करते हैं। (मैं सामग्री बिल्कुल नहीं बदलता)

30-40 + बॉट के लिए चेक जोड़ने के बाद, मैं उन्हें जोड़कर थक गया हूं। इसलिए मैं सोच रहा था कि अगर जाँच की जाए कि इसमें सिर्फ 'बॉट' या 'क्रॉल' है। मुझे पता है कि सभी बॉट नहीं मिलेंगे, लेकिन उनमें से बहुत कुछ मिलेगा। लेकिन अगर इससे कोई झूठी सकारात्मकता पैदा हो सकती है, तो यह पूरी तरह से गाड़ी को जोड़ने, एक आदेश रखने और लॉगिन करने की क्षमता को गड़बड़ कर देगा।

जवाबों:


13

Http://www.useragentstring.com/pages/useragentstring.php?typ=Browser पर सूची के अनुसार 9000 से अधिक उपयोगकर्ता एजेंट विभिन्न ब्राउज़रों से स्ट्रिंग:

  • ब्राउज़र के 0 उपयोगकर्ता एजेंट स्ट्रिंग्स में "बॉट" शब्द होता है
  • ब्राउज़र के 2 उपयोगकर्ता एजेंट तार में "क्रॉल" शब्द शामिल है
  • ब्राउज़र के 0 उपयोगकर्ता एजेंट स्ट्रिंग में "स्पाइडर" शब्द होता है

(2 जिसमें "क्रॉल" शामिल हैं, निम्नलिखित हैं: "मोज़िला / 4.0 (संगत; MSIE 5.01; विंडोज NT 5.0; YComp 5.0.2.6; MSIECrawler)" और "Mozilla / 4.0 (संगत; MSIE) 5.01; Windows NT 5.0; MSIECrawler ) "मुझे लगता है कि उन पर विचार नहीं करना सुरक्षित है।"

Http://www.useragentstring.com/pages/useragentstring.php?typ=Crawler पर सूची के अनुसार बॉट के रूप में सूचीबद्ध 442 उपयोगकर्ता एजेंट स्ट्रिंग्स के साथ:

  • बॉट के 208 उपयोगकर्ता एजेंट तार में "बॉट" शब्द होता है
  • बॉट के 63 उपयोगकर्ता एजेंट स्ट्रिंग्स में "क्रॉल" शब्द शामिल है
  • बॉट के 37 उपयोगकर्ता एजेंट तार में "मकड़ी" शब्द शामिल है
  • 282 बॉट के उपयोगकर्ता एजेंट स्ट्रिंग्स में "बॉट", "क्रॉल" या "स्पाइडर" शामिल हैं।

मेरा निष्कर्ष: "बॉट", "क्रॉल" और "स्पाइडर" शब्दों द्वारा उपयोगकर्ता एजेंट स्ट्रिंग्स द्वारा बॉट को फ़िल्टर करना सुरक्षित है। यह बुलेट प्रूफ नहीं है, लेकिन निश्चित रूप से कुछ नहीं से बेहतर है।

नोट: जब मैं कीवर्ड के लिए खोज करता था तो केस असंवेदनशील खोज का उपयोग करता था।


आपके उत्तर के लिए बहूत बहूत धन्यवाद। मैं आज एक चेक किया है, और अभी भी कोई ब्राउज़र या मोबाइल ब्राउज़र उपयोगकर्ता एजेंट स्ट्रिंग के किसी भी शामिल हैं bot, crawl, spider, और यहां तक search
ओलिवर

2

एक बेहतर समाधान आईएमओ यह पता लगाने के लिए होगा कि क्या उपयोगकर्ता लॉग इन है। यदि वे नहीं हैं, तो मानक पृष्ठ दिखाएं (यह कैश्ड हो सकता है)। कोई भी वेब स्पाइडर कभी भी लॉग इन नहीं होगा, लेकिन यदि आप उनके लिए अनुकूलन कर रहे हैं, तो आपकी साइट पर नए उपयोगकर्ताओं के लिए क्यों नहीं?


हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.