खाली उपयोगकर्ता-एजेंट की व्याख्या


12

मुझे एक खाली उपयोगकर्ता-एजेंट की व्याख्या कैसे करनी चाहिए? मेरे पास कुछ कस्टम एनालिटिक्स कोड हैं और उस कोड को केवल मानव ट्रैफ़िक का विश्लेषण करना है। मुझे मानव ट्रैफ़िक और बॉट ट्रैफ़िक को दर्शाते हुए उपयोगकर्ता-एजेंटों की एक कार्य सूची मिली है, लेकिन खाली उपयोगकर्ता-एजेंट समस्याग्रस्त साबित हो रहा है। और मुझे लगभग 10% खाली उपयोगकर्ता-एजेंट के साथ बहुत सारे ट्रैफ़िक मिल रहे हैं।

इसके अतिरिक्त, मैंने अपने वर्तमान लॉग का विश्लेषण करके मानव ट्रैफ़िक बनाम बॉट ट्रैफ़िक उपयोगकर्ता एजेंट सूची तैयार की है। जैसे कि मुझे वहां बहुत सारी प्रविष्टियाँ याद आ रही हैं। क्या बॉट ट्रैफ़िक को निरूपित करने वाले उपयोगकर्ता एजेंटों की एक सुव्यवस्थित सूची है या, उलटा, मानव ट्रैफ़िक को दर्शाने वाले उपयोगकर्ता एजेंटों की सूची है?


1
संभावित उपयोगकर्ता-एजेंटों की सूची अविश्वसनीय रूप से लंबी है। उदाहरण के लिए, मोबाइल-केवल उपयोगकर्ता-एजेंटों की सूची यहां देखें: zytrax.com/tech/web/mobile_ids.html
मैक्स वर्नोन

खाली उपयोगकर्ता-एजेंट बहुत दुर्लभ है - आप किस सर्वर सॉफ़्टवेयर का उपयोग कर रहे हैं? आप उपयोगकर्ता-एजेंट कैसे प्राप्त कर रहे हैं? क्या आपको यकीन है कि यह वास्तव में रिक्त है, या आपके संग्रह सिस्टम में कुछ बग है जो रिक्त उपयोगकर्ता-एजेंट बना रहा है?
मैक्स वेरनॉन

@ मोम - मैं खुद खाली उपयोगकर्ता एजेंट पर हैरान हूं। मैं LAMP स्टैक का उपयोग कर रहा हूं। मैं PHP के माध्यम से $ _SERVER ['HTTP_USER_AGENT'] के रूप में उपयोगकर्ता एजेंट एकत्र करता हूं। कोड सरल है; यद्यपि मैं पूरी तरह से उपयोगकर्ता एजेंट के होने की संभावना को नहीं छोड़ सकता, लेकिन मेरा कोड इसे इकट्ठा करने में विफल रहा है, या डेटाबेस इसे स्टोर करने से इनकार कर रहा है, मुझे संदेह है कि यह मामला है।

1
यदि आपके पास अपाचे की पहुंच लॉग्स तक है: क्या लॉग इन किए गए उपयोगकर्ता-एजेंट भी खाली हैं?

शायद आपके पास अपनी साइट तक पहुँचने में कोई कमी है? यह एक ऐसा तरीका हो सकता है कि आगंतुकों
Max Vernon

जवाबों:


5

यदि आप केवल "मानव यातायात" का विश्लेषण करना चाहते हैं, तो मैं खाली या लापता उपयोगकर्ता एजेंट स्ट्रिंग वाले लोगों की गणना नहीं करूंगा। मेरे अनुभव में लगभग कोई भी ब्राउज़र हमेशा एक ही भेजेगा। यहां तक ​​कि अधिकांश गोपनीयता प्लगइन्स या एक्सटेंशन नकली (अन्य OS या क्लाइंट नाम शामिल हैं) या "सामान्य करें" (जैसे कोई रिलीज़ नंबर नहीं) या यादृच्छिक करें (जैसे कभी-कभी FF, कभी-कभी IE स्ट्रिंग्स) UA स्ट्रिंग्स, लेकिन उन्हें पूरी तरह से नहीं हटाएं (जैसा कि यह हो सकता है) कुछ साइटों के साथ समस्याएँ पैदा होती हैं जो इस पर निर्भर करती हैं, भले ही यह कोई अच्छा विचार न हो।)

यूए के साथ एक साधारण अनुरोध इस तरह किया जा सकता है:

wget --user-agent="" www.example.com

जैसा कि आप देख सकते हैं कि आप अपनी इच्छानुसार कुछ भी जोड़ सकते हैं। यूए के पाए गए "जंगल में" स्टोर और प्रकाशित करने वाली साइटें बहुत काम की नहीं हैं क्योंकि वे बहुत सी बकवास हैं।

हो सकता है कि किसी ने सिर्फ आपकी सामग्री को पुन: प्राप्त किया हो। या अपनी साइट का विश्लेषण करने के लिए कुछ एसईओ टूल का उपयोग किया है (कुछ उपयोगकर्ताओं को हेडर को मैन्युअल रूप से बदलने की अनुमति देते हैं, दूसरों को एक robots.txt लाइन को अनदेखा करने के इरादे से)। इस तरह बातें। उन स्थितियों में UA हैडर को अक्सर क्लाइंट और उद्देश्य को छिपाने के लिए फेक किया जाता है।

यदि ये अनुरोध लगातार आसपास रहते हैं तो हेडर (प्रॉक्सी)? या आईपी (एक निश्चित ब्लॉक? गोपनीयता संबंधित कंपनी / प्रॉक्सी) का विश्लेषण करने में मददगार हो सकते हैं?


2

मैं एक सुरक्षा कंपनी के लिए काम करता हूं और अन्य चीजों के अलावा हम बैड ट्रैफिक की निगरानी करते हैं।

मेरे अनुभव के आधार पर, रिक्त उपयोगकर्ता-एजेंट डेटा के साथ मानव का दौरा "हेडलेस ब्राउज़र" बॉट द्वारा किए गए स्क्रैपिंग / स्पैमिंग प्रयासों (आमतौर पर स्क्रैपिंग) को दर्शाता है।

ये आगंतुक कभी-कभी JS निष्पादित कर सकते हैं, और इसलिए वे GA में दिखाई देंगे - फिर भी, यह खुराक उन्हें मानव नहीं बनाती है :)

"प्लग" के लिए माफी माँगें, लेकिन कृपया जान लें कि, यदि आवश्यक हो, तो हम सीडीएन त्वरण और अन्य अच्छाइयों के साथ नि: शुल्क बैड बॉट संरक्षण सेवाएं प्रदान करते हैं।

इस विशिष्ट मामले में हमारी प्रणाली इस यात्रा को "संदिग्ध" के रूप में पहचानती है, इसे ज्ञात अटैक वैक्टर के खिलाफ सत्यापित किया गया है और - अगर अभी भी अनिश्चित है - आगे की परीक्षा और चुनौतियों का प्रदर्शन किया। इन चुनौतियों को बिना किसी देरी के, सत्र को पूरा करने के लिए किया जाता है।


0

इंटरनेट तक पहुंचने वाले हर बिट सॉफ्टवेयर को जादुई रूप से उपयोगकर्ता एजेंट नहीं दिया जाता है। सॉफ़्टवेयर डेवलपर्स को उस कार्यक्षमता को अपने सॉफ़्टवेयर में प्रोग्राम करना होगा। आपके रिक्त उपयोगकर्ता एजेंट का अर्थ केवल यह है कि एक सॉफ़्टवेयर डेवलपर उपयोगकर्ता एजेंट को अपने सॉफ़्टवेयर में जोड़ना भूल गया।


या कि एक ब्राउज़र उपयोगकर्ता ने यूए स्ट्रिंग को हटा दिया / अवरुद्ध कर दिया।
21

5
ये गलत है। यह कहने का अर्थ है "बस का अर्थ है" का अर्थ है कि यह आमतौर पर या कम से कम अक्सर कारण होता है। कुछ लोग http सॉफ़्टवेयर का उपयोग करते हैं, जो डेवलपर ने UA को आलस्य से बाहर निकाला होगा। अगर कुछ भी यह लगभग हमेशा इंगित करता है कि ट्रैफ़िक स्रोत पहचाना नहीं जाना चाहता था, और यह दुर्भावनापूर्ण या शोषणकारी ट्रैफ़िक से जुड़ा हुआ है। दुर्भाग्य से कुछ बड़ी कंपनियों (फेसबुक) ने अतीत में खाली यूजर एजेंट स्ट्रिंग्स का इस्तेमाल किया है, इसलिए जरूरी नहीं कि उन्हें पूरी तरह से ब्लॉक किया जाए।
जर्कलैर्क

1
@jeremyclarke +1 इस तरह के व्यवहार को कभी अनदेखा नहीं करना चाहिए! और फेसबुक पर शर्म! यदि किसी वैध बॉट या ब्राउज़र को एक साइट देखने की जरूरत है, तो उन्हें हमेशा एक पहचानकर्ता होना चाहिए। आखिरकार, वे किसी और की संपत्ति में प्रवेश कर रहे हैं। कोई भी उपयोगकर्ता-एजेंट अपनी पहचान को अस्पष्ट करने के लिए मास्क के साथ चुपके से चोरी करने जैसा नहीं है।
व्हाइटबर्ड

2
यह ऐसा है जैसे कोई अपने चेहरे को अपने घर के सामने फुटपाथ के पार आगे-पीछे करता हो। जरूरी नहीं कि गैरकानूनी हो, लेकिन अगर आप उस दरवाजे का जवाब नहीं देते हैं, तो उन्हें यह नहीं समझना चाहिए कि आप पागल हैं।
jerclarke

0

मैं इस सवाल के जवाब में कुछ टिप्पणियां देख रहा हूं जो आपकी पहचान छिपाने या मानव होने के लिए यूजर-एजेंट की तुलना करता है। यह एक बेतुकी तुलना है। उपयोगकर्ता-एजेंट का पहचान या मानव होने से कोई लेना-देना नहीं है।

इसे फुटवियर की तरह समझें। आप अपने आगंतुकों से पूछ रहे हैं कि आप उन्हें पहनने से पहले किस प्रकार के जूते पहन रहे हैं। इसका सबसे आम उपयोग यह जानने के लिए है कि आपको किस प्रकार के कालीन को रोल आउट करने की आवश्यकता है, साफ कपड़े के जूते के लिए अच्छा लाल कालीन, मैला के लिए बदसूरत डोरमैट। जूते, बूट और आगंतुकों के लिए कोई कालीन नहीं है जो एलर्जी कालीन हैं।

जब आगंतुक यह नहीं कहना चाहते कि उनके पास कौन से फुटवियर हैं (उर्फ खाली उपयोगकर्ता-एजेंट) तो आप उन्हें अनदेखा कर दें।

हां, बहुत सारी अच्छी प्रथाएं हैं जो उपयोगकर्ता-एजेंट और अन्य अनुरोध हेडर जानकारी के आधार पर वेब अनुरोध के बारे में चीजों को ग्रहण करने का प्रयास करती हैं। वे समय के 99% महान काम कर सकते हैं, लेकिन इतनी ही अन्य समान प्रथाओं के साथ वे झूठे-सकारात्मक प्रवृत्त होते हैं और इस तरह से सामान्य अज्ञानी उपयोगकर्ताओं को नुकसान पहुंचाते हैं।

गलती से एक खाली उपयोगकर्ता-एजेंट का उपयोग करने के मामले में खुद को चलाने के बाद, मैं निश्चित रूप से कह सकता हूं कि यह मजेदार नहीं है जब एक वेब सेवा आपसे अलग तरीके से सिर्फ इसलिए व्यवहार करती है क्योंकि आपने इसे अपने जूते के बारे में बताने के लिए नहीं सोचा था।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.