"आगंतुकों" को कुकीज़ का मानक अनुपात?


31

जैसा कि एक हालिया ब्लॉग पोस्ट में उल्लेख किया गया है , हम Google Analytics "विज़िटर" और क्वांटकास्ट "विज़िटर" के बीच एक बड़ी विसंगति देखते हैं

इसके अलावा, जिन कारणों से हमने कभी पता नहीं लगाया है, Google Analytics को क्वांटकास्ट से बड़ी संख्या मिलती है। अभी GA पूरे नेटवर्क (14 मिलियन) पर Quantcast की तुलना में अकेले stackoverflow.com पर अधिक आगंतुकों (15 मिलियन) दिखा रहा है :

क्यूं कर? मुझे नहीं पता। या तो Google Analytics कुकीज़ को कभी-कभी खो देता है, या क्वांटकास्ट आगंतुकों को याद करता है। गिनती एक अनुभवहीन विज्ञान है।

हमें लगता है कि यह इसलिए है क्योंकि क्वांटकास्ट कुकीज़-टू-विज़िटर के अधिक रूढ़िवादी अनुपात का उपयोग करता है । जबकि Google Analytics प्रत्येक कुकी को "आगंतुक" मान सकता है, क्वांटकास्ट प्रत्येक 1.24 कुकीज़ को "आगंतुक" पर विचार करेगा। यह मेरे लिए समझ में आता है, क्योंकि लोग हमारी साइटों को कई कंप्यूटरों, कई ब्राउज़रों, वगैरह से एक्सेस कर सकते हैं।

मेरे पास दो संबंधित प्रश्न हैं:

  1. क्या आगंतुकों के लिए कुकीज़ का एक स्वीकृत मानक अनुपात है? यह स्पष्ट रूप से एक अक्षम विज्ञान है, लेकिन क्या अंगूठे का कोई उभरता हुआ नियम है?

  2. क्या ब्राउज़र कुकीज़ पर निर्भर रहने के अलावा किसी वेबसाइट पर "विज़िटर" को गिनने का कोई और सटीक तरीका है? या क्या यह हमेशा एक सर्वोत्तम प्रयास का अनुमान है कि आप इसे कैसे मापते हैं?


क्वांटकास्ट निश्चित रूप से कुकीज़ का उपयोग करता है, है ना? वे सिर्फ आईपी पते या कुछ और पर नहीं जाते हैं?
असंतुष्टगीत

@disgruntledgoat मैंने अभी वेबसाइट की जाँच की: "क्वांटकास्ट दर्शकों को अद्वितीय कुकीज़ काउंट और लोगों दोनों के लिए डेटा प्रदान करता है।"
मैथ्यू ब्रुक्स

@DisgruntledGoat इस पृष्ठ की जाँच करें। इससे कुकीज़ हैं quantserve.com
येलहेल

जवाबों:


14

मुझे ईमेल किया गया:

आपने उल्लेख किया कि आपके GA नंबरों और आपके QC नंबरों के बीच काफी पर्याप्त डेल्टा था। हालांकि ऐसा अक्सर नहीं होता है, ऐसा होता है और कई कारण होते हैं। उदाहरण के लिए, हम तृतीय पक्ष कुकीज़ और ऑटो-रिफ्रेश और जीए नहीं खाते हैं। हम यह भी पूछते हैं कि प्रकाशक एमआरसी और आईएबी मानकों का पालन करने के लिए पृष्ठ के निचले भाग के पास हमारे टैग को रखें। यदि आपके अन्य माप टैग पृष्ठ पर अधिक हैं, तो वे आग लगा सकते हैं जब क्वांटकास्ट नहीं करता है। (हम केवल एमआरसी मान्यता प्राप्त यातायात माप सेवा हैं)। इसके अलावा, समय क्षेत्र के विचारों के कारण संख्या कभी भी एक जैसी नहीं होने वाली है - हम एक सामान्यीकरण फ़ंक्शन का उपयोग करते हैं और जीए निर्धारित है।

यदि आप इस बारे में अधिक जानना चाहते हैं कि हम अपनी संख्या कैसे निर्धारित करते हैं, तो कृपया देखें: http://www.quantcast.com/how-we-do-it । हमारे पास हमारे कुकी-सही दर्शकों के डेटा और यहां स्थित हमारी कार्यप्रणाली पर श्वेत पत्र भी हैं।

श्वेत पत्र का उपयोग करते हुए मैं देखता हूं कि वे वास्तव में कर रहे हैं, जेफ सुझाव देते हैं: "आधिकारिक" संख्याओं को कुछ ऐसा पाने के लिए जो उन्हें लगता है कि लोगों की वास्तविक संख्या के करीब है। उनके पास कुकी सुधार वाला ऑडिटिव व्हाइट पेपर (पीडीएफ लिंक) है, जिसका अर्थ है कि उनकी प्रणाली विस्तृत है, न कि केवल एक जादुई संख्या से विभाजित होने के रूप में सरल:

क्वांटकास्ट क्वांटिफाइड पब्लिशर प्रोग्राम हर महीने 75 बिलियन से अधिक मीडिया उपभोग की घटनाओं पर कब्जा कर लेता है, जो 1.4 बिलियन से अधिक कुकीज़ (जून, 2008 के अनुसार डेटा) द्वारा उत्पन्न होता है। क्या अधिक है, हमारे कई क्वांटिफाइड प्रकाशक साझेदार हमारे साथ अनाम पहचानकर्ता साझा करते हैं जो कुकीज़ से स्वतंत्र हैं। हमारे मॉडल में कई पैनल शामिल हैं जो लोगों के लिए संदर्भ बिंदुओं और अंशांकन के लिए प्रदान करते हैं जो कुकी हटाने से मुक्त हैं। हम विभिन्न संग्रह प्रक्रियाओं, पूर्वाग्रहों और मुद्दों के साथ डेटा के इस द्रव्यमान को त्रिकोणीय करते हैं। हमारे मॉडल खाते की आवृत्ति, समय अवधि, कई कंप्यूटर उपयोग की संभावना और यहां तक ​​कि एक ही कंप्यूटर का उपयोग करके कई लोगों के प्रभाव को लोगों के अनुमानों को वितरित करने के लिए ध्यान में रखते हैं। लोगों को अनूठे कुकीज़ के अनुवाद के लिए हमारे मॉडल को होल्ड-आउट नमूने और स्वतंत्र डेटा सेट का उपयोग करके मान्य किया गया है। इसके अलावा, हमारा मॉडल इंटरनेट ट्रैफिक पैटर्न की बढ़ती प्रकृति को दर्शाने के लिए एक गतिशील आधार पर गतिशील और पुनर्गणित है।


2
दिलचस्प। उत्तरार्द्ध अंश पहले की तुलना में अधिक जानकारीपूर्ण (और प्रेरक) है। जीए को तीसरे पक्ष के कुकीज़ के लिए खाते की आवश्यकता नहीं है, क्योंकि यह पहली पार्टी कुकीज़ का उपयोग करता है। हां, समय क्षेत्र अंतर सटीक संख्याओं को बदल देगा, लेकिन महीने के लंबे अंतराल में, महत्वपूर्ण माप अंतरों के लिए खाते की अत्यधिक संभावना नहीं है।
येलहेल

27

क्वांटकास्ट अंडरकाउंटिंग के साथ खेलने का एक और कारक है: वे तृतीय-पक्ष कुकीज़ ( .quantserve.comडोमेन से कुकीज ) का उपयोग करते हैं, जबकि Google Analytics प्रथम-पक्ष कुकीज़ ( stackexchange.com, आदि) का उपयोग करता है

यह बहुत महत्वपूर्ण है, क्योंकि कुछ ब्राउज़र (विशेष रूप से सफारी, लेकिन अधिक हाल ही में फ़ायरफ़ॉक्स और क्रोम) डिफ़ॉल्ट सेटिंग के रूप में तीसरे पक्ष के कुकीज़ को अक्षम करते हैं, और कई अन्य व्यक्तिगत रूप से गोपनीयता सेटिंग्स चुन सकते हैं जो तृतीय-पक्ष कुकीज़ को बार करते हैं। इसका मतलब है कि जनसंख्या का एक सबसेट है जो क्वांटकैस्ट के कुकीज़ द्वारा कभी भी ट्रैक नहीं किया जाएगा। इसके बाद, इसका मतलब है कि Google Analytics हमेशा उच्च आगंतुक गणना लौटाएगा।

मैं कहूंगा कि अंगूठे का कोई नियम नहीं है। एक एनालिटिक्स प्रैक्टिशनर के रूप में, मैं कहूंगा कि 'सच्चे' विज़िटर की गिनती के लिए खोज निराशाजनक है, और इसके बजाय खुद यात्राओं पर ध्यान दें। उदाहरण के लिए, आपके Google Analytics खाते में, मैं कम से कम 8 अलग-अलग आगंतुक हूं, मेरे काम के लैपटॉप, मेरे व्यक्तिगत लैपटॉप, मेरे फोन और मेरे iPad पर Chrome, Safari और Firefox से StackOverflow एक्सेस किया गया है। Analytics सेवाएँ सभी अलग-अलग तरीकों से गिनती हैं, और इस प्रकार सभी अलग-अलग संख्याओं में वापस आती हैं।

सही कार्यान्वयन के साथ भी, Google Analytics सर्वर-आधारित आधारित एनालिटिक्स सिस्टम की तुलना में लगभग हमेशा कम काउंट काउंट दिखाएगा, लेकिन क्वांटकास्ट जैसे तृतीय-पक्ष कुकी आधारित सिस्टम की तुलना में उच्च विज़िट की संख्या दिखाएगा। महत्वपूर्ण बात कच्चे योग को देखना नहीं है, लेकिन प्रत्येक पद्धति में इसकी प्रवृत्ति को दिखाया गया है। इसलिए, Google Analytics संख्याओं के लिए क्वांटकास्ट संख्याओं की तुलना कभी न करें; इसके बजाय, उन संदर्भों के भीतर संख्याओं का उपयोग करें जिनमें उन्हें एकत्र किया गया था।

एक और मुद्दा यह हो सकता है कि आपका Google Analytics कार्यान्वयन सही नहीं है, क्योंकि आपके कई प्रकार के डोमेन-और-उपडोमेन सेटअप के लिए इसे कॉन्फ़िगर करना एक दुःस्वप्न हो सकता है यदि इसे सही ढंग से और कठोरता से नहीं किया जाए, जो एकल ब्राउज़र के रूप में गिना जा सकता है कई आगंतुक, जो आपकी गिनती को बढ़ा रहे हैं। यह क्वांटकास्ट के लिए कभी कोई समस्या नहीं है, क्योंकि सभी कुकीज़ उनके एक तीसरे पक्ष के डोमेन पर सेट की जाती हैं।


Google Chrome डिफ़ॉल्ट रूप से तृतीय-पक्ष कुकीज़ को अवरोधित करने के लिए भी लगता है।
MrWhite

7

एक से अधिक विज़िट वाली साइटों के लिए आमतौर पर अनन्य आगंतुकों के लिए कुकीज़ का अनुपात 1.3 से 1.7 के बीच होता है।

जबकि yc01 सही है कि GA प्रथम-पक्ष कुकीज़ बनाम तृतीय-पक्ष कुकीज़ का उपयोग करता है, हम RealSelf.com पर दो प्रथम-पक्ष विश्लेषिकी प्रदाता (GA और Comscore Direct) का उपयोग करते हैं और GA अभी भी Comscore के अद्वितीय आगंतुकों की तुलना में 30% अधिक निरपेक्ष अद्वितीय आगंतुकों को दिखाता है।

Comscore केवल देश के अद्वितीय आगंतुकों को दिखाता है, इसलिए GA से Comscore की तुलना करने के लिए हमें यूएस-आधारित निरपेक्ष अद्वितीय आगंतुकों की संख्या की गणना करनी होगी:

अमेरिका के दौरे / वैश्विक दौरे * निरपेक्ष अद्वितीय उपयोगकर्ता

(1,150,110 / 1,650,979) * 1,273,059 = 886,842 US- अनूठे उपयोगकर्ता

इसके विपरीत, कॉमस्कोर 680,900 यूएस-आधारित यूनिक उपयोगकर्ताओं की रिपोर्ट करता है। इसलिए GA 30.2% अधिक दिखाता है।

Comscore ने सटीक होने की कोशिश करते हुए अपने व्यवसाय का निर्माण किया है, जबकि GA प्राथमिक रूप से AdWords और AdSense का उपयोग करने वाली साइटों को ट्रैक और ऑप्टिमाइज़ करने का एक निःशुल्क तरीका है। कॉमस्कोर के पास लोगों का एक पैनल है जो वे ट्रैफ़िक का अनुमान लगाने के लिए भी उपयोग करते हैं, और वे प्रति व्यक्ति कुकीज़ की औसत संख्या निर्धारित करने के लिए उस पैनल का उपयोग करते हैं। मोबाइल उपकरणों का उपयोग करने वाले अधिक लोगों के साथ (हमारा मोबाइल उपयोग 15% है), यह समझ में आता है कि अद्वितीय कुकीज़ अद्वितीय लोगों की संख्या से अधिक हैं।


"अद्वितीय आगंतुकों के लिए कुकीज़ का अनुपात आमतौर पर एक लाख से अधिक विज़िट वाली साइटों के लिए 1.3 और 1.7 के बीच होता है।" क्या वह कॉमस्कोर-प्रकाशित आंकड़ा है?
सियारान

यह हमारे लिए आश्चर्यजनक रूप से सटीक है; मैंने UserSessionकुछ स्थानों पर तालिका के आँकड़े चलाए और वे 2.0 (स्टैक ओवरफ़्लो) से लेकर 1.46 (वेबपेज) के बीच की हर चीज़ के साथ थे। 1.6 तकनीक केंद्रित साइटों के लिए एक बहुत ही समझदार डिफ़ॉल्ट की तरह लगता है।
जेफ एटवुड

4

यहां हाल ही में (4 मई, 2011 - कल जब मैंने यह लिखा है) अलग-अलग बाजारों में "कुकी इन्फ्लेशन मल्टीप्लायर" के साथ MediaMind से अध्ययन किया है:

जर्मनी के लिए उनकी गणना मुद्रास्फीति कारक 2.2 से अमेरिका के लिए 3.0 के बीच है।


यह उत्कृष्ट है - बिल्कुल इसी तरह का संदर्भ जिसे मैं ढूंढ रहा था
जेफ एटवुड

2

हो सकता है कि आपके जीए आगंतुक संख्या दर्शकों की अधिक तकनीकी प्रकृति के कारण एक सामान्य साइट से अधिक फुलाए गए हों? उदाहरण के लिए, प्रोग्रामर, वेब डेवलपर्स विशेष रूप से, ब्राउज़रों की एक श्रृंखला का उपयोग करने की अधिक संभावना है और इस प्रकार कुकी की संख्या बढ़ जाती है।

प्रश्न 1 के लिए, मुझे लगता है कि, कई मैट्रिक्स के साथ, वैश्विक मानकों की तलाश के बजाय अपनी स्वयं की साइट से डेटा का उपयोग करना बेहतर है क्योंकि समुच्चय भ्रामक हो सकते हैं। वास्तविक आगंतुक गणना के लिए एक कुकी प्राप्त करने का एक तरीका यह हो सकता है कि आप प्रत्येक पंजीकृत उपयोगकर्ता से कितने कुकीज़ देखें, फिर उससे संख्या प्राप्त करें।

नंबर 2 के लिए, सैद्धांतिक रूप से वास्तविक आगंतुकों की गणना करने का सबसे अच्छा तरीका यह होगा कि सभी को खाता पंजीकृत करने के लिए मजबूर किया जाए। जैसा कि स्पष्ट रूप से एक अच्छा विचार नहीं है तो आप सामान्यीकरण को देख सकते हैं। उदाहरण के लिए, आप मेरे द्वारा सुझाए गए पंजीकृत उपयोगकर्ता मीट्रिक के लिए औसत कुकीज़ का उपयोग कर सकते हैं और इसे विज़िटर संख्याओं पर लागू कर सकते हैं जो GA रिपोर्ट कर रहा है।


यह एक बड़ा मुद्दा है। स्टैक ओवरफ्लो पर, हमारे पास वर्तमान में 531,484 सत्र हैं जिनमें से 261,547 अनूठे उपयोगकर्ताओं को इंगित करते हैं - इसलिए मूल रूप से प्रत्येक 1 उपयोगकर्ता प्रति 2 कुकीज़।
जेफ एटवुड 15:59 11:59

-1

मुझे लगता है कि आईपी विश्वास करने में सक्षम है ... जब मैं पीए के साथ जीए की तरह सांख्यिकीय प्रणाली बनाता हूं तो मैं इस तरह से कुछ विधि का उपयोग करता हूं

  • ब्राउज़र में कुकी भेजें और डेटाबेस के लिए सभी एजेंट डेटा को पकड़ो
  • आसान तरीका अगर नई यात्रा में कुकी है तो यह नई यात्रा नहीं है, इसलिए मैं इसे नई यात्रा के रूप में नहीं सहेजता (यदि मेरे पास नई यात्रा खोजने के लिए तारीख और विलंब का समय है, तो उपयोगकर्ता 2 घंटे बाद साइट पर फिर से आएंगे)
  • इस उपयोगकर्ता और IP और कुकी के लिए उपयोगकर्ता IP और कुछ आईडी सहेजें (इसकी कुकी में भी बचत करें)
  • नया उपयोगकर्ता आता है और उसके पास कोई कुकी नहीं है ... क्या यह आईपी नया है? हाँ? ठीक है इसका नया उपयोगकर्ता केवल उपयोगकर्ता एजेंट और आईपी / नहीं हड़प सकता है? यह उपयोगकर्ता कितनी बार आता है? हद से ज्यादा? वास्तव में नई यात्रा नहीं, इस उपयोगकर्ता एजेंट के साथ अधिक नहीं? ठीक है यह नया है ...: डी

इस पद्धति में गलती है लेकिन खराब नहीं है और वैध डेटा के पास है ... (इसका उपयोग नए उपयोगकर्ता को खोजने में देरी के समय पर निर्भर करता है (2 विज़िट के बीच देरी) और उपयोगकर्ताओं के लिए समय की कोशिश नहीं करना है)


5
एक नैट के पीछे StackOverflow का उपयोग करने वाले कई अलग-अलग डेवलपर्स के साथ एक कंपनी उदाहरण के लिए कैसे संभालती है? क्या वे सभी एक आगंतुक के रूप में गिने जाएंगे?
शविश

3
इस का आईपी पहलू वास्तव में त्रुटिपूर्ण है। आईपी ​​पता एक अद्वितीय पहचानकर्ता नहीं है।
याहेल

इसके लिए समय देने का प्रयास है ... हम एजेंट और अन्य चीजों की जांच करते हैं और हम एक आईपी को 100 से अधिक बार जोड़ सकते हैं ... इसका एक
नैट के
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.