कृपया सांख्यिकीय लिंगो की मेरी कसौटी पर माफी माँगें :) मुझे यहाँ पर कुछ ऐसे प्रश्न मिले हैं जो विज्ञापन से संबंधित हैं और दरों पर क्लिक करते हैं। लेकिन उनमें से किसी ने भी मेरी पदानुक्रमित स्थिति की मेरी समझ के साथ बहुत मदद नहीं की।
एक संबंधित सवाल है कि क्या ये समान श्रेणीबद्ध बायेसियन मॉडल के समान प्रतिनिधित्व हैं? , लेकिन मुझे यकीन नहीं है कि वे वास्तव में एक समान समस्या है। एक अन्य प्रश्न पदानुक्रमित बायेसियन द्विपद मॉडल के लिए हाइपरप्रिअर्स के बारे में विस्तार से जाता है, लेकिन मैं उनकी समस्या का समाधान करने में सक्षम नहीं हूं
मेरे पास नए उत्पाद के लिए ऑनलाइन कुछ विज्ञापन हैं। मैंने कुछ दिनों तक विज्ञापन चलने दिया। उस बिंदु पर पर्याप्त लोगों ने विज्ञापनों पर क्लिक किया है, जिसमें से सबसे अधिक क्लिक प्राप्त होते हैं। सभी को बाहर निकालने के बाद, लेकिन जिस पर सबसे अधिक क्लिक होते हैं, मैं उसे दूसरे कुछ दिनों के लिए चलता हूं, यह देखने के लिए कि विज्ञापन पर क्लिक करने के बाद लोग वास्तव में कितना खरीदते हैं। उस बिंदु पर मुझे पता है कि क्या विज्ञापन को पहले स्थान पर चलाना एक अच्छा विचार था।
मेरे आंकड़े बहुत शोर कर रहे हैं क्योंकि मेरे पास बहुत अधिक डेटा नहीं है क्योंकि मैं केवल हर दिन कुछ आइटम बेच रहा हूं। इसलिए यह अनुमान लगाना बहुत मुश्किल है कि एक विज्ञापन को देखने के बाद कितने लोग कुछ खरीदते हैं। प्रत्येक 150 क्लिकों में से केवल एक खरीद में परिणाम होता है।
आम तौर पर बोलना मुझे यह जानना चाहिए कि क्या मैं प्रत्येक विज्ञापन पर जितनी जल्दी हो सके पैसे खो रहा हूं, किसी भी तरह से सभी विज्ञापनों के वैश्विक आंकड़ों के साथ प्रति-विज्ञापन समूह के आंकड़ों को सुचारू कर रहा हूं ।
- यदि मैं प्रतीक्षा करता हूं जब तक कि प्रत्येक विज्ञापन ने पर्याप्त खरीदारी नहीं देखी, तो मैं टूट जाऊंगा क्योंकि इसमें बहुत लंबा समय लगता है: 10 विज्ञापनों का परीक्षण करने के लिए मुझे 10 गुना अधिक धन खर्च करने की आवश्यकता है ताकि प्रत्येक विज्ञापन के आंकड़े पर्याप्त रूप से विश्वसनीय हो जाएं। उस समय तक मेरे पास पैसे खत्म हो गए होंगे।
- अगर मैं उन सभी विज्ञापनों पर औसत खरीदारी करता हूं, तो मैं उन विज्ञापनों को नहीं निकाल पाऊंगा जो अभी भी काम नहीं कर रहे हैं।
मैं वैश्विक खरीद दर (इस्तेमाल कर सकते हैं एन $ उप वितरण? इसका मतलब यह होगा कि मेरे पास प्रत्येक विज्ञापन के लिए जितना अधिक डेटा होगा, उस विज्ञापन के आंकड़े उतने ही अधिक स्वतंत्र होंगे। यदि किसी ने अभी तक किसी विज्ञापन पर क्लिक नहीं किया है, तो मुझे लगता है कि वैश्विक औसत उपयुक्त है।
मैं उसके लिए कौन सा वितरण चुनूंगा?
अगर मेरे पास A पर 20 और B पर 4 क्लिक हैं, तो मैं उसे कैसे मॉडल कर सकता हूं? अब तक मुझे पता चला है कि एक द्विपद या पॉसों के वितरण से यहां समझ में आ सकती है:
purchase_rate ~ poisson
(?)(purchase_rate | group A) ~ poisson
(केवल समूह ए के लिए खरीद दर का अनुमान है?)
लेकिन मैं वास्तव में गणना करने के लिए आगे क्या करता हूं purchase_rate | group A
। समूह A (या किसी अन्य समूह) के लिए समझ बनाने के लिए मैं दो वितरणों को एक साथ कैसे प्लग करूं।
क्या मुझे पहले एक मॉडल फिट करना है? मेरे पास एक डेटा है जिसे मैं एक मॉडल को "ट्रेन" करने के लिए उपयोग कर सकता हूं:
- विज्ञापन A: 352 क्लिक, 5 खरीद
- विज्ञापन बी: 15 क्लिक, 0 खरीद
- विज्ञापन C: 3519 क्लिक, 130 खरीदारी
मैं समूहों में से किसी एक की संभावना का अनुमान लगाने का एक तरीका ढूंढ रहा हूं। यदि किसी समूह में केवल दो अंकों के अंक हैं, तो मैं अनिवार्य रूप से वैश्विक औसत पर वापस आना चाहता हूं। मैं बायेसियन आँकड़ों के बारे में थोड़ा जानता हूँ और बहुत से लोगों को पीडीएफ का वर्णन करते हुए पढ़ा है कि कैसे वे बायेसियन इनविज़न का उपयोग करते हैं और पुजारी और इतने पर संयुग्मित होते हैं। मुझे लगता है कि यह ठीक से करने का एक तरीका है, लेकिन मैं यह पता नहीं लगा सकता कि इसे सही तरीके से कैसे मॉडल किया जाए।
मैं उन संकेतों के बारे में सुपर खुश रहूंगा जो मुझे एक बायेसियन तरीके से अपनी समस्या बनाने में मदद करते हैं। इससे ऑनलाइन उदाहरण खोजने में बहुत मदद मिलेगी जिसका उपयोग मैं वास्तव में इसे लागू करने के लिए कर सकता हूं।
अपडेट करें:
जवाब देने के लिए बहुत बहुत धन्यवाद। मैं अपनी समस्या के बारे में अधिक से अधिक बिट्स को समझने लगा हूं। धन्यवाद! मुझे यह देखने के लिए कुछ प्रश्न पूछना चाहिए कि क्या मैं समस्या को थोड़ा बेहतर समझता हूं:
फिर मैं पूर्व के साथ गुणा करता हूं, जो पी (रूपांतरण) है, जो मेरे मामले में सिर्फ जेफ्रीज से पहले है, जो गैर-जानकारीपूर्ण है। क्या मैं पहले से अधिक डेटा प्राप्त करूंगा?
जेफरी के पूर्व प्रयोग में, मैं मान रहा हूं कि मैं शून्य से शुरू कर रहा हूं और अपने डेटा के बारे में कुछ नहीं जानता। उस पूर्व को "गैर-सूचनात्मक" कहा जाता है। जैसा कि मैंने अपने डेटा के बारे में सीखना जारी रखा है, क्या मैं पूर्व अद्यतन करता हूं?
जैसे ही क्लिक और रूपांतरण आते हैं, मैंने पढ़ा है कि मुझे अपने वितरण को "अपडेट" करना है। क्या इसका मतलब यह है, कि मेरे वितरण के मापदण्ड बदल जाते हैं, या पूर्व के परिवर्तन? जब मुझे विज्ञापन एक्स के लिए एक क्लिक मिलता है, तो क्या मैं एक से अधिक वितरण अपडेट करता हूं? एक से अधिक पूर्व?