मेरे पास प्रत्येक राउंड के बाद सट्टेबाजी के साथ 5 राउंड से अधिक दांव जीतने और हारने की श्रृंखला पर डेटा है। मैं डेटा प्रदर्शित करने के लिए निम्नलिखित की तरह एक निर्णय पेड़ का उपयोग कर रहा हूं।
पेड़ के शीर्ष की ओर नोड्स वे हैं जो जीतने वाले दांव लगा रहे हैं, और पेड़ के नीचे की तरफ दांव हारने वाले रन हैं। मैं प्रत्येक नोड (बी) में प्रत्येक नोड पर औसत शर्त आकार में परिवर्तन (ए) को देखना चाहता हूं। मैं पिछले नोड से प्रत्येक नोड पर आकर्षण की दर, और जीवित रहने की दर (यदि संभावना 50% है तो प्रत्येक नोड पर लोगों की अपेक्षित राशि का उपयोग करके) देख रहा हूं। उदाहरण के लिए, यदि संभावना प्रत्येक नोड पर 50% है, तो 1000 में से जो शुरू हुआ, लगभग 500 लोग प्रत्येक दूसरे नोड्स में होना चाहिए, डब्ल्यू और एल। परिकल्पना है (ए) हारने के बाद अट्रेक्शन की दर अधिक है बेट्स (बी) का मतलब है कि बेटर्स के बाद बेट्स का आकार कम किया जाता है और विजेताओं के बाद उठाया जाता है।
मैं बस पहले एक बहुत ही सरल univariate सेटिंग में यह करना चाहता हूं। यदि मैं 50 लोगों को छोड़ दिया है, तो मैं नोड डब्ल्यूडब्ल्यू से नोड डब्ल्यूडब्ल्यूडब्ल्यू के लिए मतलब दांव आकार में परिवर्तन दिखाने के लिए टी-टेस्ट कैसे कर सकता हूं? मुझे यकीन नहीं है कि यह सही दृष्टिकोण है: प्रत्येक बाद की शर्त स्वतंत्र है, लेकिन लोग हारने के बाद बाहर निकल रहे हैं, इसलिए नमूना मिलान नहीं किया गया है। अगर यह उसी वर्ग का मामला था, जिसमें एक के बाद एक परीक्षाओं की श्रृंखला एक-एक के बिना किसी एक को छोड़ने के बाद होती है, तो मुझे समझ में आता है कि उपयुक्त टी-टेस्ट कैसे करें, लेकिन मुझे लगता है कि यह थोड़ा अलग है।
मैं यह कैसे कर सकता हूँ? इसके अलावा, यदि परिणाम कम संख्या में ग्राहकों द्वारा तिरछा किए जा रहे हैं, तो मैं शीर्ष 5% और नीचे 5% कैसे निकाल सकता हूं? बस शर्त 1 - 3 से ग्राहकों को उच्चतम संचयी हिस्सेदारी के आकार को हटा दें?
मेरे पास वह डेटा है जिससे आंकड़ा उत्पन्न किया गया था, इसलिए मेरे पास प्रत्येक नोड पर माध्य, एसटीडी, एसटीडी त्रुटि आदि है।