मैं आँकड़ों में एक noob हूँ, तो क्या आप लोग यहाँ कृपया मेरी मदद कर सकते हैं।
मेरा प्रश्न निम्नलिखित है: वास्तव में पूलित विचरण का क्या अर्थ है?
जब मैं इंटरनेट में पूल किए गए विचरण के लिए एक सूत्र की तलाश करता हूं, तो मुझे निम्न सूत्र का उपयोग करके बहुत सारे साहित्य मिलते हैं (उदाहरण के लिए, यहां: http://math.tntech.edu/ISR/Mathematical_Statistics/Introduction -to_Statutic_Tests / thispage / newnode19.html ):
लेकिन यह वास्तव में क्या गणना करता है ? क्योंकि जब मैं इस फॉर्मूले का उपयोग अपने जमा हुए विचरण की गणना करने के लिए करता हूं, तो यह मुझे गलत उत्तर देता है।
उदाहरण के लिए, इन "मूल नमूने" पर विचार करें:
इस माता पिता नमूने के विचरण है है, और उसके मतलब है ˉ एक्स पी = 5 ।
अब, मान लीजिए कि मैंने इस मूल नमूने को दो उप-नमूनों में विभाजित किया है:
- पहले उप नमूना माध्य साथ 2,2,2,2,2 है और विचरण एस 2 1 = 0 ।
- दूसरा उप नमूना माध्य साथ 8,8,8,8,8 है और विचरण एस 2 2 = 0 ।
अब, स्पष्ट रूप से, इन दो उप-नमूनों के जमा / अभिभावक विचलन की गणना करने के लिए उपरोक्त सूत्र का उपयोग करने से शून्य का उत्पादन होगा, क्योंकि और एस 2 = 0 । तो यह सूत्र वास्तव में क्या गणना करता है?
दूसरी ओर, कुछ लंबी अवधि के व्युत्पन्न के बाद, मुझे सूत्र मिला जो सही जमा / अभिभावक का सही उत्पादन करता है:
उपरोक्त सूत्र में, और डी 2 = ¯ एक्स 2 - ˉ एक्स पी ।
मुझे उदाहरण के लिए मेरा एक समान सूत्र यहां मिला, http://www.emathzone.com/tutorials/basic-statistics/combined-variance.html और विकिपीडिया में भी। हालांकि मुझे यह स्वीकार करना होगा कि वे मेरे जैसे बिल्कुल नहीं दिखते हैं।
तो फिर, वास्तव में पूलित विचरण का क्या अर्थ है? इसका मतलब यह नहीं होना चाहिए कि दो उप-नमूनों में से माता-पिता के नमूने का विचरण? या मैं यहाँ पूरी तरह से गलत हूँ?
पहले ही, आपका बहुत धन्यवाद।
EDIT 1: कोई कहता है कि मेरे दो उप-नमूने पैथोलॉजिकल हैं क्योंकि उनके पास शून्य विचरण है। खैर, मैं आपको एक अलग उदाहरण दे सकता हूं। इस मूल नमूने पर विचार करें:
इस मूल नमूने का विचरण , और इसका माध्य of x p = 25.5 है ।
अब, मान लीजिए कि मैंने इस मूल नमूने को दो उप-नमूनों में विभाजित किया है:
- पहले उप नमूना माध्य साथ 1,2,3,4,5 है और विचरण एस 2 1 = 2.5 ।
- दूसरा उप-नमूना 46,47,48,49,50 मतलब और विचरण S 2 2 = 2.5 है ।
अब, यदि आप "साहित्य के फॉर्मूले" का उपयोग करते हैं, तो जमा किए गए संस्करण की गणना करने के लिए, आपको 2.5 मिलेगा, जो पूरी तरह से गलत है, क्योंकि मूल / जमाव वाला संस्करण 564.7 होना चाहिए। इसके बजाय, यदि आप "मेरे सूत्र" का उपयोग करते हैं, तो आपको सही उत्तर मिलेगा।
कृपया समझें, मैं लोगों को यह दिखाने के लिए यहां अत्यधिक उदाहरणों का उपयोग करता हूं कि सूत्र वास्तव में गलत है। यदि मैं "सामान्य डेटा" का उपयोग करता हूं, जिसमें बहुत अधिक विविधताएं (चरम मामले) नहीं हैं, तो उन दो सूत्रों से परिणाम बहुत समान होंगे, और लोग गोल त्रुटि के कारण अंतर को खारिज कर सकते हैं, इसलिए नहीं कि सूत्र ही है गलत।