एक सामान्य वितरण का पालन करने के लिए टी-स्टेटिस्टिक डेटा की आवश्यकता क्यों है


11

मैं इस नोटबुक को देख रहा था , और मैं इस कथन से हैरान हूँ:

जब हम सामान्यता के बारे में बात करते हैं तो हमारा मतलब यह है कि डेटा को सामान्य वितरण की तरह देखना चाहिए। यह महत्वपूर्ण है क्योंकि कई सांख्यिकीय परीक्षण इस पर भरोसा करते हैं (जैसे टी-आँकड़े)।

मुझे समझ में नहीं आता है कि एक सामान्य वितरण का पालन करने के लिए टी-स्टैटिस्टिक्स को डेटा की आवश्यकता क्यों है।

दरअसल, विकिपीडिया एक ही बात कहता है:

छात्र का टी-डिस्ट्रीब्यूशन (या बस टी-डिस्ट्रीब्यूशन) निरंतर संभाव्यता वितरण के परिवार का कोई भी सदस्य है जो सामान्य रूप से वितरित जनसंख्या के माध्यम का अनुमान लगाते समय उत्पन्न होता है।

हालाँकि, मुझे समझ नहीं आया कि यह धारणा क्यों आवश्यक है।

इसके सूत्र से कुछ भी मुझे इंगित नहीं करता है कि डेटा को सामान्य वितरण का पालन करना है:

यहाँ छवि विवरण दर्ज करें

मैंने इसकी परिभाषा पर थोड़ा गौर किया लेकिन मुझे समझ नहीं आया कि यह शर्त क्यों जरूरी है।

जवाबों:


17

आपके लिए आवश्यक जानकारी विकी पृष्ठ के "चरित्र" अनुभाग में है । स्वतंत्रता की डिग्री के साथ एक -distribution को यादृच्छिक चर के वितरण के रूप में परिभाषित किया जा सकता है जैसे कि जहां एक मानक सामान्य वितरण है यादृच्छिक चर और एक यादृच्छिक चर है जिसमें स्वतंत्रता की डिग्री है । इसके अलावा, और को स्वतंत्र होना चाहिए। इसलिए किसी भी और को, जो उपरोक्त परिभाषा का पालन करते हैं, तब आप एक यादृच्छिक चर पर पहुंच सकते हैं जिसमें ए हैν टी टी = जेडtνTजेड वी χ 2 ν जेड वी जेड वी टी

T=ZV/ν,
ZVχ2νZVZVt -distribution

अब, मान लीजिए कि को वितरण अनुसार वितरित किया गया है । चलो का माध्य और विचरण । Let नमूना माध्य हो और नमूना विचरण हो। हम फिर सूत्र देखेंगे: एफ एफ μ σ 2 ˉ एक्स एस 2X1,X2,,XnFFμσ2X¯S2

X¯μS/n=X¯μσ/n(n1)S2(n1)σ2.

यदि, सामान्य वितरण को दर्शाता है, तो , और इस प्रकार । इसके अलावा, कोचरन के प्रमेय द्वारा । अंत में, बसु के प्रमेय के एक आवेदन के द्वारा , और स्वतंत्र हैं। इसका तात्पर्य यह है कि परिणामी सांख्यिकी में स्वतंत्रता के डिग्री के साथ distribution है ।FX¯N(μ,σ2/n)X¯μσ/nN(0,1)(n1)S2σ2χn12X¯S2tn1

यदि मूल डेटा वितरण सामान्य नहीं था, तो, अंश और हर का सटीक वितरण क्रमशः मानक सामान्य और नहीं होगा, और इस प्रकार परिणामी आँकड़ों का -distribution नहीं होगा ।Fχ2t


3
मैंने हमेशा यह काफी दिलचस्प पाया है कि गणितीय आँकड़ों में इन गणितीय परिणामों में कितना गणितीय प्रौद्योगिकी जाता है।
मैथ्यू ड्र्यू

3
X¯Sχ2

2

मुझे लगता है कि सांख्यिकीय और इसके सूत्र, बनाम वितरण और इसके सूत्र के बीच कुछ भ्रम हो सकता है। आप किसी भी डेटासेट के लिए टी-स्टेटिस्टिकल फॉर्मूला लागू कर सकते हैं और "टी-स्टेटिस्टिक" प्राप्त कर सकते हैं, लेकिन यह स्टैटिस्टिक्स छात्र-टी वितरण के अनुसार वितरित नहीं किया जाएगा, जब तक कि डेटा एक सामान्य वितरण (या कम से कम, से नहीं होगा) होने की गारंटी है; मेरा अनुमान है कि गैर-सामान्य वितरण टी-स्टैटिस्टिक्स फॉर्मूला लागू होने पर छात्र-टी वितरण का उत्पादन नहीं करेंगे, लेकिन मैं इसके बारे में निश्चित नहीं हूं)। इसका कारण केवल यह है कि टी-स्टेटिस्टिक के वितरण की गणना उस डेटा के वितरण से की जाती है जो इसे उत्पन्न करता है, इसलिए यदि आपके पास एक अलग अंतर्निहित वितरण है, तो आपको व्युत्पन्न आँकड़ों के लिए समान वितरण की गारंटी नहीं है।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.