स्वतंत्रता परीक्षण ची-चुकता वितरण का उपयोग क्यों करता है?


12

The अच्छाई-में-फिट परीक्षण निम्नलिखित आँकड़ा का उपयोग करता है : परीक्षण में, यह अनुदान शर्तों को पूरा किया जाता है, एक का उपयोग करता है - पी-मूल्य की गणना करने के लिए वितरण जो कि दिया गया है, यह सही है कि एक ही आकार के प्रतिनिधि नमूने में इस तरह के मूल्य का निरीक्षण किया जाएगा।χ 2 0 = n Σ मैं = 1 ( हे मैं - मैं ) 2χ2

χ02=i=1n(OiEi)2Ei
एच0χ2H0

हालाँकि, एक सांख्यिकीय लिए एक -distribution ( स्वतंत्रता की डिग्री के साथ) का पालन करने के लिए, यह सही होना चाहिए: स्वतंत्र, मानक सामान्य ( विकिपीडिया ) के लिए । परीक्षण की शर्तें इस प्रकार हैं (पुन : विकिपीडिया से ):χ02χ2n1

i=1n(OiEi)2Ei=i=1n1Zi2
Zi
  1. जनसंख्या का नमूना प्रतिनिधि
  2. बड़े नमूने का आकार
  3. अपेक्षित सेल की गिनती पर्याप्त रूप से बड़ी है
  4. प्रत्येक श्रेणी के बीच स्वतंत्रता

स्थितियों (1,2) से यह स्पष्ट है कि हम नमूने से आबादी के लिए शर्तों को संतुष्ट करते हैं। (3) एक धारणा की आवश्यकता प्रतीत होती है क्योंकि असतत गिनती , जो हर में होती है, प्रत्येक लिए लगभग-निरंतर वितरण का परिणाम नहीं और यदि यह पर्याप्त बड़ी नहीं है, तो एक त्रुटि है जो येट्स के साथ सही हो सकती है 'सुधार - यह इस तथ्य से प्रतीत होता है कि एक असतत वितरण मूल रूप से एक "फ्लोर्ड" निरंतर एक है, इसलिए प्रत्येक एक के लिए से बदलाव इसे सही करता है।EiZi1/2

(4) की आवश्यकता बाद में काम में आती है, लेकिन मैं यह नहीं देख सकता कि कैसे।

सबसे पहले, मैंने सोचा था कि वितरण से मेल खाने के लिए आवश्यक है। यह मुझे उस संदिग्ध धारणा तक ले जाता है जो , जो वास्तव में गलत था। वास्तव में, समता के दो पक्षों के लिए से तक आयाम में कमी से यह स्पष्ट है कि ऐसा नहीं हो सकता है। हेमैं-मैं~एन(0,Zi=OiEiEiएनएन-1OiEiN(0,Ei)nn1

यह स्पष्ट हो गया है, व्हयूबर्स के स्पष्टीकरण के लिए, कि प्रत्येक शब्द की समान आवश्यकता नहीं है क्योंकि (सामान्य रूप से यादृच्छिक चर चर की संख्या में कमी पर ध्यान दें) जो कार्यात्मक रूप से स्वतंत्र हैं।O i - E iZi χ20=Σn-1मैं=1Z2मैंजेडमैंOiEiEiχ02=i=1n1Zi2Zi

मेरा प्रश्न है, तो, कैसे कर सकते हैं का पालन करें वितरण? किस प्रकार के संयोजन में से प्रत्येक शब्दों का परिणाम मानक वर्ग ? यह सीएलटी के उपयोग की आवश्यकता है, जाहिरा तौर पर (और यह समझ में आता है), लेकिन कैसे? दूसरे शब्दों में , प्रत्येक बराबर (या लगभग बराबर) क्या है? χ 2 ( हे मैं - मैं ) 2χ02χ2 जेड 2 आई जेडआई(OiEi)2EiZi2Zi


1
मैं उत्सुक हूं कि आपने कहां पढ़ा कि कोई भी आपके द्वारा बताई गई अंतिम चीज़ ( )। यह आवश्यक नहीं है: एक सामान्य वितरण वाले इन मानकीकृत अवशिष्टों के बिना सांख्यिकीय में वितरण (कम से कम एक बहुत अच्छा सन्निकटन) हो सकता है। आप जिस प्रश्न को पूछना चाहते हैं, वह यह है कि ये धारणाएँ वितरण के लिए सांख्यिकीय के संदर्भ में कैसे उचित हैं ? अपने आप से, वे नहीं करते हैं। क्या गलत हो सकता है, इसकी चर्चा के लिए कृपया मेरे पोस्ट को देखेंχ2OiEiN(0,Ei)χ2χ2χ2χ2
व्हीबर

1
वर्गों के दो योगों की समानता से आप यह निष्कर्ष नहीं निकाल सकते कि वर्गमूल शब्द अवधि के बराबर हैं! क्योंकि यह केवल संख्याओं के लिए मामला है, यह निश्चित रूप से यादृच्छिक चर के लिए भी मामला है।
whuber

1
इस ठोस बनाने के लिए, मान लीजिए रहे हैं स्वतंत्र रूप से वितरित स्वतंत्रता की डिग्री होने वितरण और कहा कि लेकिन सभी के लिए । फिर हालांकि से कोई भी सामान्य नहीं है, फिर भी में a वितरण है। χ ν 1 , ν 2 , ... , ν n ν 1 + ν 2 + + ν n = n - 1 ν मैं1 मैं डब्ल्यू मैं(Wi),i=1,,nχν1,ν2,,νnν1+ν2++νn=n1νi1iWii=1nWi2χ2(n1)
whuber

1
अगर "स्क्वैयर मानक सामान्य" से आपका मतलब है "स्वतंत्र स्क्वैयर मानक मानदंडों का योग," यह सवाल है, तो मेरा मानना ​​है कि आप वास्तव में शुरू से ही मुद्रा बनाना चाहते थे :-)। और अंत में, स्थिति के अधिकांश विश्लेषण वास्तव में केंद्रीय सीमा प्रमेय का आह्वान करते हैं ताकि यह साबित किया जा सके कि मानकीकृत अवशिष्ट असमान रूप से सामान्य हैं (लेकिन काफी स्वतंत्र नहीं हैं, यही वजह है कि स्वतंत्रता की डिग्री और नहीं )। n1n
whuber

1
+1 जो मैं आशा करता हूं उसके लिए बहुत जल्द एक बहुत अच्छा प्रश्न होगा। पहली समस्या है स्वतंत्रता परीक्षण दावा किए गए आंकड़े का उपयोग नहीं करता है। प्रारंभ में दिया गया आँकड़ा अपरिमेय ( श्रेणियों पर एक राशि ) है, जबकि स्वतंत्रता की परीक्षा में एक से अधिक चर की आवश्यकता होती है। कृपया परीक्षण का नाम और सांख्यिकी पत्र बनाने के लिए संपादित करें। n
Glen_b -Reinstate मोनिका

जवाबों:


6

यह पोइसन वितरण के बारे में है। यदि मीन लम्बडा के साथ , तो का विचरण भी है। इसका अर्थ है कि एक इकाई है। सीएलटी द्वारा, पॉइज़न सामान्यता की ओर जाता है क्योंकि माध्य बड़ा हो जाता है, जो कि जहां चि-चुकता में आता है। हां, यह एक स्पर्शोन्मुख परीक्षण है।XλXλ

(Xλ)2λ
z2

स्वतंत्रता की डिग्री कोचरन के प्रमेय से आती है। मूल रूप से, कोचरन बताते हैं कि किस तरह से ची-स्क्वेरड को परिवर्तित किया जाता है (या अपरिवर्तित रहता है) स्कोर में रैखिक परिवर्तन के अधीन है ।z2

izi2=ZIZ

मैट्रिक्स संकेतन में। यदि वर्गों के सामान्य योग की गणना करने के बजाय, आप कुछ मैट्रिक्स Q के लिए गणना करते हैं , तो आपको अभी भी आ ची-चुकता वितरण के साथ एक मात्रा मिलती है, लेकिन स्वतंत्रता की डिग्री अब की रैंक है । मैट्रिक्स क्यू पर अधिक स्थितियां हैं, लेकिन यह इसका सार है।

ZQZ
Q

यदि आप कुछ मैट्रिक्स नोटेशन के साथ खेलते हैं, तो आप द्विघात रूप में को व्यक्त कर सकते हैं । कोचरन मूल सामान्य चर की स्वतंत्रता को मानता है, यही वजह है कि आपकी तालिका के कॉलम स्वतंत्र भी होने चाहिए।

i(ziz¯)2

क्षमा करें, लेकिन आपने निश्चित रूप से "यदि इसके बजाय, आप करते हैं ..." पर मुझे खो दिया है
VF1

@ VF1, मैंने एक बदलाव किया है, इसलिए मुझे आशा है कि यह अधिक स्पष्ट है। कोक्रेन की प्रमेय आपके प्रश्न का उत्तर है जब मानदंडों के साथ वर्गों का योग एक ची-चुकता वितरण है।
प्लासीडिया

1
ठीक है, मैं इस पर एक नज़र डालूंगा। मैं प्रश्न को खुला छोड़ देता हूँ, हालाँकि, किसी और के पास कुछ जोड़ने के लिए है।
VF1

1
आमतौर पर नमूना आकार तय हो गया है। इसका मतलब यह है कि यह असंभव है कि कोई भी प्रविष्टि एक पॉइसन वितरण का अनुसरण कर सकती है। एक Poisson वितरण के लिए अपील इसलिए लग रहा है कि यह सिर्फ एक और सन्निकटन है - और हमें वहीं छोड़ना शुरू कर देता है जहां हमने शुरू किया था।
whuber

1

टेक्स्टबुक "परिचयात्मक सांख्यिकी के साथ यादृच्छिककरण और सिमुलेशन" के अनुसार, खंड 3.3.2 ( OpenIntro पर स्वतंत्र रूप से उपलब्ध पाठ्यपुस्तक ), टेस्ट स्टेटिस्टिक अवलोकन के विचलन को उम्मीद से जमा करने की कोशिश कर रहा है। और विचलन वास्तव में शब्द के माध्यम से व्यक्त किए जाते हैंχ2

Zi=OiEiEi

जो वास्तव में से उत्पन्न होता है ।

OiEi(StandardErrorOfTheObserved)

पाठ्यपुस्तक में कहा गया है कि का अनुमान से बेहतर है , इसलिए यह शब्द । पाठ्यपुस्तक वास्तव में यह नहीं बताती है कि यह प्रतिस्थापन स्वीकार्य क्यों है, और मुझे यह भी पता लगाना है।(StandardErrorOfTheObserved)EiZi=OiEiEi

वैसे भी, आप प्रपत्र का एक परीक्षण आँकड़ा बना सकते हैं

Z=|Z1|+|Z2|+|Z3|+...

लेकिन सभी शब्दों को वर्गबद्ध करना बेहतर है, क्योंकि आपको तुरंत सकारात्मक मूल्य मिलते हैं और उच्च मूल्य चुकता होने के बाद अधिक बाहर खड़े होते हैं। तो आपको निम्नलिखित मिलते हैं:

χ2=Z12+Z22+Z32+...

लेकिन मैं नहीं पता है या तो कारण है कि इस राशि का पालन करना चाहिए वितरण, या क्या की परिभाषा के लिए कनेक्शन है वितरण (मानक सामान्य स्वतंत्र चरों के वर्गों का योग)।χ 2χ2χ2

संपादित करें: मैं अभी भी आंकड़े सीख रहा हूं, और मुझे अभी भी नहीं लगता कि मैं परीक्षण को ठीक से समझता हूं । मुझे आशा है कि अन्य लोग भी मुझे बता सकते हैं।χ2

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.