ची-चुकता परीक्षण और ची-चुकता वितरण को समझना


13

मैं ची-स्क्वेर्ड टेस्ट के पीछे के तर्क को समझने की कोशिश कर रहा हूं।

Chi-squared परीक्षण । के बाद n- परिकल्पना को अस्वीकार करने या न करने के लिए एक p.value का पता लगाने के लिए एक ची-चुकता वितरण की तुलना में है। : हम अपने अपेक्षित मूल्यों को बनाने के लिए उपयोग किए जाने वाले वितरण से प्राप्त टिप्पणियों का उपयोग करते हैं। उदाहरण के लिए, हम परीक्षण कर सकते हैं यदि प्राप्त करने की संभावना द्वारा दी गई है जैसा कि हम उम्मीद करते हैं। तो हम 100 बार फ्लिप करते हैं और और । हम अपनी खोज की तुलना अपेक्षा के अनुसार करना चाहते हैं ( )। हम एक द्विपद वितरण का उपयोग कर सकते हैं लेकिन यह प्रश्न का बिंदु नहीं है ... प्रश्न यह है:χ2=(obsexp)2expχ2H0headpnH Heads1nH tails100p

क्या आप कृपया बता सकते हैं कि क्यों, अशक्त परिकल्पना के तहत, एक चि-वर्ग वितरण का अनुसरण करता है?(obsexp)2exp

सभी मैं ची-वर्ग वितरण के बारे में पता डिग्री के ची-वर्ग वितरण वह यह है कि का योग है मानक सामान्य बंटन चुकता।kk


2
यह नहीं है: यह एक सन्निकटन है। (बहुत) इसके बारे में और अधिक आँकड़े में दिखाई देता है ।stackexchange.com / questions / 16921/…
whuber


क्यों ची-वर्ग वितरण फिट परीक्षण की भलाई के लिए प्रयोग किया जाता है के बारे में एक संबंधित सवाल है, हालांकि नहीं काफी डुप्लिकेट: stats.stackexchange.com/questions/125312/...
silverfish

जवाबों:


12

हम एक द्विपद वितरण का उपयोग कर सकते हैं, लेकिन यह प्रश्न का बिंदु नहीं है ...

फिर भी, यह आपके वास्तविक प्रश्न के लिए भी हमारा शुरुआती बिंदु है। मैं इसे अनौपचारिक रूप से कवर करूंगा।

आइए अधिक द्विपदीय मामले के साथ विचार करें:

YBin(n,p)

मान लें और ऐसी है कि कर रहे हैं अच्छी तरह से एक ही मतलब और विचरण (कुछ विशिष्ट आवश्यकताओं की तुलना में कर रहे हैं के साथ एक सामान्य करके लगाया है छोटे नहीं है, या कि छोटा नह) ं है।npYmin(np,n(1p))np(1p)

तब लगभग । यहाँ सफलताओं की संख्या है।(YE(Y))2/Var(Y)χ12Y

हमारे पास और ।E(Y)=npVar(Y)=np(1p)

(परीक्षण के मामले में, ज्ञात है और तहत निर्दिष्ट है । हम कोई अनुमान नहीं लगाते हैं।)npH0

तो लगभग ।(Ynp)2/np(1p)χ12

ध्यान दें कि । यह भी ध्यान दें कि ।(Ynp)2=[(nY)n(1p)]21p+11p=1p(1p)

अत:(Ynp)2np(1p)=(Ynp)2np+(Ynp)2n(1p)=(Ynp)2np+[(nY)n(1p)]2n(1p)=(OSES)2ES+(OFEF)2EF

जो द्विपद मामले के लिए सिर्फ ची-स्क्वायर आँकड़ा है।

तो उस स्थिति में ची-स्क्वायर आँकड़ा एक (लगभग) मानक-सामान्य यादृच्छिक चर के वर्ग का वितरण होना चाहिए।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.