पृष्ठभूमि: सुरक्षित रूप से छोड़ें - यह यहाँ संदर्भ के लिए है, और प्रश्न को वैध बनाने के लिए।
इस पत्र का उद्घाटन पढ़ता है:
"कार्ल पियर्सन की प्रसिद्ध ची-वर्ग आकस्मिक परीक्षण एक और आंकड़ा से ली गई है, z आंकड़ा कहा जाता है, सामान्य वितरण पर आधारित। का सबसे सरल संस्करण गणितीय बराबर z परीक्षण के समान होना दिखाया जा सकता है। परीक्षण एक ही परिणाम का उत्पादन सभी परिस्थितियों में। सभी इरादों और उद्देश्यों के लिए "ची-चुकता" "z-वर्ग" कहा जा सकता। के महत्वपूर्ण मूल्यों स्वतंत्रता से एक डिग्री के लिए जेड की इसी महत्वपूर्ण मानों के वर्ग हैं। "
यह CV ( यहां , यहां , यहां और अन्य) में कई बार जोर दिया गया है ।
और वास्तव में हम कर सकते हैं साबित है कि के बराबर हैएक्स2के साथएक्स~एन( :
आइए कहते हैं कि और कहा कि वाई = एक्स 2 और के घनत्व को खोजने वाई का उपयोग करके ग विधि:
। समस्या यह है कि हम सामान्य वितरण के घनत्व को करीब से एकीकृत नहीं कर सकते हैं। लेकिन हम इसे व्यक्त कर सकते हैं:
व्युत्पन्न लेना:
चूंकि सामान्य के मान सममित हैं:
। को यह equatingपीडीएफके सामान्य (अबएक्समेंपीडीएफहो जाएगा√ कोe - x 2 में प्लग किया जाना हैसामान्यpd dfका 2 भाग); और शामिल करने के लिए याद रखना1 अंत में:
चि वर्ग के पीडीएफ की तुलना करें:
चूंकि , के लिए1df, हम वास्तव में ली गई हैपीघचची वर्ग की।
इसके अलावा, अगर हम फ़ंक्शन को कॉल prop.test()
आर में हम एक ही लागू कर रहे हैं परीक्षण के रूप में अगर हम पर फैसला ।chisq.test()
प्रश्न:
इसलिए मुझे ये सभी बिंदु मिलते हैं, फिर भी मुझे नहीं पता कि वे इन दो परीक्षणों के वास्तविक कार्यान्वयन के लिए दो कारणों से कैसे लागू होते हैं:
एक z- परीक्षण चुकता नहीं है।
वास्तविक परीक्षण आँकड़े पूरी तरह से अलग हैं:
Of 2 के लिए परीक्षण-आँकड़ा का मूल्य है:
कहाँ
= पियरसन का संचयी परीक्षण आँकड़ा, जो विषम रूप से distribution 2 वितरण सेसंपर्क करता है। ओ i = प्रकार i के अवलोकनों की संख्या; एन = टिप्पणियों की कुल संख्या; E i = N p i = प्रकार की अपेक्षित (सैद्धांतिक) आवृत्ति i , अशक्त परिकल्पना द्वारा दावा किया गया किजनसंख्या में टाइप I का अंश p i है ; n = तालिका में कोशिकाओं की संख्या।
दूसरी ओर, एक के लिए परीक्षण आंकड़ा -Test है:
के साथपी=एक्स1 , जहांx1औरx2"सफलताओं" की संख्या है, श्रेणीगत चर के प्रत्येक एक में विषयों की संख्या से अधिक है, अर्थातn1औरn2 ।
यह सूत्र द्विपद वितरण पर निर्भर करता है।
इन दो परीक्षण आंकड़े स्पष्ट रूप से अलग हैं, और विभिन्न परिणामों की वास्तविक परीक्षा आँकड़ों के लिए, साथ ही साथ के लिए में परिणाम पी -values : 5.8481
के लिए और z के परीक्षण के लिए है, जहां 2.4183 2 = ५.८४,८१७ (धन्यवाद, @ mark999 )। पी के लिए -value χ 2 परीक्षा है , जबकि z-परीक्षा है के लिए, । अंतर दो-पूंछ बनाम एक-पूंछ द्वारा समझाया गया: 0.01559 / 2 = 0.007795 (साभार @amoeba)।2.4183
0.01559
0.0077
तो हम किस स्तर पर कहते हैं कि वे एक हैं और एक ही हैं?
chisq.test()
, have you tried using correct=FALSE
?