जी-टेस्ट बनाम पियर्सन की ची-स्क्वेर्ड टेस्ट


10

मैं एक आकस्मिक तालिका में स्वतंत्रता का परीक्षण कर रहा हूं । मुझे नहीं पता कि जी-टेस्ट या पियर्सन की ची-स्क्वेर्ड टेस्ट बेहतर है या नहीं। नमूना आकार सैकड़ों में है, लेकिन कुछ कम सेल मायने रखता है। जैसा कि विकिपीडिया पृष्ठ पर कहा गया है कि पी -सन की ची-स्क्वेर्ड परीक्षण की तुलना में जी-परीक्षण के लिए ची-चुकता वितरण के लिए सन्निकटन बेहतर है। लेकिन मैं पी-मूल्य की गणना करने के लिए मोंटे कार्लो सिमुलेशन का उपयोग कर रहा हूं, तो क्या इन दोनों परीक्षणों में कोई अंतर है?N×M


जवाबों:


8

वे समान रूप से समान हैं। वे एक ही विचार के होने के अलग-अलग तरीके हैं। अधिक विशेष रूप से, पियर्सन का ची-स्क्वेर्ड टेस्ट एक स्कोर टेस्ट है, जबकि जी-टेस्ट एक संभावना अनुपात परीक्षण है। उन विचारों की बेहतर समझ पाने के लिए, यह आपको मेरा उत्तर पढ़ने में मदद कर सकता है: लॉजिस्टिक रिग्रेशन आउटपुट, ची-स्क्वेर्ड टेस्ट और OR के लिए आत्मविश्वास अंतराल के बीच मेरे पी-वैल्यू क्यों भिन्न हैं? अपने प्रत्यक्ष प्रश्न का उत्तर देने के लिए, यदि आप मोंटे कार्लो सिमुलेशन द्वारा पी-मूल्य की गणना कर रहे हैं, तो इससे कोई फर्क नहीं पड़ना चाहिए; आप सिर्फ जो भी आपके लिए अधिक सुविधाजनक हो उपयोग कर सकते हैं। ध्यान दें कि कम सेल मायने रखता है के साथ कोई समस्या नहीं है, केवल (संभावित) कम उम्मीद हैसेल मायने रखता है; यह कम सेल मायने रखता है और उम्मीद है कि अभी ठीक कर रहे हैं मायने रखता है। इसके अलावा, न तो कम वास्तविक मायने रखता है और न ही कम अपेक्षित मायने रखता है जब सिमुलेशन द्वारा पी-मूल्य निर्धारित किया जाता है।

(इसकी कीमत क्या है, इसके लिए मैं शायद पियर्सन के ची-स्क्वेयर का उपयोग करूंगा, क्योंकि आर के पास इसके लिए एक सुविधाजनक कार्य है जिसमें पी-वैल्यू का अनुकरण करने का विकल्प शामिल है।)


R में क्या कार्य है?
llewmills

@llewmills, chisq.test
गूँग - मोनिका

1

रिफत पर एक नजर। https://cran.r-project.org/web/packages/Rfast/index.html संबंधित कमांड g2Test_univariate (डेटा, dc) g2Test_univariate_perm (data, dc, nperm) हैं जो गणना बहुत तेज़ हैं। और सामान्य तौर पर जी ^ 2 परीक्षण पसंद करते हैं क्योंकि ची-स्क्वायर इसके लिए एक सन्निकटन है।


-1

ची-स्क्वायर टेस्ट और जी-टेस्ट आमतौर पर समान परिणाम उत्पन्न करते हैं। लेकिन यहां सबसे महत्वपूर्ण बात यह है कि आपको अपने परीक्षण के दौरान न केवल अपने परीक्षण के लिए दो परीक्षणों में से एक को चुनना होगा और इसके साथ रहना होगा। यह उचित है क्योंकि यदि आप दोनों परीक्षणों को एक-दूसरे के उपयोग करने की कोशिश करते हैं, तो यह बहुत संभावना है कि आप झूठे सकारात्मक होने की संभावना बढ़ा देंगे।


2
वह कौन सा तर्क है जिसके द्वारा यह दावा किया जाता है कि झूठे सकारात्मक की संभावना बढ़ जाती है? (जब तक कि आपको परीक्षण का सुझाव देने का मतलब वास्तविक काउंट्स के संदर्भ में नहीं चुना जाता है - लेकिन तब यह उन दोनों के बीच चयन करने के लिए मायने रखता है, बजाय समस्या के प्रति संभावित स्वैपिंग टेस्ट के विचार के साथ)
Glen_b -Ronate Monica

2
@ गलेन_ बी गलत होने की संभावना अगर हम परीक्षण के एक पी-वैल्यू का चयन करते हैं, तो सकारात्मक संभावना बढ़ जाती है, जो हमारी धारणाओं के अनुकूल है (यदि हम दोनों परीक्षण करने की कोशिश करते हैं)
थोड़ा_मनस्टर
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.