एकाधिक ची-स्क्वेर्ड टेस्ट


11

मेरे पास 2 x 2 x 6 तालिका में वर्गीकृत डेटा है। चलो आयामों को बुलाते हैं response, Aऔर B। मैं मॉडल के साथ डेटा के लिए एक लॉजिस्टिक प्रतिगमन फिट बैठता हूं response ~ A * B। उस मॉडल के विचलन का एक विश्लेषण कहता है कि शब्द और उनकी बातचीत दोनों महत्वपूर्ण हैं।

हालांकि, आंकड़ों के अनुपात को देखते हुए, यह केवल 2 या ऐसा लगता है जैसे Bइन महत्वपूर्ण प्रभावों के लिए स्तर जिम्मेदार हैं। मैं यह देखने के लिए परीक्षण करना चाहूंगा कि कौन से स्तर के अपराधी हैं। अभी, मेरा दृष्टिकोण 2 x 2 तालिकाओं पर 6 ची-चुकता परीक्षणों का प्रदर्शन करना है response ~ A, और फिर कई तुलनाओं (होल्म समायोजन का उपयोग करके) के लिए उन परीक्षणों से पी-मूल्यों को समायोजित करना है।

मेरा सवाल यह है कि क्या इस समस्या के लिए बेहतर दृष्टिकोण है। क्या एक अधिक प्रिंसिपल मॉडलिंग दृष्टिकोण, या कई ची-स्क्वेर्ड परीक्षण तुलना दृष्टिकोण है?


मैंने एक बार आर मेलिंग सूची पर एक ही सवाल पूछा था, और उसे कोई प्रतिक्रिया नहीं मिली। मैं आपको अपना शीर्षक बदलने का सुझाव दूंगा क्योंकि आपका प्रश्न "ची स्क्वायर के पोस्ट हॉक विश्लेषण - महत्व के कारण का पता लगाने के लिए" है (एक छोटा शीर्षक तब जो मैंने प्रस्तावित किया वह बेहतर होगा :))
ताल गैली

बस अपने दोषियों के लिए शर्त देखो .... और एक poisson, लॉग-रैखिक मॉडल का उपयोग करें। फिर आपको वही चीज़ मिलती है जो ची-स्क्वायर टेस्ट आपको देता है, लेकिन आपको एक ही बार में सभी अलग-अलग टेस्ट मिलते हैं।
probabilityislogic

जवाबों:


11

आपको "विभाजन चि-चुकता" में देखना चाहिए। यह एनोवा में पोस्ट-हॉक टेस्ट करने के तर्क में समान है। यह आपको यह निर्धारित करने की अनुमति देगा कि आपका महत्वपूर्ण समग्र परीक्षण मुख्य रूप से विशेष श्रेणियों या श्रेणियों के समूहों के अंतर के कारण है।

एक त्वरित Google ने इस प्रस्तुति को चालू कर दिया, जो अंत में ची-स्क्वेयर के विभाजन के तरीकों की चर्चा करता है।

http://www.ed.uiuc.edu/courses/EdPsy490AT/lectures/2way_chi-ha-online.pdf


दिलचस्प। क्या आप कभी इस के एक आर कार्यान्वयन के पार आए?
ताल गैली

नहीं, सीधे नहीं। हालांकि, आर आपको ऐसा करने के लिए आवश्यक सब कुछ देगा - जैसे: प्रेक्षित गणना, अपेक्षित मान और प्रत्येक कोशिका के अवशिष्ट। x <- मैट्रिक्स (c (12, 5, 7, 7), ncol = 2) chisq.test (x) chisq.test (x) $ chisq.test (x) $ रेजीड्यूल्सexpectedchisq.test(x)
Brett

मैं आपको टिक देता हूँ, क्योंकि यह मेरे शोध जीवन के लिए उपयोगी होना चाहिए। हालाँकि, यह दृष्टिकोण एक ixj मैट्रिक्स पर लागू होता है। हालाँकि, मेरे प्रश्न में एक ixjxk मैट्रिक्स शामिल है,
जोफ़रवल्ड 17

2
ची-स्क्वायर विभाजन बहु-प्रकार आकस्मिक तालिकाओं के लिए एक्स्टेंसिबल है। यहाँ लेख है कि एगेस्टी ने अपनी पुस्तक में उद्धृत किया है, वास्तव में ... हो लैंकेस्टर (1951) "कॉम्प्लेक्स आकस्मिक तालिकाओं का इलाज the2 के विभाजन द्वारा किया गया था" जर्नल ऑफ़ द रॉयल स्टैटिस्टिकल सोसाइटी। सीरीज़ बी (मेथेडोलॉजिकल), वॉल्यूम। 13, नंबर 2
ब्रेट

1

अप्रतिष्ठित दृष्टिकोण, असुरक्षित डेटा को छोड़ना है, मॉडल को परिष्कृत करना और यह देखना है कि प्रतिक्रिया और ए के लिए लॉगिट / कंडीशनल ऑड्स अनुपात बहुत अलग हैं (बी के लिए नियंत्रण)। यह आपको बता सकता है कि क्या चिंता का कारण है। B के स्तरों को पूल करना एक और दृष्टिकोण है। अधिक रियायती लाइनों पर, यदि आप सिम्पसन के विरोधाभास को प्रेरित करने वाले सापेक्ष अनुपात के बारे में चिंतित हैं, तो आप प्रतिक्रिया / ए के लिए सशर्त और सीमांत बाधाओं अनुपात में देख सकते हैं और देख सकते हैं कि क्या वे रिवर्स हैं।

विशेष रूप से कई तुलनाओं से बचने के लिए, केवल एक चीज जो मुझे होती है वह है एक पदानुक्रमित मॉडल का उपयोग करना जो पूरे स्तरों में यादृच्छिक प्रभावों के लिए खाता है।


0

मुझे नहीं पता कि आपके लक्ष्य क्या हैं, या वे क्यों हैं। लेकिन परिकल्पना परीक्षण के बजाय, मैं आमतौर पर भविष्यवाणियों और विश्वास अंतराल पर ध्यान केंद्रित करने की सलाह देता हूं।


0

पोस्ट हॉक टेस्ट आपकी समस्या के लिए उपयुक्त हो सकता है। chiqPostHoc () आर परीक्षणों में चि चि-वर्ग परीक्षण में सभी जोड़े के बीच महत्वपूर्ण अंतर के लिए परीक्षण करता है। भले ही, मैंने इसका उपयोग नहीं किया है, लेकिन यह लिंक उपयोगी हो सकता है। https://www.rforge.net/doc/packages/NCStats/chisqPostHoc.html

एक अन्य विकल्प EnQuireR पैकेज से chisq.desc () फ़ंक्शन हो सकता है।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.