आकस्मिक तालिकाओं: क्या करने के लिए परीक्षण और कब?


17

मैं उम्र के ची-वर्ग बनाम फिशर की सटीक परीक्षण बहस की इस चर्चा का विस्तार देखना चाहता हूं , इस दायरे को थोड़ा बढ़ा दिया। एक आकस्मिक तालिका में बातचीत के लिए कई परीक्षण हैं, मेरे सिर को स्पिन करने के लिए पर्याप्त है। मैं उम्मीद करता हूं कि मुझे इस बात का स्पष्टीकरण प्राप्त करना चाहिए कि मुझे किस परीक्षण का उपयोग करना चाहिए और कब, और निश्चित रूप से स्पष्टीकरण के रूप में कि एक परीक्षण को दूसरे पर क्यों पसंद किया जाना चाहिए।

मेरी वर्तमान समस्या क्लासिक मामला है, लेकिन उच्च आयामीता के संबंध में उत्तर स्वागत योग्य हैं, क्योंकि आर में विभिन्न समाधानों को लागू करने के लिए युक्तियाँ हैं, कम से कम, ऐसे मामलों में जहां यह गैर-स्पष्ट है कि कैसे आगे बढ़ना है।n×m

नीचे मैंने उन सभी परीक्षणों को सूचीबद्ध किया है जिनके बारे में मुझे पता है; मुझे आशा है कि अपनी त्रुटियों को उजागर करके उन्हें सुधारा जा सकता है।

  • χ2 । पुराना स्टैंडबाय। यहां तीन प्रमुख विकल्प हैं:

    • 2x2 तालिकाओं के लिए आर में बनाया गया सुधार: "एक आधा सब से घटाया जाता है । अंतर।" क्या मुझे हमेशा ऐसा करना चाहिए?|OE|
    • " " टेस्ट, यह सुनिश्चित करने के लिए नहीं कि आर में यह कैसे करना है।N1χ2
    • मोंटे कार्लो सिमुलेशन। क्या यह हमेशा सबसे अच्छा है? जब मैं ऐसा करता हूं तो आर मुझे डीएफ क्यों नहीं देता है?
  • फिशर का सटीक परीक्षण

    • परंपरागत रूप से सलाह दी जाती है कि किसी भी सेल को <4 होने की उम्मीद है, लेकिन जाहिर तौर पर कुछ लोग इस सलाह पर विवाद करते हैं।
    • क्या (आमतौर पर गलत) यह धारणा है कि मार्जिन वास्तव में इस परीक्षण की सबसे बड़ी समस्या है?
  • बरनार्ड का सटीक परीक्षण

    • एक और सटीक परीक्षण, सिवाय इसके कि मैंने इसके बारे में कभी नहीं सुना।
  • पोइसन रिग्रेशन

    • एक चीज जो मुझे हमेशा ग्लम्स के बारे में भ्रमित करती है, वह है कि यह महत्व परीक्षण कैसे करना है ताकि उस पर मदद की सराहना की जाए। क्या नेस्टेड मॉडल तुलना करना सबसे अच्छा है? किसी विशेष भविष्यवक्ता के वाल्ड परीक्षण के बारे में क्या?
    • क्या मुझे वास्तव में हमेशा पॉइसन रिग्रेशन करना चाहिए? इस और परीक्षण के बीच व्यावहारिक अंतर क्या है ?χ2

जवाबों:


13

यह एक अच्छा सवाल है, लेकिन एक बड़ा सवाल है। मुझे नहीं लगता कि मैं एक पूर्ण उत्तर प्रदान कर सकता हूं, लेकिन मैं विचार के लिए कुछ भोजन बाहर फेंक दूंगा।

सबसे पहले, अपने शीर्ष बुलेट बिंदु के तहत, आप जिस सुधार का उल्लेख कर रहे हैं , उसे निरंतरता के लिए येट्स के सुधार के रूप में जाना जाता है । समस्या यह है कि हम एक असतत हीन सांख्यिकीय की गणना करते हैं: (यह असतत है, क्योंकि एक आकस्मिक तालिका में प्रतिनिधित्व किए गए उदाहरणों की केवल एक सीमित संख्या के साथ, वहां संभावित एहसास मूल्यों की एक सीमित संख्या है कि यह आँकड़ा आगे बढ़ सकता है।) इस तथ्य के बावजूद, यह एक सतत संदर्भ वितरण ( अर्थात , स्वतंत्रता की डिग्री साथ वितरण की तुलना है

χ2=(OE)2E

χ2 (r1)(c1))। यह आवश्यक रूप से कुछ स्तर पर एक बेमेल की ओर जाता है। एक विशेष रूप से छोटे डेटा सेट के साथ, और यदि कुछ कोशिकाओं ने 5 से कम मूल्यों की उम्मीद की है, तो संभव है कि पी-मूल्य बहुत छोटा हो सकता है। इसके लिए येट्स का करेक्शन एडजस्ट होता है।

विडंबना यह है कि एक ही अंतर्निहित समस्या (असतत-निरंतर बेमेल) पी-मूल्यों को जन्म दे सकती है जो बहुत अधिक हैं । विशेष रूप से, पी-मूल्य को पारंपरिक रूप से डेटा प्राप्त करने की संभावना के रूप में परिभाषित किया जाता है जो कि चरम या अधिक हैदेखे गए आंकड़ों की तुलना में। निरंतर डेटा के साथ, यह समझा जाता है कि किसी भी सटीक मूल्य को प्राप्त करने की संभावना गायब है, और इस प्रकार हमारे पास वास्तव में डेटा की संभावना अधिक चरम है। हालांकि, असतत डेटा के साथ आपके जैसे डेटा प्राप्त करने की एक सीमित संभावना है। केवल डेटा को प्राप्त करने की संभावना की तुलना में आप की तुलना में अधिक चरम है कि नाममात्र पी-मानों की पैदावार होती है जो बहुत कम हैं (बढ़ी हुई प्रकार की त्रुटियों के लिए अग्रणी), लेकिन डेटा प्राप्त करने की संभावना सहित आपके लिए नाममात्र पी-मूल्यों की ओर जाता है जो बहुत अधिक हैं (जो कि टाइप II त्रुटियों को बढ़ाएगा)। ये तथ्य मध्य पी-मूल्य के विचार को प्रेरित करते हैं । इस दृष्टिकोण के तहत, पी-वैल्यू आपके प्लस आधे से अधिक डेटा की संभावना है डेटा की संभावना सिर्फ तुम्हारी जैसी है।

जैसा कि आप बताते हैं, आकस्मिक टेबल डेटा के परीक्षण के लिए कई संभावनाएं हैं। विभिन्न दृष्टिकोणों के पेशेवरों और विपक्षों का सबसे व्यापक उपचार यहां है । वह कागज 2x2 तालिकाओं के लिए विशिष्ट है, लेकिन आप इसे पढ़कर भी आकस्मिक तालिका डेटा के विकल्पों के बारे में बहुत कुछ जान सकते हैं।

मुझे भी लगता है कि यह गंभीरता से मॉडल पर विचार करने के लायक है। ची-स्क्वॉयर जैसे पुराने परीक्षण कई लोगों द्वारा त्वरित, आसान और समझ में आते हैं, लेकिन अपने डेटा की व्यापक समझ के साथ आपको नहीं छोड़ते हैं क्योंकि आप एक उपयुक्त मॉडल का निर्माण करते हैं। यदि यह आपकी आकस्मिक तालिका की पंक्तियों [स्तंभों] को प्रतिक्रिया चर के रूप में सोचने के लिए उचित है, और स्तंभों [पंक्तियों] को एक व्याख्यात्मक / भविष्य कहनेवाला चर के रूप में, एक मॉडलिंग दृष्टिकोण काफी आसानी से अनुसरण करता है। उदाहरण के लिए, यदि आपके पास सिर्फ दो पंक्तियाँ थीं, तो आप लॉजिस्टिक रिग्रेशन मॉडल बना सकते हैं ; यदि कई कॉलम हैं, तो आप ANOVA- प्रकार का मॉडल बनाने के लिए संदर्भ सेल कोडिंग (डमी कोडिंग) का उपयोग कर सकते हैं। दूसरी ओर, यदि आपके पास दो से अधिक पंक्तियाँ हैं, तो बहुराष्ट्रीय लॉजिस्टिक प्रतिगमनएक ही तरीके से इस्तेमाल किया जा सकता है। क्या आपकी पंक्तियों में आंतरिक क्रम है, क्रमिक लॉजिस्टिक प्रतिगमन बहुराष्ट्रीय के लिए बेहतर प्रदर्शन करेगा। लॉग-लीनियर मॉडल (पॉइसन रिग्रेशन) शायद कम प्रासंगिक है जब तक कि आपके विचार में दो से अधिक आयामों वाली आकस्मिक तालियाँ न हों।

इन जैसे विषयों के व्यापक उपचार के लिए, एगेस्टी द्वारा सर्वश्रेष्ठ स्रोत हैं: या तो उनका पूर्ण पैमाने पर उपचार (अधिक कठोर), उनकी इंट्रो पुस्तक (आसान लेकिन अभी भी व्यापक और बहुत अच्छी), या संभवतः उनकी क्रमिक पुस्तक भी ।

अद्यतन: बस संभावित परीक्षणों की सूची की पूर्णता के लिए, यह मेरे लिए होता है कि हम संभावना अनुपात परीक्षण (अक्सर इसे ' ' कहते हैं) जोड़ सकते हैं । यह है: यह भी चि-वर्ग के रूप में वितरित किया जाता है, और लगभग हमेशा एक ही निर्णय प्राप्त करेगा। दो आँकड़ों के वास्तविक मूल्य समान रूप से समान होंगे, लेकिन थोड़े अलग। किसी भी स्थिति में अधिक शक्तिशाली होगा का प्रश्न काफी सूक्ष्म है। मैं इकट्ठा करता हूं कि यह कुछ क्षेत्रों में परंपरा के अनुसार डिफ़ॉल्ट विकल्प है। मैं जरूरी नहीं कि यह पारंपरिक परीक्षण पर उपयोग की वकालत करता हूं; मैं केवल इसे पूर्णता के लिए सूचीबद्ध कर रहा हूं, जैसा कि मैं कहता हूं। G2-test

G2=Oln(OE)


1
यह अंतर्निहित समस्या का एक बड़ा विवरण था, धन्यवाद! साथ ही मुझे अतीत में बताया गया है कि एगेस्टी का पाठ एक महान संसाधन है इसलिए मैं इसकी जाँच करूँगा।
JVMcDonnell

4

मैं आपके कुछ प्रश्नों को अपने दृष्टिकोण से सर्वोत्तम रूप में संबोधित करने का प्रयास करूंगा। फिशर-इरविन टेस्ट का पहला फिशर सटीक परीक्षण का दूसरा नाम है। इस तथ्य को छोड़कर कि यह कभी-कभी कम्प्यूटेशनल रूप से तीव्र होता है मैं आमतौर पर फिशर टेस्ट का उपयोग करना पसंद करता हूं। यदि इस परीक्षण के साथ कोई समस्या है तो यह सीमांत योगों पर कंडीशनिंग है। परीक्षण की सुंदरता यह है कि अशक्त परिकल्पना के तहत एक ही सीमांत योग के साथ आकस्मिक तालिकाओं के सेट के रूप में मनाया तालिका में एक हाइपरजेट्रिक वितरण है। कुछ लोगों का तर्क है कि वे समान सीमांत योग के साथ तालिकाओं पर विचार करने के लिए तर्क को नहीं देखते हैं।

आकस्मिक रूप से तालिकाओं में संघ के परीक्षण के लिए पियर्सन के ची-स्क्वायर परीक्षण का उपयोग आमतौर पर किया जाता है। कई अन्य परीक्षणों की तरह यह अनुमानित है और इसलिए महत्व स्तर हमेशा सटीक नहीं होता है। कोचरन ने दिखाया कि छोटे नमूनों में जब कुछ कोशिकाएं बहुत विरल होती हैं (जैसे कुछ कोशिकाओं में 5 से कम मामले होते हैं) तो अंदाजन खराब होगा।

कई अन्य अनुमानित परीक्षण हैं। आमतौर पर एसएएस का उपयोग करके फिशर के परीक्षण को लागू करते समय मुझे इन सभी परीक्षणों में से परिणाम मिलते हैं और वे आमतौर पर लगभग एक ही परिणाम देते हैं। लेकिन सीमांत योगों पर फिशर का परीक्षण हमेशा सटीक होता है।

पॉसों के प्रतिगमन के संबंध में, यह एक मॉडल है जो सेल योगों के श्रेणीबद्ध चर से संबंधित है। किसी भी मॉडल की तरह यह मान्यताओं के एक सेट पर निर्भर करता है। सबसे महत्वपूर्ण यह है कि सेल काउंट्स एक पॉइसन वितरण का अनुसरण करता है, जिसका अर्थ है कि काउंट्स की औसत संख्या इसके विचरण के बराबर है। यह सेल गिनती वितरण के लिए आम तौर पर सच नहीं है। अतिप्रवाह (माध्य से अधिक विचरण) के मामले में एक नकारात्मक द्विपद मॉडल अधिक उपयुक्त हो सकता है।


"फिशर-इरविन टेस्ट फिशर के सटीक परीक्षण के लिए सिर्फ एक और नाम है" ... अहा, यह टिप्पणी मुझे कम भ्रमित करती है, धन्यवाद!
JVMcDonnell

3
आपके उत्तर ने वास्तव में इन चीजों को करने के बारे में मेरा भ्रम कम नहीं किया है। मुझे लगता है कि मैं जिन चीजों के बारे में सुनने की उम्मीद कर रहा था उनमें से एक का अनुमान है कि ची ^ 2 के साथ मुद्दे किस हद तक मोंटे कार्लो सिमुलेशन या सुधार, आदि द्वारा हल किए जा सकते हैं; या हद से हद यह glms द्वारा छांटा जा सकता है। इसलिए मैं अभी यह देखने के लिए थोड़ा खुला छोड़ दूंगा कि क्या मुझे और अधिक काटने मिल सकते हैं। लेकिन अगर किसी को थोड़ा सा भी नहीं लगता है तो मैं आपका जवाब स्वीकार करूंगा।
JVMcDonnell

फिशर और ची-स्क्वायर के लिए मुझे लगता है कि मैंने आपको बताया था कि जब आप ची स्क्वायर का उपयोग कर सकते हैं। यदि आप फिशर के विचार को स्वीकार करते हैं कि आपको हमेशा सीमांत योगों पर ध्यान देना चाहिए, तो फिशर का परीक्षण हमेशा लागू होता है। लेकिन अगर आप इसे स्वीकार नहीं करते हैं तो मुझे लगता है कि आपको बिना शर्त परीक्षा देनी होगी। उपलब्ध परीक्षणों की अन्य बैटरी के रूप में मैं उनके गुणों के बारे में कुछ भी नहीं जानता और इसलिए वास्तव में आपको सलाह नहीं दे सकता कि उनका उपयोग कब करें। फॉर्म का अनुभव मैंने ऐसे मामलों को देखा है जहां यह मायने रखता है क्योंकि परिणाम आमतौर पर करीबी समझौते में होते हैं।
माइकल आर। चेरिक

क्या यह वास्तव में सच है कि फिशर ने सोचा था कि "आपको हमेशा सीमांत योगों पर ध्यान देना चाहिए"? यह धारणा केवल तभी मान्य होती है जब सीमांत योग निश्चित होते हैं। चाय का स्वाद लेने वाली महिला में, महिला जानती है कि 5 दूध-पहली और 5 दूध-आखिरी हैं। लेकिन यह प्रयोगों में अधिक सामान्य है कि मार्जिन को लागू करने के लिए कोई बल नहीं है। दो सिक्कों के प्रत्येक 10 बार फ्लिप करने के मामले पर विचार करें। जब सिक्के के चारों ओर 5 सिर रोल करते हैं, तो मार्जिन को संरक्षित करने के लिए पूंछ देना शुरू नहीं करता है। ऐसे मामलों में यह प्रलेखित किया गया है कि फिशर अत्यधिक रूढ़िवादी है। इसलिए मुझे विकल्पों में दिलचस्पी है।
JVMcDonnell

हाँ। यह मेरी समझ है कि फिशर ने दिए गए डेटा से जानकारी का उपयोग करने वाले रेफरेंस वितरण को चुनने में विश्वास किया। इसलिए वह सोचता है कि आपके द्वारा देखे गए डेटा के बारे में कोई फर्क नहीं पड़ता है कि आपके द्वारा देखे गए डेटा के बारे में केवल उन आंकड़ों की तुलना की जानी चाहिए जो शून्य परिकल्पना के तहत हुए होंगे जो डेटा पर दिए गए विरोधाभासों अर्थात् दिए गए सीमांत योगों के बाद हुए थे। अन्य विचारों के साथ कि फिशर के पास यह विवादास्पद था।
माइकल आर। चेरिक
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.