इन दिनों कंप्यूटर की शक्ति को देखते हुए, क्या कभी फिशर के सटीक परीक्षण के बजाय ची-स्क्वेर्ड परीक्षण करने का कोई कारण है?


86

यह देखते हुए कि सॉफ्टवेयर फिशर की सटीक परीक्षण गणना इतनी आसानी से कर सकता है , क्या ऐसी कोई परिस्थिति है जहां, सैद्धांतिक रूप से या व्यावहारिक रूप से, ची-स्क्वेर परीक्षण वास्तव में फिशर के सटीक परीक्षण के लिए बेहतर है?

फिशर के सटीक परीक्षण के लाभों में शामिल हैं:

  • 2x2 की तुलना में आकस्मिक तालिकाओं को बड़ा करना (अर्थात किसी भी आर x सी तालिका)
  • एक सटीक पी-मूल्य देता है
  • वैध होने के लिए न्यूनतम अपेक्षित सेल काउंट होने की आवश्यकता नहीं है

10
क्योंकि यह अच्छी पुरानी क्लासिक्स है। जल्द ही यह अति सुंदर विंटेज बन जाएगा। इसके बाद भी, जब लोग कंप्यूटर के खिलाफ उठते हैं तो वह इसका दूसरा युवा होगा।
ttnphns

7
क्या आपने कभी किसी बड़ी मेज पर फिशर के सटीक परीक्षण सांख्यिकीय की गणना करने की कोशिश की है? (यह बहुत समय लगता है ...)
whuber

22
आपके द्वारा पहले ही प्राप्त की गई अच्छी टिप्पणियों और उत्तरों के अलावा, मुझे लगता है कि बेहतर प्रश्न "कंप्यूटर की शक्ति को देखते हुए, हर समय सिमुलेशन / क्रमपरिवर्तन परीक्षण क्यों नहीं किया जाता है?"।
पीटर Flom

1
@ जब मैंने C ++ में (बड़ी संख्या में) टेबल के बिना (मालिकाना) कार्यान्वयन किया। यह सेकंड में 8 अंक तक हजारों पी मान चलाता है।
बजे माइकल डी रुएटर

1
@ मिचेल I का मतलब तालिका में कुल कोशिकाओं की संख्या है। गणना 2 x 2 तालिकाओं के लिए आसान है, लेकिन जैसे-जैसे तालिकाएं बड़ी होती जाती हैं, गणनाएं शानदार होती जाती हैं।
whuber

जवाबों:


61

आप सवाल को घुमा सकते हैं। चूंकि साधारण पियर्सन परीक्षण लगभग हमेशा फिशर के सटीक परीक्षण की तुलना में अधिक सटीक है और गणना करने के लिए बहुत तेज है, कोई भी फिशर के परीक्षण का उपयोग क्यों करता है?χ2

ध्यान दें कि यह एक गिरावट है कि सटीक सेल आवृत्तियों को Pearson के लिए 5 से अधिक होना चाहिए, ताकि सटीक उपज प्राप्त हो सके। जब तक एक बहुत ही सरल सुधार परीक्षण सांख्यिकीय पर लागू किया जाता है, तब तक परीक्षण अपेक्षित है कि सेल आवृत्तियों 1.0 से अधिक है । पी एन - 1χ2PN1N


आर-हेल्प, 2009 से :

कैंपबेल, आई-ची-चुकता और फिशर-इरविन छोटे नमूना सिफारिशों के साथ दो-दो-दो तालिकाओं का परीक्षण करते हैं। चिकित्सा 2007 में सांख्यिकी ; 26 : 3661-3675। ( सार )

  • ... Armitage की पुस्तक के नवीनतम संस्करण की अनुशंसा है कि निरंतरता समायोजन का उपयोग आकस्मिक टेबल ची-स्क्वायर परीक्षणों के लिए कभी नहीं किया जाना चाहिए;

  • ई। पीयर्सन ची-स्क्वायर परीक्षण का पीयरसन संशोधन, (एन -1) / एन के एक कारक द्वारा मूल से अलग;

  • कोचरन ने नोट किया कि "अपेक्षित आवृत्ति 5 से कम" में संख्या 5 मनमाना था;

  • तुलनात्मक परीक्षणों के लिए प्रकाशित अध्ययनों के निष्कर्षों को संक्षेप में प्रस्तुत किया जा सकता है :

    1. येट की ची-स्क्वेर्ड टेस्ट में टाइप I त्रुटि दर नाममात्र से कम है, अक्सर आधे से कम नाममात्र;

    2. फिशर-इरविन परीक्षण मैं त्रुटि नाममात्र की तुलना में कम दरों टाइप है;

    3. के-पीरसन के ची-स्क्वेर्ड टेस्ट के संस्करण में टाइप I त्रुटि दर है जो येटी के ची-स्क्वेर्ड परीक्षण और फिशर-इरविन परीक्षण की तुलना में नाममात्र के करीब है, लेकिन कुछ स्थितियों में टाइप I त्रुटियों को नाममात्र के मूल्य से काफी बड़ी है।

    4. 'एन -1' ची-स्क्वेर्ड परीक्षण, के। पियर्सन के 'एन' संस्करण की तरह व्यवहार करता है, लेकिन नाममात्र मूल्यों से अधिक की प्रवृत्ति कम हो जाती है;

    5. दो तरफा फिशर-इरविन इरविन के नियम का उपयोग कर परीक्षा पद्धति एक तरफा संभावना दोगुनी से भी कम समय रूढ़िवादी है;

    6. एक तरफा संभावना को दोगुना करके मिड-पी फिशर-इरविन परीक्षण फिशर-इरविन परीक्षण के मानक संस्करणों की तुलना में बेहतर प्रदर्शन करता है, और इरविन के शासन द्वारा मिड-पी विधि अभी भी वास्तविक प्रकार से बेहतर प्रदर्शन करती है जिसमें मैं नाममात्र स्तरों के करीब हूं। ";

  • 'एन -1' परीक्षण के लिए मजबूत समर्थन प्रदान की गई आवृत्तियों 1 से अधिक है;

  • फिशर परीक्षण में दोष जो फिशर के आधार पर था कि सीमांत योग कोई उपयोगी जानकारी नहीं रखते हैं;

  • बहुत छोटे नमूना आकारों में उनकी उपयोगी जानकारी का प्रदर्शन;

  • Yate की N / 2 की निरंतरता सुधार में एक बड़ा सुधार है और यह अनुचित है;

  • काउंटर तर्क यादृच्छिक परीक्षण में यादृच्छिककरण परीक्षणों के उपयोग के लिए मौजूद हैं;

  • सबसे खराब मामलों की गणना;

  • समग्र सिफारिश : सभी अपेक्षित आवृत्तियों के कम से कम 1 होने पर 'एन -1' ची-स्क्वायर परीक्षण का उपयोग करें, अन्यथा दो तरफा परीक्षणों के लिए इरविन के नियम का उपयोग करते हुए फिशर-इरविन परीक्षण का उपयोग करें, या तो पूंछ से मेज पर ले जाना, या कम। जैसा कि मनाया गया; एंटोनियो एंड्रेस द्वारा संपादक को पत्र देखें और 27: 1791-1796 में लेखक का जवाब; 2008।


क्रांस जीजी, शस्टर जे.जे. फिशर का सटीक परीक्षण कितना रूढ़िवादी है? द्वि-नमूना तुलनात्मक द्विपद परीक्षण का एक मात्रात्मक मूल्यांकन। चिकित्सा 2008 में सांख्यिकी ; 27 : 3598-3611। ( सार )

  • ... फिशर की परीक्षा की परंपरा को सही मायने में निर्धारित करने वाला पहला पेपर;

  • "एफईटी का परीक्षण आकार 50 से पहले लगभग सभी नमूना आकारों के लिए 0.035 से कम था और 100 से अधिक नमूना आकार के लिए भी 0.05 तक नहीं पहुंचा था।"

  • "सटीक" तरीकों की रूढ़िवाद;

  • देख मेड में स्टेट 28 एक आलोचना जो अनुत्तरित था के लिए 173-179, 2009:


Lydersen S, Fagerland MW, Laake P। को टेबलों में एसोसिएशन के लिए अनुशंसित परीक्षण । चिकित्सा 2009 में सांख्यिकी ; 28 : 1159-1175। ( सार )2×2

  • ... फिशर का सटीक परीक्षण कभी भी उपयोग नहीं किया जाना चाहिए जब तक कि मध्य सुधार लागू नहीं किया जाता है;P

  • बिना शर्त परीक्षणों का मूल्य;

  • संपादक को पत्र देखें 30: 890-891; 2011


1
क्या आप सुझाव दे सकते हैं कि एन (एन -1) / एन करेक्शन कैसे लागू करें? क्या कोई ऑनलाइन कैलकुलेटर है जो इस सुधार को शामिल करता है? क्या इस सुधार को स्वयं करने के लिए ची-स्क्वेर्ड टेस्ट के परिणामों को मैन्युअल रूप से समायोजित करने का एक आसान तरीका है?
डीडब्ल्यू

आपके द्वारा ऊपर सूचीबद्ध संदर्भों में से एक आपका सबसे अच्छा दांव है।
फ्रैंक हरेल

1
आप क्यों कह रहे हैं " " फिशर के सटीक परीक्षण की तुलना में लगभग हमेशा अधिक सटीक है " ? मैं यह कहना चाहूंगा, क्योंकि एक "सटीक" परीक्षण नहीं है। χ 2χ2 χ2
स्टीफन लॉरेंट

2
"सटीक" के रूप में किसी चीज़ को लेबल करना ऐसा नहीं करता है। @Suncoolsu द्वारा नीचे दिए गए अद्भुत विवरण को देखें जिन्हें आपने याद किया होगा (आप ऊपर दिए गए सभी स्पष्टीकरणों को भी याद करते हैं)। पियर्सन परीक्षण इससे भी अधिक सटीक है कि पियर्सन ने सोचा था कि यह था। उदाहरण के लिए citeulike.org/user/harrelfe/article/13265687 और citeulike.org/user/harrelfe/article/13263676 देखें । फिशर का "सटीक" परीक्षण केवल इस अर्थ में सटीक है कि सही प्रकार की त्रुटि मैं दावे से बड़ा नहीं हूं। लेकिन यह दावा किए जाने की तुलना में छोटा है, इसलिए टाइप II त्रुटि अधिक है, जिसका अर्थ है कम शक्ति।
फ्रैंक हरेल

मुझे सटीक का मतलब पता है। सटीक बिंदु जो मुझे अस्पष्ट परीक्षणों से पसंद नहीं है, यह संभावना है कि जिस प्रकार की त्रुटि है वह नाममात्र स्तर से अधिक है। लेकिन आप सही हैं, मैंने आपके जवाब को गलत बताया और दूसरे (दोनों महान हैं)
स्टीफन लॉरेंट

47

यह एक बड़ा सवाल है।

फ़िशर का सटीक परीक्षण फ़िशर के प्रयोगात्मक उपयोग के चतुर उपयोग के महान उदाहरणों में से एक है, डेटा पर कंडीशनिंग के साथ (मूल रूप से मनाया पंक्ति और सीमांत योग के साथ तालिकाओं पर) और प्रायिकता वितरण खोजने में उनकी सरलता (हालांकि यह सबसे अच्छा उदाहरण नहीं है। , एक बेहतर उदाहरण के लिए यहां देखें )। "सटीक" पी-मानों की गणना करने के लिए कंप्यूटरों के उपयोग ने निश्चित रूप से सटीक उत्तर प्राप्त करने में मदद की है।

हालांकि, व्यवहार में फिशर के सटीक परीक्षण की मान्यताओं को सही ठहराना कठिन है। क्योंकि तथाकथित "सटीक" इस तथ्य से आता है कि "चाय चखने वाले experiement" में या 2x2 आकस्मिक तालिकाओं के मामले में, पंक्ति कुल और स्तंभ कुल, अर्थात्, मामूली योग डिजाइन द्वारा तय किए गए हैं। यह धारणा व्यवहार में शायद ही उचित हो। अच्छे संदर्भों के लिए यहां देखें ।

"सटीक" नाम एक को विश्वास दिलाता है कि इस परीक्षण द्वारा दिए गए पी-मान सटीक हैं, जो कि ज्यादातर मामलों में फिर से दुर्भाग्य से इन कारणों से सही नहीं है

  1. यदि मार्जिन डिज़ाइन द्वारा तय नहीं किए गए हैं (जो लगभग हर बार अभ्यास में होता है), पी-मान रूढ़िवादी होगा।
  2. चूंकि परीक्षण एक असतत संभाव्यता वितरण (विशेष रूप से, हाइपर-ज्यामितीय वितरण) का उपयोग करता है, कुछ कटऑफ के लिए "सटीक अशक्त संभावनाएं", पी-वैल्यू की गणना करना असंभव है।

अधिकांश व्यावहारिक मामलों में, एक संभावना अनुपात परीक्षण या ची-स्क्वायर परीक्षण का उपयोग करके फिशर के सटीक परीक्षण से बहुत अलग उत्तर (पी-मूल्य) नहीं देना चाहिए। हां, जब मार्जिन तय हो जाता है, तो फिशर का सटीक परीक्षण एक बेहतर विकल्प है, लेकिन ऐसा शायद ही कभी होगा। इसलिए, संभावना अनुपात परीक्षण के ची-वर्ग परीक्षण का उपयोग हमेशा संगतता जांच के लिए किया जाता है।

इसी तरह के विचार तब लागू होते हैं जब फिशर का सटीक परीक्षण किसी भी तालिका के लिए सामान्यीकृत होता है, जो मूल रूप से बहुभिन्नरूपी हाइपरजोमेट्रिक क्षमताओं की गणना के बराबर है। इसलिए किसी को हमेशा "सटीक" पी-मान के अलावा ची-स्क्वायर और संभावना अनुपात वितरण आधारित पी-मानों की गणना करने की कोशिश करनी चाहिए।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.