फिशर के सटीक परीक्षण में परीक्षण सांख्यिकीय क्या है?


9

2 से 2 आकस्मिक तालिका के लिए, कुछ ने कहा कि फिशर का सटीक परीक्षण परीक्षण सांख्यिकीय के रूप में तालिका में (1,1) सेल में की गिनती का उपयोग करता है , और शून्य परिकल्पना के तहत, होगा हाइपरजोमेट्रिक वितरण करें।X1,1X1,1

कुछ ने कहा कि इसका परीक्षण आँकड़ा है जहाँ नलिका के अंतर्गत अतिवृद्धि वितरण (ऊपर उल्लिखित) का मतलब है। यह भी कहा कि हाइपरोमेट्रिक वितरण की सारणी के आधार पर पी-वैल्यू का निर्धारण किया जाता है। मैं सोच रहा था कि क्या कोई मतलब घटाना है और फिर निरपेक्ष मूल्य लेना है? अशक्त के तहत एक अतिवृद्धि वितरण नहीं है, क्या यह?

|X1,1μ|
μ|X1,1μ|

जवाबों:


10

(हमारी धारणाओं को थोड़ा और सटीक बनाने के लिए, हम 'टेस्ट स्टेटिस्टिक' कहते हैं, जिस चीज़ को हम देखते हैं उसका वितरण वास्तव में पी-वैल्यू की गणना करता है। इसका मतलब है कि दो-पूंछ वाले टी-टेस्ट के लिए, हमारा टेस्ट स्टेटिस्टिक होगा। बल्कि ।)|T|T

एक परीक्षण आँकड़ा क्या करता है नमूना स्थान (या अधिक सख्ती से, एक आंशिक आदेश) पर एक आदेश को प्रेरित करता है, ताकि आप चरम मामलों (वैकल्पिक के साथ सबसे अधिक संगत वाले) की पहचान कर सकें।

फिशर के सटीक परीक्षण के मामले में, पहले से ही एक अर्थ में एक आदेश है - जो कि विभिन्न 2x2 तालिकाओं की संभावनाएं हैं। ऐसा होता है, वे पर आदेश के अनुरूप इस अर्थ में कि या तो की बढ़ते या घटते मूल्यों 'चरम' कर रहे हैं और वे कर रहे हैं भी छोटी से छोटी संभावना के साथ लोगों को। तो आपके सुझाव के तरीके में के मूल्यों को देखने के बजाय , कोई भी बड़े और छोटे छोरों से काम कर सकता है, प्रत्येक चरण में केवल जो भी मूल्य (सबसे बड़ा या सबसे छोटाX1,1X1,1X1,1X1,1(पहले से ही वहाँ नहीं है) इसके साथ जुड़ी छोटी संभावना है, जब तक आप अपनी अवलोकन तालिका तक नहीं पहुंचते; इसके शामिल किए जाने पर, उन सभी चरम तालिकाओं की कुल संभावना पी-मूल्य है।

यहाँ एक उदाहरण है:

हाइपरजोमेट्रिक प्रायिकता फ़ंक्शन

> data.frame(x=x,prob=dhyper(x,9,12,10),rank=rank(dhyper(x,9,12,10)))
   x         prob rank
1  0 1.871194e-04    2
2  1 5.613581e-03    4
3  2 5.052223e-02    6
4  3 1.886163e-01    8
5  4 3.300786e-01   10
6  5 2.829245e-01    9
7  6 1.178852e-01    7
8  7 2.245433e-02    5
9  8 1.684074e-03    3
10 9 3.402171e-05    1

पहला स्तंभ मान हैं, दूसरा स्तंभ संभाव्यताएं हैं और तीसरा स्तंभ प्रेरित आदेश है।X1,1

तो फिशर सटीक परीक्षण के विशेष मामले में, प्रत्येक तालिका की संभावना (समकक्ष, प्रत्येक मान) को वास्तविक परीक्षण सांख्यिकीय माना जा सकता हैX1,1

यदि आप अपने सुझाए गए परीक्षण आंकड़े की तुलना करते हैं, यह इस मामले में समान आदेश को प्रेरित करता है (और मेरा मानना ​​है कि यह सामान्य रूप से ऐसा करता है लेकिन मैंने जांच नहीं की है), उस सांख्यिकीय के बड़े मूल्य संभावना के छोटे मूल्य हैं, इसलिए इसे समान रूप से 'सांख्यिकीय' माना जा सकता है। - लेकिन इतनी अधिक मात्रा में - वास्तव में कोई भी जो सभी मामलों में s के इस आदेश को संरक्षित करता है , वे समान परीक्षण आँकड़े हैं, क्योंकि वे हमेशा समान पी-मूल्यों का उत्पादन करते हैं।|X1,1μ|X1,1

यह भी ध्यान दें कि शुरुआत में पेश किए गए 'टेस्ट स्टेटिस्टिक' की अधिक सटीक धारणा के साथ, इस समस्या के लिए संभावित परीक्षण आँकड़ों में से कोई भी वास्तव में हाइपरजोमेट्रिक वितरण नहीं है; करता है, लेकिन यह वास्तव में दो पूंछ वाले परीक्षण के लिए एक उपयुक्त परीक्षण आँकड़ा नहीं है (यदि हमने एक तरफा परीक्षण किया है, जहां मुख्य विकर्ण में केवल अधिक संघ है और दूसरे विकर्ण में संगत नहीं है वैकल्पिक है, तो यह एक परीक्षण आँकड़ा होगा)। यह वही एक-पूंछ / दो-पूंछ वाला मुद्दा है जिसकी मैंने शुरुआत की थी।X1,1

[संपादित करें: कुछ कार्यक्रम फिशर टेस्ट के लिए एक परीक्षण सांख्यिकीय प्रस्तुत करते हैं; मुझे लगता है कि यह एक -2logL प्रकार की गणना होगी जो कि chi-square के साथ asymptotically तुलनीय होगी। कुछ लोग इसके अनुपात या इसके लॉग को भी प्रस्तुत कर सकते हैं, लेकिन यह बिल्कुल समकक्ष नहीं है।]


धन्यवाद, Glen_b! शून्य के तहत का वितरण वितरण है, जो अपने माध्य आसपास सममित नहीं है । तो मैं सोच रहा था कि अगरएक उचित परीक्षा सांख्यिकीय है? X1,1μ|X1,1μ|
टिम

यह एक उचित रूप से उचित परीक्षण आँकड़ा लगता है, क्योंकि यह पूरी तरह से व्याख्यात्मक और आसानी से समझ में आता है। वास्तव में किसी भी संभावित आंकड़े का सममित वितरण नहीं होगा। आइए एक पल के लिए फिशर टेस्ट की बारीकियों को भूल जाएं - यदि वह आँकड़ा आपके लिए सार्थक है, तो आप उस आधार पर एक सटीक परीक्षण की गणना कर सकते हैं (संभावनाओं को खोजने के लिए अतिवृद्धि गणनाओं का उपयोग करके)। यदि आप यह दिखाना चाहते हैं कि वे सभी मामलों में समान ऑर्डर दे रहे हैं, तो शायद यह एक नया सवाल है।
Glen_b -Reinstate Monica

6

|X1,1μ| सामान्य रूप से हाइपरजोमेट्रिक वितरण नहीं हो सकता है क्योंकि μ एक पूर्णांक मान होने की आवश्यकता नहीं है और फिर |X1,1μ|पूर्णांक नहीं होगा। लेकिन सशर्त रूप से मार्जिन पर,X1,1 हाइपरजोमेट्रिक वितरण होगा।

यदि आप इसे ठीक से करते हैं और ज्ञात मूल्यों के मार्जिन को ठीक करते हैं, तो आप विचार कर सकते हैं X1,1(या कोई अन्य सेल) आपका आँकड़ा होना चाहिए। ड्राइंग की सादृश्य के साथk एक कलश से गेंदों W सफेद गेंदों और B प्रतिस्थापन के बिना काली गेंदों, X1,1 सफेद गेंदों की संख्या के रूप में व्याख्या की जा सकती है, जहां B पहली पंक्ति का योग है, W दूसरी पंक्ति का योग है, k पहले कॉलम का योग है।


4

यह वास्तव में एक नहीं है। परीक्षण के आँकड़े एक ऐतिहासिक विसंगति हैं - हमारे पास एक परीक्षण सांख्यिकीय होने का एकमात्र कारण एक पी-मूल्य प्राप्त करना है। फिशर का सटीक परीक्षण एक परीक्षण स्टैटिस्टिक से अतीत में कूदता है और सीधे पी-मूल्य पर जाता है।


धन्यवाद, लेकिन क्या वास्तव में एक परीक्षण आँकड़ा नहीं है? फिर आप p मान कैसे निर्धारित करते हैं?
टिम

फिशर के सटीक परीक्षण का परिणाम पी-मूल्य है।
जेरेमी माइल्स

@JeremyMiles: क्या आपका मतलब है कि परीक्षण के आंकड़े ऐतिहासिक विसंगतियां हैं, जिसमें कम-लागत कंप्यूटिंग से पहले, उपयोगकर्ताओं ने Z, t और इसी तरह की गणना की और फिर सांख्यिकीय महत्व को निर्धारित करने के लिए इस परीक्षण सांख्यिकीय की तुलना पूर्व-गणना की गई तालिकाओं से की, और परिणामस्वरूप, हीनतापूर्ण आँकड़ों के कई वर्तमान उपयोगकर्ता अभी भी परीक्षण आँकड़ों के संदर्भ में सोचते हैं जब वे आसानी से एक पी-मूल्य प्रदान कर सकते हैं? दूसरे शब्दों में, क्या यह एक प्रकार का जेनेरेशन प्रभाव है?
रबीडोट्टर

1
@rabidotter - हां, मुझे लगता है कि मैं करता हूं। आप ऐसे लोगों को देखते हैं जो "F = 14.352, df = 2, 568, p <0.05" लिखते हैं। बहुत ही एकमात्र कारण है कि कोई भी एफ की परवाह करता है पी की गणना करता है, फिर भी वे बड़े पैमाने पर सटीक को एफ देते हैं, और पी को बहुत कम सटीकता के साथ।
जेरेमी माइल्स
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.