मैं फिशर सटीक परीक्षण को बेहतर तरीके से समझना चाहता था, इसलिए मैंने निम्नलिखित खिलौना उदाहरण तैयार किया, जहां एफ और एम पुरुष और महिला से मेल खाते हैं, और n और y इस तरह से "सोडा की खपत" से मेल खाती है:
> soda_gender
f m
n 0 5
y 5 0
जाहिर है, यह एक कठोर सरलीकरण है, लेकिन मैं नहीं चाहता था कि संदर्भ रास्ते में आए। यहां मैंने सिर्फ यह माना कि नर सोडा नहीं पीते हैं और मादा सोडा पीते हैं, और देखना चाहते हैं कि सांख्यिकीय प्रक्रियाएं इसी निष्कर्ष पर पहुंचती हैं या नहीं।
जब मैं R में फिशर सटीक परीक्षण चलाता हूं, तो मुझे निम्नलिखित परिणाम मिलते हैं:
> fisher.test(soda_gender)
Fisher's Exact Test for Count Data
data: soda_gender
p-value = 0.007937
alternative hypothesis: true odds ratio is not equal to 1
95 percent confidence interval:
0.0000000 0.4353226
sample estimates:
odds ratio
0
यहाँ, चूंकि p-value 0.007937 है, हम यह निष्कर्ष निकालेंगे कि लिंग और सोडा की खपत जुड़ी हुई है।
मुझे पता है कि फिशर-सटीक परीक्षण हाइपरजोमेरिक वितरण से संबंधित है। इसलिए मैं उसी का उपयोग करके समान परिणाम प्राप्त करना चाहता था। दूसरे शब्दों में, आप इस समस्या को निम्नानुसार देख सकते हैं: 10 गेंदें हैं, जहां 5 को "पुरुष" के रूप में लेबल किया जाता है, और 5 को "महिला" के रूप में लेबल किया जाता है, और आप बिना प्रतिस्थापन के 5 गेंदों को यादृच्छिक रूप से आकर्षित करते हैं, और आप 0 पुरुष गेंदों को देखते हैं। । इस अवलोकन का क्या मौका है? इस प्रश्न का उत्तर देने के लिए, मैंने निम्नलिखित कमांड का उपयोग किया:
> phyper(q=0,m=5,n=5,k=5,lower.tail=TRUE)
[1] 0.003968254
मेरे प्रश्न हैं: 1) कैसे दो परिणाम अलग-अलग हैं? 2) क्या मेरे तर्क में कुछ भी गलत या कठोर नहीं है?