मैं एक नकली आनुवांशिकी समस्या में फिशर के सटीक परीक्षण को लागू करने की कोशिश कर रहा हूं, लेकिन पी-मान सही करने के लिए तिरछा दिखाई देते हैं। एक जीवविज्ञानी होने के नाते, मुझे लगता है कि मैं हर सांख्यिकीविद् के लिए कुछ स्पष्ट याद कर रहा हूं, इसलिए मैं आपकी मदद की बहुत सराहना करूंगा।
मेरा सेटअप यह है: (सेटअप 1, मार्जिन तय नहीं)
0s और 1s के दो नमूने बेतरतीब ढंग से R. में उत्पन्न होते हैं। प्रत्येक नमूना n = 500, नमूना 0 और 1 की संभावनाएं बराबर हैं। मैं फ़िशर के सटीक परीक्षण के साथ प्रत्येक नमूने में 0/1 के अनुपात की तुलना करता हूं (बस fisher.test
, इसी तरह के परिणाम के साथ अन्य सॉफ़्टवेयर की भी कोशिश की)। नमूनाकरण और परीक्षण 30 000 बार दोहराया जाता है। परिणामी पी-मान इस तरह वितरित किए जाते हैं:
सभी पी-वैल्यू का मतलब लगभग ०.५५ है, ५.० प्रतिशत ०.०५--पर। यहां तक कि वितरण दाईं ओर बंद दिखाई देता है।
मैं वह सब कुछ पढ़ रहा हूं जो मैं कर सकता हूं, लेकिन मुझे ऐसा कोई संकेत नहीं मिला है कि यह व्यवहार सामान्य है - दूसरी ओर, यह सिर्फ नकली डेटा है, इसलिए मुझे किसी भी पूर्वाग्रह के लिए कोई स्रोत नहीं दिख रहा है। क्या कोई समायोजन मुझे याद आया? बहुत छोटा नमूना आकार? या शायद इसे समान रूप से वितरित नहीं किया जाना चाहिए, और पी-मानों की अलग-अलग व्याख्या की जाती है?
या क्या मुझे इसे एक लाख बार दोहराना चाहिए, 0.05 मात्रात्मक मिल जाए, और जब मैं इसे वास्तविक डेटा पर लागू करता हूं तो इसका उपयोग कटऑफ के रूप में करना चाहिए?
धन्यवाद!
अपडेट करें:
माइकल एम ने 0 और 1. के सीमांत मूल्यों को ठीक करने का सुझाव दिया। अब पी-वैल्यू एक बहुत अच्छे वितरण को प्रदान करते हैं - दुर्भाग्य से, यह एक समान नहीं है, और न ही किसी अन्य आकार की पहचान करता हूं:
वास्तविक R कोड जोड़ना: (सेटअप 2, मार्जिन तय)
samples=c(rep(1,500),rep(2,500))
alleles=c(rep(0,500),rep(1,500))
p=NULL
for(i in 1:30000){
alleles=sample(alleles)
p[i]=fisher.test(samples,alleles)$p.value
}
hist(p,breaks=50,col="grey",xlab="p-values",main="")
अंतिम संपादन:
जैसा कि टिप्पणी में व्हॉबर बताते हैं, क्षेत्र केवल द्विपद के कारण विकृत दिखते हैं। मैं सेटअप 1 (मुक्त मार्जिन) और सेटअप 2 (निश्चित मार्जिन) के लिए क्यूक्यू-प्लॉट संलग्न कर रहा हूं। इसी तरह के प्लॉट नीचे ग्लेन के सिमुलेशन में देखे जाते हैं, और वास्तव में ये सभी परिणाम एक जैसे लगते हैं। सहायता के लिए धन्यवाद!