मैं भेदभाव के मामलों के साथ अनुभव से इसे रिवर्स-इंजीनियर करने जा रहा हूं। मैं निश्चित रूप से स्थापित कर सकता हूं जहां "741 में एक" , आदि के मूल्य आए थे। हालाँकि, अनुवाद में इतनी जानकारी खो गई थी कि मेरा बाकी का पुनर्निर्माण यह देखने पर निर्भर करता है कि लोग कैसे कठघरे की सेटिंग में आँकड़े बनाते हैं। मैं केवल कुछ विवरणों पर अनुमान लगा सकता हूं।
चूंकि 1960 के दशक (टाइटल VI) में भेदभाव-विरोधी कानून पारित किए गए थे, इसलिए संयुक्त राज्य अमेरिका की अदालतों ने पी-मूल्यों को देखना और उनकी तुलना और 0.01 की सीमा तक करना सीख लिया है । उन्होंने मानकीकृत प्रभावों को देखना भी सीखा है, जिन्हें आमतौर पर "मानक विचलन" कहा जाता है और उनकी तुलना "दो से तीन मानक विचलन" की सीमा से की जाती है। भेदभाव के मुकदमे के लिए एक प्रथम दृष्टया मामला कायम करने के लिए, वादी आम तौर पर एक सांख्यिकीय गणना का प्रयास करते हैं, जो इन थ्रेसहोल्ड से अधिक "असमान प्रभाव" दिखाती है। यदि ऐसी गणना का समर्थन नहीं किया जा सकता है, तो मामला आमतौर पर आगे नहीं बढ़ सकता है।0.050.01
अभियोगी के लिए सांख्यिकीय विशेषज्ञ अक्सर इन परिचित शब्दों में अपने परिणामों को उद्धृत करने का प्रयास करते हैं। विशेषज्ञों में से कुछ एक सांख्यिकीय परीक्षण करते हैं जिसमें अशक्त परिकल्पना "कोई प्रतिकूल प्रभाव नहीं" व्यक्त करती है, यह मानते हुए कि रोजगार के फैसले विशुद्ध रूप से यादृच्छिक थे और कर्मचारियों की किसी भी अन्य विशेषताओं से अपरिवर्तित थे। (चाहे वह एक-पूंछ वाला या दो-पूंछ वाला विकल्प विशेषज्ञ और परिस्थितियों पर निर्भर हो सकता है।) वे फिर इस परीक्षण के पी-मूल्य को मानक "सामान्य वितरण" के रूप में संदर्भित करके "मानक विचलन" की संख्या में परिवर्तित कर देते हैं। - यहां तक कि जब मानक सामान्य मूल परीक्षण के लिए अप्रासंगिक है। इस गोल चक्कर में वे अपने निष्कर्ष को स्पष्ट रूप से न्यायाधीश तक पहुंचाने की उम्मीद करते हैं।
आकस्मिक तालिकाओं में संक्षेपित किए जा सकने वाले डेटा का पसंदीदा परीक्षण फिशर का सटीक परीक्षण है। इसके नाम में "सटीक" की घटना विशेष रूप से वादी को भाता है, क्योंकि यह एक सांख्यिकीय निर्धारण को दर्शाता है जो त्रुटि के बिना बनाया गया है (जो कुछ भी हो सकता है!)।
यहाँ, तब, श्रम विभाग की गणना का मेरा (सट्टा पुनर्निर्माण) है।
वे (जैसे कि एक के रूप में फिशर सटीक टेस्ट, या यह की तरह कुछ भाग गया एक पी-मूल्य यादृच्छिकीकरण के माध्यम से निर्धारित के साथ परीक्षण)। यह परीक्षण मैथ्यू गन के जवाब में वर्णित एक अतिवृद्धि वितरण मानता है। (इस शिकायत में शामिल लोगों की कम संख्या के लिए, हाइपरमेट्रिक वितरण को सामान्य वितरण द्वारा अच्छी तरह से अनुमानित नहीं किया गया है।)χ2
उन्होंने इसका पी-मान एक सामान्य जेड स्कोर ("मानक विचलन की संख्या") में बदल दिया।
उन्होंने Z अंक को निकटतम पूर्णांक में गोल किया: "तीन मानक विचलन से अधिक," "पांच मानक विचलन से अधिक है," और "छह मानक विचलन से अधिक है।" (क्योंकि इन Z- स्कोर के कुछ गोल ऊपर अधिक मानक विचलन के लिए, मैं सही साबित कर सकते नहीं "से अधिक है", सब मैं क्या कर सकते हैं यह बोली है।)
शिकायत में इन अभिन्न जेड स्कोर को पी-मान में बदल दिया गया था! फिर से मानक सामान्य वितरण का उपयोग किया गया था।
इन पी-वैल्यू का वर्णन किया गया है (यकीनन भ्रामक तरीके से) "संभावना के अनुसार यह परिणाम हुआ।"
इस अटकलें टिप्पणी का समर्थन करने के लिए, कि तीन मामलों में फिशर सटीक परीक्षण के लिए पी मूल्यों लगभग रहे हैं , 1 / 565,000 , और 1 / ५८०००००० । इनमें से संभालने पूल पर आधारित होते हैं 730 , 1160 , और 130 "इससे अधिक" करने के लिए इसी 730 , 1160 , और 130 , क्रमशः। इन नंबरों का सामान्य Z स्कोर होता है - 3.16 , - 4.64 , और - 5.521/12801/5650001/5800000073011601307301160130−3.16−4.64−5.52, क्रमशः, जब गोल तीन, पांच और छह मानक विचलन होते हैं, तो शिकायत में दिखाई देने वाली संख्या बिल्कुल। वे के (एक पूंछ) सामान्य पी मूल्यों अनुरूप , 1 / 3500000 , और 1 / 1000000000 : ठीक मूल्यों शिकायत में उद्धृत।1/7411/35000001/1000000000
R
इन गणनाओं को करने के लिए यहां कुछ कोड का उपयोग किया गया है।
f <- function(total, percent.asian, hired.asian, hired.non.asian) {
asian <- round(percent.asian/100 * total)
non.asian <- total-asian
x <- matrix(c(asian-hired.asian, non.asian-hired.non.asian, hired.asian, hired.non.asian),
nrow = 2,
dimnames=list(Race=c("Asian", "non-Asian"),
Status=c("Not hired", "Hired")))
s <- fisher.test(x)
s$p.value
}
1/pnorm(round(qnorm(f(730, 77, 1, 6))))
1/pnorm(round(qnorm(f(1160, 85, 11, 14))))
1/pnorm(round(qnorm(f(130, 73, 4, 17))))