किसी भी पर अपने माउस मँडरा टैग (←एक नकली टैग है) इसके विकी का एक संक्षिप्त अंश देखने के लिए नीचे दिखाई दे रहा है। कृपया लाइन रिक्ति के व्यवधान को क्षमा करें। मुझे यह सार्थक लगता है क्योंकि टैग अंश पाठकों को पढ़ने के दौरान शब्दजाल की समझ की जांच करने में मदद कर सकता है। इन अंशों में से कुछ संपादन के लायक भी हो सकते हैं, इसलिए वे भी एक प्रचारक, IMHO के योग्य हैं।
p > .05 आमतौर पर तात्पर्य किसी को अस्वीकार नहीं करना चाहिए शून्य परिकल्पना। इसके विपरीत,टाइप-ए-त्रुटियोंया झूठी सकारात्मकता तब होती है जब कोई व्यक्ति अशक्त को अस्वीकार कर देता हैनमूना त्रुटि या कुछ अन्य असामान्य घटना जो उत्पादन करती है नमूना अन्यथा यह असंभव नहीं था (आमतौर पर साथ पी < .05) एक से बेतरतीब ढंग से नमूना लिया गया है आबादीजिसमें नल सत्य है। के साथ एक परिणामp > .05 जिसे एक झूठी सकारात्मक कहा जाता है, वह गलत परिकल्पना की गलतफहमी को दर्शाता है महत्व परीक्षणआईएनजी (NHST)। प्रकाशित शोध साहित्य में गलतफहमी असामान्य नहीं है, क्योंकि एनएचएसटी कुख्यात रूप से प्रति-सहज है। यह रैली के रोने में से एक हैबायेसियनआक्रमण (जो मैं समर्थन करता हूं, लेकिन पालन नहीं करता ... अभी तक)। मैंने हाल ही में अपने आप को इन जैसे गलत छापों के साथ काम किया है, इसलिए मैं सबसे अधिक दिल से सहानुभूति रखता हूं।
@DavidRobinson यह देखने में सही है पी शून्य के झूठे होने की संभावना नहीं है frequentistNHST। यह (कम से कम) गुडमैन में से एक (2008) "डर्टी डोजेन" के बारे में गलत धारणा हैपीमान ( हर्लबर्ट और लोम्बार्डी, 2009 भी देखें ) । NHST में,पी है संभावना जो किसी भी भविष्य के यादृच्छिक नमूनों को उसी माध्यम से आकर्षित करेगा, जो किसी रिश्ते या अंतर (या जो कुछ भी) का प्रदर्शन करेगा प्रभावी आकार अशक्त के खिलाफ परीक्षण किया जा रहा है, यदि प्रभाव आकार की अन्य किस्में मौजूद हैं ...?) कम से कम अशक्त परिकल्पना से अलग (एक ही जनसंख्या) के नमूने (ओं) के रूप में एक से एक पर पहुंचने के लिए परीक्षण किया है पीमान, यदि नल सत्य है। अर्थात्,पीएक नमूना प्राप्त करने की संभावना है जैसे तुम्हारा दिया गया नल ; यह शून्य की संभावना को प्रतिबिंबित नहीं करता है - कम से कम, सीधे नहीं। इसके विपरीत, बायेसियन विधियों ने सांख्यिकीय विश्लेषण के अपने सूत्रीकरण पर गर्व किया, जैसा कि साक्ष्य के आकलन के लिए या उसके खिलाफ केंद्रित थापूर्वएक प्रभाव के सिद्धांत को दिया गया है , जिसके बारे में उनका तर्क है कि अन्य फायदे के साथ अधिक सहज रूप से आकर्षक दृष्टिकोण ( Wagenmakers, 2007 ) है , और एक तरफ विवादित नुकसान की स्थापना। (निष्पक्ष होने के लिए, " बायेसियन विश्लेषण के विचार क्या हैं? " आपने उन लेखों का हवाला दिया है जो वहां कुछ अच्छे उत्तर दे सकते हैं: मोये, 2008; हर्लबर्ट और लोम्बार्डी, 2009। )
वास्तव में, शाब्दिक रूप से कहा गया अशक्त परिकल्पना अक्सर गलत होने की तुलना में अधिक होने की संभावना है, क्योंकि शून्य परिकल्पना सबसे अधिक होती है, शाब्दिक रूप से शून्य प्रभाव की परिकल्पना । (कुछ आसान जवाबी उदाहरणों के लिए, उत्तर देखें: " क्या बड़े डेटा परिकल्पना परीक्षण के लिए अनुपयुक्त हैं? ") दर्शन संबंधी मुद्दे जैसे कि तितली के प्रभाव से शाब्दिक खतरा पैदा होता है।वैधताऐसी किसी भी परिकल्पना का; इसलिए अशक्त कुछ nonzero प्रभाव की एक वैकल्पिक परिकल्पना के लिए तुलना के आधार के रूप में सबसे अधिक उपयोगी है। इस तरह की एक वैकल्पिक परिकल्पना डेटा एकत्र किए जाने के बाद नल की तुलना में अधिक प्रशंसनीय रह सकती है जो कि नल के सत्य होने पर असंभव थी । इसलिए शोधकर्ता आमतौर पर अशक्त के खिलाफ सबूत से एक वैकल्पिक परिकल्पना के लिए समर्थन का अनुमान लगाते हैं, लेकिन ऐसा नहीं हैपी मूल्योंसीधे मात्रा ( Wagenmakers, 2007 ) ।
जैसा कि आपको संदेह है, आंकड़ों की महत्ता का एक कार्य है नमूने का आकार, साथ ही प्रभाव आकार और स्थिरता। (देखें @ हाल ही में सवाल का गुंग का जवाब, " कैसे एक टी परीक्षण सांख्यिकीय रूप से महत्वपूर्ण हो सकता है, तो मतलब अंतर लगभग 0 है? ") सवाल हम अक्सर अपने डेटा के पूछने के लिए करना चाहते हैं, कर रहे हैं "के प्रभाव क्या है xपर y? " विभिन्न कारणों से (आंकड़ों में, विशेष रूप से गैर-सांख्यिकीविदों द्वारा सिखाया गया, जैसे IMO, गलत और अन्यथा कमी वाले शैक्षिक कार्यक्रम), हम अक्सर खुद को खोजने के बजाय शाब्दिक रूप से संबंधित प्रश्न पूछते हैं, "मेरे जैसे बेतरतीब ढंग से नमूना लेने की संभावना क्या है।" जिस आबादी पर xकोई असर नहीं पड़ता y? " यह क्रमशः प्रभाव के आकार के आकलन और महत्व के परीक्षण के बीच आवश्यक अंतर है। एपी मूल्य केवल उत्तरार्द्ध प्रश्न का सीधे उत्तर देता है, लेकिन कई पेशेवर (@rpierce शायद आपको मुझसे बेहतर सूची दे सकते हैं; मुझे आपको इसमें खींचने के लिए क्षमा करें!) ने तर्क दिया है कि शोधकर्ताओं ने गलत अनुमान लगाया है! पीप्रभाव आकार के पूर्व प्रश्न के उत्तर के रूप में सभी अक्सर; मुझे डर है कि मैं सहमत होना चाहिए।
के अर्थ के बारे में अधिक सीधे जवाब देने के लिए .05 < p < .95, यह है कि जिस डेटा की आबादी सच है, अशक्त होने पर यादृच्छिक रूप से नमूना लेने की संभावना है, लेकिन यह उस संबंध या अंतर को प्रदर्शित करता है, जो इससे भिन्न होता है, जो कि शून्य का शाब्दिक रूप से विस्तृत और आपके डेटा के अनुरूप एक मार्जिन द्वारा वर्णन करता है। .. <श्वास> ... 5-95% के बीच है। एक निश्चित रूप से यह तर्क दे सकता है कि यह नमूना आकार का एक परिणाम है, क्योंकि नमूना आकार बढ़ने से छोटे और असंगत प्रभाव के आकार का पता लगाने की क्षमता में सुधार होता है और 5% से अधिक आत्मविश्वास के साथ शून्य प्रभाव, के शून्य प्रभाव से उन्हें अलग करता है। हालांकि, छोटे और असंगत प्रभाव आकार व्यावहारिक रूप से महत्वपूर्ण हो सकते हैं या नहीं भी हो सकते हैं (≠महत्वपूर्ण रूप से सांख्यिकीय - गुडमैन का एक और (2008) गंदा दर्जन); यह डेटा के अर्थ पर कहीं अधिक निर्भर करता है, जिसके साथ सांख्यिकीय महत्व केवल सीमित सीमा तक ही चिंता करता है। ऊपर दिए गए मेरे जवाब को देखें ।
क्या किसी परिणाम को निश्चित रूप से गलत (केवल असमर्थित के बजाय) कॉल करना सही नहीं होना चाहिए अगर ... p> 0.95?
चूंकि डेटा को आमतौर पर अनुभवजन्य तथ्यात्मक टिप्पणियों का प्रतिनिधित्व करना चाहिए , वे झूठे नहीं होने चाहिए; आदर्श रूप में उनके बारे में केवल इस जोखिम का सामना करना चाहिए। (मापन त्रुटि भी निश्चित रूप से होती है, लेकिन यह मुद्दा कुछ हद तक इस उत्तर के दायरे से बाहर है, इसलिए इसे यहां उल्लेख करने से अलग, मैं इसे अन्यथा अकेले ही बताऊंगा।) कुछ जोखिम हमेशा अशक्त होने के बारे में गलत सकारात्मक अनुमान लगाने से कम उपयोगी होते हैं। वैकल्पिक परिकल्पना की तुलना में, कम से कम जब तक कि अवर को पता नहीं है कि यह सच है। केवल ज्ञान की कठिन-से-कठिन परिस्थिति में कि अशक्त वस्तुतः सत्य है और एक वैकल्पिक परिकल्पना के पक्ष में एक अनुमान निश्चित रूप से गलत है ... कम से कम, जहां तक मैं इस समय की कल्पना कर सकता हूं।
स्पष्ट रूप से, व्यापक उपयोग या सम्मेलन महामारी या हीनता की वैधता पर सबसे अच्छा अधिकार नहीं है। यहां तक कि प्रकाशित संसाधन गिरने योग्य हैं; उदाहरण के लिए पी-वैल्यू परिभाषा में गिरावट । आपका संदर्भ ( हर्लबर्ट और लोम्बार्डी, 2009 ) इस सिद्धांत का कुछ दिलचस्प विवरण भी प्रस्तुत करता है (पृष्ठ 322):
स्टेटसॉफ्ट (2007) अपनी वेबसाइट पर दावा करता है कि उनका ऑनलाइन मैनुअल "एनसाइक्लोपीडिया बिटकॉइनिका द्वारा अनुशंसित आंकड़ों पर एकमात्र इंटरनेट संसाधन है।" बम्पर स्टिकर के अनुसार, 'डेजर्ट्स अथॉरिटी' के लिए यह इतना महत्वपूर्ण नहीं है। [कॉमली टूटी हुई यूआरएल हाइपरलिंक किए गए पाठ में परिवर्तित हो गई।]
इस मामले में एक और मामला: एक बहुत ही हालिया नेचर न्यूज़ लेख ( Nuzzo, 2014 ) में यह वाक्यांश : "P value, साक्ष्य की ताकत के लिए एक सामान्य सूचकांक ..." Wagenmakers देखें (2007, पृष्ठ 787) "समस्या 3:पीमान सांख्यिकीय प्रमाण नहीं निर्धारित करते हैं "... हालांकि, @MichaelLew ( Lew, 2013 ) एक तरह से असहमत है जो आपको उपयोगी लग सकता है: वह उपयोग करता हैपीसंभावित कार्यों को अनुक्रमित करने के लिए मूल्य। फिर भी इन प्रकाशित स्रोतों में एक दूसरे के विपरीत, कम से कम एक गलत होना चाहिए! (किसी स्तर पर, मुझे लगता है ...) बेशक, यह "अविश्वास" के प्रति उतना बुरा नहीं है। मुझे आशा है कि मैं माइकल को यहाँ टैगिंग के रूप में चिन्हित कर सकता हूँ क्योंकि मेरे पास है (लेकिन मुझे यकीन नहीं है कि उपयोगकर्ता टैग सूचना भेजते समय संपादित किए जाएंगे - मुझे नहीं लगता कि आपका ओपी में किया था)। वह केवल एक ही हो सकता है जो नाज़ो को बचा सकता है - यहां तक कि प्रकृति भी ! हमारी मदद करें ओबी-वान! (और मुझे माफ़ करें अगर मेरा जवाब यहाँ प्रदर्शित करता है कि मैं अभी भी आपके काम के निहितार्थ को समझने में विफल रहा हूँ, जो मुझे यकीन है कि मैं किसी भी मामले में है ...) BTW, Nuzzo भी कुछ पेचीदा आत्म-रक्षा और प्रतिनियुक्ति प्रदान करता है Wagenmaakers की "समस्या 3": Nuzzo का "संभावित कारण" देखें( गुडमैन, 2001 , 1992; गोरोचन, हॉज, हीमैन, डर्नर, और ग्रीनबर्ग, 2007 ) । इनमें केवल वह उत्तर शामिल हो सकता है जिसकी आप वास्तव में तलाश कर रहे हैं, लेकिन मुझे संदेह है कि मैं बता सकता हूं।
पुन: आपके बहुविकल्पीय प्रश्न, मैं चुनता हूं d। हो सकता है कि आपने यहां कुछ अवधारणाओं का गलत अर्थ निकाला हो, लेकिन आप निश्चित रूप से अकेले नहीं हैं यदि आप ऐसा करते हैं, और मैं आपको निर्णय छोड़ दूंगा, क्योंकि केवल आप ही जानते हैं कि आप वास्तव में क्या मानते हैं। गलत व्याख्या निश्चित रूप से कुछ मात्रा में होती है, जबकि एक प्रश्न पूछना विपरीत का अर्थ है, और यह कि जब सवाल अनिश्चित और प्रशंसनीय है, तो यह बहुत ही प्रशंसनीय है। मानव स्वभाव का यह मामला हमारे सम्मेलनों की गलत तरीके से हानिरहित रूप से कम, और यहां संदर्भित लोगों की शिकायतों के योग्य बनाता है। (आपके हिस्से में धन्यवाद!) हालांकि, आपका प्रस्ताव पूरी तरह से सही नहीं है।
से जुड़ी समस्याओं की कुछ रोचक चर्चा पीजिन मूल्यों में मैंने भाग लिया है, वे इस प्रश्न में प्रकट होते हैं: पी-मानों के उलझे हुए विचार । मेरा जवाब कुछ संदर्भों को सूचीबद्ध करता है जिन्हें आप व्याख्यात्मक समस्याओं और विकल्पों के लिए आगे पढ़ने के लिए उपयोगी हो सकते हैंपीमान। पूर्वाभास हो: मैं अभी भी इस विशेष खरगोश छेद के नीचे खुद को नहीं मार पाया हूं, लेकिन मैं आपको कम से कम यह बता सकता हूं कि यह बहुत गहरा है । मैं अभी भी इसके बारे में खुद सीख रहा हूं (अन्यथा मुझे संदेह है कि मैं अधिक बायेसियन परिप्रेक्ष्य से संपादित करूंगा ]: या शायद एनएफएसए परिप्रेक्ष्य! हर्लबर्ट और लोम्बार्डी, 2009 ) , मैं सबसे अच्छे रूप में एक कमजोर प्राधिकरण हूं, और मैं स्वागत करता हूं किसी भी सुधार या विस्तार से दूसरों को जो मैंने यहाँ कहा है, उसकी पेशकश कर सकते हैं। मैं सभी निष्कर्ष निकाल सकता हूं कि शायद गणितीय रूप से सही उत्तर है, और यह अच्छी तरह से हो सकता है कि ज्यादातर लोग इसे गलत समझें। सही उत्तर निश्चित रूप से आसानी से नहीं आता है, क्योंकि निम्नलिखित संदर्भ प्रदर्शित होते हैं ...
PS के रूप में अनुरोध किया गया (जैसे ... मैं मानता हूं कि मैं वास्तव में इसे काम करने के बजाय इस पर काम कर रहा हूं), यह सवाल कभी-कभी एक समान वितरण के लिए एक बेहतर संदर्भ हैpnull दिया: " क्यों p- मानों को समान रूप से शून्य परिकल्पना के तहत वितरित किया जाता है? " विशेष रूप से रुचि @ whuber की टिप्पणियां हैं, जो अपवादों का एक वर्ग बढ़ाती हैं। एक पूरे के रूप में चर्चा के साथ कुछ हद तक सही है, मैं 100% तर्कों का पालन नहीं करता हूं, अकेले उनके निहितार्थ बताएं, इसलिए मैं उन समस्याओं के बारे में नहीं हूंpवितरण एकरूपता वास्तव में असाधारण हैं। इसके अलावा गहरे बैठे सांख्यिकीय भ्रम के लिए, मुझे डर है ...
संदर्भ
- गुडमैन, एसएन (1992)। प्रतिकृति, पी uesvalues और सबूत पर एक टिप्पणी । चिकित्सा में सांख्यिकी, 11 (7), 875-879।
- गुडमैन, एसएन (2001)। के पी ए विनम्र प्रस्ताव: -values और Bayes। महामारी विज्ञान, 12 (3), 295-297। Http://swfsc.noaa.gov/uploadedFiles/Divisions/PRD/Programs/ETP_Cetacean_Assessment/Of_P_Values_and_BayesesA_Modest_Proposal.6.pdf से पुनर्प्राप्त किया गया ।
- गुडमैन, एस। (2008)। एक गंदा दर्जन: बारहवीं- पी- गलत धारणाएं। हेमटोलॉजी में सेमिनार, 45 (3), 135-140। से लिया गया http://xa.yimg.com/kq/groups/18751725/636586767/name/twelve+P+value+misconceptions.pdf ।
- गोरोचन, पी।, हॉज, एसई, हीमैन, जीए, डर्नर, एम।, और ग्रीनबर्ग, डीए (2007)। संघ अध्ययनों की गैर-प्रतिकृति: "छद्म विफलताओं" को दोहराने के लिए? चिकित्सा में जेनेटिक्स, 9 (6), 325-331। Http://www.nature.com/gim/journal/v9/n6/full/gim200755a.html से लिया गया ।
- हर्लबर्ट, एसएच, और लोम्बार्डी, सीएम (2009)। नेमन-पियर्सन निर्णय सिद्धांत और रूपरेखा के अंतिम पतन नेफिशियन का उदय। एनलस ज़ूलोगिसी फ़ेनिकी, 46 (5), 311-349। से लिया गया http://xa.yimg.com/kq/groups/1542294/508917937/name/HurlbertLombardi2009AZF.pdf ।
- ल्यू, एमजे (2013)। P के लिए P या नहीं: P- मानों की स्पष्ट प्रकृति और वैज्ञानिक अनुमान में उनके स्थान पर। arXiv: 1311.0081 [stat.ME]। से लिया गयाhttp://arxiv.org/abs/1311.0081 ।
- मोय, ला (2008)। नैदानिक परीक्षणों में बायिसियन: स्विच पर सोएं। चिकित्सा में सांख्यिकी, 27 (4), 469-482।
- नाज़ो, आर। (2014, 12 फरवरी)। वैज्ञानिक विधि: सांख्यिकीय त्रुटियां। नेचर न्यूज, 506 (7487)। Http://www.nature.com/news/scientific-method-statutic-errors-1.14700 से लिया गया ।
- वागेनमेकर्स, ईजे (2007)। P मानों की व्यापक समस्याओं का एक व्यावहारिक समाधान । साइकोनोमिक बुलेटिन एंड रिव्यू, 14 (5), 779-804। Http://www.brainlife.org/reprint/2007/Wagenmakers_EJ071000.pdf से लिया गया ।