लोग दिए गए मॉडल की संभावना की कंप्यूटिंग के बजाय पी-वैल्यू का उपयोग क्यों करते हैं?


43

मोटे तौर पर एक पी-मूल्य बोलने से एक परिकल्पना (मॉडल) दिए गए प्रयोग के देखे गए परिणाम की संभावना मिलती है। इस संभावना (पी-वैल्यू) के बाद हम अपनी परिकल्पना (यह कितनी संभावना है) का न्याय करना चाहते हैं। लेकिन क्या यह अधिक स्वाभाविक नहीं होगा कि परिकल्पित परिकल्पना की संभावना को देखते हुए परिणाम दिया जाए?

अधिक विवरण में। हमारे पास एक सिक्का है। हम इसे 20 बार फ्लिप करते हैं और हमें 14 सिर मिलते हैं (20 में से 14 को मैं "प्रयोग के परिणाम" कहता हूं)। अब, हमारी परिकल्पना यह है कि सिक्का निष्पक्ष है (सिर और पूंछ की संभावनाएं एक दूसरे के बराबर हैं)। अब हम पी-मूल्य की गणना करते हैं, जो कि सिक्के के 20 टुकड़ों में 14 या अधिक सिर पाने की संभावना के बराबर है। ठीक है, अब हमारे पास यह संभावना है (0.058) और हम इस संभावना का उपयोग अपने मॉडल को जज करने के लिए करना चाहते हैं (यह कैसे संभव है कि हमारे पास एक उचित सिक्का है)।

लेकिन अगर हम मॉडल की संभावना का अनुमान लगाना चाहते हैं, तो हम प्रयोग को देखते हुए मॉडल की संभावना की गणना क्यों नहीं करते? हम मॉडल (पी-मूल्य) दिए गए प्रयोग की संभावना की गणना क्यों करते हैं?


संभावना-कार्य की गणना करने में सक्षम होने के लिए आपको किसी तरह अपने प्रयोग को मॉडल करना होगा।
रस्कोलनिकोव

11
पीट डिक्सन "क्यों वैज्ञानिकों मूल्य पी मूल्यों" (बुलाया 1998 में एक लेख लिखा था वापस psychonomic.org/backissues/1631/R382.pdf ) है कि एक जानकारीपूर्ण पढ़ने हो सकता है। प्रतिस्थापन मैट्रिक ( pbr.psychonomic-journals.org/content/11/5/791.full.pdf ) के रूप में संभावना अनुपात पर एक अच्छा अनुवर्ती ग्लोवर और डिक्सन का 2004 का पेपर होगा ।
माइक लॉरेंस

2
माइक, जो मुझे एक अच्छे उत्तर की तरह संदिग्ध रूप से दिखता है। यह टिप्पणियों में क्या कर रहा है?
मैट पार्कर

जॉन डी कुक ने मेरे एक प्रश्न का एक उत्कृष्ट उत्तर पोस्ट किया, जो मुझे लगता है कि आपको दिलचस्प लगेगा
doug

लोग पी-वैल्यू का उपयोग नहीं करते हैं, सांख्यिकीविद करते हैं। (यह कहते हुए कि यह भी सच है, एक पिथी का विरोध नहीं किया जा सकता है। बेशक, एक बार जब आप प्रत्येक संज्ञा को ठीक से करना शुरू कर देते हैं, तो यह एक पवित्रता खो देता है।)
वेन

जवाबों:


31

इस संभावना की गणना करते हुए कि परिकल्पना सही है प्रायिकता की परिभाषावादी परिभाषा में अच्छी तरह से फिट नहीं होती है (एक लंबी अवधि की आवृत्ति), जिसे संभावना की बेयसियन परिभाषा की अनुमानित विषयवस्तु से बचने के लिए अपनाया गया था। किसी विशेष परिकल्पना का सच एक यादृच्छिक चर नहीं है, यह या तो सच है या यह लंबे समय तक चलने की आवृत्ति नहीं है। यह वास्तव में अधिक स्वाभाविक है कि परिकल्पना की सच्चाई की संभावना में रुचि होना, जो कि IMHO है क्यों पी-मानों को अक्सर इस संभावना के रूप में गलत व्याख्या की जाती है कि अशक्त परिकल्पना सच है। कठिनाई का एक हिस्सा यह है कि बेयस नियम से, हम जानते हैं कि पश्च-संभाव्यता की गणना करने के लिए कि एक परिकल्पना सच है, आपको एक पूर्व संभावना के साथ शुरू करने की आवश्यकता है कि परिकल्पना सच है।

एक बायेसियन इस संभावना की गणना करेगा कि परिकल्पना सही है, डेटा (और उसकी / उसके पूर्व विश्वास)।

बार-बार आने वाले व्यक्ति और बेयसियन दृष्टिकोण के बीच निर्णय लेने में अनिवार्य रूप से एक विकल्प है कि क्या बायेसियन दृष्टिकोण की कथित शालीनता इस तथ्य से अधिक घृणित है कि अक्सर होने वाला दृष्टिकोण आमतौर पर उस प्रश्न का सीधा जवाब नहीं देता है जिसे आप वास्तव में पूछना चाहते हैं - लेकिन इसके लिए जगह है दोनों।

यह पूछने के मामले में कि क्या एक सिक्का उचित है, अर्थात एक सिर की संभावना पूंछ की संभावना के बराबर है, हमारे पास एक परिकल्पना का एक उदाहरण है जिसे हम वास्तविक दुनिया में जानते हैं, यह निश्चित रूप से शुरू से ही लगभग सही है। सिक्के के दो पहलू गैर-सममित हैं, इसलिए हमें सिर और पूंछ की संभावनाओं में थोड़ी सी विषमता की उम्मीद करनी चाहिए, इसलिए यदि सिक्का परीक्षण से गुजरता है, तो इसका मतलब है कि हमारे पास पर्याप्त अवलोकन नहीं हैं निष्कर्ष निकालना कि हम पहले से ही क्या जानते हैं - कि सिक्का बहुत थोड़ा पक्षपाती है!


4
वास्तव में, अधिकांश सिक्के वास्तव में निष्पक्ष रूप से बहुत करीब हैं, और उन्हें पूर्वाग्रह करने के लिए शारीरिक रूप से प्रशंसनीय तरीके से आना मुश्किल है - उदाहरण के लिए stat.columbia.edu/~gelman/research/published/diceRad2.pdf
बेन बोलकर

8
मेले के बहुत करीब होना बिलकुल निष्पक्ष होने के समान नहीं है, जो अशक्त परिकल्पना है। मैं परिकल्पना के परीक्षण की एक पहचान की ओर इशारा कर रहा था, जिसका अर्थ है कि हम अक्सर जानते हैं कि शून्य परिकल्पना झूठी है, लेकिन फिर भी इसका उपयोग करें। एक अधिक व्यावहारिक परीक्षण यह पता लगाने का लक्ष्य रखेगा कि क्या सबूत है कि सिक्का पक्षपाती है, बल्कि महत्वपूर्ण सबूतों के बजाय कि सिक्का पक्षपाती है।
डिक्रान मार्सुपियल

1
हाय, शायद मैं गलत हूं, लेकिन मैंने सोचा कि विज्ञान में, आप कभी नहीं कह सकते कि वैकल्पिक परिकल्पना सच है, आप केवल यह कह सकते हैं कि शून्य परिकल्पना खारिज कर दी गई है और आप वैकल्पिक परिकल्पना को स्वीकार करते हैं। मेरे लिए p मान यह दर्शाता है कि आप एक टाइप 1 त्रुटि करेंगे, अर्थात आप वैकल्पिक परिकल्पना को अस्वीकार कर देंगे और शून्य परिकल्पना को स्वीकार करेंगे (जैसे कि p = .05 या 5% समय। यह टाइप 1 के बीच अंतर करना महत्वपूर्ण है। त्रुटि और टाइप 2 त्रुटि, और वह भूमिका जो शक्ति आपके घटनाओं के मॉडलिंग में निभाती है।
user2238

3
बार-बार होने वाले परीक्षणों के लिए, मैं एक और भी कमजोर कथन का उपयोग करूंगा, जो यह है कि आप या तो "अशक्त परिकल्पना को अस्वीकार करते हैं" या आप "अशक्त परिकल्पना को अस्वीकार करने में विफल" हैं, और कुछ भी स्वीकार नहीं करते हैं। मुख्य बिंदु यह है कि (पक्षपाती सिक्के के मामले में) कभी-कभी आप एक प्राथमिकताओं को जानते हैं कि शून्य परिकल्पना सच नहीं है, आपके पास यह प्रदर्शित करने के लिए पर्याप्त डेटा नहीं है कि यह सच नहीं है; किस स्थिति में इसे "स्वीकार" करना अजीब होगा। बार-बार होने वाले परीक्षणों में टाइप- I और टाइप- II त्रुटि दर होती है, लेकिन इसका मतलब यह नहीं है कि वे किसी विशेष परिकल्पना की सत्यता की बात कर सकते हैं, जैसा कि ओपी में है।
डिक्रान मार्सुपियल

2
@ user2238 पी-मूल्य प्रकार I त्रुटि की संभावना है केवल जब शून्य परिकल्पना "सरल" (संयुक्त नहीं) है और यह सच भी है। उदाहरण के लिए, एक-तरफा परीक्षण में कि क्या कोई सिक्का पूंछ ( ) की ओर पक्षपाती है , दो सिरों वाले सिक्के का उपयोग करके I त्रुटि के अवसर की गारंटी देता है, भले ही पी-वैल्यू से शून्य हो कोई भी परिमित नमूना नॉनजरो होगा। H0:p<0.5
whuber

18

वास्तव में एक पुराने प्रश्न का उत्तर देने जैसा कुछ भी नहीं है, लेकिन यहाँ जाता है ...।

पी-वैल्यू लगभग वैध परिकल्पना परीक्षण हैं। यह Jaynes की 2003 प्रायिकता सिद्धांत पुस्तक (दोहराए गए प्रयोगों: प्रायिकता और आवृत्ति) से लिया गया एक थोड़ा अनुकूलित अंश है। मान लें कि हमारे पास एक शून्य परिकल्पना जिसे हम परीक्षण करना चाहते हैं। हम डेटा है और पूर्व जानकारी । मान लीजिए कि कुछ अनिर्दिष्ट परिकल्पना जो हम खिलाफ परीक्षण करेंगे । खिलाफ पीछे का अनुपात फिर निम्न द्वारा दिया जाता है: डी मैं एच एच 0 एच एच 0H0DIHAH0HAH0

P(HA|DI)P(H0|DI)=P(HA|I)P(H0|I)×P(D|HAI)P(D|H0I)

अब दाहिने हाथ की ओर पहला शब्द डेटा से स्वतंत्र है, इसलिए डेटा केवल दूसरे शब्द के माध्यम से परिणाम को प्रभावित कर सकता है। अब, हम हमेशा एक वैकल्पिक परिकल्पना आविष्कार कर सकते हैं जैसे कि - एक "सही फिट" परिकल्पना। इस प्रकार हम उपयोग कर सकते हैं कि डेटा कितनी अच्छी तरह से नल पर किसी भी वैकल्पिक परिकल्पना का समर्थन कर सकता है। इस बात की कोई वैकल्पिक परिकल्पना नहीं है कि डेटा से अधिक समर्थन कर सकता है । हम विकल्पों के वर्ग को भी प्रतिबंधित कर सकते हैं, और परिवर्तन यह है कि को उस वर्ग के भीतर अधिकतम संभावना (सामान्यीकृत स्थिरांक सहित) द्वारा प्रतिस्थापित किया जाता है। यदि P ( D | H A I ) = 1 1HAP(D|HAI)=1 H01 |1P(D|H0I)H0 1P(D|H0I)H0HAt(D)>t0t(D)Dt(D)1P(D|H0I)1P(D|H0I)बहुत छोटा होने लगता है, फिर हम अशक्त होने लगते हैं, क्योंकि और बीच विकल्पों की संख्या बढ़ती है (कुछ गैर-नगण्य पूर्व संभावनाओं के साथ)। लेकिन यह बहुत अधिक है जो पी-मूल्यों के साथ किया जाता है, लेकिन एक अपवाद के साथ: हम कुछ सांख्यिकीय लिए और सांख्यिकीय के कुछ "खराब" क्षेत्र के लिए संभावना की गणना नहीं करते हैं। हम लिए संभाव्यता की गणना करते हैं - हमारे पास वास्तव में जानकारी है, इसके बजाय कुछ सबसेट के अलावा, ।H0HAt(D)>t0t(D)Dt(D)

एक और कारण है कि लोग पी-वैल्यू का उपयोग करते हैं, वे अक्सर "उचित" परिकल्पना परीक्षण के लिए राशि लेते हैं, लेकिन गणना करना आसान हो सकता है। हम सामान्य विचरण के साथ सामान्य माध्य के परीक्षण के बहुत सरल उदाहरण के साथ इसे दिखा सकते हैं। हम डेटा है एक ग्रहण मॉडल के साथ (पहले जानकारी के भाग )। हम का परीक्षण करना चाहते हैं । फिर हमारे पास, थोड़ी गणना के बाद:एक्स मैं ~ एन आर एम एक एल ( μ , σ 2 ) मैं एच 0 : μ = μ 0D{x1,,xN}xiNormal(μ,σ2)IH0:μ=μ0

P(D|H0I)=(2πσ2)N2exp(N[s2+(x¯μ0)2]2σ2)

जहाँ पर और । इससे पता चलता है कि का अधिकतम मूल्य तब प्राप्त होगा जब । अधिकतम मूल्य है:x¯=1Ni=1Nxis2=1Ni=1N(xix¯)2P(D|H0I)μ0=x¯

P(D|HAI)=(2πσ2)N2exp(Ns22σ2)

इसलिए हम इन दोनों का अनुपात लेते हैं, और हम प्राप्त करते हैं:

P(D|HAI)P(D|H0I)=(2πσ2)N2exp(Ns22σ2)(2πσ2)N2exp(Ns2+N(x¯μ0)22σ2)=exp(z22)

जहाँ "Z-आँकड़ा" है। के बड़े मूल्यअशक्त परिकल्पना पर संदेह करना, सामान्य अर्थ के बारे में परिकल्पना के सापेक्ष जो डेटा द्वारा सबसे अधिक मजबूती से समर्थित है। हम यह भी देख सकते हैं कि डेटा की जरूरत का एकमात्र हिस्सा है, और इस प्रकार यह परीक्षण के लिए पर्याप्त आँकड़ा है।z=Nx¯μ0σ|z|x¯

इस समस्या के लिए पी-मूल्य दृष्टिकोण लगभग समान है, लेकिन रिवर्स में। हम पर्याप्त सांख्यिकीय साथ शुरू करते हैं , और हम इसके नमूने वितरण को शांत करते हैं, जो आसानी से को दिखाया जाता है। - जहाँ मैंने चर को प्रेक्षित मान से अलग करने के लिए एक बड़े अक्षर का उपयोग किया है । अब हमें एक ऐसा क्षेत्र खोजने की जरूरत है जो अशक्त परिकल्पना पर संदेह करता है: यह आसानी से उन क्षेत्रों में देखा जाता है जहांबड़ा है। इसलिए हम इस संभावना की गणना कर सकते हैं किx¯X¯Normal(μ,σ2N)X¯x¯|X¯μ0||X¯μ0||x¯μ0|निरूपित परिकल्पना से कितनी दूर देखा गया डेटा का एक उपाय है। पहले की तरह, यह एक सरल गणना है, और हम प्राप्त करते हैं:

p-value=P(|X¯μ0||x¯μ0||H0)
=1P[N|x¯μ0|σNX¯μ0σN|x¯μ0|σ|H0]
=1P(|z|Z|z||H0)=2[1Φ(|z|)]

अब, हम देख सकते हैं कि p- मान एक घटता हुआ फ़ंक्शन है, जिसका अर्थ है कि हम अनिवार्य रूप से "उचित" परिकल्पना परीक्षण के समान उत्तर प्राप्त करते हैं। जब पी-मान एक निश्चित सीमा से नीचे होता है, तो अस्वीकार करना, जब पीछे की ओर एक निश्चित सीमा से ऊपर होता है, तो अस्वीकार करना एक ही बात है। हालाँकि, ध्यान दें कि उचित परीक्षण करने में, हमें विकल्पों की श्रेणी को परिभाषित करना था, और हमें उस वर्ग पर एक संभावना को अधिकतम करना था। पी-वैल्यू के लिए, हमें एक आँकड़ा खोजना होगा, और इसके सैंपलिंग वितरण की गणना करनी होगी, और अवलोकन किए गए मूल्य पर इसका मूल्यांकन करना होगा। कुछ अर्थों में एक आंकड़ा चुनना एक वैकल्पिक परिकल्पना को परिभाषित करने के बराबर है, जिस पर आप विचार कर रहे हैं।|z|

यद्यपि वे दोनों इस उदाहरण में आसान चीजें हैं, लेकिन वे हमेशा अधिक जटिल मामलों में इतने आसान नहीं होते हैं। कुछ मामलों में इसका नमूना वितरण का उपयोग करने और गणना करने के लिए सही आंकड़ा चुनना आसान हो सकता है। दूसरों में यह विकल्प की श्रेणी को परिभाषित करना आसान हो सकता है, और उस वर्ग को अधिकतम कर सकता है।

पी-मूल्य आधारित परीक्षण की एक बड़ी मात्रा के लिए यह सरल उदाहरण खाता है, बस इसलिए कि कई परिकल्पना परीक्षण "अनुमानित सामान्य" विविधता के हैं। यह आपके सिक्के की समस्या का एक अनुमानित उत्तर भी प्रदान करता है (द्विपद के लिए सामान्य सन्निकटन का उपयोग करके)। यह यह भी दर्शाता है कि इस मामले में पी-मूल्य आपको भटक ​​नहीं सकते हैं, कम से कम एक एकल परिकल्पना का परीक्षण करने के मामले में। इस मामले में, हम कह सकते हैं कि पी-मान अशक्त परिकल्पना के खिलाफ सबूत का एक उपाय है।

हालांकि, पी-वैल में बेयस फैक्टर की तुलना में कम व्याख्यात्मक पैमाने हैं - पी-मूल्य और नल के खिलाफ सबूत की "राशि" के बीच की कड़ी जटिल है। पी-वैल्यू बहुत जल्दी छोटा हो जाता है - जिससे उन्हें ठीक से उपयोग करना मुश्किल हो जाता है। वे डेटा द्वारा प्रदान किए गए नल के खिलाफ समर्थन को ओवरस्टैट करते हैं। यदि हम n- के विपरीत संभावनाओं के रूप में p- मानों की व्याख्या करते हैं - बाधाओं के रूप में , जब वास्तविक साक्ष्य , और बाधाओं के रूप में जब वास्तविक साक्ष्य । या इसे दूसरे तरीके से रखने के लिए, एक संभावना के रूप में पी-मूल्य का उपयोग करते हुए कि नल यहां झूठा है, पूर्व बाधाओं को स्थापित करने के बराबर है। तो पी-मूल्य के लिए0.193.870.05196.830.1शून्य के खिलाफ निहित पूर्व बाधाओं और के पी-मूल्य के लिए शून्य के खिलाफ निहित पूर्व बाधाओं ।2.330.052.78


4
+1। "... एक आँकड़ा चुनना वैकल्पिक परिकल्पना को परिभाषित करने के बराबर है जिसे आप विचार कर रहे हैं" मुझे गहरी अंतर्दृष्टि के रूप में प्रभावित करता है।
whuber

अच्छा उत्तर। यह ध्यान देने योग्य है (हालांकि स्पष्ट) है कि विकल्प के एक वर्ग से बड़ा है उस के साथ काम कर रहा है कुछ छोटे के लिए अक्सर computationally निषेधात्मक हो सकता है, अकेले अगर एक एक अनंत या विकल्प के अगणनीय संख्या है, जो भी हो सकती है के साथ काम करने के लिए है प्रयोग में। पी-मूल्य दृष्टिकोण का एक बड़ा प्लस यह है कि यह अक्सर (आमतौर पर?) कम्प्यूटेशनल रूप से सरल / ट्रैक्टेबल होता है। कश्मीरkk
फहीम मीठा

1
@ faheemmitha- आप दहनशील विस्फोट के बारे में सही हैं, हालांकि यह मेरे द्वारा वर्णित दृष्टिकोण के लिए नहीं होता है (वास्तव में आप दिखा सकते हैं कि बेयस दृष्टिकोण प्रभावी रूप से अवशिष्ट को परिभाषित कर रहा है)। ऐसा इसलिए है क्योंकि हमें केवल कक्षा को परिभाषित करने की आवश्यकता है। हमें प्रत्येक विकल्प का मूल्यांकन करने की आवश्यकता नहीं है, बस सबसे अच्छा लगता है।
probabilityislogic

यह जवाब क्यों है सामुदायिक विकी?
अमीबा का कहना है कि मोनिका

10

एक पूर्व शैक्षणिक के रूप में, जो अभ्यास में चले गए, मैं एक शॉट लूंगा। लोग पी-वैल्यू का उपयोग करते हैं क्योंकि वे उपयोगी हैं। आप इसे पाठ्यपुस्तकों में सिक्के के उतार-चढ़ाव के उदाहरणों में नहीं देख सकते। यकीन है कि वे वास्तव में ठोस रूप से ठोस नहीं हैं, लेकिन शायद यह उतना जरूरी नहीं है जितना हम यह सोचना चाहते हैं कि जब हम अकादमिक रूप से सोच रहे हैं। डेटा की दुनिया में, हम संभावित रूप से अनंत चीज़ों से घिरे हुए हैं, जो अगली चीज़ों पर ध्यान देंगे। पी-मूल्य संगणना के साथ आप सभी को इस बात का विचार करना चाहिए कि किस प्रकार का डेटा निर्बाध है और किस प्रकार का डेटा दिलचस्प हो सकता है (ठीक है, और निर्बाध के लिए एक प्रायिकता मॉडल)। फिर व्यक्तिगत रूप से या सामूहिक रूप से हम बहुत सरल चीजों को स्कैन कर सकते हैं, निर्बाध के थोक को खारिज कर सकते हैं। पी-वैल्यू हमें यह कहने की अनुमति देता है "यदि मैं इस बारे में सोचने पर बहुत प्राथमिकता नहीं देता हूं, अन्यथा


10

आपका सवाल अक्सर तर्कवादी तर्क का एक बड़ा उदाहरण है और वास्तव में काफी स्वाभाविक है। मैंने परिकल्पना परीक्षणों की प्रकृति को प्रदर्शित करने के लिए अपनी कक्षाओं में इस उदाहरण का उपयोग किया है। मैं एक स्वयंसेवक से एक सिक्का फ्लिप के परिणामों की भविष्यवाणी करने के लिए कहता हूं। कोई फर्क नहीं पड़ता कि परिणाम क्या है, मैं "सही" अनुमान दर्ज करता हूं। हम ऐसा बार-बार करते हैं जब तक कि कक्षा संदिग्ध न हो जाए।

अब, उनके सिर में एक अशक्त मॉडल है। वे सिक्का को उचित मानते हैं। यह देखते हुए कि सब कुछ उचित होने पर 50% सही होने की धारणा, हर क्रमिक सही अनुमान से अधिक संदेह पैदा करता है कि उचित सिक्का मॉडल गलत है। कुछ सही अनुमान हैं और वे मौके की भूमिका स्वीकार करते हैं। 5 या 10 सही अनुमानों के बाद, वर्ग को हमेशा संदेह होने लगता है कि निष्पक्ष सिक्के की संभावना कम है। इस प्रकार यह अक्सर मॉडल के तहत परिकल्पना परीक्षण की प्रकृति के साथ है।

यह परिकल्पना परीक्षण पर लगातार लेने वाले का स्पष्ट और सहज प्रतिनिधित्व है। यह देखा गया डेटा की संभावना है कि शून्य सत्य है। यह वास्तव में काफी आसान है जैसा कि इस आसान प्रयोग द्वारा दिखाया गया है। हम इसे इस बात के लिए लेते हैं कि मॉडल 50-50 है, लेकिन सबूत के रूप में, मैं उस मॉडल को अस्वीकार करता हूं और संदेह करता हूं कि खेल में कुछ और है।

इसलिए, यदि मैं जो निरीक्षण करता हूं, उसकी संभावना कम है कि मुझे जो मॉडल मान (पी-वैल्यू) दिया गया है, तो मुझे अपने ग्रहण किए गए मॉडल को खारिज करने का कुछ विश्वास है। इस प्रकार, एक पी-वैल्यू मेरे ग्रहण किए गए मॉडल के खिलाफ मौका की भूमिका को ध्यान में रखते हुए साक्ष्य का एक उपयोगी उपाय है।

एक अस्वीकरण: मैंने इस अभ्यास को एक लंबे समय से भूल गए लेख से लिया, जो मुझे याद है, एएसए पत्रिकाओं में से एक था।


ब्रेट, यह दिलचस्प और एक महान उदाहरण है। मेरे लिए यहां मॉडल ऐसा प्रतीत होता है कि लोगों को बेतरतीब ढंग से सिर और पूंछ के क्रम की उम्मीद है। उदाहरण के लिए, यदि मुझे एक पंक्ति में 5 सिर दिखाई देते हैं, तो मुझे अनुमान है कि यह एक गैर-यादृच्छिक प्रक्रिया का एक उदाहरण है। वास्तव में, और मैं यहां गलत हो सकता हूं, एक टोइन कोस (यादृच्छिकता मानकर) की संभावना 50% सिर और 50% पूंछ है, और यह पिछले परिणाम से पूरी तरह से स्वतंत्र है। मुद्दा यह है कि अगर हमने एक सिक्का 50000 बार फेंका, और पहले 25000 प्रमुख थे, बशर्ते शेष 25000 पूंछ थे, यह अभी भी पूर्वाग्रह की कमी को दर्शाता है
user2238

@ user2238: आपका अंतिम कथन सत्य है, लेकिन यह अत्यंत दुर्लभ होगा। वास्तव में, 5 tosses में 5 सिर का एक रन देखकर उस समय का केवल 3% होगा यदि सिक्का उचित है। यह हमेशा संभव है कि अशक्त सत्य है और हमने एक दुर्लभ घटना देखी है।
ब्रेट

6

"मोटे तौर पर पी-वैल्यू एक परिकल्पना (मॉडल) दिए गए प्रयोग के देखे गए परिणाम की संभावना देता है।"

लेकिन यह नहीं है। मोटे तौर पर भी नहीं - यह एक आवश्यक भेद करता है।

मॉडल निर्दिष्ट नहीं किया गया है, जैसा कि रस्कोलनिकोव बताते हैं, लेकिन मान लें कि आप एक द्विपद मॉडल (स्वतंत्र सिक्का टॉस, निश्चित अज्ञात सिक्का पूर्वाग्रह) का मतलब है। परिकल्पना का दावा है कि इस मॉडल में प्रासंगिक पैरामीटर, प्रमुखों की पूर्वाग्रह या संभावना 0.5 है।

"इस संभावना (पी-मूल्य) के बाद हम अपनी परिकल्पना (यह कैसे संभव है) का न्याय करना चाहते हैं"

हम वास्तव में यह निर्णय करना चाहते हैं, लेकिन ऐसा करने में हमारी मदद करने के लिए एक पी-वैल्यू (और डिजाइन नहीं किया गया) नहीं होगा।

"लेकिन क्या यह अधिक स्वाभाविक नहीं होगा कि परिकल्पना की संभावना को देखते हुए गणना की जाए?"

शायद यह होगा। ऊपर Bayes की सभी चर्चा देखें।

"[...] अब हम पी-मूल्य की गणना करते हैं, जो कि सिक्के के 20 टुकड़ों में 14 या अधिक सिर पाने की संभावना के बराबर है। ठीक है, अब हमारे पास यह संभावना (0.058) है और हम इस संभावना का उपयोग करना चाहते हैं। हमारे मॉडल का न्याय करें (यह कैसे संभव है कि हमारे पास एक उचित सिक्का है)। ”

'हमारी परिकल्पना, हमारे मॉडल को सत्य मानते हुए', लेकिन अनिवार्य रूप से: हाँ। बड़े पी-वैल्यू संकेत करते हैं कि सिक्के का व्यवहार इस परिकल्पना के अनुरूप है कि यह उचित है। (वे भी आम तौर पर परिकल्पना के झूठे होने के अनुरूप हैं, लेकिन इतना सच होने के करीब कि हमारे पास बताने के लिए पर्याप्त डेटा नहीं है, 'सांख्यिकीय शक्ति' देखें।)

"लेकिन अगर हम मॉडल की संभावना का अनुमान लगाना चाहते हैं, तो हम प्रयोग को देखते हुए मॉडल की संभावना की गणना क्यों नहीं करते? हम मॉडल (पी-वैल्यू) को देखते हुए प्रयोग की संभावना की गणना क्यों करते हैं?"

हम वास्तव में इस सेटअप में परिकल्पना को दिए गए प्रयोगात्मक परिणामों की संभावना की गणना नहीं करते हैं। आखिरकार, संभावना केवल 10 प्रमुखों को देखने की 0.176 है जब परिकल्पना सच होती है, और यह सबसे संभावित मूल्य है। यह बिल्कुल भी ब्याज की मात्रा नहीं है।

यह भी प्रासंगिक है कि हम आमतौर पर या तो मॉडल की संभावना का अनुमान नहीं लगाते हैं। दोनों बार-बारवादी और बेयसियन जवाब आमतौर पर मान लेते हैं कि मॉडल सही है और इसके मापदंडों के बारे में उनकी राय है। वास्तव में, सभी बायेसियन सिद्धांत रूप में भी मॉडल की संभावना में दिलचस्पी नहीं लेंगे , यह है: संभावना है कि पूरी स्थिति एक द्विपद वितरण द्वारा अच्छी तरह से मॉडलिंग की गई थी। वे बहुत सारे मॉडल की जाँच कर सकते हैं, लेकिन वास्तव में कभी नहीं पूछते हैं कि अन्य संभावित मॉडल के अंतरिक्ष में द्विपद की कितनी संभावना थी। बेयस फैक्टर की परवाह करने वाले बायसी इच्छुक हैं, दूसरों को इतना नहीं।


2
हम्म, दो डाउन वोट। यदि उत्तर इतना बुरा है तो अच्छा होगा कि कुछ टिप्पणी हो।
संयुक्ताक्षरी

मुझे यह जवाब पसंद आया। कभी-कभी लोग वोट उत्तरों को नीचे कर देते हैं क्योंकि यह एक पाठ्यपुस्तक के समान नहीं है और चर्चा की सभी साइटों को हटाने की कोशिश करता है जिसमें सामान्य ज्ञान या विवरण की तरह परतें होती हैं।
वास

मैं नीचे नहीं गया, लेकिन मुझे लगता है कि एक समस्या यह है कि आपकी बात स्पष्ट नहीं है।
एल्विस

6

अन्य उत्कृष्ट उत्तरों के लिए एक पक्ष ध्यान दें: इस अवसर पर कई बार हम ऐसा नहीं करते हैं। उदाहरण के लिए, बहुत हाल तक, उन्हें एपिडेमियोलॉजी पत्रिका में स्पष्ट रूप से प्रतिबंधित कर दिया गया था - अब वे केवल "दृढ़ता से हतोत्साहित" हैं और संपादकीय बोर्ड ने उन्हें यहां चर्चा के लिए अंतरिक्ष की एक जबरदस्त मात्रा में समर्पित किया: http: //junnals.lww। com / epidem / पृष्ठों / collectiondetails.aspx? TopicalCollectionId = 4


3

मैं केवल कुछ टिप्पणी जोड़ूंगा; मैं आपसे सहमत हूँ कि -values ​​का अधिक उपयोग हानिकारक है।p

  • लागू आँकड़े में कुछ लोगों का गलत मतलब निकालने -values, विशेष रूप से उन संभावना है कि रिक्त परिकल्पना सच है के रूप में समझने; cf इन कागजात: पी वैल्यूज़ एरर प्रोबेबिलिटीज नहीं हैं और हम वास्तव में यह क्यों नहीं जानते कि "सांख्यिकीय महत्व" का अर्थ है: एक प्रमुख शैक्षिक विफलताp

  • एक अन्य आम ग़लतफ़हमी है कि -values, प्रभाव के आकार या वर्गीकरण के लिए उनकी क्षमता को दर्शाते हैं, जब वे नमूने के आकार और प्रभावों के आकार दोनों को दर्शाते हैं। यह कुछ लोगों को यह समझाने के लिए कागजात लिखने के लिए प्रेरित करता है कि चर को "चरित्र से दृढ़ता से जुड़ा" क्यों दिखाया गया है (अर्थात बहुत छोटे पी मानों के साथ) यह एक जैसे खराब क्लासिफायर हैं ...p

  • निष्कर्ष निकालने के लिए, मेरी राय यह है कि प्रकाशन मानकों के कारण वैल्यू का व्यापक रूप से उपयोग किया जाता है। लागू क्षेत्रों में (बायोस्टैट्स ...) उनका आकार कभी-कभी कुछ समीक्षकों की एकमात्र चिंता है।p


2

संभावना को परिभाषित करें । वाकई। इससे पहले कि हम और आगे बढ़ें, हमें शर्तों पर समझौता करना होगा।

DM

P(M|D)P(M,D)

106/28109

चिकित्सा स्थितियों और उनके काम करने के तरीके के साथ व्यावहारिक दुनिया की समस्याओं में, आप संयुक्त वितरण के इन घटकों में से किसी के साथ आने में सक्षम नहीं हो सकते हैं, और शर्त नहीं लगा सकते हैं।

P(M,D)p=0.5P(p=0.5)=0B(0.5,0.5)B(1000,1000)0.528109/(28109+106)

इसके बारे में बात करने में कठिनाइयों के अलावा कि वास्तव में सही मॉडल क्या हैं, बायेसियन विधियों में मॉडल प्रक्षेपन से निपटने के सीमित तरीके हैं। यदि आप गॉसियन त्रुटियों को पसंद नहीं करते हैं, या आप सिक्का टॉस की स्वतंत्रता पर विश्वास नहीं करते हैं (आपका हाथ पहले 10,000 या तो टॉस के बाद थक जाता है, तो आप इसे पहले 1,000 या उतनी बार उच्च के रूप में टॉस नहीं करते हैं,) व्हिच संभावनाओं को प्रभावित कर सकता है), जो आप बायेसियन दुनिया में कर सकते हैं वह एक और अधिक जटिल मॉडल बनाने के लिए है - सामान्य मिश्रण के लिए स्टिक ब्रेकिंग पुजारी, समय के साथ संभावनाओं में विभाजन, जो भी हो। लेकिन ह्यूबर सैंडविच मानक त्रुटियों के लिए कोई प्रत्यक्ष एनालॉग नहीं है जो स्पष्ट रूप से स्वीकार करते हैं कि मॉडल को गलत किया जा सकता है, और उसके लिए खाते के लिए तैयार हैं।

<Ω,F,P>ΩFσPAΩAFXt,t[0,1]{Xt>0,t[0,0.5]}{Xt>0,t{t1,t2,,tk}}σkσ


1

लेकिन अगर हम मॉडल की संभावना का अनुमान लगाना चाहते हैं, तो हम प्रयोग को देखते हुए मॉडल की संभावना की गणना क्यों नहीं करते?

क्योंकि हम नहीं जानते कि कैसे। मॉडल की अनंत संख्या संभव है, और उनकी संभावना स्थान परिभाषित नहीं है।

यहाँ एक व्यावहारिक उदाहरण है। मान लीजिए कि मैं यूएस जीडीपी का पूर्वानुमान लगाना चाहता हूं। मुझे समय श्रृंखला मिलती है, और एक मॉडल फिट होता है। क्या संभावना है कि यह मॉडल सही है?

तो, चलो वास्तव में जीडीपी श्रृंखला में एक यादृच्छिक चलना मॉडल फिट करते हैं: जहां विकास दर है और एक यादृच्छिक त्रुटि है। नीचे मेरा कोड बस यही करता है, और यह पूर्वानुमान (लाल) भी उत्पन्न करता है और इसकी तुलना ऐतिहासिक डेटा (नीला) से करता है। μ टी

Δlnyt=μ+et
μet

यहाँ छवि विवरण दर्ज करें

हालांकि, किसने कहा कि जीडीपी एक यादृच्छिक चलने की प्रक्रिया है? यह एक प्रवृत्ति प्रक्रिया क्या थी? तो, चलिए फिट करते हैं: जहां समय की प्रवृत्ति का ढलान है। ट्रेंड मॉडल का उपयोग करने का पूर्वानुमान उसी चार्ट (पीले) पर दिखाया गया है। c

lnyt=ct+et
c

अब, आप इस संभावना की गणना कैसे करेंगे कि मेरा यादृच्छिक चलना मॉडल सही है? MLE के भीतर हम डेटा सेट दिए गए बहाव की संभावना की गणना कर सकते हैं , लेकिन यह संभावना नहीं है। दूसरा, और अधिक महत्वपूर्ण बात, आप इस संभावना की गणना कैसे करेंगे कि मॉडल इस बहाव के साथ यादृच्छिक चलना है यह जानकर कि यह एक प्रवृत्ति मॉडल भी हो सकता है? यह किसी भी अन्य मॉडल की संख्या हो सकती है जो इस तरह के गतिशील का उत्पादन करती है।μ

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.