एक मनमाना वितरण से पी-मूल्य की गणना


14

मुझे आशा है कि यह एक मूर्खतापूर्ण सवाल नहीं है। मान लीजिए कि मेरे पास कुछ मनमाना निरंतर वितरण है। मेरे पास एक आंकड़ा भी है, और मैं इस सांख्यिकीय के लिए एक पी-मूल्य प्राप्त करने के लिए इस मनमाने ढंग से वितरण का उपयोग करना चाहूंगा।

मुझे लगता है कि आर में यह करना आसान है जब तक कि आपका वितरण बिल्ट-इन में से एक को फिट करता है, जैसे कि यह सामान्य है। लेकिन क्या किसी भी वितरण के साथ ऐसा करने का एक आसान तरीका है, इस तरह की धारणा के बिना?

जवाबों:


12

यदि आपके पास एक संचयी वितरण फ़ंक्शन , तो दिए गए सांख्यिकीय टी के लिए p -value की गणना करना केवल 1 - F ( T ) है । यह आर में सीधा है। यदि आपके पास दूसरी तरफ संभाव्यता घनत्व फ़ंक्शन है , तो F ( x ) = x - p ( t ) d tFpT1F(T)F(x)=xp(t)dt । आप इसे अभिन्न विश्लेषणात्मक या संख्यात्मक रूप से पा सकते हैं। आर में इस तरह दिखेगा:

dF <- function(x)dnorm(x)
pF <- function(q)integrate(dF,-Inf,q)$value 

> pF(1)
[1] 0.8413448
> pnorm(1)
[1] 0.8413447

आप ट्यून कर सकते हैं integrate बेहतर सटीकता के लिए । यह निश्चित रूप से विशिष्ट मामलों के लिए विफल हो सकता है, जब अभिन्न अच्छी तरह से व्यवहार नहीं करता है, लेकिन इसे अधिकांश घनत्व कार्यों के लिए काम करना चाहिए।

आप निश्चित रूप से मापदंडों को पास कर सकते हैं pF, यदि आपके पास कई पैरामीटर मान हैं, तो dFहर बार प्रयास करना और फिर से परिभाषित नहीं करना चाहते हैं ।

dF <- function(x,mean=0,sd=1)dnorm(x,mean=mean,sd=sd)
pF <- function(q,mean=0,sd=1)integrate(dF,-Inf,q,mean=mean,sd=sd)$value 

> pF(1,1,1)
[1] 0.5
> pnorm(1,1,1)
[1] 0.5

निश्चित रूप से आप @suncoolsu द्वारा विस्तृत मोंटे-कार्लो विधियों का भी उपयोग कर सकते हैं, यह एकीकरण के लिए सिर्फ एक और संख्यात्मक विधि होगी।


मुझे लगता है कि आपका तरीका मेरे द्वारा सुझाए गए तरीके से आसान है, खासकर अगर उस फ़ंक्शन पर कोई प्रतिबंध नहीं है जिसे आप एकीकृत कर रहे हैं। मुझे संख्यात्मक तकनीक की जानकारी नहीं है। में आर।
suncoolsu

हां, मुझे लगता है कि यह मेरी वर्तमान क्षमताओं के अनुरूप है। धन्यवाद!
एलन एच।

वास्तव में, मुझे यकीन नहीं है कि मैं इन कार्यों का पालन करता हूं। उदाहरण एक सामान्य वितरण के लिए परिणाम देते हैं, लेकिन मैं अपने संभाव्यता घनत्व फ़ंक्शन में कहां प्लग करता हूं?
एलन एच।

(मैंने परीक्षण किए हैं, और मेरा डेटा दूरस्थ रूप से सामान्य नहीं लगता है।)
एलन एच।

@ एलन एच।, अपने घनत्व फ़ंक्शन को प्लग इन करें dF। यही कारण है dFको देखते हुए तर्क पर घनत्व समारोह मूल्य वापस चाहिए।
mpiktas

9

हां, किसी भी आंकड़े के लिए पी-मूल्य प्राप्त करने के लिए किसी भी मनमाने वितरण का उपयोग करना संभव है । सैद्धांतिक और व्यावहारिक रूप से आप इस सूत्र द्वारा (एक तरफा) पी-मूल्य की गणना कर सकते हैं।

पी-vएलयू=पी[टी>टीरोंआरv|एच0एलरों]

कहाँ पे टी ब्याज की परीक्षा-आँकड़ा है और टीरोंआरv मान है कि आपने देखे गए डेटा के लिए गणना की है।

यदि आप के सैद्धांतिक वितरण पता है टी के अंतर्गत एच0, महान! अन्यथा, आप एमसीएमसी अनुकरण का उपयोग कर सकते से उत्पन्न करने के लिए अशक्त वितरण कीटीऔर पी-मूल्य प्राप्त करने के लिए मोंटे कार्लो अभिन्न की गणना । संख्यात्मक एकीकरण तकनीक उस मामले में भी काम करेगी, जिसका आप उपयोग नहीं करना चाहते हैं (हो सकता है) मोंटे कार्लो के तरीकों का उपयोग करना आसान हो सकता है (विशेषकर आर में; मैथेमेटिका एकीकरण में आसान हो सकता है, लेकिन मुझे इसका उपयोग करने का कोई अनुभव नहीं है)

यहाँ आप जो एकमात्र धारणा बना रहे हैं वह है - आप टी के शून्य वितरण को जानते हैं (जो मानक आर यादृच्छिक संख्या जनरेटर प्रारूपों में नहीं हो सकता है)। यही है - जब तक आप अशक्त वितरण जानते हैं, पी-मूल्य की गणना की जा सकती है।


1
मुझे टिप्पणी करनी चाहिए - यह एक कारण है कि पी-मान इतने लोकप्रिय हैं और गलत समझा जाना आसान है। (IMHO)
सनकूलू

ठीक है, यह समझ में आता है। मेरे पास वह है जो मैं मानता हूं कि अशक्त वितरण का एक अच्छा अनुमान है। आर में इसे लागू करने के बारे में कोई संकेत? धन्यवाद!
एलन एच।

1
@ एलन - क्या आप जानते हैं कि अपने नल वितरण से यादृच्छिक मूल्य कैसे उत्पन्न होते हैं? यदि हां, मान लें - नल वितरण से खींचा जाता है - T = c (T1, ..., TN) - p-value = sum (T> T_obs) / N। यदि आप नहीं जानते कि कैसे उत्पन्न किया जाए, तो क्या आपको T1 ... TN प्राप्त करने के लिए मेट्रोपोलिस सैंपलिंग या गिब्स सैम्पलिंग का उपयोग करने की आवश्यकता हो सकती है, लेकिन यह बहुत सक्षम है।
suncoolsu
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.