सामान्य वितरण के संयोजन से मात्राएँ


13

मुझे अलग-अलग उम्र के बच्चों के लिए एंथ्रोपोमेट्रिक आयाम (जैसे कंधे की हड्डी) के वितरण की जानकारी है। प्रत्येक आयु और आयाम के लिए, मेरा मतलब है, मानक विचलन। (मेरे पास आठ मात्राएँ भी हैं, लेकिन मुझे नहीं लगता कि मैं उनसे जो चाहूंगा, प्राप्त कर सकूंगा।)

प्रत्येक आयाम के लिए, मैं लंबाई वितरण के विशेष मात्राओं का अनुमान लगाना चाहूंगा। अगर मुझे लगता है कि प्रत्येक आयाम सामान्य रूप से वितरित किया जाता है, तो मैं इसका मतलब और मानक विचलन के साथ कर सकता हूं। क्या कोई सुंदर सूत्र है जिसका उपयोग मैं वितरण के किसी विशेष परिमाण से जुड़े मूल्य को प्राप्त करने के लिए कर सकता हूं?

रिवर्स काफी आसान है: किसी विशेष मूल्य के लिए, सामान्य वितरण (आयु) में से प्रत्येक के लिए मूल्य के दाईं ओर क्षेत्र प्राप्त करें। परिणामों को योग करें और वितरण की संख्या से विभाजित करें।

अद्यतन : यहाँ ग्राफिकल रूप में एक ही सवाल है। मान लें कि प्रत्येक रंगीन वितरण सामान्य रूप से वितरित किया जाता है। चित्रमय रूप में एक ही सवाल

इसके अलावा, मैं स्पष्ट रूप से बस अलग-अलग लंबाई का एक गुच्छा आज़मा सकता हूं और उन्हें तब तक बदल सकता हूं जब तक कि मुझे एक ऐसा न मिल जाए जो मेरी सटीकता के लिए वांछित मात्रा के करीब हो। मैं सोच रहा हूं कि क्या इससे बेहतर कोई तरीका है। और अगर यह सही दृष्टिकोण है, तो क्या इसका कोई नाम है?


3
क्या आप पूछ रहे हैं कि क्या सामान्य वितरण के मिश्रण की मात्राओं की गणना करने का एक सरल सूत्र है ? इस एप्लिकेशन में, आप उम्र-विशिष्ट मापदंडों के आधार पर उम्र की परवाह किए बिना कंधे की मात्रा (कहने) के लिए पूछ रहे होंगे । क्या यह एक सही व्याख्या है?
whuber

जवाबों:


16

दुर्भाग्य से, मानक सामान्य (जिसमें से अन्य सभी को निर्धारित किया जा सकता है, क्योंकि सामान्य एक स्थान-स्केल परिवार है) क्वांटाइल फ़ंक्शन एक बंद फॉर्म (यानी 'एक सुंदर सूत्र') को स्वीकार नहीं करता है। एक बंद रूप के लिए निकटतम बात यह है कि मानक सामान्य मात्रात्मक फ़ंक्शन फ़ंक्शन, , जो अंतर समीकरण को संतुष्ट करता हैw

d2wdp2=w(dwdp)2

और प्रारंभिक शर्तें और । अधिकांश कंप्यूटिंग वातावरण में एक फ़ंक्शन होता है जो सामान्य रूप से सामान्य मात्रात्मक फ़ंक्शन की गणना करता है। आर में, आप टाइप करेंगेw(1/2)=0w(1/2)=2π

qnorm(p, mean=mu, sd=sigma)

वितरण के 'वें मात्रा प्राप्त करने के लिए ।pN(μ,σ2)


संपादित करें: समस्या की संशोधित समझ के साथ, डेटा मानदंडों के मिश्रण से उत्पन्न होता है, ताकि देखे गए डेटा का घनत्व निम्न हो:

p(x)=iwipi(x)

जहाँ और प्रत्येक माध्य और मानक विचलन साथ कुछ सामान्य घनत्व है । यह निम्नानुसार है कि देखे गए डेटा का CDF हैiwi=1pi(x)μiσi

F(y)=yiwipi(x)dx=iwiypi(x)=iwiFi(y)

जहां माध्य और मानक विचलन साथ सामान्य CDF है । एकीकरण और योग को परस्पर जोड़ा जा सकता है क्योंकि ये अभिन्न परिमित हैं। यह सीडीएफ एक कंप्यूटर पर गणना करने के लिए निरंतर और आसान है, इसलिए उलटा सीडीएफ, , जिसे क्वांटाइल फ़ंक्शन के रूप में भी जाना जाता है, एक लाइन खोज करके गणना की जा सकती है। मैं इस विकल्प के लिए डिफ़ॉल्ट हूं क्योंकि घटक के मिश्रण के क्वांटाइल फ़ंक्शन के लिए कोई सरल सूत्र, घटक वितरण के क्वांटाइल्स के फ़ंक्शन के रूप में, दिमाग में नहीं आता है।μ i σ i F - 1Fi(x)μiσiF1

निम्नलिखित R कोड संख्यात्मक रूप से गणना करता है जो लाइन खोज के लिए बाइसेक्शन का उपयोग करता है। फ़ंक्शन F_inv () क्वांटाइल फ़ंक्शन है, आपको वेक्टर को प्रत्येक युक्त और आपूर्ति करने की आवश्यकता है , । डब्ल्यू मैं , μ मैं , σ मैं पीF1wi,μi,σip

# evaluate the function at the point x, where the components 
# of the mixture have weights w, means stored in u, and std deviations
# stored in s - all must have the same length.
F = function(x,w,u,s) sum( w*pnorm(x,mean=u,sd=s) )

# provide an initial bracket for the quantile. default is c(-1000,1000). 
F_inv = function(p,w,u,s,br=c(-1000,1000))
{
   G = function(x) F(x,w,u,s) - p
   return( uniroot(G,br)$root ) 
}

#test 
# data is 50% N(0,1), 25% N(2,1), 20% N(5,1), 5% N(10,1)
X = c(rnorm(5000), rnorm(2500,mean=2,sd=1),rnorm(2000,mean=5,sd=1),rnorm(500,mean=10,sd=1))
quantile(X,.95)
    95% 
7.69205 
F_inv(.95,c(.5,.25,.2,.05),c(0,2,5,10),c(1,1,1,1))
[1] 7.745526

# data is 20% N(-5,1), 45% N(5,1), 30% N(10,1), 5% N(15,1)
X = c(rnorm(5000,mean=-5,sd=1), rnorm(2500,mean=5,sd=1),
      rnorm(2000,mean=10,sd=1), rnorm(500, mean=15,sd=1))
quantile(X,.95)
     95% 
12.69563 
F_inv(.95,c(.2,.45,.3,.05),c(-5,5,10,15),c(1,1,1,1))
[1] 12.81730

2
प्रश्न का अंतिम पैराग्राफ संकेत देता है कि कुछ और मांगा जा रहा है। मैंने स्पष्टीकरण मांगा है।
whuber

व्हीबर का कूबड़ सही है। मैंने प्रश्न को कम भ्रामक बनाने के लिए एक चित्र जोड़ा।
थॉमस लेविन

1
अब इस समस्या से निपटने के लिए एक अनुसंधान पैकेज है, को देखने के stats.stackexchange.com/questions/390931/...
क्रिस्टोफ Hanck
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.