काटे गए वितरण का क्या अर्थ है?


14

एक डायनेमिक सिस्टम के एक साधारण अंतर समीकरण मॉडल के संवेदनशीलता विश्लेषण के बारे में एक शोध लेख में, लेखक ने सामान्य वितरण के रूप में एक मॉडल पैरामीटर का वितरण प्रदान किया (मतलब = 1e-4, std = 3e-5) रेंज में विभाजित [0.5e] -4 १.५e-४]। फिर वह मॉडल के सिमुलेशन के लिए इस काटे गए वितरण से नमूने का उपयोग करता है। इस कटे-फटे वितरण से अलग वितरण और नमूने का क्या मतलब है?

मैं ऐसा करने के दो तरीकों के साथ आ सकता हूं:

  • एक सामान्य वितरण से नमूना लेकिन सिमुलेशन से पहले निर्दिष्ट सीमा के बाहर गिरने वाले सभी यादृच्छिक मूल्यों को अनदेखा करें।
  • किसी तरह एक विशेष "काटे गए सामान्य" वितरण को प्राप्त करें और इससे नमूने प्राप्त करें।

क्या ये वैध और समकक्ष दृष्टिकोण हैं?

मेरा मानना ​​है कि पहले मामले में, यदि कोई नमूना के प्रयोगात्मक cdf / pdf की साजिश रचने के लिए था, तो यह एक सामान्य वितरण की तरह नहीं लगेगा क्योंकि वक्र नहीं फैलते हैं ।±

जवाबों:


16

वितरण को कम करने के लिए अपने मूल्यों को एक अंतराल तक सीमित करना और घनत्व को फिर से सामान्य करना है ताकि उस सीमा पर अभिन्न 1 हो।

तो, काटना एक अंतराल के वितरण ( एक , ) एक यादृच्छिक चर घनत्व है कि उत्पन्न करने के लिए किया जाएगाN(μ,σ2)(a,b)

pa,b(x)=ϕμ,σ2(x)abϕμ,σ2(y)dyI{x(a,b)}

जहां है एन ( μ , σ 2 ) घनत्व। आप इस घनत्व से कई तरीकों से नमूना ले सकते हैं। एक तरह से (सबसे आसान तरीका मैं के बारे में सोच सकते हैं) यह करने के लिए उत्पन्न करने के लिए किया जाएगा एन ( μ , σ 2 ) मूल्यों और जो कि में शामिल नहीं हैं बाहर फेंक ( एक , )ϕμ,σ2(x)N(μ,σ2)N(μ,σ2)(a,b)अंतराल, जैसा कि आपने उल्लेख किया है। तो, हाँ, आपके द्वारा सूचीबद्ध दो गोलियां एक ही लक्ष्य को पूरा करेगी। इसके अलावा, आप सही है कि इस वितरण से चर का अनुभवजन्य घनत्व (या हिस्टोग्राम) पर लागू नहीं होगा । यह निश्चित रूप से ( , बी ) तक ही सीमित रहेगा ।±(a,b)


17

सामान्य से अनुकरण वितरण तक परिणाम एक अंतराल के भीतर गिर जाता है ( एक , ) ठीक है जब संभावना ρ = एक φ μ , σ 2 ( एक्स )N(μ,σ2)(a,b) काफी बड़ा है। यदि यह बहुत छोटा है, इस प्रक्रिया बहुत महंगी के बाद से की औसत संख्या ड्रॉ एक स्वीकृति के लिए है 1 / ρ

ϱ=abφμ,σ2(x)dx
1/ϱ

मोंटे कार्लो स्टैटिस्टिकल मेथड्स (चैप्टर 2, उदाहरण 2.2), साथ ही साथ मेरे आर्टएक्सिव पेपर में वर्णित है , इस छंटनी वाले सामान्य को अनुकरण करने का एक अधिक कुशल तरीका एक घातांक वितरण के आधार पर स्वीकार-अस्वीकार पद्धति का उपयोग करना है ।E(α)

व्यापकता की हानि के बिना पर विचार करें, इस मामले और σ = 1 । जब = + , एक संभावित महत्वपूर्ण भूमिका निभाई वितरण अनुवाद घातीय वितरण, है ( α , एक ) , घनत्व के साथ जी α ( z ) = α - α ( जेड - एक )μ=0σ=1b=+E(α,a) अनुपात पी एक , ( जेड ) / α ( जेड ) α - α ( जेड - एक )- जेड 2 / 2 तब से घिरा है exp ( α 2 / 2 - α एक ) यदि α > एक और द्वारा विस्तार ( - एक 2 / 2 ) अन्यथा। संबंधित (ऊपरी) बाध्य है

gα(z)=αeα(za)Iza.
pa,(z)/gα(z)eα(za)ez2/2
exp(α2/2αa)α>aexp(a2/2) पहली अभिव्यक्ति से कम से कम है α*=1
{1/αexp(α2/2αa)if α>a,1/αexp(a2/2)otherwise.
जबकि ~ α = एक कम करता है दूसरा बाध्य। Α काइष्टतम विकल्पइसलिए (1) है।
α=12a+12a2+4,(1)
α~=aα

2
यू~unif(Φ(),Φ())एक्स=Φ-1(यू)

2
0

1
शीआन सही है, @ बन्नुल। qnormR लूप में चलना एक अच्छा विचार नहीं है।
स्टीफन लॉरेंट

@ शीआन: यह सच है, लेकिन ऐसे कार्यों को मनमाने ढंग से सटीक करने के लिए डिज़ाइन किया जा सकता है।
नील जी

9

एक सामान्य वितरण से नमूना लेकिन सिमुलेशन से पहले निर्दिष्ट सीमा के बाहर गिरने वाले सभी यादृच्छिक मूल्यों को अनदेखा करें।

यह विधि सही है, लेकिन, जैसा कि उनके जवाब में @ शीआन ने उल्लेख किया है, यह एक लंबा समय लगेगा जब सीमा छोटी होती है (अधिक सटीक रूप से, जब इसका माप सामान्य वितरण के तहत छोटा होता है)।

एफ-1(यू)एफयू~unif(0,1)एफजी(,)जी-1(यू)यू~unif(जी(),जी())

जी-1जी-1जीजी-1जी

महत्व के नमूने का उपयोग करते हुए एक काटे गए वितरण का अनुकरण करें

एन(0,1)जीजीजी(क्ष)=arctan(क्ष)π+12जी-1(क्ष)=तन(π(क्ष-12))। इसलिए, काटे गए काउची वितरण को उलटा विधि द्वारा नमूना करना आसान है और यह काटे गए सामान्य वितरण के महत्व के नमूने के लिए वाद्य चर का एक अच्छा विकल्प है।

थोड़ा सरलीकरण, नमूना लेने के बाद यू~unif(जी(),जी()) और ले रहा है जी-1(यू) लेने के बराबर है तन(यू') साथ में यू'~unif(arctan(),arctan()):

a <- 1
b <- 5
nsims <- 10^5
sims <- tan(runif(nsims, atan(a), atan(b)))

अब प्रत्येक सैंपल वैल्यू के लिए वजन की गणना करनी होगी एक्समैं, अनुपात के रूप में परिभाषित किया गया है φ(एक्स)/जी(एक्स) सामान्यीकरण तक दो घनत्व हैं, इसलिए हम ले सकते हैं

w(एक्स)=exp(-एक्स2/2)(1+एक्स2),
लेकिन यह लॉग-वेट लेने के लिए सुरक्षित हो सकता है:
log_w <- -sims^2/2 + log1p(sims^2)
w <- exp(log_w) # unnormalized weights
w <- w/sum(w)

भारित नमूना (एक्समैं,w(एक्समैं)) हर अंतराल के माप का अनुमान लगाने की अनुमति देता है [यू,v] अंतराल के अंदर गिरने वाले प्रत्येक सैंपल वैल्यू के भार को जोड़कर लक्ष्य वितरण के तहत:

u <- 2; v<- 4
sum(w[sims>u & sims<v])
## [1] 0.1418

यह लक्ष्य संचयी फ़ंक्शन का एक अनुमान प्रदान करता है। हम जल्दी से इसे प्राप्त कर सकते हैं और spatsatपैकेज के साथ प्लॉट कर सकते हैं :

F <- spatstat::ewcdf(sims,w)
# estimated F:
curve(F(x), from=a-0.1, to=b+0.1)
# true F:
curve((pnorm(x)-pnorm(a))/(pnorm(b)-pnorm(a)), add=TRUE, col="red")

ewcdf

# approximate probability of u<x<v:
F(v)-F(u)
## [1] 0.1418

बेशक, नमूना (एक्समैं)निश्चित रूप से लक्ष्य वितरण का एक नमूना नहीं है, लेकिन वाद्य कॉची वितरण का, और किसी को बहुराष्ट्रीय नमूने का उपयोग करके, उदाहरण के लिए, भारित पुन : नमूनाकरण करके लक्ष्य वितरण का एक नमूना मिलता है :

msample <- rmultinom(1, nsims, w)[,1]
resims <- rep(sims, times=msample)
hist(resims) 

hist

mean(resims>u & resims<v)
## [1] 0.1446

एक और विधि: तेजी से उलटा नमूना बदलना

ऑलवर और टाउनसेंड ने निरंतर वितरण के व्यापक वर्ग के लिए एक नमूना विधि विकसित की। यह मैटलैब के लिए chebfun2 लाइब्रेरी के साथ-साथ जूलिया के लिए ApproxFun लाइब्रेरी में लागू किया गया है । मैंने हाल ही में इस पुस्तकालय की खोज की है और यह बहुत ही आशाजनक लगता है (न केवल यादृच्छिक नमूने के लिए)। मूल रूप से यह उलटा तरीका है लेकिन cdf और व्युत्क्रम cdf के शक्तिशाली सन्निकटन का उपयोग करना। इनपुट सामान्यीकरण तक लक्ष्य घनत्व फ़ंक्शन है।

नमूना केवल निम्नलिखित कोड द्वारा उत्पन्न होता है:

using ApproxFun
f = Fun(x -> exp(-x.^2./2), [1,5]);
nsims = 10^5;
x = sample(f,nsims);

जैसा कि नीचे की जाँच की गई है, यह अंतराल की अनुमानित माप देता है [2,4] महत्व नमूना द्वारा पहले प्राप्त एक के करीब:

sum((x.>2) & (x.<4))/nsims
## 0.14191
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.