के वितरण क्या है


17

मेरे पास चार स्वतंत्र रूप से वितरित चर हैं a,b,c,d , प्रत्येक में [0,1] । मैं के वितरण की गणना करना चाहता हूं (ad)2+4bc। मैं के वितरण की गणना की u2=4bc होने के लिए

f2(u2)=14lnu24
(इसलिएu2(0,4]), और केu1=(ad)2होने के लिए
f1(u1)=1u1u1.
अब,u1+u2कावितरणहै (u1,u2 भी स्वतंत्र हैं)
fu1+u2(x)=+f1(xy)f2(y)dy=14041xyxylny4dy,
क्योंकिy(0,4]। यहाँ, यहx>yइसलिए इंटीग्रलfu1+u2(x)=-1 केबराबर है
fu1+u2(x)=140x1xyxylny4dy.
अब मैं इसे Mathematica में सम्मिलित करता हूं और प्राप्त करता हूं कि
fu1+u2(x)=14[x+xlnx42x(2+lnx)].

मैं चार स्वतंत्र सेट किए गए से मिलकर 10 6 संख्या प्रत्येक और का हिस्टोग्राम आकर्षित किया ( एक - ) 2 + 4 :a,b,c,d106(ad)2+4bc

यहाँ छवि विवरण दर्ज करें

और का एक प्लॉट आकर्षित किया :fu1+u2(x)

यहाँ छवि विवरण दर्ज करें

आम तौर पर, प्लॉट हिस्टोग्राम के समान होता है, लेकिन अंतराल पर यह सबसे नकारात्मक है (जड़ 2.27034 पर है)। और सकारात्मक भाग का अभिन्न integr 0.77 है(0,5)0.77

गलती कहाँ हुई? या मैं कहाँ गुम हूँ?

संपादित करें: मैंने पीडीएफ दिखाने के लिए हिस्टोग्राम को बढ़ाया।

यहाँ छवि विवरण दर्ज करें

संपादित करें 2: मुझे लगता है कि मुझे पता है कि मेरे तर्क में समस्या कहां है - एकीकरण सीमा में। क्योंकि और एक्स - वाई ( 0 , 1 ] , मैं नहीं कर सकता बस एक्स 0 साजिश से पता चलता है क्षेत्र मैं में एकीकृत करने के लिए है:।y(0,4]xy(0,1]0x

यहाँ छवि विवरण दर्ज करें

इस का मतलब है मेरे पास है के लिए y ( 0 , 1 ] (इसलिए मेरी का हिस्सा सही था), एक्स एक्स - 1 में वाई ( 1 , 4 ] , और 4 एक्स - 1 में वाई ( 4 , 5 ] । दुर्भाग्य से, गणितज्ञ बाद के दो अभिन्नों की गणना करने में विफल रहता है (ठीक है, यह दूसरी गणना करता है, आउटपुट में एक काल्पनिक इकाई है जो सब कुछ खराब कर देती है ...)।0xy(0,1]fx1xy(1,4]x14y(4,5]

संस्करण 3: ऐसा प्रतीत होता है कि गणितज्ञ निम्नलिखित कोड के साथ अंतिम तीन अभिन्न गणना कर सकते हैं:

(1/4)*Integrate[((1-Sqrt[u1-u2])*Log[4/u2])/Sqrt[u1-u2],{u2,0,u1}, Assumptions ->0 <= u2 <= u1 && u1 > 0]

(1/4)*Integrate[((1-Sqrt[u1-u2])*Log[4/u2])/Sqrt[u1-u2],{u2,u1-1,u1}, Assumptions -> 1 <= u2 <= 3 && u1 > 0]

(1/4)*Integrate[((1-Sqrt[u1-u2])*Log[4/u2])/Sqrt[u1-u2],{u2,u1-1,4}, Assumptions -> 4 <= u2 <= 4 && u1 > 0]

जो एक सही उत्तर देता है :)


2
मुझे पसंद है कि आपने सिमुलेशन द्वारा आपके उत्तर की तर्कशीलता की जांच करने की कोशिश की है। आपकी समस्या यह है कि आप जानते हैं कि आप एक त्रुटि कर चुके हैं, लेकिन काफी नहीं देख सकते हैं। क्या आपने माना है कि आप अपनी पद्धति के प्रत्येक चरण की जांच कर सकते हैं कि त्रुटि कहाँ है? उदाहरण के लिए, क्या त्रुटि आपके ? ठीक है, आप अपनी गणना की हुई पीडीएफ की जांच कर सकते हैं जैसे कि आपने अपने अंतिम उत्तर के लिए किया था। एफ 2 के लिए डिट्टो । यदि f 1 और f 2 दोनों सही हैं, तो आपने उन्हें संयोजित करते समय त्रुटि की। इस तरह के कदम-दर-चरण की जाँच आपको पिन-पॉइंट देती है जहाँ आप गलत हो गए हैं!f1(u1)f2f1f2
सिल्वरफिश

मैंने अपना पहला प्रयास फेंक दिया और इसे एक खरोंच से पुनर्गणना किया। मेरा मानना ​​है कि और f 2 सही हैं, हालांकि मुझे एकता से सामान्य करने के लिए अपने शुरुआती f 1 को मैन्युअल रूप से 2 से गुणा करना पड़ा । लेकिन यह सिर्फ ऊंचाई को बदलता है और यह नहीं बताता है कि मेरे पास नकारात्मक एफ क्यों है । f1f2f1f
कोरी 979

गणना किए गए बीजीय मात्रा की तुलना करने के लिए इस तरह के हिस्टोग्राम का निर्माण करते समय, हिस्टोग्राम को एक वैध घनत्व (और यदि आप कर सकते हैं तो उन्हें सुपरइम्पोज़ करें) को स्केल करें। अपने f1 और f2 के लिए एक समान जांच करें यह सुनिश्चित करने के लिए कि आपके पास उनका अधिकार है; अगर वे सही हैं (मुझे अभी तक उन पर संदेह करने के लिए कोई अच्छा कारण नहीं मिला, लेकिन इसकी दोहरी जांच के लिए सबसे अच्छा है), तो समस्या बाद में होनी चाहिए।
Glen_b -Reinstate मोनिका

जवाबों:


19

अक्सर यह संचयी वितरण कार्यों का उपयोग करने में मदद करता है।

प्रथम,

F(x)=Pr((ad)2x)=Pr(|ad|x)=1(1x)2=2xx.

आगे,

G(y)=Pr(4bcy)=Pr(bcy4)=0y/4dt+y/41ydt4t=y4(1log(y4)).

चलो (छोटी के बीच सीमा 0 ) और सबसे बड़ा ( 5 ) की संभावित मान ( एक - ) 2 + 4 । लेखन एक्स = ( एक - ) 2 CDF साथ एफ और y = 4 के साथ पीडीएफ जी = जी ' , हम गणना करने की जरूरत हैδ05(ad)2+4bcx=(ad)2Fy=4bcg=G

H(δ)=Pr((ad)2+4bcδ)=Pr(xδy)=04F(δy)g(y)dy.

हम इसे बुरा होने की उम्मीद कर सकते हैं- एक समान वितरण पीडीएफ बंद है और इस तरह एसो की परिभाषा में टूटने का उत्पादन करना चाहिए यह कुछ हद तक आश्चर्यजनक है कि गणितज्ञ एक बंद रूप प्राप्त करता है (जो मैं यहां पुन: पेश नहीं करूंगा)। के संबंध में यह फर्क δ वांछित घनत्व देता है। इसे तीन अंतराल के भीतर टुकड़ा-टुकड़ा परिभाषित किया गया है। में 0 < δ < 1 ,Hδ0<δ<1

H(δ)=h(δ)=18(8δ+δ((2+log(16)))+2(δ2δ)log(δ)).

में ,1<δ<4

h(δ)=14((δ+1)log(δ1)+δlog(δ)4δcoth1(δ)+3+log(4)).

4<δ<5

h(δ)=14(δ4δ4+(δ+1)log(4δ1)+4δtanh1((δ4)δδδδ4)1).

Figure

This figure overlays a plot of h on a histogram of 106 iid realizations of (ad)2+4bc. The two are almost indistinguishable, suggesting the correctness of the formula for h.


The following is a nearly mindless, brute-force Mathematica solution. It automates practically everything about the calculation. For instance, it will even compute the range of the resulting variable:

ClearAll[ a, b, c, d, ff, gg, hh, g, h, x, y, z, zMin, zMax, assumptions];
assumptions = 0 <= a <= 1 && 0 <= b <= 1 && 0 <= c <= 1 && 0 <= d <= 1; 
zMax = First@Maximize[{(a - d)^2 + 4 b c, assumptions}, {a, b, c, d}];
zMin = First@Minimize[{(a - d)^2 + 4 b c, assumptions}, {a, b, c, d}];

Here is all the integration and differentiation. (Be patient; computing H takes a couple of minutes.)

ff[x_] := Evaluate@FullSimplify@Integrate[Boole[(a - d)^2 <= x], {a, 0, 1}, {d, 0, 1}];
gg[y_] := Evaluate@FullSimplify@Integrate[Boole[4 b c <= y], {b, 0, 1}, {c, 0, 1}];
g[y_]  := Evaluate@FullSimplify@D[gg[y], y];
hh[z_] := Evaluate@FullSimplify@Integrate[ff[-y + z] g[y], {y, 0, 4}, 
          Assumptions -> zMin <= z <= zMax];
h[z_]  :=  Evaluate@FullSimplify@D[hh[z], z];

Finally, a simulation and comparison to the graph of h:

x = RandomReal[{0, 1}, {4, 10^6}];
x = (x[[1, All]] - x[[4, All]])^2 + 4 x[[2, All]] x[[3, All]];
Show[Histogram[x, {.1}, "PDF"], 
 Plot[h[z], {z, zMin, zMax}, Exclusions -> {1, 4}], 
 AxesLabel -> {"\[Delta]", "Density"}, BaseStyle -> Medium, 
 Ticks -> {{{0, "0"}, {1, "1"}, {4, "4"}, {5, "5"}}, Automatic}]

8
(+1), especially for reminding people that, instead say of density convolutions, "Often it helps to use cumulative distribution functions" -especially when they have such a simple form as here. And you were damn quick, also.
Alecos Papadopoulos

That looks like a neat solution that I'd love to accept - right after I understand it. I'm more a calculus man than a probabilist; at this moment I have three questions: i) how did you use the CDF to get F(x) and G(y), ii) why there's F and g under the integral for H, and iii) how do you from its form that the solution result will be piecewise?
corey979

(1) F and G are the CDFs. They are computed from the definition of a CDF, as indicated by the first equalities following their first appearances. The details should be apparent in the code I have inserted. (2) This is the convolution formula for a sum (more fully explained in a similar calculation at stats.stackexchange.com/a/144237). (3) I inserted a link to another thread about properties of uniform distributions.
whuber

7

Like the OP and whuber, I would use independence to break this up into simpler problems:

Let X=(ad)2. Then the pdf of X, say f(x) is:

enter image description here

Let Y=4bc. Then the pdf of Y, say g(y) is:

enter image description here

The problem reduces to now finding the pdf of X+Y. There may be many ways of doing this, but the simplest for me is to use a function called TransformSum from the current developmental version of mathStatica. Unfortunately, this is not available in a public release at the present time, but here is the input:

TransformSum[{f,g}, z]

which returns the pdf of Z=X+Y as the piecewise function:

enter image description here

Here is a plot of the pdf just derived, say h(z):

enter image description here

Quick Monte Carlo check

The following diagram compares an empirical Monte Carlo approximation of the pdf (squiggly blue) to the theoretical pdf derived above (red dashed). Looks fine.

enter image description here

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.