विचरण की रैखिकता


16

मुझे लगता है कि निम्नलिखित दो सूत्र सत्य हैं:

Var(aX)=a2Var(X)
, जबकि एक एक निरंतर संख्या है
Var(X+Y)=Var(X)+Var(Y)
यदिX ,Y स्वतंत्र हैं

हालांकि, मुझे यकीन नहीं है कि नीचे के साथ क्या गलत है:

जो नहीं है के बराबर 2 2 वी एक आर ( एक्स ) , यानी 4 वी एक आर ( एक्स )

Var(2X)=Var(X+X)=Var(X)+Var(X)
22Var(X)4Var(X)

यदि यह मान लिया जाए कि जनसंख्या से लिया गया नमूना है, तो मुझे लगता है कि हम हमेशा X को अन्य X से स्वतंत्र मान सकते हैं ।XXX

तो मेरी उलझन में क्या गलत है?


8
विचरण रैखिक नहीं है - (अपने पहले बयान इस शो अगर यह थे, तो आप होगा । सहप्रसरण दूसरी ओर द्विरेखीय है।Var(aX)=aVar(X)
बैटमैन

जवाबों:


33

आपके तर्क की रेखा के साथ समस्या है

"मुझे लगता है कि हम हमेशा को अन्य X s से स्वतंत्र मान सकते हैं ।"XX

से स्वतंत्र नहीं है एक्स । यहांएक ही यादृच्छिक चर को संदर्भित करने के लिएप्रतीक X का उपयोग किया जा रहा है। एक बार जब आपअपने सूत्र में प्रकट होने वालेपहले X का मूल्य जान लेते हैं, तो यहप्रकट होने के लिए दूसरे X कामान भी ठीककर देता है। यदि आप उन्हें अलग (और संभावित रूप से स्वतंत्र) यादृच्छिक चर को संदर्भित करना चाहते हैं, तो आपको उन्हें अलग-अलग अक्षरों (जैसे X और Y ) या सदस्यता (उदाहरण X 1 और X 2 )का उपयोग करकेसूचित करना होगा; उत्तरार्द्ध अक्सर (लेकिन हमेशा नहीं) एक ही वितरण से तैयार किए गए चर को दर्शाने के लिए उपयोग किया जाता है।XXXXXXYX1X2

यदि दो चर और Y स्वतंत्र हैं, तो Pr ( X = a | Y = b ) , Pr ( X = a ) के समान है : Y के मूल्य को जानने से हमें X के मूल्य के बारे में कोई अतिरिक्त जानकारी नहीं मिलती है । लेकिन पीआर ( एक्स = एक | एक्स = ) है 1 अगर एक = और 0 अन्यथा: का मूल्य जानने एक्सXYPr(X=a|Y=b)Pr(X=a)YXPr(X=a|X=b)1a=b0Xआपको के मूल्य के बारे में पूरी जानकारी देता है । [आप इस पैराग्राफ में संभावनाओं को संचयी वितरण कार्यों या जहां उचित, प्रायिकता घनत्व कार्यों द्वारा अनिवार्य रूप से एक ही प्रभाव में बदल सकते हैं।]X

चीजों को देखने का एक और तरीका है कि है तो वे शून्य संबंध हो दो चर स्वतंत्र हैं, तो (हालांकि शून्य सहसंबंध स्वतंत्रता संकेत नहीं करता है !), लेकिन है पूरी तरह से खुद के साथ सहसंबद्ध, Corr ( एक्स , एक्स ) = 1 तो एक्स स्वतंत्र नहीं हो सकता खुद का। ध्यान दें कि जब से सहप्रसरण द्वारा दिया जाता है Cov ( एक्स , वाई ) = Corr ( एक्स , वाई ) XCorr(X,X)=1X , तोCov(एक्स,एक्स)=1Cov(X,Y)=Corr(X,Y)Var(X)Var(Y)

Cov(X,X)=1Var(X)2=Var(X)

दो यादृच्छिक चर की राशि के विचरण के लिए अधिक सामान्य सूत्र है

Var(X+Y)=Var(X)+Var(Y)+2Cov(X,Y)

विशेष रूप से, , इसलिएCov(X,X)=Var(X)

Var(X+X)=Var(X)+Var(X)+2Var(X)=4Var(X)

जो कि नियम लागू करने से घटाया जाएगा

Var(aX)=a2Var(X)Var(2X)=4Var(X)

यदि आप रैखिकता में रुचि रखते हैं, तो आप सहसंयोजक के द्विपक्षीयता में दिलचस्पी ले सकते हैं । यादृच्छिक चर के लिए , X , Y और Z (निर्भर या स्वतंत्र) और हमारे पास a , b , c और d हैंWXYZabcd

Cov(aW+bX,Y)=aCov(W,Y)+bCov(X,Y)

Cov(X,cY+dZ)=cCov(X,Y)+dCov(X,Z)

और कुल मिलाकर,

Cov(aW+bX,cY+dZ)=acCov(W,Y)+adCov(W,Z)+bcCov(X,Y)+bdCov(X,Z)

फिर आप अपने पोस्ट में लिखे गए विचरण के लिए (गैर-रैखिक) परिणामों को साबित करने के लिए इसका उपयोग कर सकते हैं:

Var(aX)=Cov(aX,aX)=a2Cov(X,X)=a2Var(X)

Var(aX+bY)=Cov(aX+bY,aX+bY)=a2Cov(X,X)+abCov(X,Y)+baCov(X,Y)+b2Cov(Y,Y)Var(aX+bY)=a2Var(X)+b2Var(Y)+2abCov(X,Y)

उत्तरार्द्ध देता है, एक विशेष मामले के रूप में जब ,a=b=1

Var(X+Y)=Var(X)+Var(Y)+2Cov(X,Y)

जब और Y असंबंधित होते हैं (जिसमें वह मामला शामिल होता है जहां वे स्वतंत्र होते हैं), तो यह Var ( X + Y ) = Var ( X ) + Var ( Y ) तक कम हो जाता है । इसलिए यदि आप एक "रेखीय" तरीके से भिन्नताओं में हेरफेर करना चाहते हैं (जो कि बीजगणितीय रूप से काम करने का एक अच्छा तरीका है), तो इसके बजाय सहसंयोजकों के साथ काम करें और उनकी द्विपक्षीयता का शोषण करें।XYVar(X+Y)=Var(X)+Var(Y)


1
हाँ! मुझे लगता है कि आपने शुरुआत में यह इंगित किया था कि भ्रम अनिवार्य रूप से एक उल्लेखनीय था। मुझे यह तब बहुत मददगार लगा जब एक किताब (बहुत स्पष्ट रूप से, कुछ लोग मज़बूती से कह सकते हैं) ने एक संभाव्य कथन के मूल्यांकन के नियमों की व्याख्या की (ताकि ऐसा हो, उदाहरण के लिए, भले ही आप जानते हैं कि आप क्या मतलब है जहां एक्स ~ वर्दी ( 1..6 ) , यह तकनीकी रूप से है गलत यदि आप एक फेंकने पर विचार कर रहे एन क्रेप्स में (और एक्स + एक्स = 2 एक्सPr(X+X=n)XUniform(1..6)nX+X=2XX1,X2

1
2+PRNG(6)+PRNG(6)2d6=d6+d6

@Vandermonde That's an interesting point. I initially considered mentioning the use of subscripts to distinguish between "different Xs" but didn't bother - think I might edit it in now. The argument that "you'd never get an odd total score if the sum was 2X" is very clear and convincing to someone who can't see the need to distinguish: thanks for sharing it.
Silverfish

0

Another way of thinking about it is that with random variables 2XX+X.

2X would mean two times the value of the outcome of X, while X+X would mean two trials of X. In other words, it's the difference between rolling a die once and doubling the result, vs rolling a die twice.


+1 This is a perfectly clear and correct answer. Welcome to our site!
whuber

Thanks @whuber!
Benjamin
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.