Iterated Expectations के कानून का एक सामान्यीकरण


43

मैं हाल ही में इस पहचान में आया:

E[E(Y|X,Z)|X]=E[Y|X]

मैं निश्चित रूप से उस नियम के सरल संस्करण से परिचित हूं, अर्थात् लेकिन मैं इसके लिए औचित्य नहीं ढूंढ पा रहा था इसका सामान्यीकरण।E[E(Y|X)]=E(Y)

मैं आभारी रहूंगा यदि कोई मुझे इस तथ्य के लिए एक न-तकनीकी संदर्भ में इंगित कर सकता है, या इससे भी बेहतर, अगर कोई इस महत्वपूर्ण परिणाम के लिए एक साधारण प्रमाण दे सकता है।


2
यदि को कुछ पर वातानुकूलित किया गया होता, तो क्या यह बिल्कुल सरल संस्करण से बाहर नहीं होता? yx
मेहरदाद

जवाबों:


36

सामान्य उपचार

हमें यह याद रखना चाहिए कि जहां हम यादृच्छिक चर पर शर्त लगाते हैं, वह गलत है, हालांकि अर्थ के रूप में, संकेतन। वास्तव में हम इन यादृच्छिक चर उत्पन्न करने वाले सिग्मा-बीजगणित पर शर्त लगाते हैं। दूसरे शब्दों में E[YX] मतलब करने के लिए है E[Yσ(X)] । यह टिप्पणी "अनौपचारिक उपचार" में जगह से बाहर लग सकती है, लेकिन यह हमें याद दिलाती है कि हमारी कंडीशनिंग इकाइयां सेट का संग्रह हैं (और जब हम एक एकल मूल्य पर शर्त लगाते हैं, तो यह एक सिंगलटन सेट है)। और इन सेटों में क्या है? उनमें जानकारी होती हैजिसके साथ रैंडम वैरिएबल के संभावित मान Xहमें इस बात की आपूर्ति करते हैं कि की प्राप्ति के साथ क्या हो सकता है Y
सूचना की अवधारणा में लाना, हमें बहुत सहज तरीके से Iterated Expectations (कभी-कभी "टॉवर संपत्ति" कहा जाता है) के कानून के बारे में सोचने (और उपयोग) की अनुमति देता है:
दो यादृच्छिक चर द्वारा उत्पन्न सिग्मा-बीजगणित, कम से कम उतना ही है : एक यादृच्छिक चर द्वारा उत्पन्न कि के रूप में बड़े σ(X)σ(X,Z) उचित सेट सैद्धांतिक अर्थ में। तो जानकारी के बारे में Y में निहित σ(X,Z) में संबंधित जानकारी के रूप में महान के रूप में कम से कम हैσ(X)
अब, सांकेतिक व्यंग्य के रूप में, सेटσ(X)Ix औरσ(X,Z)Ixz । फिर जिस समीकरण को हम देख रहे हैं उसका एलएचएस लिखा जा सकता है

मौखिक रूप से ऊपर अभिव्यक्ति हम बताते: "की {की उम्मीद मूल्य उम्मीद क्या है Y दी गई जानकारी मैं x z } यह देखते हुए कि हम उपलब्ध जानकारी नहीं है मैं x केवल?"

E[E(Y|Ixz)|Ix]
YIxzIx

क्या हम किसी तरह " " को ध्यान में रख सकते हैं ? नहीं - हम केवल I x जानते हैं । लेकिन अगर हम अपने पास मौजूद उस चीज़ का उपयोग करते हैं (जैसा कि हम जिस अभिव्यक्ति को हल करना चाहते हैं, उसके द्वारा बाध्य हैं), तो हम अनिवार्य रूप से वाई के बारे में उम्मीद ऑपरेटर के तहत बातें कर रहे हैं , अर्थात हम कहते हैं " ( वाई x आई एक्स ) ", और नहीं - हमने अभी-अभी अपनी जानकारी समाप्त की है।IxzIxYE(YIx)

इसलिए

E[E(Y|Ixz)|Ix]=E(Y|Ix)

अगर कोई और नहीं करता है, तो मैं औपचारिक उपचार के लिए लौटूंगा।

(थोड़ा और) औपचारिक उपचार

आइए देखें कि कैसे दो बहुत महत्वपूर्ण किताबें हैं प्रायिकता सिद्धांत, पी। बिलिंग्सले की संभावना और माप (3 डी एड।-1995) और डी। विलियम्स "प्रोबेलबिलिटी विद मार्टिंगेल्स" (1991), "लॉ ऑफ़ आईटर एक्सपेक्टेशंस" को साबित करने के मामले को मानते हैं:
बिलिंग्सले ने प्रमाण के लिए ठीक तीन पंक्तियों को समर्पित किया है। विलियम्स, और मैं बोली, कहते हैं

"(टॉवर संपत्ति) वस्तुतः सशर्त अपेक्षा की परिभाषा से तत्काल है"।

यह पाठ की एक पंक्ति है। बिलिंग्सले का प्रमाण कम अपारदर्शी नहीं है।

वे निश्चित रूप से सही हैं: सशर्त अपेक्षा की यह महत्वपूर्ण और बहुत सहज संपत्ति अनिवार्य रूप से सीधे (और लगभग तुरंत) अपनी परिभाषा से प्राप्त करती है-केवल समस्या यह है, मुझे संदेह है कि यह परिभाषा आमतौर पर नहीं सिखाई जाती है, या कम से कम हाइलाइट नहीं की जाती है, बाहर की संभावना या सिद्धांतिक हलकों को मापें। लेकिन (लगभग) तीन पंक्तियों को दिखाने के लिए जो कानून की प्रत्याशित अपेक्षाएं रखती हैं, हमें सशर्त अपेक्षा की परिभाषा की आवश्यकता है, या बल्कि, इसकी परिभाषित संपत्ति

एक प्रायिकता स्थान और एक पूर्णांक रैंडम वेरिएबल Y को दें । चलो जी हो एक उप σ की -algebra एफ , जीएफ । फिर एक फ़ंक्शन W मौजूद है जो G -measurable है, पूर्णांक है और (यह परिभाषित करने वाली संपत्ति है)(Ω,F,P)YGσFGFWG

E(W1G)=E(Y1G)GG[1]

जहाँ सेट G का सूचक कार्य है । हम कहते हैं कि डब्ल्यू की सशर्त उम्मीद ( "का एक संस्करण") है Y दिया जी , और हम लिखने डब्ल्यू = ( Y | जी )1GGWYG यहाँ ध्यान दें करने के लिए महत्वपूर्ण विस्तार कि सशर्त उम्मीद, एक ही उम्मीद मूल्य के रूप में है Y , करता है न सिर्फ पूरे से अधिक जी ,लेकिन हर सबसेट में जी की जीW=E(YG)a.s.
YGGG

(मैं अब पेश करने की कोशिश करूँगा कि कैसे टॉवर संपत्ति सशर्त अपेक्षा की परिभाषा से निकलती है)।

एक G -measurable यादृच्छिक चर है। तो विचार करें कुछ उप σ -algebra, का कहना है कि एचजी । फिर जी एचजी जी । तो, पहले की तरह एक अनुरूप तरीके से, हमें W दी गई H की सशर्त अपेक्षा है, U = E ( W analog H ) कहेंWGσHGGHGGWHयह विशेषता है U=E(WH)a.s.

E(U1G)=E(W1G)GH[2]

के बाद से , समीकरण [ 1 ] और [ 2 ] हमें देने केHG[1][2]

E(U1G)=E(Y1G)GH[3]

लेकिन यह दी गई H की सशर्त अपेक्षा की परिभाषित संपत्ति है । YHइसलिए हम लिखने के लिए हकदार हैं जब से हम निर्माण से भी यू = ( डब्ल्यू | एच ) = ([ Y | जी ] | एच ) - आठ लाइनों में, हम बस टॉवर संपत्ति, या पुनरावृत्त के कानून उम्मीदें के सामान्य रूप से साबित कर दिया।U=E(YH)a.s.
U=E(WH)=E(E[YG]H)


6
(+1) यह एक अमूर्त और कठिन अवधारणा का वर्णन करने के लिए एक उपयोगी तरीका है। मेरा मानना ​​है, हालांकि, वाक्यांश "... कोई बड़ा नहीं है ..." होना चाहिए "कोई छोटा नहीं है।" बेहतर अभी तक, उस खंड को नकारात्मक को हटाकर और एक समानांतर निर्माण का उपयोग करके स्पष्ट किया जा सकता है, जैसा कि "दो चर द्वारा उत्पन्न सिग्मा बीजगणित कम से कम उतना ही बड़ा है जितना कि एक यादृच्छिक चर द्वारा उत्पन्न ... तो बारे में जानकारी निहित में σ ( एक्स , जेड ) के रूप में कम से कम है महान के रूप में में संबंधित जानकारी के σ ( एक्स ) । " Yσ(X,Z)σ(X)
whuber

आप दोनों को धन्यवाद, cc @whuber। यह बहुत उपयोगी प्रमेय है।
जॉनके

@ whuber सुझाव के लिए इस -और जगह के लिए धन्यवाद।
एलेकोस पापाडोपोलोस

24

जिस तरह से मैं सशर्त अपेक्षा को समझता हूं और अपने छात्रों को सिखाता हूं वह निम्नलिखित है:

सशर्त अपेक्षा एक तस्वीर संकल्प के साथ एक कैमरे से ली गई है σ ( एक्स )E[Y|σ(X)]σ(X)

जैसा कि एलेकोस पापाडोपोलोस ने उल्लेख किया है, संकेतन E [ Y | से अधिक सटीक है X ] है । कैमरे की लाइन के साथ, कोई वाई को मूल वस्तु के रूप में सोच सकता है , उदाहरण के लिए, एक परिदृश्य, दृश्य। [ | σ ( एक्स , जेड ) ] एक तस्वीर संकल्प के साथ एक कैमरे से ली गई है σ ( एक्स , जेड )E[Y|σ(X)]E[Y|X]YE[Y|σ(X,Z)]σ(X,Z)। उम्मीद एक औसत ऑपरेटर ("धुंधला" ऑपरेटर है?)। दर्शनीय स्थान में बहुत सारा सामान हो सकता है, लेकिन कम रिज़ॉल्यूशन वाले कैमरे का उपयोग करके जो चित्र लिया गया है, वह निश्चित रूप से कुछ विस्तार कर देगा, उदाहरण के लिए, आकाश में एक यूएफओ हो सकता है जो आपकी नग्न आंखों से देखा जा सकता है लेकिन ऐसा नहीं है आपके द्वारा ली गई तस्वीर में (iphone 3?)

संकल्प इतनी अधिक है कि इस तरह के है , तो इस तस्वीर असली दृश्यों के हर विस्तार पर कब्जा करने में सक्षम है। इस मामले में, हमारे पास E [ Y | σ ( वाई ) ] = वाईσ(X,Z)=σ(Y)E[Y|σ(Y)]=Y

अब, के रूप में देखा जा सकता है: संकल्प के साथ एक और कैमरे का उपयोग कर σ ( एक्स ) (जैसे, iphone 1) जो तुलना में कम है σ ( एक्स , जेड ) (जैसे, iphone 3) और के द्वारा उत्पन्न की है कि चित्र पर एक तस्वीर ले लो संकल्प के साथ कैमरा σ ( एक्स , जेड ) , तो यह स्पष्ट किया जाना चाहिए किE[E[Y|σ(X,Z)]|σ(X)]σ(X)σ(X,Z)σ(X,Z)एक तस्वीर पर इस तस्वीर के लिए यदि आप मूल रूप से सिर्फ कम संकल्प के साथ एक कैमरे का उपयोग के रूप में ही किया जाना चाहिए दृश्यों पर।σ(X)

यह वास्तव में यही अंतर्ज्ञान हमें बताता है कि E [ E [ Y | X ] | एक्स , जेड ] = [ वाई | X ]E[E[Y|X,Z]|X]=E[Y|X]E[E[Y|X]|X,Z]=E[Y|X]फिर भी। इसका कारण यह है: यदि आपकी पहली तस्वीर iphone 1 (यानी, कम रिज़ॉल्यूशन) द्वारा ली गई है, और अब आप पहली तस्वीर पर एक और फोटो जेनरेट करने के लिए एक बेहतर कैमरा (जैसे, iphone 3) का उपयोग करना चाहते हैं, तो आपके लिए कोई रास्ता नहीं है पहली तस्वीर की गुणवत्ता में सुधार कर सकते हैं।


2
इसे प्यार करना! :) महान व्याख्या।
जेसिका


21

पुनरावृत्त उम्मीद के कानून (झूठ), में , कि भीतर उम्मीद एक है यादृच्छिक चर जो के एक समारोह होने वाला एक्स , का कहना है कि जी ( एक्स ) , और नहीं एक Y का कार्य । कि X के इस कार्य की अपेक्षा Y की अपेक्षा के बराबर होती है, LIE का परिणाम है। सभी कि यह, हाथ से wavingly, बस दावे के औसत मूल्य कि वाई द्वारा पाया जा सकता औसतनE[E[YX]]=E[Y]Xg(X)YXYYविभिन्न परिस्थितियों में का औसत मूल्य । वास्तव में, यह सब कुल संभाव्यता के कानून का प्रत्यक्ष परिणाम है। उदाहरण के लिए, यदि X और Y संयुक्त pmf p X , Y ( x , y ) के साथ यादृच्छिक चर असतत हैं , तो E [ Y ]YXYpX,Y(x,y) सूचना कैसे है कि पिछले उम्मीद के संबंध में हैएक्स; [Y|एक्स]की एक समारोह हैएक्सकी नहीं,वाई, लेकिन फिर भी अपने मतलब का मतलब रूप में ही हैवाई

E[Y]=yypY(y)definition=yyxpX,Y(x,y)write in terms of joint pmf=yyxpYX(yX=x)pX(x)write in terms of conditional pmf=xpX(x)yypYX(yX=x)interchange order of summation=xpX(x)E[YX=x]inner sum is conditional expectation=E[E[YX]]RV E[YX] has value E[YX=x] when X=x
XE[YX]XYY

सामान्यीकृत झूठ है कि आप देख रहे हैं बाईं तरफ है जिसमें भीतरी उम्मीद एक समारोह है ( एक्स , जेड ) के दो यादृच्छिक चर एक्स और जेड । तर्क ऊपर उल्लिखित के समान है, लेकिन अब हम दिखाने के लिए कि है यादृच्छिक चर [ Y | एक्स ] एक और यादृच्छिक चर बराबर होती है। हम का मूल्य को देखकर ऐसा करने [ Y |E[E[YX,Z]X]h(X,Z)XZ E[YX] जब X का मान x होता है। स्पष्टीकरणों को छोड़कर, हमारे पास वह E [ Y x X = x ] हैE[YX]Xx ध्यान दें कि अंत से पहले सही पक्ष के लिए सूत्र हैसशर्त उम्मीद मूल्ययादृच्छिक चर के[Y|एक्स,जेड](के एक समारोहएक्सऔरजेड) Xके मान परवातानुकूलित। हम फिक्सिंग रहे हैंएक्समूल्य के लिएएक्स, यादृच्छिक चर के मान गुणा[Y|एक्स

E[YX=x]=yypYX(yX=x)=yypX,Y(x,y)pX(x)=yyzpX,Y,Z(x,y,z)pX(x)=yyzpYX,Z(yX=x,Z=z)pX,Z(x,z)pX(x)=zpX,Z(x,z)pX(x)yypYX,Z(yX=x,Z=z)=zpZX(zX=x)yypYX,Z(yX=x,Z=z)=zpZX(zX=x)E[YX=x,Z=z)=E[E[YX,Z]X=x]
E[YX,Z]XZXXx द्वारासशर्तकी PMF मूल्य जेड दिया एक्स , और ऐसे सभी मामले संक्षेप।E[YX,Z]ZX

इस प्रकार, के लिए प्रत्येक मान यादृच्छिक चर के एक्स , यादृच्छिक चर का मान [ Y | एक्स ] (जो हम पहले उल्लेख किया की एक समारोह है एक्स , की नहीं Y ,) यादृच्छिक चर के मान के समान है [ [ Y | एक्स , जेड ] | एक्स ] , है कि, इन दो यादृच्छिक चर बराबर हैं। क्या मैं तुमसे झूठ बोलूंगा?xXE[YX]XYE[E[YX,Z]X]

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.