रैखिक प्रतिगमन, सशर्त अपेक्षाएं और अपेक्षित मूल्य


11

ठीक है तो बस कुछ चीजों पर थोड़ा सा धुंधला, किसी भी मदद की बहुत सराहना की जाएगी। यह मेरी समझ है कि रैखिक प्रतिगमन मॉडल की सशर्त अपेक्षा के माध्यम से भविष्यवाणी की जाती है

(Y|एक्स)=+एक्स+
  1. क्या हम मान लेते हैं कि और दोनों कुछ अज्ञात संभावना वितरण के साथ यादृच्छिक चर हैं? यह मेरी समझ थी कि केवल अवशिष्ट और अनुमानित बीटा गुणांक यादृच्छिक चर थे। यदि ऐसा है, तो उदाहरण के रूप में, यदि मोटापा और आयु, यदि हम सशर्त अपेक्षा अर्थ लेते हैं, तो व्यक्ति के नमूने में होने पर मोटे होने का अपेक्षित मान क्या होगा? बस उन टिप्पणियों के लिए y का औसत (अंकगणितीय माध्य) लें जहां ? अभी तक अपेक्षित मूल्य नहीं आया है कि हमें ऐसा होने की संभावना से गुणा करना होगा? लेकिन इस अर्थ में कि कैसे हम की प्रायिकता पाते हैंएक्सYY=एक्स=(Y|एक्स=35)35एक्स=35X-युगांतर चर अगर यह उम्र की तरह कुछ का प्रतिनिधित्व करता है?
  2. यदि विनिमय दर जैसी किसी चीज़ का प्रतिनिधित्व करता है, तो क्या इसे यादृच्छिक के रूप में वर्गीकृत किया जाएगा? यद्यपि संभावना को जाने बिना आप पृथ्वी पर इसका अपेक्षित मूल्य कैसे पाएंगे? या अपेक्षित मूल्य सीमा में माध्य के बराबर होगा।X
  3. अगर हम यह नहीं मानते हैं कि निर्भर चर स्वयं यादृच्छिक चर हैं, क्योंकि हम संभावना को नहीं मानते हैं, तो हम क्या मानते हैं कि वे हैं? सिर्फ निश्चित मूल्य या कुछ और? लेकिन अगर ऐसा है, तो हम शुरुआत करने के लिए गैर-यादृच्छिक चर पर कैसे शर्त लगा सकते हैं? हम स्वतंत्र चर वितरण के बारे में क्या सोचते हैं?

क्षमा करें अगर कुछ भी समझ में नहीं आता है या किसी के लिए स्पष्ट है।


1
प्रतिगमन गुणांक एक अज्ञात स्थिरांक है, न कि एक यादृच्छिक चर (कम से कम दुनिया में)। β
रिचर्ड हार्डी

सशर्त अपेक्षाओं से आपका क्या अभिप्राय है? E (Y | X) का अर्थ है Y दिया गया X, अर्थात X का Y का अपेक्षित मान। कहो, y = 5 + x, तो आप E (Y | X = 5) 10. है। मुझे आपकी बात नहीं लगी। सशर्त अपेक्षा
ज़मीर अकिम्बकोव

@ रीचर्डहार्डी, यह मेरी समझ थी कि चूंकि बी बीटा के नमूने के वितरण का मतलब है, इसलिए यह सामान्य वितरण की विशेषता वाला एक यादृच्छिक चर है। क्या आप जनसंख्या मॉडल की बात कर रहे हैं?
विलियम कारुल्ली

हां, जनसंख्या मॉडल।
रिचर्ड हार्डी

1
@WilliamCarulli रिचर्ड जनसंख्या पैरामीटर और अनुमानित पैरामीटर के बीच अंतर का उल्लेख कर रहा है । अनुमानित पैरामीटर वास्तव में एक यादृच्छिक चर है, लेकिन (अज्ञात) वास्तविक जनसंख्या पैरामीटर एक निश्चित मूल्य है।
मैथ्यू डॉरी

जवाबों:


8

संभावना मॉडल रेखीय प्रतीपगमन अंतर्निहित में, एक्स और वाई हैं यादृच्छिक परिवर्तनीय।

यदि ऐसा है, तो उदाहरण के रूप में, यदि Y = मोटापा और X = आयु, यदि हम सशर्त अपेक्षा E (Y | X = 35) का अर्थ लेते हैं, तो व्यक्ति के नमूने में 35 होने पर मोटे होने का अपेक्षित मूल्य क्या होगा, क्या हम? बस उन टिप्पणियों के लिए y का औसत (अंकगणितीय माध्य) लें जहां X = 35 है?

ये सही है। सामान्य तौर पर, आप यह उम्मीद नहीं कर सकते हैं कि आपके पास X के प्रत्येक विशिष्ट मूल्य पर पर्याप्त डेटा होगा, या ऐसा करना असंभव हो सकता है यदि X मानों की एक निरंतर श्रेणी ले सकता है। लेकिन वैचारिक रूप से, यह सही है।

अभी तक अपेक्षित मूल्य नहीं आया है कि हमें ऐसा होने की संभावना से गुणा करना होगा?

यह बीच का अंतर है बिना शर्त उम्मीद और सशर्त उम्मीद [ Y | एक्स = एक्स ] । उनके बीच का संबंध हैE[Y]E[YX=x]

E[Y]=xE[YX=x]Pr[X=x]

जो कुल अपेक्षा का नियम है।

लेकिन उस अर्थ में हम एक्स-वैल्यू वैरिएबल की प्रायिकता का पता कैसे लगाते हैं यदि यह उम्र जैसी किसी चीज का प्रतिनिधित्व करता है?

आम तौर पर आप रैखिक प्रतिगमन में नहीं होते हैं। चूंकि हम निर्धारित करने का प्रयास कर रहे हैं , हमें P r [ X = x ] को जानने की आवश्यकता नहीं है ।E[YX]Pr[X=x]

यदि हम नहीं मानते कि स्वतंत्र चर स्वयं यादृच्छिक चर हैं, क्योंकि हम संभावना को नहीं मानते हैं, तो हम क्या मानते हैं कि वे हैं? सिर्फ निश्चित मूल्य या कुछ और?

हम करते हैं लगता है कि वाई एक यादृच्छिक चर रहा है। रैखिक प्रतिगमन के बारे में सोचने का एक तरीका वाई के लिए एक संभावना मॉडल के रूप में हैY

Y~एक्सβ+एन(0,σ)

जो कहता है कि, एक बार जब आप X का मूल्य जानते हैं, Y में यादृच्छिक भिन्नता समन तक ही सीमित है ।एन(0,σ)


आपकी टिप्पणी के लिए बहुत बहुत धन्यवाद, मुझे बहुत मदद की। खुश होती है।
विलियम कारुल्ली

@WilliamCarulli आपका स्वागत है! बेझिझक कोई भी सवाल पूछें और मैं जवाब देने की पूरी कोशिश करूंगा। अगर मैंने वास्तव में आपके सभी मुद्दों को मंजूरी दे दी है, तो आप इसे भी स्वीकार कर सकते हैं।
मैथ्यू डॉरी

3
यह एक अच्छी पोस्ट है। हालांकि, मुझे लगता है कि कोई भी जवाब जो यह स्वीकार नहीं करता है कि (ए) तय किया जा सकता है या (बी) एक यादृच्छिक चर हो सकता है (विशेष स्वतंत्रता मान्यताओं के साथ) वास्तव में प्रश्न में व्यक्त चिंताओं को संबोधित नहीं कर रहा है। एक्स
whuber

@MatthewDrury, बस स्पष्ट करने के लिए, अगर मेरे आश्रित चर को विनिमय दर कहा जाता है, और मेरा आश्रित घरेलू ब्याज दर है, तो
विलियम कारुल्ली

@ मैथ्यूड्राइ @ मैथ्यूड्र्यू, केवल स्पष्ट करने के लिए, अगर मेरे आश्रित चर को विनिमय दर कहा जाता है, और मेरा आश्रित घरेलू ब्याज दर है, तो E (E (विनिमय दर | ब्याज दर)) = E (विनिमय दर) = नमूना माध्य विनिमय दर का? मुझे लगता है कि जो मुझे भ्रमित कर रहा है वह यह है कि मुझे लगता है कि हमेशा अपेक्षाओं की गणना संभाव्यता के आधार पर की जाती है, मैं रैखिक प्रतिगमन को सशर्त अपेक्षा के रूप में प्रदर्शित करने का कारण नहीं देखता जब मैट्रिक्स बीजगणित के माध्यम से इसे हल करना बहुत अलग लगता है फिर समग्र अपेक्षा लेना।
विलियम कारुल्ली

3

इस प्रश्न के बहुत सारे उत्तर होंगे, लेकिन मैं अभी भी एक जोड़ना चाहता हूं क्योंकि आपने कुछ दिलचस्प बिंदु बनाए हैं। सादगी के लिए मैं केवल सरल रैखिक मॉडल पर विचार करता हूं।

   It is my understanding that the linear regression model
   is predicted via a conditional expectation E(Y|X)=b+Xb+e

एक सरल रैखिक प्रतिगमन विश्लेषण का मूल समीकरण है: इस समीकरण अर्थ है कि के औसत मूल्य है वाई के मूल्यों पर रेखीय है एक्स । एक भी कर सकते हैं सूचना है कि उम्मीद मूल्य भी है रैखिक मानकों पर बीटा 0 और बीटा 1 , यही वजह है कि मॉडल रैखिक कहा जाता है। यह मौलिक समीकरण के रूप में लिखा जा सकता है: Y = β 0 + β 1 एक्स + ε , जहां ε मतलब शून्य के साथ एक यादृच्छिक चर रहा है: ( ε ) =

(Y|एक्स)=β0+β1एक्स,
Yएक्सβ0β1
Y=β0+β1एक्स+ε,
ε(ε)=0
Do we assume that both X and Y are Random variables with some unknown 
probability distribution? ... If we don't assume the independent variables 
are themselves random 

स्वतंत्र चर यादृच्छिक या तय किया जा सकता है। निर्भर चर Y हमेशा यादृच्छिक है।एक्सY

आम तौर पर एक मानता है कि निश्चित संख्याएँ हैं। ऐसा इसलिए है क्योंकि प्रतिगमन विश्लेषण विकसित किया गया था और बड़े पैमाने पर डिज़ाइन किए गए प्रयोगों के संदर्भ में लागू किया गया है, जहां एक्स के मूल्य पहले से तय हैं।{एक्स1,,एक्सn}एक्स

की कम से कम वर्गों अनुमान के लिए फार्मूले और β 1 एक ही है, भले ही कर रहे हैं एक्स के यादृच्छिक ग्रहण कर रहे हैं, लेकिन इन अनुमानों के वितरण आम तौर पर तय हो गई के साथ स्थिति की तुलना में समान नहीं होगा एक्स की।β0β1एक्सएक्स

if we take the conditional expectation E(Y|X=35) ... would we just take 
the average(arithmetic mean) of y for those observations where X=35?

φ^(एक्स)(Y|एक्स=एक्स)β^0β^1

φ^(एक्स)=β^0+β^1एक्स

सशर्त माध्य कम से कम चुकता आकलनकर्ता के पास आपके द्वारा वर्णित मॉडल के बराबर अभिव्यक्ति है यदि आपका मॉडल एक एकल कारक के स्तर के रूप में विभिन्न भारों का व्यवहार करता है। उन मॉडलों को वन-वे एनोवा के रूप में भी जाना जाता है, जो रैखिक मॉडल का एक विशेष मामला है (सरल नहीं)।

1
एक्सβ^0β^1एक्स

1
@whuber "सबसे पहले, मॉडल को" रैखिक "कहा जाता है क्योंकि यह मापदंडों में रैखिक है" मैं समीकरण अर्थ समझा रहा था, "रैखिक मॉडल" में "रैखिक" का अर्थ नहीं। "अनुमान the 0 और are 1 X के बारे में जो कुछ भी माना जाता है, उसकी परवाह किए बिना यादृच्छिक चर हैं", लेकिन निश्चित रूप से उन यादृच्छिक चर का वितरण आपके इलाज के तरीके के आधार पर बदलता है।
Mur1lo

1
@ जब भी मैं आपके अंतिम बिंदुओं से पूरी तरह सहमत हूं। मैं अपने उत्तर को संपादित करने जा रहा हूं, इसलिए यह आपके द्वारा बताए गए सभी मुद्दों में स्पष्ट है। प्रतिक्रिया के लिए धन्यवाद।
211 बजे मुर्सलो
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.