रैखिक और उपस्कर प्रतिगमन के लिए त्रुटि वितरण


9

निरंतर डेटा के साथ, एक रेखीय प्रतिगमन मान लेता है कि त्रुटि शब्द N (0, ) वितरित किया गया हैY=β1+β2X2+uσ2

1) क्या हम मानते हैं कि वर (Y | x) वैसे ही है ~ N (0, )?σ2

2) लॉजिस्टिक रिग्रेशन में यह त्रुटि वितरण क्या है? जब डेटा प्रति केस 1 रिकॉर्ड के रूप में होता है, जहां "Y" 1 या 0 होता है, तो बर्नौली (यानी विचरण p (1-p)) वितरित की गई त्रुटि अवधि है और जब डेटा # फॉर्म में है # सफलताओं में से सफलता, क्या इसे द्विपद (यानी विचरण np (1-p)) माना जाता है, जहां p की संभावना है कि Y 1 है?


2
आप सटीक नहीं हैं। मॉडल की धारणा यह है कि त्रुटि शब्द स्वतंत्र हैं और पहचान के साथ एक वितरण के साथ वितरित किया जाता है जो कि एन (0, is ) है और COVARIATE से असंबंधित है। Var (Y | x) क्या है? क्या आप X = x पर कंडीशनिंग कर रहे हैं ? क्या मॉडल मान लेता है कि कोवरिएट किसी तरह से यादृच्छिक है या इसलिए हम मान लेते हैं कि कोवरिएट एक डिजाइन मैट्रिक्स के अनुसार तय किया गया है? मुझे लगता है कि यह उत्तरार्द्ध है और इसलिए वर (Y | X = x) मान्यताओं से निहित है और इसे ग्रहण करने की आवश्यकता नहीं है। 222
माइकल आर। चेरनिक

@MichaelChernick मॉडल यह क्यों मानता है कि तय है? यह निश्चित रूप से मामला हो सकता है कि यह तय हो गया है, लेकिन यह यादृच्छिक भी हो सकता है। प्रश्न में कुछ भी मेरे लिए नहीं है। X2
पीटर Flom

@PeterFlom मैंने इस प्रश्न को पढ़ा कि त्रुटि मान वितरण के साथ रैखिक प्रतिगमन का मतलब OLS है जिसे X को ठीक करने और ज्ञात करने की आवश्यकता होती है । यदि किसी के पास डेमिंग रिग्रेशन (चर प्रतिगमन में त्रुटि) है तो इसे प्रश्न में निर्दिष्ट किया जाएगा। उत्तर को देखते हुए स्टेट ने संकेत दिया कि उन्होंने इस तरह से भी प्रश्न को दोहराया। 2
माइकल आर। चेरनिक

जवाबों:


10

1) यदि uसामान्य वितरण है अर्थात तो , क्योंकि कोई यादृच्छिक नहीं है चर।N(0,σ2)Var(Y|X2)=Var(β1+β2X2)+Var(u)=0+σ2=σ2β1+β2X2

2) लॉजिस्टिक रिग्रेशन में, यह माना जाता है कि त्रुटियां एक द्विपद वितरण का अनुसरण करती हैं जैसा कि यहां बताया गया है । इसे , क्योंकि वे संभाव्यताएं पर निर्भर करती हैं , जैसा कि यहां संदर्भित है या एप्लाइड लॉजिस्टिक रिग्रेशन में हैVar(Yj|Xj)=mj.E[Yj|Xj].(1E[Yj|Xj])=mjπ(Xj).(1π(Xj))Xजे


स्टेट, इसलिए, यह कहना सही है कि ith व्यक्तिगत त्रुटि के लिए विचरण, ei, है pi(1-pi) जो आपके द्वारा दिखाए गए के बराबर है, यह दर्शाता है कि एक ही कोवरिएट पैटर्न (यानी अन्य) के साथ डेटा में 1 से अधिक अवलोकन हैं mjसभी के लिए = 1)?
B_Miner

2
हां यह सही है। अगरYi=pi+ei साथ में P(Yi=1)=1P(Yi=0)=pi, फिर ei=1pi संभाव्यता के साथ pi या ei=pi संभाव्यता के साथ 1pi। इसलियेei माध्य से वितरण है 0 और विचरण के बराबर है pi(1pi)
स्टेट

यहां एक अतिरिक्त बिंदु, स्टेट, हमें यह मान लेना है कि एक्स तय किए गए हैं, नॉन यादृच्छिक के लिए वर (वाई | एक्स) = वार (ई) रैखिक और लॉजिस्टिक रिग्रेशन दोनों मामलों के लिए सही हैं?
B_Miner

एनबी ei=1pi संभाव्यता के साथ pi या ei=pi संभाव्यता के साथ 1piके लिए द्विपद वितरण नहीं हैei
Scortchi - को पुनः स्थापित मोनिका

B_Miner: Var(Y|X)=Var(Y|X=x) का विचरण का अर्थ है Y यादृच्छिक चर पर सशर्त Xएक मनाया मूल्य ले रहा है x। तो यह सारहीन है कि क्या आपके भविष्यवाणियों को एक प्रयोग द्वारा तय किया गया है या एक नमूने में देखा गया है: क्या @ स्टेटस कह रहे हैं कि उन्हें अब प्रतिगमन के प्रयोजनों के लिए यादृच्छिक चर के रूप में नहीं माना जा रहा है।
Scortchi - को पुनः स्थापित मोनिका
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.