प्रतिगमन में एक और चर जोड़ते हुए और अधिक परिमाण के साथ फ़्लिपिंग साइन करें


9

बुनियादी ढांचा:

प्रतिगमन मॉडल: जहां C नियंत्रण चर का वेक्टर है।y=constant+β1x1+β2x2+β3x3+β4x4+αC+ϵ

मैं में रुचि रखता और नकारात्मक होने के लिए और अपेक्षा करता । हालांकि, मॉडल में समस्या है, सहसंबंध के गुणांक द्वारा दिया गया है, ( , 0.9345, गल ( , 0.1765, ( , 0.3019।ββ1β2x1x2)=x1x3)=x2x3)=

तो और अत्यधिक सहसंबद्ध हैं, और उन्हें वास्तव में एक ही जानकारी प्रदान करनी चाहिए। मैं तीन रजिस्टर चलाता हूं: x1x2

  1. चर को बाहर करें; 2. 2 चर को ; 3. मूल मॉडल दोनों और ।x1x2x1x2

परिणाम:
प्रतिगमन 1 और 2 के लिए, यह क्रमशः और इसी तरह के परिमाण के साथ और लिए अपेक्षित संकेत प्रदान करता है । और मानक त्रुटि में HAC सुधार करने के बाद दोनों मॉडल में 10% स्तर पर और महत्वपूर्ण हैं। सकारात्मक है लेकिन दोनों मॉडल में महत्वपूर्ण नहीं है।β2β1β2β1β3

लेकिन 3 के लिए, में अपेक्षित संकेत है, लेकिन निरपेक्ष मान में से दो गुना अधिक परिमाण के साथ लिए संकेत सकारात्मक है । और और दोनों ही महत्वहीन हैं। इसके अलावा, प्रतिगमन 1 और 2 की तुलना में लिए परिमाण लगभग आधा ।β1β2β1β1β2β3

मेरा सवाल यह है कि:

3 में क्यों, 2 का चिन्ह सकारात्मक हो जाता है और निरपेक्ष मान में से बहुत अधिक होता है ? क्या कोई सांख्यिकीय कारण है कि साइन फ्लिप कर सकता है और बड़ी परिमाण है? या यह क्योंकि मॉडल 1 और 2 का लोप पीड़ित चर समस्या जो फुलाया है प्रदान की y पर सकारात्मक प्रभाव पड़ता है? लेकिन फिर प्रतिगमन मॉडल 1 और 2 में, दोनों और नकारात्मक के बजाय सकारात्मक होना चाहिए, क्योंकि प्रतिगमन मॉडल 3 में और का कुल प्रभाव सकारात्मक है।β2β1β2β3x2β2β1x1x2

जवाबों:


8

इस उदाहरण के बारे में सोचो:

लोगों की जेब में सिक्कों के आधार पर एक डाटासेट लीजिए, y चर / प्रतिक्रिया सिक्कों का कुल मूल्य है, चर X1 सिक्कों की कुल संख्या है और x2 उन सिक्कों की संख्या है जो क्वार्टर नहीं हैं (या जो भी सबसे बड़ा मूल्य है) आम सिक्के स्थानीय के लिए हैं)।

यह देखना आसान है कि X1 या x2 के साथ प्रतिगमन एक सकारात्मक ढलान देगा, लेकिन जब मॉडल में दोनों को ढंकेगा तो x2 पर ढलान नकारात्मक हो जाएगा क्योंकि छोटे सिक्कों की संख्या में वृद्धि के बिना सिक्कों की कुल संख्या में वृद्धि का मतलब होगा। छोटे सिक्कों के साथ बड़े सिक्के और समग्र मूल्य (y) को कम करना।

जब आप x चर को सहसंबद्ध करते हैं, तब भी यही बात हो सकती है, संकेत तब आसानी से विपरीत हो सकते हैं जब कोई शब्द अपने आप में और दूसरों की उपस्थिति में हो।


3

आपने अपने प्रश्न का उत्तर दिया है - इसमें समरूपता है।

थोड़ा सा स्पष्टीकरण: और अत्यधिक समतल हैं। लेकिन जब आप दोनों को प्रतिगमन में दर्ज करते हैं, तो प्रतिगमन अन्य चर के प्रभाव को नियंत्रित करने का प्रयास कर रहा है। दूसरे शब्दों में, स्थिर रखें , में में क्या परिवर्तन करते हैं । लेकिन तथ्य यह है कि वे बहुत संबंधित हैं इसका मतलब है कि यह सवाल मूर्खतापूर्ण है, और अजीब चीजें हो सकती हैं।x1x2x1x2y


बहुत बहुत धन्यवाद। लेकिन चूंकि सिद्धांत में केवल पुष्पक्रम विचरण करती है, लेकिन अत्यधिक सहसंबद्ध चर की समग्र भविष्यवाणी शक्ति को प्रभावित नहीं करती है, इसलिए मैंने मॉडल 3 में को मॉडल 1 या में समान परिणाम प्रदान करना चाहिए। मॉडल 2 में , चूंकि x3 के साथ X1 x2 का जोड़ीदार सहसंबंध उच्च नहीं है (वास्तव में यह मेरा भ्रमित करने वाला हिस्सा है)। लेकिन चूंकि सहसंबंध वास्तव में गड़बड़ हो सकता है, और व्यवहार में, मुझे यह उम्मीद नहीं करनी चाहिए क्योंकि मेरा मॉडल केवल डीजीपी का एक अनुमान है और अन्य चर मामलों के साथ सहसंबंध है। β1x1+β2x2β2x2β1x1
टिंग

यदि आप इसके गणित में उतरना चाहते हैं, तो मैं डेविड बेल्सली की पुस्तकों की अत्यधिक अनुशंसा करता हूं।
पीटर फ्लोम

महान, बहुत बहुत धन्यवाद !!! बस पुस्तकालय से पुस्तकों का अनुरोध किया :)
ting

2

3 में क्यों, becomes2 का चिन्ह धनात्मक हो जाता है और निरपेक्ष मान में absolute1 से बहुत अधिक होता है? क्या कोई सांख्यिकीय कारण है कि can2 फ्लिप कर सकता है और बड़े परिमाण हो सकता है?

इसका सीधा सा जवाब है, कोई गहरा कारण नहीं है।

इसके बारे में सोचने का तरीका यह है कि जब बहु-विषयक दृष्टिकोण सही होता है, तो आपके द्वारा फिटिंग से प्राप्त विशिष्ट मूल्य डेटा के छोटे और छोटे विवरणों पर अधिक निर्भर हो जाते हैं। यदि आप समान अंतर्निहित वितरण से डेटा की समान मात्रा का नमूना लेने और फिर फिट होने के लिए थे, तो आप पूरी तरह से अलग-अलग मान प्राप्त कर सकते थे।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.