साधारण रैखिक प्रतिगमन मामले में , आप कम से कम वर्ग अनुमानक ऐसा है कि आपको का अनुमान लगाने के लिएβ 1 = Σ ( एक्स मैं - ˉ एक्स ) ( y मैं - ˉ y )β 0 β 1
मान लीजिए कि मेरे पास , तो मैं का आकलन किए बिना कैसे प्राप्त ? या यह संभव नहीं है?β 1 β 2
साधारण रैखिक प्रतिगमन मामले में , आप कम से कम वर्ग अनुमानक ऐसा है कि आपको का अनुमान लगाने के लिएβ 1 = Σ ( एक्स मैं - ˉ एक्स ) ( y मैं - ˉ y )β 0 β 1
मान लीजिए कि मेरे पास , तो मैं का आकलन किए बिना कैसे प्राप्त ? या यह संभव नहीं है?β 1 β 2
जवाबों:
मैट्रिक्स संकेतन में व्युत्पत्ति
से शुरू करना , जो वास्तव में बस के रूप में ही है
यह सब कम से कम करने के लिए आता है :
इसलिए कम से कम हमें देता है:
ई ' ई = ( y - एक्स ख ) ' ( y - एक्स ख )
ई ' ई = y ' y - 2 ख ' एक्स ' y + ख ' एक्स ' एक्स ख
एक अंतिम गणितीय चीज़, न्यूनतम के लिए दूसरी ऑर्डर की स्थिति के लिए आवश्यक है कि मैट्रिक्स सकारात्मक निश्चित हो। यह आवश्यकता उस स्थिति में पूरी होती है जब की पूरी रैंक हो।एक्स
अधिक सटीक व्युत्पत्ति जो अधिक चरणों में सभी गर्त में जाती है, http://economictheoryblog.com/2015/02/19/ols_estimator/ के तहत पाई जा सकती है
*
एक हो +
? इसके अलावा, नहीं यह होना चाहिए के बजाय आकार-प्रकार के प्राप्त करने के लिए? बी एन
दूसरों के अनुमान के बिना एक एकाधिक प्रतिगमन में सिर्फ एक गुणांक का अनुमान लगाना संभव है।
अन्य से के प्रभावों को और फिर के अवशिष्टों के विरुद्ध के को पुनः प्राप्त करके का अनुमान प्राप्त किया जाता है । यह समझाया और चित्रित किया गया है कि वास्तव में अन्य चर के लिए एक नियंत्रण कैसे होता है? और कैसे (ए) प्रतिगमन गुणांक को सामान्य करने के लिए? । इस दृष्टिकोण की सुंदरता यह है कि इसके लिए कोई कैलकुलस की आवश्यकता नहीं है, कोई रेखीय बीजगणित नहीं है, बस दो आयामी ज्यामिति का उपयोग करके कल्पना की जा सकती है, संख्यात्मक रूप से स्थिर है, और कई प्रतिगमन के सिर्फ एक मौलिक विचार का शोषण करता है: जो बाहर निकालना (या उसे नियंत्रित करना) ) एकल चर का प्रभाव।एक्स 2 y एक्स 1
वर्तमान मामले में तीन सामान्य प्रतिगमन चरणों का उपयोग करके एकाधिक प्रतिगमन किया जा सकता है:
वापसी पर (एक निरंतर अवधि के बिना!)। फिट होने दें । अनुमान इसलिए अवशिष्ट ज्यामितीय, क्या बची हुई है है के बाद पर अपने प्रक्षेपण घटाया जाता है।x 2 y = अल्फा y , 2 एक्स 2 + δ अल्फा y , 2 = Σ मैं y मैं एक्स 2 मैंδ=y-αy,2एक्स2। δyx2
X_2 पर को (स्थिर अवधि के बिना)। फिट होने दें । अनुमानअवशिष्टज्यामितीय, क्या बची हुई है है के बाद पर अपने प्रक्षेपण घटाया जाता है।
Regress on Gamma (स्थिर अवधि के बिना)। अनुमानफिट होगा । ज्यामितीय, का घटक है (जो का प्रतिनिधित्व करता है के साथ में बाहर ले जाया) दिशा (जो का प्रतिनिधित्व करता है साथ बाहर ले जाया)।
ध्यान दें कि का अनुमान नहीं लगाया गया है। यह आसानी से प्राप्त किया जा सकता है जो अब तक प्राप्त किया गया है ( साधारण प्रतिगमन मामले में सिर्फ में ढलान अनुमान से आसानी से प्राप्त होता है )। की द्विचर प्रतिगमन के लिए बच रहे हैं पर और ।
साधारण प्रतिगमन के साथ समानांतर मजबूत है: चरण (1) और (2) सामान्य सूत्र में साधनों को घटाने के एनालॉग हैं। यदि आप को किसी का वेक्टर हैं, तो आप वास्तव में सामान्य सूत्र को पुनर्प्राप्त करेंगे।
यह दो से अधिक चर के साथ प्रतिगमन करने के लिए स्पष्ट तरीके से सामान्यीकरण करता है: का अनुमान लगाने के लिए , सभी अन्य चर के खिलाफ अलग से और फिर से प्राप्त करें, फिर एक दूसरे के खिलाफ अपने अवशेषों को फिर से प्राप्त करें। उस बिंदु पर के एकाधिक प्रतिगमन में अन्य गुणांक में से कोई भी अभी तक अनुमानित नहीं किया गया है।
का सामान्य न्यूनतम वर्ग अनुमान प्रतिक्रिया चर का एक रैखिक कार्य है । सीधे शब्दों में, गुणांक के ओएलएस अनुमान, का केवल आश्रित चर ( ') और स्वतंत्र चर ( ' s) का उपयोग करके लिखा जा सकता है ।
एक सामान्य प्रतिगमन मॉडल के लिए इस तथ्य को समझाने के लिए, आपको थोड़ा रैखिक बीजगणित समझने की आवश्यकता है। मान लीजिए कि आप गुणांक का कई प्रतिगमन मॉडल में ,
जहाँ लिए । डिज़ाइन मैट्रिक्स एक मैट्रिक्स है जहाँ प्रत्येक कॉलम में निर्भर चर के अवलोकन । आप अनुमानित गुणांक गणना करने के लिए उपयोग किए जाने वाले सूत्र के कई स्पष्टीकरण और व्युत्पन्न पा सकते हैं । , जो हैमैं = 1 , । । । , n X n × k n k t h X k
यह मानते हुए कि व्युत्क्रम मौजूद है। अनुमानित गुणांक डेटा के कार्य हैं, अन्य अनुमानित गुणांक के नहीं।
सिद्धांत बनाम व्यवहार पर एक छोटा सा लघु नोट। गणितीय रूप से का अनुमान निम्न सूत्र से लगाया जा सकता है:
जहाँ मूल इनपुट डेटा है और वह चर है जिसका हम अनुमान लगाना चाहते हैं। यह त्रुटि को कम करने से होता है। मैं एक छोटा सा व्यावहारिक बिंदु बनाने से पहले इसे आगे बढ़ाऊंगा।
बता दें कि त्रुटि है जो रैखिक प्रतिगमन बिंदु पर बनाता है । फिर:
कुल चुकता त्रुटि अब हम करते हैं:
क्योंकि हमारे पास एक रैखिक मॉडल है जिसे हम जानते हैं कि:
जिसे मैट्रिक्स नोटेशन में फिर से लिखा जा सकता है:
हम जानते हैं कि
हम कुल वर्ग त्रुटि को कम करना चाहते हैं, जैसे कि निम्नलिखित अभिव्यक्ति यथासंभव छोटी होनी चाहिए
यह बराबर है:
पुनर्लेखन भ्रामक लग सकता है लेकिन यह रैखिक बीजगणित से आता है। ध्यान दें कि जब हम कुछ संदर्भों में उन्हें गुणा कर रहे होते हैं, तो वे चर के समान व्यवहार करते हैं।
हम इस तरह के रूप में छोटा है कि इस तरह के के मूल्यों को खोजने के लिए चाहते हैं। हमें व्युत्पन्न को शून्य के बराबर अंतर करने और सेट करने की आवश्यकता होगी। हम यहां चेन नियम का उपयोग करते हैं।
यह देता है:
ऐसा अंत में:
इसलिए गणितीय रूप से हमें लगता है कि एक समाधान मिल गया है। हालांकि एक समस्या है, और वह यह है कि की गणना करना बहुत कठिन है यदि मैट्रिक्स बहुत बड़ा है। यह संख्यात्मक सटीकता के मुद्दे दे सकता है। इस स्थिति में लिए इष्टतम मानों को खोजने का एक और तरीका एक ढाल मूल विधि का उपयोग करना है। जिस फ़ंक्शन को हम ऑप्टिमाइज़ करना चाहते हैं वह अनबाउंड और उत्तल है, इसलिए यदि आवश्यक हो तो हम अभ्यास में एक ढाल विधि का भी उपयोग करेंगे।
एक साधारण व्युत्पत्ति सिर्फ LR की ज्यामितीय व्याख्या का उपयोग करके की जा सकती है।
रेखीय प्रतिगमन को स्तंभ स्थान पर के प्रक्षेपण के रूप में व्याख्या किया जा सकता है । इस प्रकार, त्रुटि, के स्तंभ स्थान के लिए ।
इसलिए, और त्रुटि के बीच आंतरिक उत्पाद 0 होना चाहिए, अर्थात
जिसका तात्पर्य है,
।
अब वही किया जा सकता है:
(1) को पर प्रोजेक्ट (त्रुटि ), ,
(2) प्रोजेक्ट करना पर (त्रुटि ), ,
और अंत में,
(3) प्रोजेक्ट करना पर ,