रिज प्रतिगमन में, उद्देश्य समारोह को कम से कम किया जा रहा है:
क्या यह लैगेंज गुणक विधि का उपयोग करके अनुकूलित किया जा सकता है? या यह सीधे भेदभाव है?
रिज प्रतिगमन में, उद्देश्य समारोह को कम से कम किया जा रहा है:
क्या यह लैगेंज गुणक विधि का उपयोग करके अनुकूलित किया जा सकता है? या यह सीधे भेदभाव है?
जवाबों:
रिज समस्या के लिए दो योग हैं। पहले वाला है
का विषय है
यह सूत्रीकरण प्रतिगमन गुणांक पर आकार की कमी को दर्शाता है। ध्यान दें कि यह बाधा क्या है; हम गुणांक को त्रिज्या साथ मूल के आसपास एक गेंद में झूठ बोलने के लिए मजबूर कर रहे हैं ।
दूसरा सूत्रीकरण आपकी समस्या है
जिसे लार्जेंज मल्टीप्लायर फॉर्मुलेशन के रूप में देखा जा सकता है। ध्यान दें कि यहाँ एक ट्यूनिंग पैरामीटर है और इसके बड़े मान अधिक सिकुड़न को जन्म देंगे। आप संबंध में अभिव्यक्ति को अलग करने के लिए आगे बढ़ सकते हैं और प्रसिद्ध रिज अनुमानक प्राप्त कर सकते हैं
दो योग पूरी तरह से समतुल्य हैं , क्योंकि और बीच एक-से-एक पत्राचार है ।
मुझे उस पर थोड़ा विस्तार करना चाहिए। कल्पना करें कि आप आदर्श ऑर्थोगोनल केस में हैं, । यह एक बहुत ही सरलीकृत और अवास्तविक स्थिति है, लेकिन हम अनुमानक की जांच मेरे साथ थोड़ा और अधिक बारीकी से कर सकते हैं। विचार करें कि समीकरण (1) के साथ क्या होता है। रिज अनुमानक कम हो जाता है
जैसे कि ऑर्थोगोनल केस में OLS आकलनकर्ता को । इस घटक-वार को देखते हुए अब हम प्राप्त करते हैं
ध्यान दें कि अब संकोचन सभी गुणांक के लिए स्थिर है। यह सामान्य मामले में पकड़ नहीं हो सकता है और वास्तव में यह दिखाया जा सकता है कि अगर मैट्रिक्स में पतित हैं तो संकोचन व्यापक रूप से भिन्न होंगे ।
लेकिन विवश अनुकूलन समस्या पर वापस लौटते हैं। केकेटी सिद्धांत द्वारा, इष्टतमता के लिए एक आवश्यक शर्त है
इसलिए या तो या (इस मामले में हम कहते हैं कि बाधा बाध्यकारी है)। यदि तो कोई जुर्माना नहीं है और हम नियमित OLS स्थिति में वापस आ गए हैं। मान लीजिए कि फिर बाधा बाध्यकारी है और हम दूसरी स्थिति में हैं। (2) में सूत्र का उपयोग करना, हमारे पास तब है
जिसे हम प्राप्त करते हैं
पहले एक-से-एक रिश्ते ने दावा किया था। मुझे उम्मीद है कि यह गैर-ऑर्थोगोनल मामले में स्थापित करना कठिन है, लेकिन परिणाम की परवाह किए बिना किया जाता है।
हालांकि (2) को फिर से देखें और आप देखेंगे कि हम अभी भी याद नहीं कर रहे हैं । इसके लिए एक इष्टतम मूल्य प्राप्त करने के लिए, आप या तो क्रॉस-सत्यापन का उपयोग कर सकते हैं या रिज ट्रेस को देख सकते हैं। उत्तरार्द्ध विधि में (0,1) में अनुक्रम का निर्माण करना और यह देखना है कि अनुमान कैसे बदलते हैं। फिर आप उन्हें स्थिर करने वाले चयन करते हैं। इस विधि को नीचे दिए गए संदर्भों के दूसरे तरीके से सुझाया गया था और यह सबसे पुराना है।
संदर्भ
होर्ल, आर्थर ई।, और रॉबर्ट डब्ल्यू। केनार्ड। "रिज रिग्रेशन: अपरंपरागत समस्याओं के लिए बायस्ड अनुमान।" टेक्नोमेट्रिक्स 12.1 (1970): 55-67।
होर्ल, आर्थर ई।, और रॉबर्ट डब्ल्यू। केनार्ड। "रिज रिग्रेशन: नॉनथोगोगोनल समस्याओं के लिए आवेदन।" टेक्नोमेट्रिक्स 12.1 (1970): 69-82।
मेरी पुस्तक प्रतिगमन मॉडलिंग रणनीतियाँ चुनने के लिए प्रभावी एआईसी के उपयोग में । यह दंडित लॉग लाइबिलिटी और स्वतंत्रता की प्रभावी डिग्री से आता है, बाद वाला एक फ़ंक्शन है जो पेनल्टीकरण द्वारा के कितने संस्करण कम किए जाते हैं। इस बारे में एक प्रस्तुति यहां दी गई है । R पैकेज ढूँढता है जो प्रभावी AIC को अनुकूलित करता है, और कई पेनल्टी पैरामीटर (उदाहरण के लिए, रैखिक मुख्य प्रभावों के लिए एक, nonlinear मुख्य प्रभावों के लिए एक, रैखिक संपर्क प्रभावों के लिए एक, और nonlinear इंटरैक्शन प्रभावों के लिए एक) की अनुमति देता है।rmspentrace
मैं इसे विश्लेषणात्मक रूप से नहीं करता, बल्कि संख्यात्मक रूप से करता हूं। मैं आमतौर पर RMSE बनाम λ की साजिश करता हूं:
चित्रा 1. आरएमएसई और निरंतर λ या अल्फा।