रिज प्रतिगमन में, उद्देश्य समारोह को कम से कम किया जा रहा है:
क्या यह लैगेंज गुणक विधि का उपयोग करके अनुकूलित किया जा सकता है? या यह सीधे भेदभाव है?
रिज प्रतिगमन में, उद्देश्य समारोह को कम से कम किया जा रहा है:
क्या यह लैगेंज गुणक विधि का उपयोग करके अनुकूलित किया जा सकता है? या यह सीधे भेदभाव है?
जवाबों:
रिज समस्या के लिए दो योग हैं। पहले वाला है
का विषय है
यह सूत्रीकरण प्रतिगमन गुणांक पर आकार की कमी को दर्शाता है। ध्यान दें कि यह बाधा क्या है; हम गुणांक को त्रिज्या साथ मूल के आसपास एक गेंद में झूठ बोलने के लिए मजबूर कर रहे हैं ।
दूसरा सूत्रीकरण आपकी समस्या है
जिसे लार्जेंज मल्टीप्लायर फॉर्मुलेशन के रूप में देखा जा सकता है। ध्यान दें कि यहाँ एक ट्यूनिंग पैरामीटर है और इसके बड़े मान अधिक सिकुड़न को जन्म देंगे। आप संबंध में अभिव्यक्ति को अलग करने के लिए आगे बढ़ सकते हैं और प्रसिद्ध रिज अनुमानक प्राप्त कर सकते हैं
दो योग पूरी तरह से समतुल्य हैं , क्योंकि और बीच एक-से-एक पत्राचार है ।
मुझे उस पर थोड़ा विस्तार करना चाहिए। कल्पना करें कि आप आदर्श ऑर्थोगोनल केस में हैं, । यह एक बहुत ही सरलीकृत और अवास्तविक स्थिति है, लेकिन हम अनुमानक की जांच मेरे साथ थोड़ा और अधिक बारीकी से कर सकते हैं। विचार करें कि समीकरण (1) के साथ क्या होता है। रिज अनुमानक कम हो जाता है
जैसे कि ऑर्थोगोनल केस में OLS आकलनकर्ता को । इस घटक-वार को देखते हुए अब हम प्राप्त करते हैं
ध्यान दें कि अब संकोचन सभी गुणांक के लिए स्थिर है। यह सामान्य मामले में पकड़ नहीं हो सकता है और वास्तव में यह दिखाया जा सकता है कि अगर मैट्रिक्स में पतित हैं तो संकोचन व्यापक रूप से भिन्न होंगे ।
लेकिन विवश अनुकूलन समस्या पर वापस लौटते हैं। केकेटी सिद्धांत द्वारा, इष्टतमता के लिए एक आवश्यक शर्त है
इसलिए या तो या (इस मामले में हम कहते हैं कि बाधा बाध्यकारी है)। यदि तो कोई जुर्माना नहीं है और हम नियमित OLS स्थिति में वापस आ गए हैं। मान लीजिए कि फिर बाधा बाध्यकारी है और हम दूसरी स्थिति में हैं। (2) में सूत्र का उपयोग करना, हमारे पास तब है
जिसे हम प्राप्त करते हैं
पहले एक-से-एक रिश्ते ने दावा किया था। मुझे उम्मीद है कि यह गैर-ऑर्थोगोनल मामले में स्थापित करना कठिन है, लेकिन परिणाम की परवाह किए बिना किया जाता है।
हालांकि (2) को फिर से देखें और आप देखेंगे कि हम अभी भी याद नहीं कर रहे हैं । इसके लिए एक इष्टतम मूल्य प्राप्त करने के लिए, आप या तो क्रॉस-सत्यापन का उपयोग कर सकते हैं या रिज ट्रेस को देख सकते हैं। उत्तरार्द्ध विधि में (0,1) में अनुक्रम का निर्माण करना और यह देखना है कि अनुमान कैसे बदलते हैं। फिर आप उन्हें स्थिर करने वाले चयन करते हैं। इस विधि को नीचे दिए गए संदर्भों के दूसरे तरीके से सुझाया गया था और यह सबसे पुराना है।
संदर्भ
होर्ल, आर्थर ई।, और रॉबर्ट डब्ल्यू। केनार्ड। "रिज रिग्रेशन: अपरंपरागत समस्याओं के लिए बायस्ड अनुमान।" टेक्नोमेट्रिक्स 12.1 (1970): 55-67।
होर्ल, आर्थर ई।, और रॉबर्ट डब्ल्यू। केनार्ड। "रिज रिग्रेशन: नॉनथोगोगोनल समस्याओं के लिए आवेदन।" टेक्नोमेट्रिक्स 12.1 (1970): 69-82।
मेरी पुस्तक प्रतिगमन मॉडलिंग रणनीतियाँ चुनने के लिए प्रभावी एआईसी के उपयोग में । यह दंडित लॉग लाइबिलिटी और स्वतंत्रता की प्रभावी डिग्री से आता है, बाद वाला एक फ़ंक्शन है जो पेनल्टीकरण द्वारा के कितने संस्करण कम किए जाते हैं। इस बारे में एक प्रस्तुति यहां दी गई है । R पैकेज ढूँढता है जो प्रभावी AIC को अनुकूलित करता है, और कई पेनल्टी पैरामीटर (उदाहरण के लिए, रैखिक मुख्य प्रभावों के लिए एक, nonlinear मुख्य प्रभावों के लिए एक, रैखिक संपर्क प्रभावों के लिए एक, और nonlinear इंटरैक्शन प्रभावों के लिए एक) की अनुमति देता है।rms
pentrace
मैं इसे विश्लेषणात्मक रूप से नहीं करता, बल्कि संख्यात्मक रूप से करता हूं। मैं आमतौर पर RMSE बनाम λ की साजिश करता हूं:
चित्रा 1. आरएमएसई और निरंतर λ या अल्फा।