रिज रिग्रेशन का अनुमान एक रेखीय मॉडल में पैरामीटर by \ hat {\ boldsymbol \ Beta} _ \ lambda = (\ mathbff x ^ \ top \ mathbf X + \ lambda \ mathbf I) ^ {- 1} \ mathbf X ^ \ top \ mathbf y, जहां \ lambda एक नियमितीकरण पैरामीटर है। यह सर्वविदित है कि यह अक्सर ओएलएस प्रतिगमन ( \ lambda = 0 के साथ ) से बेहतर प्रदर्शन करता है जब कई सहसंबद्ध भविष्यवक्ता होते हैं।बीटा λ = ( एक्स ⊤ एक्स + λ मैं ) - 1 एक्स ⊤ y , λ λ = 0
रिज प्रतिगमन के लिए एक अस्तित्व प्रमेय का कहना है कि वहाँ हमेशा एक पैरामीटर मौजूद है ऐसी है कि के माध्य-चुकता त्रुटि OLS की संकरी-चुकता त्रुटि से सख्ती से छोटा होता है अनुमान । दूसरे शब्दों में, का एक इष्टतम मूल्य हमेशा गैर-शून्य होता है। यह जाहिरा तौर पर पहली बार होर्ल और केनेर्ड, 1970 में साबित हुआ था और कई व्याख्यान नोटों में दोहराया गया है जो मुझे ऑनलाइन (जैसे यहां और यहां ) मिलते हैं । मेरा प्रश्न इस प्रमेय की मान्यताओं के बारे में है:
क्या सहसंयोजक मैट्रिक्स \ mathbf X ^ \ top \ mathbf X के बारे में कोई धारणा है ?
क्या \ mathbf X की आयामीता के बारे में कोई धारणा है ?
विशेष रूप से, क्या प्रमेय अभी भी सही है अगर भविष्यवक्ता ऑर्थोगोनल हैं (यानी विकर्ण है), या यहां तक कि अगर ? और क्या यह अभी भी सच है अगर केवल एक या दो भविष्यवक्ता हैं (कहते हैं, एक भविष्यवक्ता और एक अवरोधक)?
यदि प्रमेय ऐसी कोई धारणा नहीं बनाता है और इन मामलों में भी सही रहता है, तो रिज प्रतिगमन आमतौर पर केवल सहसंबद्ध भविष्यवक्ताओं के मामले में अनुशंसित है, और कभी नहीं (?) सरल (यानी एकाधिक नहीं) प्रतिगमन के लिए अनुशंसित है?
यह संकोचन पर एकीकृत दृष्टिकोण के बारे में मेरे प्रश्न से संबंधित है : स्टीन के विरोधाभास, रिज प्रतिगमन और मिश्रित मॉडल में यादृच्छिक प्रभावों के बीच क्या संबंध है (यदि कोई है)? , लेकिन वहां कोई जवाब अब तक इस बिंदु को स्पष्ट नहीं करता है।