यह सवाल दिलचस्प है, क्योंकि यह अनुकूलन सिद्धांत, अनुकूलन विधियों और सांख्यिकीय तरीकों के बीच कुछ कनेक्शनों को उजागर करता है, जिसे किसी भी सक्षम उपयोगकर्ता को समझने की आवश्यकता होती है। यद्यपि ये कनेक्शन सरल और आसानी से सीखे जाते हैं, वे सूक्ष्म और अक्सर अनदेखी होते हैं।
टिप्पणियों से कुछ विचारों को अन्य उत्तरों के लिए संक्षेप में, मैं बताना चाहूंगा कि कम से कम दो तरीके हैं जो "रैखिक प्रतिगमन" गैर-अद्वितीय समाधान पैदा कर सकते हैं - केवल सैद्धांतिक रूप से नहीं, लेकिन व्यवहार में।
पहचान की कमी
पहला है जब मॉडल पहचानने योग्य नहीं है। यह एक उत्तल बनाता है, लेकिन कड़ाई से उत्तल उद्देश्य फ़ंक्शन नहीं है, जिसमें कई समाधान हैं।
उदाहरण के लिए, डेटा ) के लिए और (एक अवरोधन के साथ) के विरुद्ध को पुनः प्राप्त करें। । एक समाधान है । एक और । यह देखने के लिए कि कई समाधान होने चाहिए, मॉडल को तीन वास्तविक मापदंडों और एक त्रुटि शब्द के रूप में करेंzxy(x,y,z)जेड = 1 + y z = 1 - एक्स ( λ , μ , ν ) ε(1,−1,0),(2,−2,−1),(3,−3,−2)z^=1+yz^=1−x(λ,μ,ν)ε
z=1+μ+(λ+ν−1)x+(λ−ν)y+ε.
अवशिष्टों के वर्गों का योग सरल हो जाता है
SSR=3μ2+24μν+56ν2.
(यह वस्तुनिष्ठ कार्यों का एक सीमित मामला है, जो व्यवहार में उत्पन्न होता है, जैसे कि एक एम-अनुमानक के अनुभवजन्य हेसियन अनिश्चित काल के लिए चर्चा कर सकते हैं ? जहां आप विस्तृत विश्लेषण पढ़ सकते हैं और फ़ंक्शन के प्लॉट देख सकते हैं।)
चूँकि वर्गों के गुणांक ( और ) धनात्मक होते हैं और निर्धारक धनात्मक होता है, यह धनात्मक-अर्धवार्षिक द्विघात रूप में । यह कम से कम हो जाता है जब , लेकिन का कोई भी मान हो सकता है। चूँकि वस्तुनिष्ठ फ़ंक्शन पर निर्भर नहीं करता है , न तो इसका ग्रेडिएंट (या कोई भी अन्य डेरिवेटिव) नहीं है। इसलिए, किसी भी ढाल वंशज एल्गोरिथ्म - अगर यह दिशा के कुछ मनमाने बदलाव नहीं करता है - तो जो भी शुरुआती मूल्य था, उसके समाधान का मूल्य निर्धारित करेगा ।56 3 × 56 - ( 24 / 2 ) 2 = 24 ( μ , ν , λ ) μ = ν = 0 λ एसएसआर λ λ3563×56−(24/2)2=24(μ,ν,λ)μ=ν=0λSSRλλ
यहां तक कि जब ढाल वंश का उपयोग नहीं किया जाता है, तो समाधान अलग-अलग हो सकता है। में R
के रूप में: उदाहरण के लिए, वहाँ दो आसान, बराबर इस मॉडल को निर्दिष्ट करने के तरीके हैं z ~ x + y
या z ~ y + x
। पहला पैदावार लेकिन दूसरा । जेड =1+yz^=1−xz^=1+y
> x <- 1:3
> y <- -x
> z <- y+1
> lm(z ~ x + y)
Coefficients:
(Intercept) x y
1 -1 NA
> lm(z ~ y + x)
Coefficients:
(Intercept) y x
1 1 NA
( NA
मानों को शून्य के रूप में व्याख्या की जानी चाहिए, लेकिन एक चेतावनी के साथ कि कई समाधान मौजूद हैं। चेतावनी का प्रदर्शन संभव था क्योंकि इसमें किए गए प्रारंभिक विश्लेषण R
इसकी समाधान विधि से स्वतंत्र हैं। एक ढाल वंश विधि संभवतः कई समाधानों की संभावना का पता नहीं लगाएगा। हालाँकि एक अच्छा व्यक्ति आपको कुछ अनिश्चितता के बारे में चेतावनी देता है कि यह इष्टतम पर आ गया है।)
पैरामीटर बाधा
सख्त उत्तलता एक अद्वितीय वैश्विक इष्टतम की गारंटी देती है, बशर्ते मापदंडों का डोमेन उत्तल हो। पैरामीटर प्रतिबंध गैर-उत्तल डोमेन बना सकते हैं, जिससे कई वैश्विक समाधान हो सकते हैं।
एक बहुत ही सरल उदाहरण डेटा लिए एक "माध्य" का आकलन करने की समस्या को वहन करता है प्रतिबंध के अधीन । यह एक ऐसी स्थिति है जो रिज रेज्रेशन, लास्सो, या इलास्टिक नेट जैसे नियमितीकरण के तरीकों के विपरीत है: यह जोर दे रहा है कि एक मॉडल पैरामीटर बहुत छोटा न हो। (इस पैरामीटर पर विभिन्न प्रश्न सामने आए हैं, जिसमें पूछा गया है कि ऐसे पैरामीटर बाधाओं के साथ प्रतिगमन समस्याओं को कैसे हल किया जाए, जिससे पता चलता है कि वे अभ्यास में उत्पन्न होते हैं।)μ| μ | ≥ 1 / 2−1,1|μ|≥1/2
इस उदाहरण के दो कम-वर्ग समाधान हैं, दोनों समान रूप से अच्छे हैं। वे कम से कम बाधा के अधीन पाए जाते हैं । दो समाधान । एक से अधिक समाधान उत्पन्न हो सकते हैं क्योंकि पैरामीटर प्रतिबंध डोमेन गैर- बनाता है :(1−μ)2+(−1−μ)2|μ|≥1/2μ=±1/2μ∈(−∞,−1/2]∪[1/2,∞)
Parabola एक (सख्ती से) उत्तल फ़ंक्शन का ग्राफ है। गाढ़ा लाल भाग, के डोमेन तक सीमित हिस्सा है : इसमें दो सबसे कम अंक , जहां वर्गों का योग । बाकी परबोला (बिंदीदार दिखाया गया है) बाधा द्वारा हटा दिया जाता है, जिससे विचार से इसकी अद्वितीय न्यूनतम समाप्त हो जाती है।μμ=±1/25/2
एक ढाल वंश विधि, जब तक यह बड़ी छलांग लेने के लिए, संभावना "अद्वितीय" समाधान खोजने होगा तैयार थे जब एक सकारात्मक मूल्य के साथ शुरू और अन्यथा यह "अद्वितीय" समाधान खोजने के हैं नकारात्मक मूल्य के साथ शुरू होने पर ।μ=1/2μ=−1/2
एक ही स्थिति बड़े डेटासेट और उच्च आयामों में हो सकती है (जो कि फिट होने के लिए अधिक प्रतिगमन मापदंडों के साथ है)।