हस्ती और तिब्शीरानी ने अपनी पुस्तक के खंड 4.3.2 में उल्लेख किया है कि रैखिक प्रतिगमन सेटिंग में, सबसे कम वर्ग दृष्टिकोण वास्तव में अधिकतम संभावना का एक विशेष मामला है। हम इस परिणाम को कैसे साबित कर सकते हैं?
पुनश्च: कोई गणितीय विवरण नहीं।
हस्ती और तिब्शीरानी ने अपनी पुस्तक के खंड 4.3.2 में उल्लेख किया है कि रैखिक प्रतिगमन सेटिंग में, सबसे कम वर्ग दृष्टिकोण वास्तव में अधिकतम संभावना का एक विशेष मामला है। हम इस परिणाम को कैसे साबित कर सकते हैं?
पुनश्च: कोई गणितीय विवरण नहीं।
जवाबों:
रैखिक प्रतिगमन मॉडल
, कहाँ पे
, तथा
ध्यान दें कि हमारा मॉडल त्रुटि (अवशिष्ट) है । हमारा लक्ष्य एक वेक्टर की खोज करना हैकि कम से कम इस त्रुटि का मानक वर्ग।
कम से कम दो गुना
डेटा दिया गया जहां प्रत्येक है आयामी, हम खोजना चाहते हैं:
अधिकतम संभाव्यता
ऊपर दिए गए मॉडल का उपयोग करके, हम मापदंडों को दिए गए डेटा की संभावना निर्धारित कर सकते हैं जैसा:
कहाँ पे औसत 0 और विचरण के साथ एक सामान्य वितरण की पीडीएफ है । इसमें प्लगिंग:
अब आम तौर पर जब संभावना से निपटने के लिए इसकी गणितीय रूप से जारी रखने से पहले लॉग लेना आसान हो जाता है (उत्पाद रकम बन जाते हैं, घातांक दूर हो जाते हैं), तो चलो ऐसा करते हैं।
चूँकि हम अधिकतम संभावना का अनुमान चाहते हैं, इसलिए हम सम्मान के साथ, अधिकतम समीकरण का अधिकतम पता लगाना चाहते हैं । पहला शब्द हमारे अनुमान को प्रभावित नहीं करता है, इसलिए हम इसे अनदेखा कर सकते हैं:
ध्यान दें कि भाजक सम्मान के साथ एक स्थिर है । अंत में, ध्यान दें कि राशि के सामने एक नकारात्मक चिन्ह है। इसलिए एक ऋणात्मक संख्या का अधिकतम पता लगाना नकारात्मक के बिना इसका न्यूनतम पता लगाने जैसा है। दूसरे शब्दों में:
याद रखें कि इस काम के लिए, हमें कुछ मॉडल मान्यताओं (त्रुटि की शर्तों की सामान्यता, 0 माध्य, निरंतर विचरण) करना था। यह कुछ शर्तों के तहत कम से कम वर्गों को MLE के बराबर बनाता है। अधिक चर्चा के लिए यहां और यहां देखें ।
पूर्णता के लिए, ध्यान दें कि समाधान के रूप में लिखा जा सकता है: