मान लीजिए कि हमारे पास इनपुट (प्रेडिक्टर) और आउटपुट (प्रतिक्रिया) डेटा बिंदु A, B, C, D, E हैं और हम बिंदुओं के माध्यम से एक पंक्ति फिट करना चाहते हैं। यह प्रश्न को स्पष्ट करने के लिए एक सरल समस्या है, लेकिन इसे उच्च आयामों तक भी बढ़ाया जा सकता है।
समस्या का विवरण
वर्तमान सर्वश्रेष्ठ फिट या परिकल्पना को ऊपर काली रेखा द्वारा दर्शाया गया है। नीला तीर ( ) डेटा बिंदु और वर्तमान सबसे अच्छा फिट के बीच ऊर्ध्वाधर दूरी का प्रतिनिधित्व करता है, बिंदु से एक ऊर्ध्वाधर रेखा खींचकर जब तक यह रेखा को पार नहीं करता है।
हरा तीर ( ) इस तरह खींचा जाता है कि यह चौराहे के बिंदु पर वर्तमान परिकल्पना के लंबवत है, और इस प्रकार डेटा बिंदु और वर्तमान परिकल्पना के बीच कम से कम दूरी का प्रतिनिधित्व करता है। अंक ए और बी के लिए, एक रेखा ऐसी खींची जाती है कि यह वर्तमान सबसे अच्छे अनुमान के लिए लंबवत हो और एक रेखा के समान हो जो x अक्ष पर लंबवत हो। इन दो बिंदुओं के लिए, नीली और हरी रेखाएँ ओवरलैप होती हैं, लेकिन वे अंक C, D और E के लिए नहीं होती हैं।
कम से कम वर्ग सिद्धांत किसी भी दिए गए प्रशिक्षण चक्र पर डेटा परिकल्पना (ए, बी, सी, डी या ई) के माध्यम से अनुमानित परिकल्पना ( ) के माध्यम से एक ऊर्ध्वाधर रेखा खींचकर रैखिक प्रतिगमन के लिए लागत फ़ंक्शन को परिभाषित करता है, और इसका प्रतिनिधित्व करता है
यहाँ डेटा बिंदुओं का प्रतिनिधित्व करता है, और ज θ ( एक्स मैं ) का प्रतिनिधित्व करता है सबसे अच्छा फिट।
एक बिंदु (ए, बी, सी, डी या ई) के बीच की न्यूनतम दूरी को उस बिंदु से खींची गई एक लंबवत रेखा द्वारा दर्शाया गया है जो वर्तमान सर्वोत्तम अनुमान (हरे तीर) पर है।
कम से कम स्क्वायर फंक्शन का लक्ष्य एक उद्देश्य फ़ंक्शन को परिभाषित करना है, जब कम से कम परिकल्पना और सभी बिंदुओं के बीच कम से कम दूरी को जन्म देगा, लेकिन जरूरी नहीं कि परिकल्पना और एक एकल इनपुट बिंदु के बीच की दूरी को कम करेगा।
**सवाल**
इनपुट डेटा बिंदु और परिकल्पना के बीच कम से कम दूरी के रूप में रैखिक प्रतिगमन के लिए लागत फ़ंक्शन को हम परिभाषित क्यों नहीं करते हैं (परिकल्पना के लिए लंबवत एक रेखा द्वारा परिभाषित) इनपुट डेटापॉइन से गुजर रहा है, जैसा कि ( ) द्वारा दिया गया है ?