प्रक्षेप और प्रतिगमन के बीच मुख्य अंतर, उनके द्वारा हल की जाने वाली समस्या की परिभाषा है।
डेटा बिंदुओं को देखते हुए , जब आप प्रक्षेप करते हैं, तो आप एक फ़ंक्शन की तलाश करते हैं जो कुछ पूर्वनिर्धारित रूप का होता है जिसमें उस बिंदु के मान बिल्कुल निर्दिष्ट होते हैं। इसका मतलब है कि दिए गए जोड़े ( x i , y i ) आप कुछ पूर्वनिर्धारित रूप के F को खोजते हैं जो F ( x i ) = y i को संतुष्ट करता है । मुझे लगता है कि आमतौर पर एफ को बहुपद चुना जाता है, स्पलाइन (दिए गए बिंदुओं के बीच अंतराल पर कम डिग्री बहुपद)।n(xi,yi)FF(xi)=yiF
जब आप प्रतिगमन करते हैं, तो आप एक फ़ंक्शन की तलाश करते हैं जो कुछ लागत को कम करता है, आमतौर पर त्रुटियों के वर्गों का योग। आपको दिए गए बिंदुओं पर सटीक मान रखने के लिए फ़ंक्शन की आवश्यकता नहीं है, आप बस एक अच्छा -प्रकार चाहते हैं। सामान्य, अपने पाया समारोह में नहीं संतुष्ट हो सकता है एफ ( एक्स मैं ) = y मैं किसी भी डेटा बिंदु, लेकिन लागत समारोह, यानी के लिए Σ n मैं = 1 ( एफ ( एक्स मैं ) - y मैं ) 2 छोटी संभव हो जाएगा दिए गए फ़ॉर्म के सभी कार्य।FF(xi)=yi∑ni=1(F(xi)−yi)2
एक अच्छा उदाहरण है कि आप क्यों चाहते हैं कि इंटरपोल के बजाय केवल शेयर बाजार पर कीमतें हो सकती हैं। आप कुछ में कीमतों ले जा सकते हैं समय की हाल ही में इकाइयों, और उन्हें अंतर्वेशन के लिए समय की अगली इकाई में मूल्य के कुछ भविष्यवाणी प्राप्त करने की कोशिश। यह बल्कि एक बुरा विचार है, क्योंकि यह सोचने का कोई कारण नहीं है कि कीमतों के बीच संबंधों को वास्तव में एक बहुपत्नी द्वारा व्यक्त किया जा सकता है। लेकिन रैखिक प्रतिगमन कर सकता है, क्योंकि कीमतों में कुछ "ढलान" हो सकता है और एक रेखीय कार्य एक अच्छा संकरण हो सकता है, कम से कम स्थानीय रूप से (संकेत: यह इतना आसान नहीं है, लेकिन प्रतिगमन निश्चित रूप से इस मामले में प्रक्षेप से बेहतर विचार है )।k