प्रतिगमन की अवधारणा से संबंधित प्रक्षेप कैसे होता है?


17

संक्षेप में बताएं कि प्रक्षेप का क्या अर्थ है। यह प्रतिगमन की अवधारणा से कैसे संबंधित है?

प्रक्षेप एक तालिका की पंक्तियों के बीच पढ़ने की कला है और प्राथमिक गणित में यह शब्द आमतौर पर उस फ़ंक्शन के दिए गए या सारणीबद्ध मानों के एक सेट से फ़ंक्शन के मध्यवर्ती मूल्यों की गणना करने की प्रक्रिया को दर्शाता है।

मैं दूसरे प्रश्न का उत्तर नहीं दे सकता। कृपया सहायता कीजिए


4
प्रतिगमन का उद्देश्य एक्स (स्वतंत्र चर) दिए गए वाई (आश्रित चर) के अपेक्षित मूल्य का वर्णन करने के लिए एक फ़ंक्शन की पहचान करना है । एक्स के दिए गए मूल्यों पर वाई के मूल्य की भविष्यवाणी के लिए इंटरपोलेशन प्रतिगमन का उपयोग करता है । अंतर सूक्ष्म है, लेकिन उन मॉडलों में सामने आता है जहां वाई के सहसंबंधित हैं, क्योंकि तब अनुमानित मूल्य आमतौर पर उनके प्रतिगमन मूल्यों से भिन्न होते हैं। गणितीय तालिकाओं में प्रक्षेप करने के लिए न तो प्रतिगमन और न ही भविष्यवाणी सीधे लागू होती है, जो आमतौर पर माना जाता है कि कोई यादृच्छिक त्रुटि नहीं है, लेकिन उनके एल्गोरिदम का अभी भी उपयोग किया जा सकता है। YXYXY
व्हीबर

2
क्या यह काम किसी वर्ग के लिए है?
Glen_b -Reinstate Monica

जवाबों:


23

प्रक्षेप और प्रतिगमन के बीच मुख्य अंतर, उनके द्वारा हल की जाने वाली समस्या की परिभाषा है।

डेटा बिंदुओं को देखते हुए , जब आप प्रक्षेप करते हैं, तो आप एक फ़ंक्शन की तलाश करते हैं जो कुछ पूर्वनिर्धारित रूप का होता है जिसमें उस बिंदु के मान बिल्कुल निर्दिष्ट होते हैं। इसका मतलब है कि दिए गए जोड़े ( x i , y i ) आप कुछ पूर्वनिर्धारित रूप के F को खोजते हैं जो F ( x i ) = y i को संतुष्ट करता है । मुझे लगता है कि आमतौर पर एफ को बहुपद चुना जाता है, स्पलाइन (दिए गए बिंदुओं के बीच अंतराल पर कम डिग्री बहुपद)।n(xi,yi)FF(xi)=yiF

जब आप प्रतिगमन करते हैं, तो आप एक फ़ंक्शन की तलाश करते हैं जो कुछ लागत को कम करता है, आमतौर पर त्रुटियों के वर्गों का योग। आपको दिए गए बिंदुओं पर सटीक मान रखने के लिए फ़ंक्शन की आवश्यकता नहीं है, आप बस एक अच्छा -प्रकार चाहते हैं। सामान्य, अपने पाया समारोह में नहीं संतुष्ट हो सकता है एफ ( एक्स मैं ) = y मैं किसी भी डेटा बिंदु, लेकिन लागत समारोह, यानी के लिए Σ n मैं = 1 ( एफ ( एक्स मैं ) - y मैं ) 2 छोटी संभव हो जाएगा दिए गए फ़ॉर्म के सभी कार्य।FF(xi)=yii=1n(F(xi)yi)2

एक अच्छा उदाहरण है कि आप क्यों चाहते हैं कि इंटरपोल के बजाय केवल शेयर बाजार पर कीमतें हो सकती हैं। आप कुछ में कीमतों ले जा सकते हैं समय की हाल ही में इकाइयों, और उन्हें अंतर्वेशन के लिए समय की अगली इकाई में मूल्य के कुछ भविष्यवाणी प्राप्त करने की कोशिश। यह बल्कि एक बुरा विचार है, क्योंकि यह सोचने का कोई कारण नहीं है कि कीमतों के बीच संबंधों को वास्तव में एक बहुपत्नी द्वारा व्यक्त किया जा सकता है। लेकिन रैखिक प्रतिगमन कर सकता है, क्योंकि कीमतों में कुछ "ढलान" हो सकता है और एक रेखीय कार्य एक अच्छा संकरण हो सकता है, कम से कम स्थानीय रूप से (संकेत: यह इतना आसान नहीं है, लेकिन प्रतिगमन निश्चित रूप से इस मामले में प्रक्षेप से बेहतर विचार है )।k


अच्छा उत्तर। मैं कहूंगा कि प्रतिगमन के साथ, इसके पीछे एक सांख्यिकीय मॉडल है जो कुछ वितरण के संदर्भ में और एक्स के बीच के संबंध को परिभाषित करता है , जहां हम अनुमान लगाते हैं कि यह (या मंझला, या क्वांटाइल्स आदि प्रतिगमन के विभिन्न स्वादों में), जैसे आँकड़े .stackexchange.com / प्रश्न / 173,660 / ...YX
टिम

क्या आपके द्वारा वर्णित उदाहरण प्रक्षेप के बजाय एक्सट्रपलेशन नहीं होगा?
bi_scholar

6

पिछले दो जवाबों ने रैखिक प्रक्षेप और रैखिक प्रतिगमन (या यहां तक ​​कि सामान्य प्रक्षेप और बहुपद प्रतिगमन) के बीच संबंधों को समझाया है। लेकिन एक महत्वपूर्ण कनेक्शन यह है कि एक बार जब आप एक प्रतिगमन मॉडल फिट करते हैं, तो आप इसे दिए गए डेटा बिंदुओं के बीच प्रक्षेप करने के लिए उपयोग कर सकते हैं।


इसलिए जब मैं पुनः प्राप्त करता हूं, तो कहता हूं, लिंग के खिलाफ ऊंचाई मैं अर्ध-पुरुष, अर्ध-महिला की अपेक्षित ऊंचाई खोजने के लिए प्रक्षेप कर सकता हूं! यह काल्पनिक उदाहरण इस प्रतिक्रिया में मूल दोष को उजागर करता है, जो यह धारणा है कि एक प्रतिगमन मॉडल में सभी regressors को बड़े चर होना चाहिए।
whuber

2
मेरा उत्तर तब लागू होता है जब सभी भविष्यवक्ता चर निरंतर होते हैं ..
माइकल आर। चेरिक

4

उम्मीद है कि यह एक सरल उदाहरण और दृश्य के साथ जल्दी से आ जाएगा।

मान लें कि आपके पास निम्न डेटा है:

X  Y
1  6
10 15
20 25
30 35
40 45
50 55

हम X की प्रतिक्रिया के रूप में Y को मॉडल करने के लिए प्रतिगमन का उपयोग कर सकते हैं। R का उपयोग कर: lm(y ~ x)

परिणाम 5 का एक अवरोधन हैं, और 1 का x के लिए गुणांक है। जिसका अर्थ है कि एक मनमाना Y को किसी दिए गए X के लिए X + 5 के रूप में गणना की जा सकती है। चित्र के रूप में, आप इसे इस तरह देख सकते हैं:

enter image description here

ध्यान दें कि यदि आप X अक्ष पर, उसके साथ कहीं भी गए हैं, और फिट की गई रेखा तक एक रेखा खींची है, और फिर Y अक्ष पर एक रेखा खींची है, तो आप एक मान प्राप्त कर सकते हैं, चाहे मैंने उसके लिए मान बिंदु प्रदान किया हो या नहीं वाई। प्रतिगमन अंतर्निहित संबंधों का अनुमान लगाकर बिना किसी डेटा वाले क्षेत्रों में चिकनाई कर रहा है।


2

बुनियादी अंतर b / w इंटरपोलेशन और रिग्रेशन इस प्रकार है: इंटरपोलेशन: मान लीजिए कि n पॉइंट्स हैं (उदाहरण: 10 डेटा पॉइंट्स), इंटरपोलेशन में हम सभी डेटा पॉइंट्स से गुजरने वाले कर्व को फिट करेंगे (यानी 10 डेटा पॉइंट्स) बहुपद की संख्या (no.of डेटा अंक -1; यानी यहां यह 9 है)। जहाँ भी प्रतिगमन में सभी डेटा बिंदु नहीं होते हैं, केवल उनमें से एक सेट वक्र फिटिंग के लिए आवश्यक है।

आमतौर पर इंटरपोलेशन और रिग्रेशन का क्रम (1,2 या 3) होगा यदि ऑर्डर 3 से अधिक है, तो वक्र में अधिक दोलनों को देखा जाएगा।


2
इसका तात्पर्य यह है कि प्रक्षेप बहुपद पर आधारित है, लेकिन कई अन्य विधियां हैं, जैसे कि क्यूबिक स्लाइन, पीसवाइज क्यूबिक हर्माइट, निकटतम पड़ोसी, आदि
निक कॉक्स

@ हालांकि आप सही हैं, यह उत्सुक है कि आपके द्वारा वास्तव में नाम की जाने वाली प्रत्येक विधि बहुपद पर आधारित है! शायद सबसे सरल, सबसे प्रसिद्ध गैर-बहुपद इंटरपोलर उलटा-दूरी भार (आईडीडब्ल्यू) है।
व्हीबर

@ शुभंकर सहमत; यदि बहुपदों को अड़चनों के साथ लागू किया जा सकता है, तो अधिकांश विधियाँ अर्हता प्राप्त करती हैं, जैसे निकटतम पड़ोसी = कृप्या स्थिर, आदि
Nick Cox

2

प्रतिगमन सर्वोत्तम फिट की रेखा को खोजने की प्रक्रिया है [1]। इंटरपोलेशन एक और के मूल्य से एक चर के मूल्य का अनुमान लगाने के लिए सबसे अच्छा फिट की रेखा का उपयोग करने की प्रक्रिया है, बशर्ते कि आप जिस मूल्य का उपयोग कर रहे हैं वह आपके डेटा की सीमा के भीतर हो। यदि यह सीमा के बाहर है, तो आप एक्सट्रैपलेशन [1] का उपयोग कर रहे होंगे।

[१] http://mathhelpforum.com/advanced-applied-math/182558-interpolation-vs-regression.html


2
यह उत्तर एक्सट्रपलेशन से प्रक्षेप को अलग नहीं करता है। क्या आप बनाए रखते हैं कि वे एक ही चीज हैं? BTW, गणित फ़ोरम (और पाठ्यपुस्तकें और पेपर, यहां तक ​​कि) आम तौर पर सांख्यिकीय मुद्दों के बारे में जानकारी के अच्छे स्रोत नहीं हैं, क्योंकि वे संकीर्ण गणितीय अर्थों पर ध्यान केंद्रित करते हैं - हालांकि विशुद्ध रूप से गणितीय अनुप्रयोगों में सही और उपयोगी - अधिक व्यापक रूप से लागू नहीं हो सकते हैं ।
whuber

1

इंटरपोलेशन या स्पिलिट फिटिंग के साथ जो हमें मिलता है वह एक बड़े आकार का एक संख्यात्मक डेटा (प्रक्षेपित बेट वीमेन ओरिजिनल डेटा का प्रत्येक जोड़ा) होता है, जो कि प्लॉट किए जाने पर एक चिकनी वक्र का प्रभाव उत्पन्न करता है। वास्तविक डेटा में, मूल डेटा के प्रत्येक जोड़े के बीच एक अलग बहुपद फिट किया जाता है, इसलिए प्रक्षेप के बाद पूरा वक्र एक टुकड़ा-वार निरंतर वक्र है, जहां प्रत्येक टुकड़ा एक अलग बहुपद से बनता है।

यदि कोई मूल संख्यात्मक डेटा के पैरामीट्रिक प्रतिनिधित्व की तलाश में है, तो प्रतिगमन किया जाना चाहिए। तुम भी एक उच्च डिग्री बहुपद को फिट करने की कोशिश कर सकते हैं। किसी भी मामले में, प्रतिनिधित्व एक सन्निकटन होने जा रहा है। आप यह भी जाँच सकते हैं कि सन्निकटन कितना सही है।


ऐसा प्रतीत होता है कि आपके पास निक कॉक्स की टिप्पणी को पढ़ने का मौका नहीं है , जो बताता है कि सभी इंटरपोलर (स्थानीय) बहुपद नहीं हैं।
whuber

0

प्रतिगमन और प्रक्षेप दोनों का उपयोग किसी अन्य चर (X) के दिए गए मान के लिए एक चर (Y) के मूल्यों की भविष्यवाणी करने के लिए किया जाता है। प्रतिगमन में हम स्वतंत्र चर (एक्स) के दिए गए मूल्य के लिए निर्भर चर (वाई) के किसी भी मूल्य की भविष्यवाणी कर सकते हैं, भले ही वह सारणीबद्ध मूल्यों की सीमा के बाहर हो। लेकिन अंतर के मामले में हम केवल निर्भर चर के मूल्यों की भविष्यवाणी कर सकते हैं (Y) स्वतंत्र चर (X) के मान के लिए जो X के दिए गए मानों की सीमा के भीतर है।


0

इंटरपोलेशन एक्स = ए और एक्स = बी के बीच कई बिंदुओं को फिट करने की प्रक्रिया है, जो कि एक इंटरपोलिंग पॉलीनोमियल के बिल्कुल समान है। प्रतिगमन तकनीक की तुलना में बेहतर सटीकता के साथ डोमेन x = [a, b] में y के अनुमानित मूल्य (या लापता मूल्य) को खोजने के लिए प्रक्षेप का उपयोग किया जा सकता है।

दूसरी ओर, प्रतिगमन एक वक्र को कई बिंदुओं को फिट करने की एक प्रक्रिया है जो न्यूनतम चुकता त्रुटि वाले बिंदुओं के माध्यम से या उसके पास से गुजरती है। प्रतिगमन डोमेन x में y के मान का अनुमान नहीं लगाएगा बी, + अनंत)।

संक्षेप में, प्रक्षेप एक ज्ञात एक्स श्रेणी के डोमेन के भीतर y के मूल्य में बेहतर सटीकता प्रदान करते हैं, जबकि प्रतिगमन एक्स के ज्ञात सीमा से नीचे और परे डोमेन में वाई के बेहतर पूर्वानुमान प्रदान करता है।


3
यह प्रक्षेप की परिभाषा नहीं है कि एक बहुपद का उपयोग किया जाता है। अन्य सुचारू कार्य उपयुक्त हो सकते हैं।
निक कॉक्स

3
आपके दावों के साथ अन्य मुद्दे भी हैं। उदाहरण के लिए, प्रतिगमन प्रक्षेप से अधिक सटीक हो सकता है। दो प्रक्रियाओं के बीच सांख्यिकीय अंतर जो आप प्रतिनिधित्व करते हैं, उससे काफी अलग है: कृपया इस धागे में अन्य पदों को देखें।
whuber
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.