प्रतिगमन समस्याओं को "प्रतिगमन" समस्या क्यों कहा जाता है?


36

मैं बस सोच रहा था कि क्यों प्रतिगमन समस्याओं को "प्रतिगमन" समस्याएं कहा जाता है। नाम के पीछे की कहानी क्या है?

प्रतिगमन के लिए एक परिभाषा: "एक कम परिपूर्ण या विकसित राज्य के लिए पलायन।"


1
"इतिहास" खंड का दूसरा पैराग्राफ देखिए en.m.wikipedia.org/wiki/Regression_analysis
मार्क व्हाइट

जवाबों:


34

शब्द "प्रतिगमन" का उपयोग फ्रांसिस गाल्टन ने अपने 1886 के पेपर "वंशानुगत वंशानुगत में औसत दर्जे की ओर प्रतिगमन" के लिए किया था। मेरे ज्ञान के लिए उन्होंने केवल प्रतिगमन के संदर्भ में इस शब्द का इस्तेमाल किया । इस शब्द को तब अन्य लोगों द्वारा अपनाया गया था, जिसका अर्थ यह है कि आज यह एक सामान्य सांख्यिकीय पद्धति है।


15
गैल्टन ने उस कागज में पिता की ऊंचाई से एक बेटे की ऊंचाई का अनुमान लगाने के लिए एक रैखिक सन्निकटन निकाला। उनके समीकरण को फिट किया गया था, इसलिए औसत ऊंचाई वाले पिता का एक औसत ऊंचाई बेटा होगा, लेकिन औसत पिता की तुलना में लंबा एक बेटा होगा जो उसके पिता की औसत राशि से 2/3 अधिक लंबा है। औसत से कम के साथ। यह एक सरल रेखीय प्रतिगमन (आज का अर्थ) होने का तर्क दिया जा सकता है। और निश्चित रूप से आज प्रतिगमन का और भी व्यापक अर्थ है: यह कोई भी मॉडल है जो निरंतर भविष्यवाणियां करता है। यह दिलचस्प है कि उस शब्द का उसका मूल उपयोग कितना बदल गया है।
rm999

3
एनआरएच द्वारा उत्तर सही है। नीचे दिए गए लिंक "वंशानुगत कद में सामान्यता की ओर प्रतिगमन" फ्रांसिस गैलटॉन के कागज पर बहुत अधिक विवरण देता है blog.minitab.com/blog/statistics-and-quality-data-analysis/...
गौरव सिंघल

क्या यह आँकड़े समुदाय के लिए 'प्रतिगमन' शब्द को एक अधिक सीधे और स्पष्ट शब्द के साथ बदलने का समय है, शायद 'फार्मूलाटिक प्रेडिक्टर'?
एविएड रोजनशेख

4

प्रगति के विपरीत, हम वापस मतलब की ओर गिर रहे हैं, अर्थात वापस लौट रहे हैं। इसलिए शब्द प्रतिगमन! मुझे लगता है कि कुछ ऐसा है जो उठा और अटक गया।


2

@ मार्क व्हाइट ने पहले से ही लिंक का उल्लेख किया है, लेकिन आप में से उन लोगों के लिए जिनके पास लिंक की जांच करने के लिए अधिक समय नहीं है, यहां सटीक रूप से उचित सजा दी गई है:

'प्रतिगमन' की उत्पत्ति

"रिग्रेशन" शब्द 19 वीं शताब्दी में फ्रांसिस गैल्टन द्वारा एक जैविक घटना का वर्णन करने के लिए गढ़ा गया था। घटना यह थी कि लम्बे पूर्वजों के वंशजों की ऊंचाइयां एक सामान्य औसत (इस घटना को प्रतिगमन के रूप में प्रतिगमन के रूप में भी जाना जाता है) (गैल्टन, 1989 में पुनर्मुद्रित ) की ओर पुनः प्राप्त करती हैं। गैल्टन के लिए, प्रतिगमन का केवल यही जैविक अर्थ था (गैलटन, 1887) , लेकिन उनके काम को बाद में उडी यूल और कार्ल पियर्सन ने एक अधिक सामान्य सांख्यिकीय संदर्भ (पियर्सन, 1903) द्वारा विस्तारित किया

संदर्भ

https://en.wikipedia.org/wiki/Regression_analysis#History

गैल्टन, एफ। (1877)। आनुवंशिकता के विशिष्ट नियम। तृतीय। प्रकृति, 15 (389), 512-514।

गैल्टन, एफ (पुनर्मुद्रित 1989)। रिश्तेदारी और सहसंबंध। सांख्यिकीय विज्ञान, 4 (2), 80-86।

पियर्सन, के। (1903)। पैतृक आनुवंशिकता का नियम। बायोमेट्रिक, 2 (2), 211-228।


गैलन का 'प्रतिगमन से माध्य' के रूप में प्रतिगमन समझ में आता है। हालाँकि, मैं 'प्रतिगमन' शब्द के उपयोग को 'इंडिपेंडेंट वैरिएबल से फॉर्मूला वेरिएबल वेरिएबल' सीखने का मतलब नहीं समझता हूँ
एविएड रोज़ेनशेख

1
यह आमतौर पर इसका मतलब है कि, लेकिन मशीन लर्निंग प्रतिगमन का उपयोग करता है, लेकिन प्रतिगमन एक मशीन सीखने की तकनीक नहीं है, लोकप्रिय, गलत राय के बावजूद। सांख्यिकीय अधिगम मशीन लर्निंग से अलग है, लेकिन सामान्य तौर पर, एमएल प्रस्तावक सांख्यिकीय तरीके लेते हैं और गलत तरीके से उन्हें लेबल करते हैं ताकि एमएल असंगतताएं उत्पन्न हों। गैलन की प्रतिगमन प्रतिगमन है; यह मॉडलिंग / एक प्रवृत्ति की भविष्यवाणी के साथ करना है।
एलएससी

0

"प्रतिगमन" "रेज्रेस" से आता है जो बदले में लैटिन "रेग्रेसस" से आता है - वापस जाने के लिए (कुछ करने के लिए)।

उस अर्थ में, प्रतिगमन एक ऐसी तकनीक है जो डेटा को व्याख्या करने के लिए गन्दा, कठिन और स्पष्ट अर्थपूर्ण मॉडल से "वापस जाने" की अनुमति देती है। एक भौतिक विज्ञानी के रूप में, मुझे यह विचार पसंद है, क्योंकि भौतिक विज्ञानी अपेक्षाकृत सरल प्राकृतिक नियम के कई संभावित परिणामों के रूप में प्राकृतिक घटनाओं को देखते हैं।

दूसरे शब्दों में, प्रतिगमन शब्द से प्रतीत होता है कि डेटा केवल "सांख्यिकीय मॉडल" का दृश्यमान, मूर्त प्रभाव है। दूसरे शब्दों में, मॉडल पहले आता है, और आपकी इच्छा डेटा "वापस जाने के लिए" का उपयोग करती है जो उन्हें उत्पन्न करता है।


0

जैसा कि मुझे पता है कि regressionसांख्यिकीय अर्थ का शब्द एक चर के माध्य मूल्य और अन्य चर के संबंधित मूल्यों के बीच संबंध का माप है।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.