रैखिक प्रतिगमन का अध्ययन क्यों करें?


13

यह देखते हुए दो यादृच्छिक चर और η हम गणना कर सकता है उनके "सहसंबंध गुणांक" , और इन दो यादृच्छिक चर के बीच सबसे अच्छा फिट की रेखा बनाती हैं। मेरा सवाल यह है कि क्यों?ξηc

1) यादृच्छिक चर, कर रहे हैं और η जो सबसे खराब संभव तरीके से निर्भर कर रहे हैं, यानी ξ = ( η ) और इस के बावजूद = 0 । यदि कोई केवल रेखीय प्रतिगमन के साथ सोचता है, तो कोई भी पूरी तरह से अंधा हो जाएगा।ξηξ=f(η)c=0

2) विशेष रूप से रैखिक क्यों? अन्य प्रकार के संबंध हैं जो यादृच्छिक चर के बीच मौजूद हो सकते हैं। क्यों सभी लोगों में से एक अकेला?


18
यह पूछने की तरह थोड़ा सा है कि जब आप कभी-कभी नाखूनों का सामना करते हैं, तो आपके पास एक पेचकश क्यों है।
साइकोरैक्स ने

6
आप इस आधार को भी मानने लगते हैं कि वहाँ ऐसे लोग हैं जो केवल रेखीय प्रतिगमन की परवाह करते हैं: "यदि कोई केवल रेखीय प्रतिगमन के बारे में सोचता है", "क्यों अकेला है जो सभी में से एक है "। यह मेरे लिए एक स्ट्रोमैन की तरह लगता है, बेशक यह एक और केवल एक उपकरण या परिप्रेक्ष्य का पालन करने के लिए हास्यास्पद है।
मैथ्यू ड्र्यू

7
रैखिक "विशेष रूप से" वास्तव में आधार कार्यों के रैखिक संयोजनों के बारे में अधिक है , जो वास्तव में काफी सामान्य हैं।
GeoMatt22

2
@MatthewDrury कोई स्ट्रोमैन नहीं है, और मैं कुछ भी नहीं मान रहा हूं, मैं केवल पद्धति में एक कमजोर बिंदु को समझने के लिए एक रोग-संबंधी-चरम-केस का उपयोग करके एक प्रश्न पूछ रहा हूं। आप ऐसा क्यों मान लेते हैं कि मैं ऐसा मानता हूं? सांख्यिकीविदों के लिए प्रतिगमन एक बहुत बड़ा विषय है। मुझे समझ नहीं आ रहा है कि इसमें ऐसा क्या खास है कि इसका इतना अध्ययन किया जाता है।
निकोलस बोर्बाकी

8
उन लोगों के लिए जो इस प्रश्न पर कड़ी मेहनत कर रहे हैं: मुझे लगता है कि जब आप पहली बार रैखिक प्रतिगमन के बारे में जान गए थे तो आपको वापस भूल गए थे और कहा गया था कि "मान्यताओं में से एक रैखिक प्रभाव है"। आपने खुद पर सोचा "लेकिन एक प्रभाव कभी रैखिक नहीं होता है!"। बहुत संभावना है, बहुत विचार करने के बाद , आपने खुद को आश्वस्त किया कि इसके बावजूद, रैखिक प्रतिगमन अभी भी एक मूलभूत उपकरण है जिसे दोनों को समझा और इस्तेमाल किया जा सकता है। अब बस अपने आप को वापस स्थापित करने से पहले आप उस विचार को पूरा कर लें। मुझे लगता है कि यह एक महान प्रश्न है कि प्रत्येक सांख्यिकी छात्र को विचार करने में अच्छा समय बिताना चाहिए।
एबी एबी

जवाबों:


10

मैं मानता हूं कि सभी संबंध अपने आप में रैखिक नहीं होते हैं, लेकिन काफी सारे संबंध रैखिक रूप से अनुमानित किए जा सकते हैं। हमने गणित में ऐसे कई मामले देखे हैं जैसे टेलर श्रृंखला या फूरियर श्रृंखला आदि। यहाँ प्रमुख बिंदु है, geomatt22 ने टिप्पणी में कहा, आप सामान्य रूप से नॉनलाइन डेटा को रूपांतरित कर सकते हैं और आधार कार्यों के साथ कुछ प्रकार के परिवर्तन लागू कर सकते हैं और रेखीय कर सकते हैं रिश्ते। कारण विश्वविद्यालय केवल 'कई रैखिक प्रतिगमन मॉडल' (सरल प्रतिगमन मॉडल सहित) को संबोधित करते हैं, क्योंकि वे अधिक उन्नत स्तर के मॉडल के लिए बिल्डिंग ब्लॉक हैं जो रैखिक भी हैं।

गणितीय रूप से बोल रहा हूं, जब तक आप यह साबित कर सकते हैं कि हिल्बर्ट अंतरिक्ष में एक निश्चित रैखिक सन्निकटन घना है, तब आप अंतरिक्ष में किसी फ़ंक्शन का प्रतिनिधित्व करने के लिए सन्निकटन का उपयोग करने में सक्षम होंगे।


2
बिल्कुल सही। किसी और ने इसका उल्लेख नहीं किया, लेकिन जैसा कि यह उत्तर कहता है, सामान्य तौर पर, आप हमेशा रिश्ते को रैखिक बनाने के लिए अपने चर में परिवर्तन लागू कर सकते हैं। इसके अलावा: ए) रैखिक रजिस्टरों के लिए वैश्विक मैक्सिमा को ढूंढना आसान है और बी) तंत्रिका नेटवर्क सहित कई अन्य मॉडल, यह समझना आसान है कि क्या आप लॉजिस्टिक रजिस्ट्रेशंस को जानते हैं जो रैखिक रेजिमेंट्स पर आधारित हैं।
रिकार्डो क्रूज़

7

जिस मॉडल का आप उल्लेख कर रहे हैं, सरल रेखीय प्रतिगमन, उर्फ ​​"सर्वश्रेष्ठ फिट की रेखा" (मैं यहां भ्रमित करने वाला मॉडल और अनुमान विधि हूं), माना जाता है कि यह बहुत सरल है (जैसा कि नाम कहता है)। इसका अध्ययन क्यों? मैं बहुत सारे कारण देख सकता हूं। निम्नलिखित में मैं मानता हूं कि यादृच्छिक चर की अवधारणा को कम से कम अनौपचारिक रूप से पेश किया गया है, क्योंकि आपने अपने प्रश्न में इसका उल्लेख किया है।

  1. शैक्षणिक: बेशक, आपके लिए यह स्पष्ट है कि परिमित दूसरे क्रम के क्षणों के साथ वास्तविक-मूल्यवान यादृच्छिक चर एक हिल्बर्ट स्थान बनाते हैं। शायद यह पहले से ही स्पष्ट था जब आपने पहली बार संभाव्यता सिद्धांत का अध्ययन किया था। लेकिन आंकड़ों को केवल गणित के छात्रों को नहीं सिखाया जाता है: भौतिक विज्ञान से लेकर अर्थशास्त्र तक, कंप्यूटर विज्ञान से लेकर सामाजिक विज्ञान आदि तक एक व्यापक जनता है, ये छात्र अपने अध्ययन के दौरान सांख्यिकी का सामना कर सकते हैं। वे रेखीय बीजगणित की अपेक्षा हो सकते हैं या नहीं हो सकते हैं, और यहां तक ​​कि पहले मामले में, उन्होंने इसे गणित के पाठ्यक्रम के अधिक सार बिंदु से नहीं देखा होगा। इन छात्रों के लिए, किसी अन्य यादृच्छिक चर द्वारा एक यादृच्छिक चर का अनुमान लगाने की बहुत अवधारणा इतनी तत्काल नहीं है। यहां तक ​​कि साधारण रैखिक मॉडल की मूल संपत्ति, यानी, तथ्य यह है कि त्रुटि और भविष्यवक्ता रूढ़िवादी यादृच्छिक चर हैं, कभी-कभी उन्हें आश्चर्य होता है। तथ्य यह है कि आप यादृच्छिक चर ("गंदा" वस्तुओं के बीच एक "कोण" को परिभाषित कर सकते हैं? एक औसत दर्जे का स्थान से एक औसत दर्जे का कार्य) आपके लिए स्पष्ट हो सकता है, लेकिन जरूरी नहीं कि एक नए व्यक्ति के लिए। इस प्रकार, यदि वेक्टर रिक्त स्थान का अध्ययन अच्छे राजभाषा 'यूक्लिडियन प्लेन' से शुरू होता है, तो क्या यह सबसे सरल एक के साथ सांख्यिकीय मॉडल का अध्ययन शुरू करने का कोई मतलब नहीं है?
  2. ξ=β0+i=1Nβiηi+ϵξ=i=0Nβiϕ(ηi)+ϵ
  3. व्यावहारिक : सरल रैखिक प्रतिगमन के कई सफल अनुप्रयोग हैं। अर्थशास्त्र में ओकुन का नियम , हुक का नियम , भौतिकी में ओम का नियम और चार्ल्स का नियम , चिकित्सा में रक्त सिस्टोलिक दबाव और उम्र के बीच संबंध (मुझे कोई पता नहीं है कि क्या इसका कोई नाम है!) सभी अलग-अलग डिग्री के साथ सरल रेखीय प्रतिगमन के उदाहरण हैं! सटीकता।

5

एक और कारण है प्यारा तरीका प्रतिगमन एनोवा जैसी तकनीकों का एकीकृत उपचार देता है । मेरे लिए, एनोवा का सामान्य 'प्राथमिक' उपचार काफी अस्पष्ट लगता है, फिर भी एक प्रतिगमन-आधारित उपचार क्रिस्टल स्पष्ट है। मुझे संदेह है कि प्रतिगमन मॉडल के साथ ऐसा करने के लिए बहुत कुछ है जो कुछ मान्यताओं को स्पष्ट करते हैं कि 'प्राथमिक' उपचार मौन और अपरिचित हैं। इसके अलावा, इस तरह के एक एकीकृत परिप्रेक्ष्य द्वारा की पेशकश की वैचारिक स्पष्टता सांख्यिकीय सॉफ्टवेयर में तरीकों को लागू करने के लिए समय आने पर इसी तरह के व्यावहारिक लाभों के साथ है।

यह सिद्धांत न केवल एनोवा पर लागू होता है, बल्कि प्रतिबंधित क्यूबिक स्प्लिन जैसे विस्तार पर भी लागू होता है - जो आपके दूसरे प्रश्न को विशेष रूप से संबोधित करता है।


3

रैखिक प्रतिगमन की लोकप्रियता इसकी व्याख्या करने वाले हिस्से के कारण है - अर्थात, गैर-तकनीकी लोग बस थोड़ा सा स्पष्टीकरण के साथ पैरामीटर गुणांक को समझ सकते हैं। यह व्यावसायिक स्थितियों में बहुत अधिक मूल्य जोड़ता है, जहां आउटपुट या पूर्वानुमान के अंत उपयोगकर्ताओं को गणित / आंकड़ों की गहरी समझ नहीं हो सकती है।

हां, इस तकनीक (सभी दृष्टिकोणों के साथ) के साथ धारणाएं और सीमाएं हैं, और यह कई मामलों में सबसे अच्छा फिट प्रदान नहीं कर सकता है। लेकिन रैखिक प्रतिगमन बहुत मजबूत है, और अक्सर मान्यताओं का उल्लंघन होने पर भी काफी अच्छा प्रदर्शन कर सकता है।

इन कारणों से, यह निश्चित रूप से अध्ययन के लायक है।


हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.