एक प्रतिगमन मॉडल की विविधता को समझाते हुए


13

यह एक सरल स्पष्टीकरण हो सकता है (मैं वैसे भी उम्मीद कर रहा हूं)।

मैंने रिग्रेशन टूलबॉक्स का उपयोग करते हुए मतलाब में कुछ प्रतिगमन विश्लेषण किया है। हालाँकि, मैं एक अध्ययन में आया हूँ जो यह बताता है:

"प्रतिगमन विश्लेषण का उपयोग करते हुए, केवल चार ध्वनि विशेषताओं का उपयोग करके एक भविष्य कहनेवाला मॉडल स्थापित करना संभव था जो 60% विचरण की व्याख्या करते हैं"

यदि आवश्यक हो तो लेख का लिंक यहां है: अनुच्छेद

मुझे 100% यकीन नहीं है कि इसका क्या मतलब है, लेकिन मैं इसके सरल होने की उम्मीद कर रहा हूं। इसके अलावा 60% एक अच्छी बात है? मैंने इसके लिए खोज करने की कोशिश की है, क्योंकि शब्द 'विचरण' से पहले हमेशा एक प्रतिशत होता है, इसका उत्तर खोजना कठिन है।

जवाबों:


9

मैं इसे सरल शब्दों में समझाने की कोशिश करूंगा।

प्रतिगमन मॉडल एक आश्रित चर और स्वतंत्र चर के सेट के बीच संबंध पर केंद्रित है । आश्रित चर वह परिणाम है, जिसे आप एक या अधिक स्वतंत्र चर का उपयोग करके भविष्यवाणी करने की कोशिश कर रहे हैं।

मान लें कि आपके पास एक मॉडल है:

वेट_आई = 3.0 + 35 * ऊंचाई_आई + +

अब एक स्पष्ट प्रश्न है: यह मॉडल कितनी अच्छी तरह काम करता है? दूसरे शब्दों में, किसी व्यक्ति की ऊंचाई कितनी अच्छी तरह से सटीक रूप से भविष्यवाणी करती है - या बताती है - उस व्यक्ति का वजन ?

इस प्रश्न का उत्तर देने से पहले, हमें यह समझने की आवश्यकता है कि हम लोगों के वजन में कितना उतार-चढ़ाव देखते हैं। यह महत्वपूर्ण है, क्योंकि हम यहां जो करने की कोशिश कर रहे हैं, वह विभिन्न लोगों के वजन में उतार-चढ़ाव (भिन्नता) को उनकी ऊंचाइयों का उपयोग करके समझाने के लिए है। यदि लोगों की ऊंचाई वजन में इस भिन्नता को समझाने में सक्षम है, तो हमारे पास एक अच्छा मॉडल है।

विचरण एक अच्छा मीट्रिक, इस उद्देश्य के लिए प्रयोग की जाने वाली के रूप में यह उपायों कितनी दूर संख्याओं के एक समूह (उनके माध्य मान से) बाहर फैले हुए हैं है।

इससे हमें अपने मूल प्रश्न को फिर से समझने में मदद मिलती है: किसी व्यक्ति के वजन में उसके / उसकी ऊँचाई के बारे में कितना विचलन हो सकता है ?

यह वह जगह है जहाँ "% विचरण समझाया गया" आता है। वैसे, प्रतिगमन विश्लेषण के लिए, यह सहसंबंध गुणांक आर-वर्ग के बराबर है ।

ऊपर दिए गए मॉडल के लिए, हम एक बयान देने में सक्षम हो सकते हैं जैसे: प्रतिगमन विश्लेषण का उपयोग करना, किसी व्यक्ति की ऊंचाई का उपयोग करके एक भविष्य कहनेवाला मॉडल स्थापित करना संभव था जो वजन में 60% विचरण की व्याख्या करता है ”।

अब, 60% कितना अच्छा है? इस बारे में वस्तुनिष्ठ निर्णय लेना कठिन है। लेकिन अगर आपके पास अन्य प्रतिस्पर्धी मॉडल हैं - कहते हैं, एक और प्रतिगमन मॉडल जो किसी व्यक्ति की आयु का उपयोग उसके वजन का अनुमान लगाने के लिए करता है - आप विभिन्न मॉडलों की तुलना उनके आधार पर कर सकते हैं कि उनके द्वारा कितना विचरण समझाया गया है और यह तय करें कि कौन सा मॉडल बेहतर है। (इसके कुछ संकेत हैं, 'इंटरप्रिटिंग एंड यूजिंग रिग्रेशन' - क्रिस्टोफर एच। अचेन http://www.sagepub.in/books/Book450/authors )


1
यह निश्चित रूप से मेरे प्रश्न का एक बड़ा हिस्सा है। लेखक इसके विशाल महत्व के कारण इसे क्यों कह रहे हैं, मुझे नहीं पता। इसलिए, यदि यह R- वर्गमूलक मान है और हम आपके उदाहरण पर वापस जाते हैं: कहते हैं कि हमने 'आयु' के लिए एक मॉडल का उपयोग किया था, जिसमें 80% का विचरण था, और फिर 'ऊँचाई' के लिए मॉडल था जिसमें 85 का विचरण था किसी व्यक्ति के वजन का अनुमान लगाने के लिए%, मैं इसे लेता हूं कि बाद वाला मॉडल अधिक महत्वपूर्ण होगा? पुस्तक लिंक के लिए धन्यवाद, मैंने इसे कल रात खरीदा क्योंकि मैं आगामी महीनों में प्रतिगमन का उपयोग कर रहा हूं।
user1574598

1
हां, आप यह निष्कर्ष निकाल सकते हैं कि बाद वाला मॉडल किसी व्यक्ति, कैटरिस पैरासस के वजन की भविष्यवाणी करने (या समझाने) की क्षमता में बेहतर है। BTW, आपने इसे "मॉडल में 80% का विचरण" कहा था, लेकिन यह "मॉडल 80% विचरण बताता है" होना चाहिए।
विशाल

4

लेखक मॉडल के लिए मान का उल्लेख कर रहे हैं जो सूत्र द्वारा दिया गया हैR2

i=1n(y^iy¯)2i=1n(yiy¯)2

जहां मनाया मूल्य, है के लिए कम से कम वर्गों फिट मूल्य डेटा बिंदु और समग्र मतलब है। हम कभी-कभी बारे में सोचते हैं कि मॉडल द्वारा बताए गए भिन्नता के अनुपात के कारण वर्गों के विघटन का कुल योग हैy मैं मैं वें ˉ y आर 2yiy^iithy¯R2

i=1n(yiy¯)2=i=1n(y^iy¯)2+i=1n(yiy^i)2,

अवशिष्ट त्रुटि अवशिष्ट त्रुटि है जिसका मॉडल द्वारा हिसाब नहीं किया जाता है। मूल रूप से हमें बताता है कि कैसे समग्र बदलाव की ज्यादा कर दिया गया सज्जित मूल्यों "में समाहित" किया है।R2

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.