मैं इसे सरल शब्दों में समझाने की कोशिश करूंगा।
प्रतिगमन मॉडल एक आश्रित चर और स्वतंत्र चर के सेट के बीच संबंध पर केंद्रित है । आश्रित चर वह परिणाम है, जिसे आप एक या अधिक स्वतंत्र चर का उपयोग करके भविष्यवाणी करने की कोशिश कर रहे हैं।
मान लें कि आपके पास एक मॉडल है:
वेट_आई = 3.0 + 35 * ऊंचाई_आई + +
अब एक स्पष्ट प्रश्न है: यह मॉडल कितनी अच्छी तरह काम करता है? दूसरे शब्दों में, किसी व्यक्ति की ऊंचाई कितनी अच्छी तरह से सटीक रूप से भविष्यवाणी करती है - या बताती है - उस व्यक्ति का वजन ?
इस प्रश्न का उत्तर देने से पहले, हमें यह समझने की आवश्यकता है कि हम लोगों के वजन में कितना उतार-चढ़ाव देखते हैं। यह महत्वपूर्ण है, क्योंकि हम यहां जो करने की कोशिश कर रहे हैं, वह विभिन्न लोगों के वजन में उतार-चढ़ाव (भिन्नता) को उनकी ऊंचाइयों का उपयोग करके समझाने के लिए है। यदि लोगों की ऊंचाई वजन में इस भिन्नता को समझाने में सक्षम है, तो हमारे पास एक अच्छा मॉडल है।
विचरण एक अच्छा मीट्रिक, इस उद्देश्य के लिए प्रयोग की जाने वाली के रूप में यह उपायों कितनी दूर संख्याओं के एक समूह (उनके माध्य मान से) बाहर फैले हुए हैं है।
इससे हमें अपने मूल प्रश्न को फिर से समझने में मदद मिलती है: किसी व्यक्ति के वजन में उसके / उसकी ऊँचाई के बारे में कितना विचलन हो सकता है ?
यह वह जगह है जहाँ "% विचरण समझाया गया" आता है। वैसे, प्रतिगमन विश्लेषण के लिए, यह सहसंबंध गुणांक आर-वर्ग के बराबर है ।
ऊपर दिए गए मॉडल के लिए, हम एक बयान देने में सक्षम हो सकते हैं जैसे: प्रतिगमन विश्लेषण का उपयोग करना, किसी व्यक्ति की ऊंचाई का उपयोग करके एक भविष्य कहनेवाला मॉडल स्थापित करना संभव था जो वजन में 60% विचरण की व्याख्या करता है ”।
अब, 60% कितना अच्छा है? इस बारे में वस्तुनिष्ठ निर्णय लेना कठिन है। लेकिन अगर आपके पास अन्य प्रतिस्पर्धी मॉडल हैं - कहते हैं, एक और प्रतिगमन मॉडल जो किसी व्यक्ति की आयु का उपयोग उसके वजन का अनुमान लगाने के लिए करता है - आप विभिन्न मॉडलों की तुलना उनके आधार पर कर सकते हैं कि उनके द्वारा कितना विचरण समझाया गया है और यह तय करें कि कौन सा मॉडल बेहतर है। (इसके कुछ संकेत हैं, 'इंटरप्रिटिंग एंड यूजिंग रिग्रेशन' - क्रिस्टोफर एच। अचेन http://www.sagepub.in/books/Book450/authors )