अवशिष्ट त्रुटि शर्तों के हमारे अनुमान हैं
इस प्रश्न का संक्षिप्त उत्तर अपेक्षाकृत सरल है: एक प्रतिगमन मॉडल में मान्यताओं में त्रुटि शर्तों के व्यवहार के बारे में धारणाएं हैं, और अवशिष्ट त्रुटि शब्दों के हमारे अनुमान हैं। वास्तव में , अवशिष्ट अवशिष्टों के व्यवहार की जांच हमें बताती है कि त्रुटि शर्तों के बारे में मान्यताएँ प्रशंसनीय हैं या नहीं।
तर्क की इस सामान्य रेखा को और अधिक विस्तार से समझने के लिए, यह एक मानक प्रतिगमन मॉडल में अवशिष्टों के व्यवहार की विस्तार से जांच करने में मदद करता है। स्वतंत्र होमोसकेस्टिक सामान्य त्रुटि शर्तों के साथ एक मानक कई रैखिक प्रतिगमन के तहत अवशिष्ट वेक्टर का वितरण ज्ञात है, जो आपको प्रतिगमन मॉडल में अंतर्निहित वितरण संबंधी मान्यताओं का परीक्षण करने की अनुमति देता है। मूल विचार यह है कि आप प्रतिगमन मान्यताओं के तहत अवशिष्ट वेक्टर के वितरण का पता लगाते हैं, और फिर यह जांचते हैं कि अवशिष्ट मान इस सैद्धांतिक वितरण से क्या मेल खाते हैं। सैद्धांतिक अवशिष्ट वितरण से विचलन यह दर्शाता है कि त्रुटि के संदर्भ में अंतर्निहित ग्रहण वितरण कुछ मामलों में गलत है।
यदि आप अंतर्निहित त्रुटि वितरण का उपयोग करते हैं ϵi∼IID N(0,σ2) एक मानक प्रतिगमन मॉडल के लिए और आप गुणांक के लिए ओएलएस आकलन का उपयोग करते हैं, फिर अवशिष्ट के वितरण को बहुभिन्नरूपी सामान्य वितरण दिखाया जा सकता है:
r=(I−h)ϵ∼N(0,σ2(I−h)),
कहाँ पे h=x(xTx)−1xTहै टोपी मैट्रिक्स प्रतिगमन के लिए। अवशिष्ट वेक्टर त्रुटि वेक्टर की नकल करता है, लेकिन विचरण मैट्रिक्स में अतिरिक्त गुणक शब्द हैI−h। प्रतिगमन मान्यताओं का परीक्षण करने के लिए हम छात्र अवशिष्ट का उपयोग करते हैं, जिसमें सीमांत टी-वितरण होता है:
si≡riσ^Ext⋅(1−li)∼T(dfRes−1).
(यह सूत्र बाहरी रूप से छात्र के अवशेषों के लिए है, जहाँ विचरण अनुमानक परिवर्तनशील मानों को छोड़ देता है। मान) li=hi,iउत्तोलन मूल्य हैं, जो हैट मैट्रिक्स में विकर्ण मान हैं । छात्र अवशिष्ट स्वतंत्र नहीं हैं, लेकिन यदिnबड़ा है, वे स्वतंत्र के करीब हैं। इसका अर्थ है कि सीमांत वितरण एक साधारण ज्ञात वितरण है लेकिन संयुक्त वितरण जटिल है।) अब, यदि सीमाlimn→∞(xTx)/n=Δ मौजूद है, तो यह दिखाया जा सकता है कि गुणांक अनुमानक सही प्रतिगमन गुणांक के निरंतर अनुमानक हैं, और अवशिष्ट वास्तविक त्रुटि शर्तों के निरंतर अनुमानक हैं।
अनिवार्य रूप से, इसका मतलब है कि आप छात्र के अवशिष्टों की तुलना टी-वितरण से करते हुए त्रुटि के लिए अंतर्निहित वितरण संबंधी मान्यताओं का परीक्षण करते हैं। त्रुटि वितरण के प्रत्येक अंतर्निहित गुण (रैखिकता, समरूपता, असंबद्ध त्रुटियां, सामान्यता) का परीक्षण छात्र के अवशेषों के विकृति के अनुरूप गुणों का उपयोग करके किया जा सकता है। यदि मॉडल सही ढंग से निर्दिष्ट है, तो बड़े के लिएn अवशिष्ट वास्तविक त्रुटि शर्तों के करीब होना चाहिए, और उनके पास एक समान वितरण प्रपत्र है।
प्रतिगमन मॉडल से एक व्याख्यात्मक चर का प्रवेश गुणांक अनुमानकों में छोड़े गए चर पूर्वाग्रह की ओर जाता है और यह अवशिष्ट वितरण को प्रभावित करता है। अवशिष्ट वेक्टर के माध्य और विचरण दोनों लोप किए गए चर से प्रभावित होते हैं। यदि प्रतिगमन में छोड़े गए शब्द हैंZδ तब अवशिष्ट वेक्टर बन जाता है r=(I−h)(Zδ+ϵ)। यदि डेटा आवृत्त मैट्रिक्स में वैक्टरZ IID सामान्य वैक्टर हैं और फिर त्रुटि की शर्तों से स्वतंत्र हैं Zδ+ϵ∼N(μ1,σ2∗I) ताकि अवशिष्ट वितरण हो जाए:
r=(I−h)(Zδ+ϵ)∼N(μ(I−h)1,σ2∗(I−h)).
यदि मॉडल में पहले से ही एक अवरोधन शब्द है (यानी, यदि यूनिट वेक्टर है 1 तब डिजाइन मैट्रिक्स में है) (I−h)1=0, जिसका अर्थ है कि अवशिष्ट के मानक वितरण रूप संरक्षित है। यदि मॉडल में कोई अवरोधन शब्द नहीं है, तो छोड़े गए चर अवशिष्ट के लिए एक गैर-शून्य मतलब दे सकते हैं। वैकल्पिक रूप से, यदि छोड़ा गया चर IID सामान्य नहीं है तो यह मानक अवशिष्ट वितरण से अन्य विचलन को जन्म दे सकता है। इस बाद के मामले में, अवशिष्ट परीक्षण एक लोप किए गए चर की उपस्थिति के परिणामस्वरूप कुछ भी पता लगाने की संभावना नहीं है; यह आमतौर पर यह निर्धारित करना संभव नहीं है कि सैद्धांतिक अवशिष्ट वितरण से विचलन एक छोड़े गए चर के परिणामस्वरूप होता है, या केवल शामिल चर के साथ एक बीमार-पीडित संबंध के कारण होता है (और यकीनन ये किसी भी मामले में एक ही बात हैं)।