जवाबों:
विषमलैंगिकता के परिणाम हैं:
साधारण न्यूनतम वर्ग (OLS) आकलनकर्ता अभी भी सुसंगत है लेकिन यह अब कुशल नहीं है ।
अनुमान जहां है नहीं एक सुसंगत आकलनकर्ता अब अपने आकलनकर्ता की सहप्रसरण मैट्रिक्स के लिए। यह पक्षपाती और असंगत दोनों हो सकता है। और व्यवहार में, यह काफी हद तक विचरण को कम कर सकता है।
बिंदु (1) एक प्रमुख मुद्दा नहीं हो सकता है; लोग अक्सर वैसे भी साधारण OLS अनुमानक का उपयोग करते हैं। लेकिन बिंदु (2) को संबोधित किया जाना चाहिए। क्या करें?
आपको हेटरोसेडसिटी-सुसंगत मानक त्रुटियों की आवश्यकता है । मानक दृष्टिकोण बड़े-नमूना मान्यताओं, स्पर्शोन्मुख परिणामों पर झुकाव और के विचरण का अनुमान है :
यह हेटेरोसेडासिटी-सुसंगत मानक त्रुटियों को देता है। उन्हें ह्यूबर-व्हाइट मानक त्रुटियों, मजबूत मानक त्रुटियों, "सैंडविच" अनुमानक, आदि के रूप में भी जाना जाता है ... किसी भी बुनियादी मानक आँकड़े पैकेज में मजबूत मानक त्रुटियों का विकल्प होता है। इसका इस्तेमाल करें!
यदि हेटेरोसेडासिटी काफी बड़ी है, तो नियमित ओएलएस अनुमान में बड़ी व्यावहारिक समस्याएं हो सकती हैं। अभी भी एक सुसंगत अनुमानक के रूप में, आपके पास छोटी नमूना समस्याएं हो सकती हैं, जहां आपका पूरा अनुमान कुछ उच्च, उच्च विचरण टिप्पणियों द्वारा संचालित होता है। (यह वही है जो @ seanv507 टिप्पणियों में बात कर रहा है)। ओएलएस अनुमानक अक्षम है कि यह इष्टतम की तुलना में उच्च विचरण टिप्पणियों को अधिक वजन दे रहा है। अनुमान बेहद शोर हो सकता है।
अक्षमता को ठीक करने की कोशिश के साथ एक समस्या यह है कि आप शायद त्रुटि शर्तों के लिए सहसंयोजक मैट्रिक्स को नहीं जानते हैं, इसलिए जीएलएस जैसी किसी चीज का उपयोग करने से चीजें और भी खराब हो सकती हैं यदि त्रुटि शब्द सहसंयोजक मैट्रिक्स का कचरा है।
इसके अलावा, ह्यूबर-व्हाइट मानक त्रुटियां जो मैं ऊपर देता हूं, छोटे नमूनों में बड़ी समस्याएं हो सकती हैं। इस विषय पर एक लंबा साहित्य है। उदाहरण के लिए। Imbens और Kolesar (2016) देखें, "छोटे नमूनों में मजबूत मानक त्रुटियां: कुछ व्यावहारिक सलाह।"
यदि यह स्व-अध्ययन है, तो विचार करने के लिए अगली व्यावहारिक चीज क्लस्टर्ड मानक त्रुटियां हैं। ये समूहों के भीतर मनमानी सहसंबंध के लिए सही हैं।
वैसे संक्षिप्त उत्तर मूल रूप से आपका मॉडल गलत है
इसलिए विषमता-सहसंयोजक मैट्रिक्स के आकलन के साथ विषमलैंगिकता की समस्याओं के मामले में, जो गुणांकों की गलत मानक त्रुटियों को जन्म देता है, जिसके परिणामस्वरूप गलत टी-आँकड़े और पी-मान होते हैं। संक्षेप में कहें, यदि आपकी त्रुटि शर्तों में निरंतर परिवर्तन नहीं है, तो साधारण न्यूनतम वर्ग अनुमान के लिए सबसे प्रभावी तरीका नहीं है। इस संबंधित प्रश्न पर एक नज़र डालें ।
"Heteroscedasticity" पूर्वानुमान त्रुटियों के वास्तविक मानक विचलन का अनुमान लगाना मुश्किल बनाता है। इससे आत्मविश्वास अंतराल हो सकता है जो बहुत व्यापक या बहुत संकीर्ण हैं (विशेष रूप से वे आउट-ऑफ-सैंपल भविष्यवाणियों के लिए बहुत संकीर्ण होंगे, यदि त्रुटियों का विचलन समय के साथ बढ़ रहा है)।
इसके अलावा, प्रतिगमन मॉडल डेटा के सबसेट पर बहुत अधिक ध्यान केंद्रित कर सकता है।
अच्छा संदर्भ: रैखिक प्रतिगमन की परीक्षण मान्यताओं