आपको ओएलएस अनुमानक की स्थिरता के लिए 4 वें क्षणों पर मान्यताओं की आवश्यकता नहीं है, लेकिन आपको एसिम्प्टोटिक सामान्यता के लिए और उच्च क्षणों पर मान्यताओं की आवश्यकता है और लगातार यह अनुमान लगाने के लिए कि असममित सहसंयोजक मैट्रिक्स क्या है।एक्सε
कुछ अर्थों में, यह एक गणितीय, तकनीकी बिंदु है, व्यावहारिक बिंदु नहीं है। OLS के लिए कुछ अर्थों में परिमित नमूनों में अच्छी तरह से काम करने के लिए, asymptotic स्थिरता या रूप में सामान्यता प्राप्त करने के लिए आवश्यक न्यूनतम मान्यताओं से अधिक की आवश्यकता होती है ।n → ∞
संगति के लिए पर्याप्त परिस्थितियाँ:
यदि आपके पास प्रतिगमन समीकरण है:
yमैं=एक्स'मैंβ +εमैं
OLS आकलनकर्ता रूप में लिखा जा सकता है:
ख^
ख^= β +(एक्स'एक्सn)- 1(एक्स'εn)
के लिए स्थिरता , आप बड़े नंबर की Kolmogorov 's कानून लागू करने या धारावाहिक निर्भरता, कुछ कार्लिन और टेलर की ergodic प्रमेय की तरह इतना है कि साथ समय श्रृंखला के मामले में, करने में सक्षम होने की जरूरत है:
1nएक्स'एक्स→पीई [एक्समैंएक्स'मैं]1nएक्स'ε→पीई [एक्स'मैंεमैं]
अन्य मान्यताओं की आवश्यकता है:
- ई [एक्समैंएक्स'मैं] पूर्ण रैंक है और इसलिए मैट्रिक्स है।
- प्रतिगमन पूर्वनिर्धारित या कड़ाई से बहिष्कृत होते हैं ताकि ।ई [एक्समैंεमैं] = ०
तब और आपको(एक्स'एक्सn)- 1(एक्स'εn)→पी0ख^→पीβ
यदि आप चाहते हैं कि केंद्रीय सीमा प्रमेय लागू हो, तो आपको उच्च क्षणों पर मान्यताओं की आवश्यकता होती है, उदाहरण के लिए, जहां । केंद्रीय सीमा प्रमेय वह है जो आपको सामान्यता प्रदान करता है और आपको मानक त्रुटियों के बारे में बात करने की अनुमति देता है। दूसरे क्षण के लिए को अस्तित्व में लिए, आपको अस्तित्व में आने के लिए और के चौथे क्षणों की आवश्यकता होती है। आप यह तर्क देना चाहते हैं कि जहांई [जीमैंजी'मैं]जीमैं=एक्समैंεमैंख^ई [जीमैंजी'मैं]एक्सεn--√(1nΣमैंएक्स'मैंεमैं)→घएन( 0 , Σ )Σ = ई [एक्समैंएक्स'मैंε2मैं] । इस काम के लिए, परिमित होना चाहिए।Σ
एक अच्छी चर्चा (जिसने इस पोस्ट को प्रेरित किया) हयाशी के अर्थमिति में दिया गया है । (4 पलों के लिए पी। 149 भी देखें और सहसंयोजक मैट्रिक्स का आकलन करें।)
चर्चा:
4 वें क्षण पर ये आवश्यकताएं व्यावहारिक बिंदु के बजाय संभवतः तकनीकी बिंदु हैं। आप शायद पैथोलॉजिकल डिस्ट्रीब्यूशन का सामना नहीं करने जा रहे हैं, जहां यह रोजमर्रा के आंकड़ों में एक समस्या है? यह ओआरएस की अधिक आम धारणा या अन्य धारणाओं के बारे में पता चलता है।
एक अलग सवाल, निस्संदेह स्टैकएक्सचेंज पर कहीं और जवाब दिया गया है, कि परिमित नमूनों के करीब पहुंचने के लिए आपको कितने नमूनों की आवश्यकता है। वहाँ कुछ समझदारी है जिसमें शानदार आउटलेर धीमी गति से अभिसरण का नेतृत्व करते हैं। उदाहरण के लिए, वास्तव में उच्च विचरण के साथ एक तार्किक वितरण के माध्य का अनुमान लगाने का प्रयास करें। नमूना मतलब जनसंख्या का एक सुसंगत, निष्पक्ष अनुमानक है, लेकिन पागल लॉग इन में सामान्य से अधिक कुरूपता आदि ... (लिंक का अनुसरण करें), परिमित नमूना परिणाम वास्तव में काफी बंद हैं।
परिमित बनाम अनंत गणित में एक बेहद महत्वपूर्ण अंतर है। यह वह समस्या नहीं है जिसका आप प्रतिदिन के आंकड़ों में सामना करते हैं। छोटी बनाम बड़ी श्रेणी में व्यावहारिक समस्याएं अधिक हैं। क्या विचरण, कुर्तोसिस आदि ... इतना छोटा है कि मैं अपने नमूना आकार को देखते हुए उचित अनुमान प्राप्त कर सकूं?
पैथोलॉजिकल उदाहरण जहां ओएलएस अनुमानक सुसंगत है लेकिन एसिम्पोटिक रूप से सामान्य नहीं है
विचार करें:
yमैं= बीएक्समैं+εमैं
जहाँ लेकिन को आज़ादी के 2 डिग्री के साथ एक टी-वितरण से तैयार किया जाता है, इस प्रकार । OLS अनुमान में संभाव्यता में परिवर्तित हो जाता है, लेकिन OLS अनुमान लिए नमूना वितरण सामान्य रूप से वितरित नहीं होता है। नीचे 10000 टिप्पणियों के साथ एक प्रतिगमन के 10000 सिमुलेशन पर आधारित लिए अनुभवजन्य वितरण है ।
एक्समैं∼ एन( 0 , 1 )εमैंV a r (εमैं) = ∞खख^ख^
का वितरण सामान्य नहीं है, पूंछ बहुत भारी हैं। लेकिन अगर आप स्वतंत्रता की डिग्री को 3 तक बढ़ा देते हैं ताकि दूसरा क्षण of मौजूद हो, तो केंद्रीय सीमा लागू होती है और आप:
ख^εमैं
इसे उत्पन्न करने के लिए कोड:
beta = [-4; 3.7];
n = 1e5;
n_sim = 10000;
for s=1:n_sim
X = [ones(n, 1), randn(n, 1)];
u = trnd(2,n,1) / 100;
y = X * beta + u;
b(:,s) = X \ y;
end
b = b';
qqplot(b(:,2));