रैखिक प्रतिगमन: ओएलएस और एमएलई की पहचान देने वाला कोई भी गैर-सामान्य वितरण?


13

यह प्रश्न यहाँ टिप्पणियों में लंबी चर्चा से प्रेरित है: रैखिक प्रतिगमन सामान्य वितरण का उपयोग कैसे करता है?

सामान्य रेखीय प्रतिगमन मॉडल में, सादगी के लिए यहां केवल एक भविष्यवक्ता के साथ लिखा गया है: जहां ज्ञात स्थिरांक हैं और शून्य-मतलब स्वतंत्र त्रुटि शब्द हैं। यदि हम इसके अलावा त्रुटियों के लिए सामान्य वितरण मान लेते हैं, तो सामान्य रूप से कम से कम वर्ग अनुमानक और के अधिकतम संभावना अनुमान समान होते हैं।

Yi=β0+β1xi+ϵi
xiϵiβ0,β1

तो मेरा आसान सवाल है: क्या त्रुटि की शर्तों के लिए कोई अन्य वितरण मौजूद है जैसे कि mle साधारणतम स्क्वाएर्स अनुमानक के समान है? एक निहितार्थ दिखाना आसान है, दूसरा ऐसा नहीं है।


1
(+1) इसे शून्य के आसपास केंद्रित वितरण होना चाहिए, और ऐसा प्रतीत होता है कि यह एक सममितीय होने पर मदद करेगा। कुछ उम्मीदवार जो मन में आते हैं, जैसे कि t- या लाप्लास वितरण चाल के रूप में नहीं लगता है, क्योंकि MLE है, यहां तक ​​कि निरंतर एकमात्र मामले में, क्रमशः बंद रूप में उपलब्ध नहीं है या माध्यिका द्वारा दिया गया है।
क्रिस्टोफ़ हनक

यह भी देखें आँकड़े ।stackexchange.com / questions / 99014 / , ऐसा लगता है कि केवल इतना ही है
क्रिस्टोफ़ हनक

मुझे यकीन है कि जवाब नहीं है। हालांकि एक कठोर प्रमाण लिखना कठिन हो सकता है।
गॉर्डन स्माइथ

जवाबों:


11

अधिकतम संभावना अनुमान में, हम गणना करते हैं

β^ML:lnf(ϵi)β=0f(ϵi)f(ϵi)xi=0

अंतिम संबंध प्रतिगमन समीकरण की रैखिकता संरचना को ध्यान में रखते हुए।

इसकी तुलना में, ओएलएस अनुमानक संतुष्ट करता है

ϵixi=0

ढलान गुणांक के लिए समान बीजीय भाव प्राप्त करने के लिए हमें इस तरह की त्रुटि के लिए एक घनत्व होना चाहिए।

f(ϵi)f(ϵi)=±cϵif(ϵi)=±cϵif(ϵi)

ये फॉर्म इक्वेशन हैं जिसके पास समाधान हैंy=±xy

1ydy=±xdxlny=±12x2

y=f(ϵ)=exp{±12cϵ2}

कोई भी फ़ंक्शन जिसमें यह कर्नेल है और एक उपयुक्त डोमेन पर एकता को एकीकृत करता है, ढलान गुणांक के लिए MLE और OLS समान बना देगा। अर्थात् हम खोज रहे हैं

g(x)=Aexp{±12cx2}:abg(x)dx=1

क्या ऐसा जो सामान्य घनत्व (या अर्ध-सामान्य या त्रुटि फ़ंक्शन के व्युत्पन्न) नहीं है? g

निश्चित रूप से। लेकिन एक और बात जिस पर विचार करना है वह निम्न है: यदि कोई घातांक में प्लस चिह्न का उपयोग करता है, और उदाहरण के लिए शून्य के आसपास एक सममित समर्थन, तो एक को एक घनत्व मिलेगा जो बीच में एक अद्वितीय न्यूनतम है, और दो स्थानीय मैक्सिमा समर्थन की सीमाओं।


शानदार उत्तर (+1), लेकिन यदि कोई फ़ंक्शन में प्लस चिह्न का उपयोग करता है, तो क्या यह घनत्व भी है? तब यह प्रतीत होता है कि फ़ंक्शन में अनंत अभिन्न है और इस प्रकार एक घनत्व फ़ंक्शन को सामान्य नहीं किया जा सकता है। यदि ऐसा है, तो सामान्य वितरण के साथ ही हमें छोड़ दिया जाता है।
बेन -

1
@ धन्यवाद। ऐसा लगता है कि आप स्पष्ट रूप से मान रहे हैं कि यादृच्छिक चर की सीमा प्लस / माइनस इन्फिनिटी होगी। लेकिन हम एक rv को एक सीमित अंतराल में सीमित करने के लिए परिभाषित कर सकते हैं, जिस स्थिति में हम प्लस चिह्न का बहुत अच्छी तरह से उपयोग कर सकते हैं। यही कारण है कि मेरे अभिव्यक्तियों में मैंने एकीकरण सीमा के रूप में इस्तेमाल किया । (a,b)
एलेकोस पापाडोपोलोस

यह सच है - मैं यह मान रहा था।
बेन -

5

यदि हम OLS को के समाधान के रूप में परिभाषित करते हैं तो किसी भी घनत्व ऐसा कि स्वीकार्य है। उदाहरण के लिए इसका मतलब है कि प्रपत्र स्वीकार्य हैं। चूंकि कारक पैरामीटर पर निर्भर नहीं करता है । इसलिए इस तरह के वितरण की एक अनंतता है।

argβ0,β1mini=1n(yiβ0β1xi)2
f(y|x,β0,β1)
argβ0,β1mini=1nlog{f(yi|xi,β0,β1)}=argβ0,β1mini=1n(yiβ0β1xi)2
f(y|x,β0,β1)=f0(y|x)exp{ω(yiβ0β1xi)2}
f0(y|x)(β0,β1)

एक अन्य सेटिंग जहां दोनों अनुमानक संयोग करते हैं, जब डेटा एक गोलाकार सममित वितरण से आता है , अर्थात जब (वेक्टर) डेटा में सशर्त घनत्व के साथ एक कम कार्य करते हैं। (इस मामले में OLS अभी भी उपलब्ध है, हालांकि की स्वतंत्रता की धारणा केवल सामान्य मामले में है।)y

h(||yXβ||)
h()ϵi

1
यह मुझे सही नहीं लगता। यदि आप एक अलग गोलाकार सममित वितरण का उपयोग करते हैं, तो क्या यह वर्ग की तुलना में आदर्श के एक अलग कार्य को कम करने का कारण नहीं होगा (इस प्रकार कम से कम-वर्ग अनुमान नहीं है)?
बेन -

1

मुझे इस सवाल के बारे में तब तक नहीं पता था जब तक @ शीआन सिर्फ एक जवाब के साथ अपडेट नहीं हुआ। अधिक सामान्य समाधान है। कुछ मापदंडों के साथ घातीय परिवार वितरण, ब्रेगमैन डाइवर्जेंस के लिए निश्चित उपज। इस तरह के वितरण के लिए मतलब न्यूनतम है। ओएलएस मिनिमाइज़र भी माध्य है। इसलिए इस तरह के सभी वितरणों के लिए उन्हें संयोग करना चाहिए जब रैखिक कार्यात्मक माध्य पैरामीटर से जुड़ा होता है।

http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.75.6958&rep=rep1&type=pdf

यहाँ छवि विवरण दर्ज करें

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.