प्रतिबंधित अधिकतम संभावना क्यों वर्जित का एक बेहतर (निष्पक्ष) अनुमान लगाती है?


11

मैं मिश्रित मॉडल की नाइटी-किरकिरा को बेहतर ढंग से समझने के लिए आर के lme4 पैकेज पर डौग बेट्स के थ्योरी पेपर को पढ़ रहा हूं , और एक पेचीदा परिणाम के बारे में आया हूं जिसे मैं बेहतर समझना चाहता हूं, वेरिएंट का अनुमान लगाने के लिए प्रतिबंधित अधिकतम संभावना (REML) का उपयोग करने के बारे में ।

REML कसौटी पर खंड 3.3 में, वह कहता है कि विचरण के अनुमान में REML का उपयोग एक फिट रैखिक मॉडल में अवशिष्ट विचलन से विचरण का आकलन करते समय स्वतंत्रता सुधार की एक डिग्री के उपयोग से निकटता से संबंधित है। विशेष रूप से, "हालांकि आमतौर पर इस तरह से व्युत्पन्न नहीं किया जाता है", स्वतंत्रता सुधार की डिग्री "REML मानदंड" (Eq। (28)) के अनुकूलन के माध्यम से विचरण का अनुमान लगाकर प्राप्त की जा सकती है। REML मानदंड अनिवार्य रूप से सिर्फ संभावना है, लेकिन रैखिक फिट मापदंडों को हाशिए पर डालकर (उन्हें फिट अनुमान के बराबर स्थापित करने के बजाय समाप्त कर दिया गया है, जो पक्षपाती नमूना प्रसरण देगा)।

मैंने गणित किया और केवल निश्चित प्रभावों के साथ एक सरल रैखिक मॉडल के लिए दावा किए गए परिणाम का सत्यापन किया । मैं जो संघर्ष कर रहा हूं वह व्याख्या है। क्या ऐसा कोई परिप्रेक्ष्य है, जिसमें इस तरह के बदलाव का अनुमान लगाना स्वाभाविक है, जहां फिट मापदंडों को हाशिए पर डाल दिया गया है? यह बेज़ियन की तरह महसूस करता है, जैसे कि मैं इसके पीछे के रूप में होने की संभावना के बारे में सोच रहा हूं और फिट मापदंडों को हाशिए पर रख रहा हूं, क्योंकि वे यादृच्छिक चर हैं।

या औचित्य मुख्य रूप से सिर्फ गणितीय है - यह रैखिक मामले में काम करता है लेकिन सामान्य भी है?

जवाबों:


4

विचरण में पूर्वाग्रह इस तथ्य से उपजा है कि माध्य डेटा से अनुमान लगाया गया है और इसलिए 'इस अनुमानित माध्य के चारों ओर उस डेटा का प्रसार' (यानी था विचरण) 'सही' माध्य के आस-पास डेटा के प्रसार से छोटा है। । यह भी देखें: मानक विचलन की गणना करते समय द्वारा विभाजित करने के लिए सहज व्याख्या ?n1

निश्चित पुतलियाँ 'माध्य के लिए' मॉडल का निर्धारण करती हैं, इसलिए, यदि आप एक भिन्नता अनुमान लगा सकते हैं, जो डेटा से माध्य का अनुमान किए बिना प्राप्त किया गया था ('निश्चित प्रभावों को कम करने' (अर्थात माध्य) से) तो यह कम करके आंका गया प्रसार (यानी विचरण) को कम किया जाएगा।

यह 'सहज' समझ है कि क्यों रेम का अनुमान पूर्वाग्रह को खत्म करता है; आपको 'अनुमानित माध्य' का उपयोग किए बिना विचरण के लिए एक अनुमान मिलता है।


1

APPENDIX की जाँच करें: लेखक डेविड डिके के इस एसएएस-संबंधित संसाधन के भीतर से REML ESTIMATION METHOD ।

" हम हमेशा ज्ञात माध्य 0 के साथ Z (n-1) संख्या Z और n Y मान के रूप में वर्ग और सैद्धांतिक विचरण के समान योग प्राप्त कर सकते हैं। यह Z की संख्या से वर्गों के Z योग के विभाजन को प्रेरित करता है, जो n है -1। "

जब मैं ग्रेड स्कूल में था, तो कटी हुई ब्रेड के बाद से REML को सबसे अच्छी चीज बना दिया गया था। Lme4 पैकेज का अध्ययन करने से , मुझे पता चला कि यह वास्तव में उस कुएं का सामान्यीकरण नहीं करता है और शायद यह चीजों की भव्य योजना में उतना महत्वपूर्ण नहीं है।


शायद नहीं ... हालांकि गणित और आंकड़ों का एक दिलचस्प सा।
पॉल

1
मैं पॉल से सहमत हूं। मुझे लगता है कि REML सांख्यिकी में सुरुचिपूर्ण और रचनात्मक समस्या को हल करने का एक बड़ा उदाहरण है। यह निश्चित रूप से अभ्यास में उपयोग हो रहा है, और शायद यह सब आप सांख्यिकीय अनुसंधान के लिए आशा कर सकते हैं।
बेन ओगोरक
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.