क्यों विल्कस 1938 प्रक्षेपीकृत मॉडल के लिए प्रूफ का काम नहीं करता है?


23

प्रसिद्ध 1938 के पेपर में (" समग्र परिकल्पनाओं के परीक्षण के लिए संभावना अनुपात का बड़ा-नमूना वितरण ", गणितीय सांख्यिकी के विवरण, 9: 60-62), सैमुअल विल्क्स ने (लॉग संभावना अनुपात) के विषम वितरण का व्युत्पन्न किया। नेस्टेड परिकल्पनाओं के लिए, इस धारणा के तहत कि बड़ी परिकल्पना सही ढंग से निर्दिष्ट है। सीमित वितरण है (ची-वर्ग) स्वतंत्रता की डिग्री के साथ , जहां बड़ी परिकल्पना और में मापदंडों की संख्या हैχ 2 एच - एम एच एम2×LLRχ2hmhmनेस्टेड परिकल्पना में मुक्त मापदंडों की संख्या है। हालांकि, यह माना जाता है कि यह परिणाम तब नहीं होता है जब परिकल्पना को गलत तरीके से परिभाषित किया जाता है (यानी, जब बड़ी परिकल्पना नमूना आंकड़ों के लिए सही वितरण नहीं होती है)।

क्या कोई समझा सकता है क्यों? यह मुझे लगता है कि विल्क्स का प्रमाण अभी भी मामूली संशोधनों के साथ काम करना चाहिए। यह अधिकतम संभावना अनुमान (MLE) की स्पर्शोन्मुख सामान्यता पर निर्भर करता है, जो अभी भी गलत मॉडल के साथ है। एकमात्र अंतर सीमित बहुभिन्नरूपी के सहसंयोजक मैट्रिक्स है: सही ढंग से निर्दिष्ट मॉडल के लिए, हम उलटा फिशर सूचना मैट्रिक्स के साथ सहसंयोजक मैट्रिक्स को अनुमानित कर सकते हैं, प्रक्षेपीकरण के साथ, हम सहसंयोजक मैट्रिक्स के सैंडविच अनुमान का उपयोग कर सकते हैं। ( )। बाद में फिशर सूचना मैट्रिक्स के व्युत्क्रम को कम कर देता है जब मॉडल सही ढंग से निर्दिष्ट होता है ( बाद से जे - 1 के जे - 1 जे = केJ1J1KJ1J=K)। AFAICT, विल्क्स प्रूफ परवाह नहीं करता है कि सहसंयोजक मैट्रिक्स का अनुमान कहाँ से आता है, जब तक कि हमारे पास बहुराष्ट्रीय के एक उलटा स्पर्शोन्मुख सहसंयोजक मैट्रिक्स MLEs के लिए सामान्य है ( विल्क्स पेपर में)। c1


जब बड़ा मॉडल सही होता है, लेकिन सबमॉडल गलत होता है, तो एसिम्प्टोटिक वितरण नहीं होता है (गॉसियन त्रुटियों वाले रैखिक मॉडल में, उदाहरण के लिए, हमें सटीक noncentral-F वितरण जैसी चीजें मिलती हैं, इसलिए asymptotic वितरण nc जैसा कुछ होना चाहिए। - [ मैं अनुमान लगा रहा हूं)। तो क्यों न हम इसे होने की उम्मीद होती है जब दोनों बड़े और छोटे मॉडल दोनों गलत कर रहे हैं? वास्तव में अशक्त परिकल्पना किसके साथ शुरू होती है? χ 2 χ 2χ2χ2χ2
आदमी

सही ढंग से निर्दिष्ट अशक्त-परिकल्पना में, दोनों मॉडल "सही" है, लेकिन नेस्टेड एक है पैरामीटर सही मूल्य पर तय की। Misspecified अशक्त-परिकल्पना में, दोनों मॉडल "गलत" हैं, लेकिन नेस्टेड एक है pseudotrue मूल्यों पर तय मानकों। ("स्यूडोट्र्यू वैल्यू" पैरामीटर का असममित मूल्य है जो कि मिसकैप्ड मॉडल और ट्रू मॉडल के बीच कुल्बैक-लाइब्लर दूरी को कम करता है)। तो गैर-एफआरएल का आपका उदाहरण प्रासंगिक नहीं है, क्योंकि यह वितरण है जब यहां अशक्त-परिकल्पना झूठी है। मीmm
रतसाल

क्षमा करें, मुझे कहना चाहिए कि नेस्टेड परिकल्पना में सही मानों पर निर्धारित पैरामीटर हैं। hm
रटसालड

यह मेरी समझ है कि एक गलत तरीके से किया गया अशक्त मॉडल कई मायनों में गलत हो सकता है। उदाहरण के लिए: अवशिष्टों का गलत वितरण, डेटा में विषमलैंगिकता होती है, प्रभाव एडिटिव नहीं होते हैं, आदि, हालांकि, मैं मानता हूं कि यदि "परीक्षण किए गए" मापदंडों में से कम से कम एक गलत मान पर निर्धारित किया गया है (उदाहरण के लिए स्यूडोट्रॉस्ट वैल्यू) , यह गलत तरीके से निर्दिष्ट अशक्त मॉडल का एक उदाहरण है। hm
rcorty

जवाबों:


19

आरवी फाउटज़ और आरसी श्रीवास्तव ने इस मुद्दे की विस्तार से जाँच की है। उनके 1977 के पेपर "मॉडल के गलत होने पर संभावना अनुपात परीक्षण का प्रदर्शन" में प्रूफ के बहुत संक्षिप्त स्केच के साथ-साथ प्रच्छादन के मामले में वितरण परिणाम का विवरण शामिल है, जबकि उनके 1978 के पेपर "संभावना अनुपात के विषम वितरण जब" मॉडल गलत है " सबूत में शामिल है -लेकिन बाद वाले को पुराने जमाने के टाइप-राइटर में टाइप किया गया है (दोनों पेपर समान नोटेशन का उपयोग करते हैं, हालांकि आप उन्हें पढ़ने में जोड़ सकते हैं)। इसके अलावा, सबूत के कुछ चरणों के लिए वे केपी रॉय द्वारा 1957 से "संभावना अनुपात के विषम वितरण पर एक नोट" के एक पेपर का उल्लेख करते हैं, जो ऑन-लाइन उपलब्ध नहीं है, यहां तक ​​कि गेटेड भी नहीं दिखता है।

वितरणात्मक प्रक्षेपीकरण के मामले में, यदि MLE अभी भी सुसंगत है और अस्वाभाविक रूप से सामान्य है (जो कि हमेशा मामला नहीं होता है), LR स्टेटिस्टिक स्पर्शोन्मुख रूप से स्वतंत्र ची-वर्गों (स्वतंत्रता की एक डिग्री में से प्रत्येक) का एक रैखिक संयोजन का अनुसरण करता है

2lnλdi=1rciχi2

जहाँ । एक "समानता" देख सकते हैं: के साथ एक ची-वर्ग के बजाय स्वतंत्रता की डिग्री, हम स्वतंत्रता से एक डिग्री के साथ प्रत्येक ची वर्गों। लेकिन "सादृश्य" वहाँ बंद हो जाता है, क्योंकि ची-वर्गों के एक रैखिक संयोजन में एक बंद-रूप घनत्व नहीं होता है। प्रत्येक स्केल किए गए ची-वर्ग एक गामा है, लेकिन एक अलग पैरामीटर के साथ जो गामा-और के लिए एक अलग पैमाने के पैरामीटर की ओर जाता है और ऐसे गामा का योग बंद-रूप नहीं है, हालांकि इसके मूल्यों की गणना की जा सकती है।h - m h - m c ir=hmhmhmci

के लिए स्थिरांक, हमारे पास , और वे एक मैट्रिक्स ... जो मैट्रिक्स eigenvalues के कर रहे हैं? खैर, लेखकों अंकन का उपयोग, सेट लॉग-संभावना के हेस्सियन और होने के लिए लॉग-संभावना की ढाल के बाहरी उत्पाद (expectational संदर्भ में) किया जाना है। तो एमएलई का असममित विचरण-सहसंयोजक मैट्रिक्स है।1सी 2सी आर0 Λ सी वी = Λ - 1 सी ( Λ ' ) - 1cic1c2...cr0ΛCV=Λ1C(Λ)1

फिर को के ऊपरी विकर्ण खंड के रूप में सेट करें । आर × आर वीMr×rV

ब्लॉक फॉर्म में भी लिखेंΛ

Λ=[Λr×rΛ2Λ2Λ3]

और ( नकारात्मक है Schur Complement of ) सेट करें। डब्ल्यू ΛW=Λr×r+Λ2Λ31Λ2WΛ

फिर के मापदंडों के सही मूल्यों पर मैट्रिक्स मूल्यांकन किया जाता है। M WciMW

परिशिष्ट
टिप्पणी में ओपी की वैध टिप्पणी का जवाब देते हुए (कभी कभी, वास्तव में, सवाल एक अधिक सामान्य परिणाम को साझा करने के लिए एक मंच बन जाते हैं, और खुद को इस प्रक्रिया में उपेक्षित किया जा सकता है), यहाँ है कैसे विल्क्स के सबूत आय: विल्क्स संयुक्त साथ शुरू होता है MLE का सामान्य वितरण, और इसकी संभावना के अनुपात की कार्यात्मक अभिव्यक्ति प्राप्त करने के लिए आगे बढ़ता है। तक और उसके eq भी शामिल है। , प्रमाण आगे बढ़ सकते हैं, भले ही हम यह मान लें कि हमारे पास वितरणात्मक प्रक्षेपीकरण है: ओपी नोटों के रूप में, प्रसरण सहसंयोजक मैट्रिक्स की शर्तें प्रच्छन्न परिदृश्य में अलग होंगी, लेकिन सभी विल्क्स डेरिवेटिव ले सकते हैं, और पहचान करेंगे asymptotically नगण्य शब्द। और इसलिए वह ईक पर आता है। जहाँ हम देखते हैं कि संभावना अनुपात सांख्यिकीय है,[ ] एच - एम एच - एम[9][9]यदि विनिर्देश सही है, तो बस का योग है मानक सामान्य यादृच्छिक चर चुकता, और इसलिए वे के साथ एक ची-वर्ग के रूप में वितरित कर रहे हैं स्वतंत्रता की डिग्री: (सामान्य अंकन)hmhm

2lnλ=i=1hm(nθ^iθiσi)2dχhm2

लेकिन अगर हमारे पास मिसकैरेज है, तो केन्द्रित और आवर्धित MLE को स्केल करने के लिए उपयोग की जाने वाली शर्तें अब वे शब्द नहीं हैं जो प्रत्येक की भिन्नताओं को एकता के बराबर बना देंगे, और इसलिए प्रत्येक पद को एक मानक सामान्य आरवी और योग को ची-स्क्वायर में बदल दें। और वे नहीं हैं, क्योंकि इन शर्तों में लॉग-लाइबिलिटी के दूसरे डेरिवेटिव के अपेक्षित मान शामिल हैं ... लेकिन अपेक्षित मूल्य केवल सच्चे वितरण के संबंध में लिया जा सकता है, क्योंकि MLE डेटा और फ़ंक्शन का एक फ़ंक्शन है डेटा सही वितरण का अनुसरण करता है, जबकि लॉग-संभावना के दूसरे डेरिवेटिव की गणना गलत घनत्व धारणा के आधार पर की जाती है। n(θ^θ)

इसलिए मिसकैपिफिकेशन के तहत हमारे पास कुछ है जैसे और सबसे अच्छा हम यह कर सकते हैं कि इसमें हेरफेर किया जाए

2lnλ=i=1hm(nθ^iθiai)2

2lnλ=i=1hmσi2ai2(nθ^iθiσi)2=i=1hmσi2ai2χ12

जो की राशि है बढ़ाया ची-वर्ग आर.वी. की, अब के साथ एक ची वर्ग आर.वी. के रूप में वितरित स्वतंत्रता की डिग्री। ओपी द्वारा प्रदान किया गया संदर्भ वास्तव में इस अधिक सामान्य मामले का एक बहुत स्पष्ट स्पष्टीकरण है जिसमें एक विशेष मामले के रूप में विल्क्स का परिणाम शामिल है।hm


1
तो, यह मानक परिणाम का केवल एक प्रतिबंध है जब मॉडल गलत किया जाता है। यह परिणाम कई बार व्युत्पन्न और पुनः प्राप्त हुआ है। मैंने जो स्पष्ट और सबसे रोशन व्युत्पत्ति देखी है, वह केंट 1982 " लाइबली प्रॉपर्टीज ऑफ़ लाइकैलिटी रेशियो टेस्ट " (बायोमेट्रिक 69:19) से है। हालाँकि, आपने मेरे प्रश्न का उत्तर नहीं दिया। मेरा प्रश्न विशेष रूप से विल्क्स 1938 प्रमाण के बारे में था, और यह विफल क्यों हुआ।
रात्सलद

2

विल्क्स का 1938 प्रमाण काम नहीं करता है क्योंकि विल्क्स ने जैसा कि उनके प्रमाण में एसिम्प्टोटिक कोवरियनस मैट्रिक्स है। सैंडविच अनुमानक बजाय नकारात्मक लॉग संभावना के हेस्सियन का विलोम है । संदर्भ विल्क्स की वें तत्व के रूप में उनका एक प्रमाण में। यह धारणा बनाकर कि Wilks (1938) मान रहा है कि धारण करता है जो फिशर सूचना मैट्रिक्स समानता है। यदि संभाव्यता मॉडल सही ढंग से निर्दिष्ट है तोJ1J1J1KJ1ijJcijJ1KJ1=J1K=JK=J। तो विल्क्स द्वारा धारणा की एक व्याख्या यह है कि वह मजबूत धारणा को मान रहा है कि संभावना मॉडल सही ढंग से निर्दिष्ट है।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.