विल्क्स की प्रमेय के साथ एक सीमित मिश्रण में गौसियों की संख्या ज्ञात करना?


11

मान लें कि मेरे पास स्वतंत्र, समान रूप से वितरित अविभाज्य टिप्पणियों और दो परिकल्पनाओं का एक सेट है कि कैसे उत्पन्न किया गया था:एक्सएक्स

एच0 : अज्ञात माध्य और विचरण के साथ एक एकल गाऊसी वितरण से लिया गया है।एक्स

एच : दो मिश्रण से अज्ञात माध्य, विचरण और मिश्रण गुणांक से तैयार किया गया है।एक्स

अगर मैं सही तरीके से , तो ये नेस्टेड मॉडल हैं क्योंकि प्रतिनिधित्व करने वाले मॉडल को रूप में वर्णित किया जा सकता है यदि आप दो के मापदंडों को एक समान करने के लिए विवश करते हैं या दो एक के लिए शून्य होने के लिए मिश्रण गुणांक को विवश करते हैं। एच0एच

इसलिए, ऐसा लगता है कि आपको के मापदंडों का अनुमान लगाने के लिए EM एल्गोरिथ्म का उपयोग करने में सक्षम होना चाहिए और फिर तहत डेटा की संभावना से अधिक है या नहीं यह निर्धारित करने के लिए Wilks के प्रमेय का उपयोग करें । इस धारणा में विश्वास की एक छोटी छलांग है कि ईएम एल्गोरिथ्म यहां अधिकतम संभावना के अनुरूप होगा, लेकिन यह वह है जिसे मैं बनाने के लिए तैयार हूं।एचएचएच0

मैंने एक मोंटे कार्लो सिमुलेशन में यह कोशिश की, यह मानते हुए कि को तुलना में स्वतंत्रता की 3 अधिक डिग्री है (दूसरे गौसियन और मिक्सिंग पैरामीटर के लिए माध्य और विचरण)। जब मैंने से डेटा का अनुकरण किया , तो मुझे एक P-value वितरण मिला जो कि काफी हद तक गैर-समान था और छोटे P-मानों के लिए समृद्ध था। (यदि ईएम वास्तविक अधिकतम संभावना के अनुरूप नहीं थे, तो इसके ठीक विपरीत की उम्मीद की जाएगी।) विलक्स प्रमेय के मेरे आवेदन के साथ क्या गलत है जो यह पूर्वाग्रह पैदा कर रहा है?एचएच0एच0

जवाबों:


8

दो-घटक मिश्रण मॉडल में अशक्त परिकल्पना कैसे निहित है, इसकी सावधानीपूर्वक विशिष्टता के साथ, यह देखना संभव है कि समस्या क्या हो सकती है। मिश्रण मॉडल में पांच पैरामीटर हैं , तो एच 0 : ( μ 1 = μ 2  और  σ 1 = σ 2 )  या  ρ { 0 , 1 } μ1,μ2,σ1,σ2,ρ

एच0:(μ1=μ2 तथा σ1=σ2) या ρ{0,1}
क्योंकि या तो दो सामान्य मिश्रण घटक समान होते हैं, जिस स्थिति में मिश्रण अनुपात अप्रासंगिक है, या मिश्रण अनुपात ρ 0 या 1 है, इस मामले में मिश्रण घटकों में से एक अप्रासंगिक है। निष्कर्ष यह है कि शून्य परिकल्पना को निर्दिष्ट नहीं किया जा सकता है, स्थानीय रूप से भी नहीं, एक साधारण पैरामीटर प्रतिबंध के रूप में जो पैरामीटर अंतरिक्ष के आयाम को 5 से 2 तक गिरा देता है।ρρ

अशक्त परिकल्पना पूर्ण पैरामीटर स्थान का एक जटिल उपसमुच्चय है, और अशक्त के तहत पैरामीटर पहचान योग्य भी नहीं हैं। विल्क की प्रमेय को प्राप्त करने के लिए आवश्यक सामान्य धारणाएं टूट जाती हैं, विशेष रूप से लॉग-लाइबिलिटी के उचित टेलर विस्तार का निर्माण संभव नहीं है।

मुझे इस विशेष समस्या के साथ कोई व्यक्तिगत अनुभव नहीं है, लेकिन मुझे ऐसे अन्य मामलों के बारे में पता है, जहां अशक्त के तहत पैरामीटर "गायब" हो जाते हैं, जो यहां भी मामला प्रतीत होता है, और इन मामलों में विल्क के प्रमेय के निष्कर्ष भी टूट जाते हैं। । एक त्वरित खोज ने, अन्य बातों के अलावा, यह कागज जो प्रासंगिक दिखता है, और जहां आप मिश्रण मॉडल के संबंध में संभावना अनुपात परीक्षण के उपयोग पर आगे संदर्भ प्राप्त करने में सक्षम हो सकते हैं।


धन्यवाद। मैंने सोचा था कि इस तरह की समस्या हो सकती है, लेकिन मुझे यकीन नहीं था। मैं विल्क्स के प्रमेय के उद्देश्य से एक नेस्टेड मॉडल का गठन करने वाले महीन बिंदुओं के बारे में थोड़ा भ्रमित था। अशक्त के तहत पहचान के बारे में अच्छी बात।
dsimcha 13

4

ρपैरामीटर स्पेस की सीमा पर है और (b) नल के तहत पैरामीट्रिशन अज्ञात है। यह कहना नहीं है कि सामान्यीकृत संभावना अनुपात का वितरण अज्ञात है! यदि आपके सेटअप के सभी 5 पैरामीटर अज्ञात हैं, और इससे भी महत्वपूर्ण बात- अनबाउंड- तो एलआर स्टेटिस्टिक का वितरण नहीं होता है। यदि सभी अज्ञात मापदंडों को बाध्य किया जाता है, तो एलआर सांख्यिकीय एक छंटनी की गई गौसियन प्रक्रिया के वर्चस्व में एकरस है। जिनमें से सहसंयोजक को सामान्य (5 पैरामीटर) मामले में गणना करना आसान नहीं है, और जब आपके पास होता है तब भी - ऐसी प्रक्रिया के वर्चस्व का वितरण आसानी से अनुमानित नहीं होता है। दो-घटक मिश्रण के बारे में कुछ व्यावहारिक परिणामों के लिए यहां देखें। दिलचस्प है, कागज से पता चलता है कि सरल सेटअपों में, LR सांख्यिकीय वास्तव में कुछ सरल आंकड़ों की तुलना में कम शक्तिशाली है। इस तरह की समस्याओं में एसिम्प्टोटिक वितरण प्राप्त करने पर सेमिनल पेपर के लिए यहां देखें । सभी व्यावहारिक उद्देश्यों के लिए, आप ईएम का उपयोग करके मिश्रण को फिट कर सकते हैं, और फिर एलआर स्टेटिस्टिक के वितरण को बूटस्ट्रैप कर सकते हैं। यह कुछ समय ले सकता है क्योंकि ईएम को धीमा होने के लिए जाना जाता है, और आपको नमूना आकार के प्रभाव को पकड़ने के लिए कई प्रतिकृति की आवश्यकता होती है। देखें यहाँ जानकारी के लिए।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.