मान लें कि मेरे पास स्वतंत्र, समान रूप से वितरित अविभाज्य टिप्पणियों और दो परिकल्पनाओं का एक सेट है कि कैसे उत्पन्न किया गया था:
: अज्ञात माध्य और विचरण के साथ एक एकल गाऊसी वितरण से लिया गया है।
: दो मिश्रण से अज्ञात माध्य, विचरण और मिश्रण गुणांक से तैयार किया गया है।
अगर मैं सही तरीके से , तो ये नेस्टेड मॉडल हैं क्योंकि प्रतिनिधित्व करने वाले मॉडल को रूप में वर्णित किया जा सकता है यदि आप दो के मापदंडों को एक समान करने के लिए विवश करते हैं या दो एक के लिए शून्य होने के लिए मिश्रण गुणांक को विवश करते हैं।
इसलिए, ऐसा लगता है कि आपको के मापदंडों का अनुमान लगाने के लिए EM एल्गोरिथ्म का उपयोग करने में सक्षम होना चाहिए और फिर तहत डेटा की संभावना से अधिक है या नहीं यह निर्धारित करने के लिए Wilks के प्रमेय का उपयोग करें । इस धारणा में विश्वास की एक छोटी छलांग है कि ईएम एल्गोरिथ्म यहां अधिकतम संभावना के अनुरूप होगा, लेकिन यह वह है जिसे मैं बनाने के लिए तैयार हूं।
मैंने एक मोंटे कार्लो सिमुलेशन में यह कोशिश की, यह मानते हुए कि को तुलना में स्वतंत्रता की 3 अधिक डिग्री है (दूसरे गौसियन और मिक्सिंग पैरामीटर के लिए माध्य और विचरण)। जब मैंने से डेटा का अनुकरण किया , तो मुझे एक P-value वितरण मिला जो कि काफी हद तक गैर-समान था और छोटे P-मानों के लिए समृद्ध था। (यदि ईएम वास्तविक अधिकतम संभावना के अनुरूप नहीं थे, तो इसके ठीक विपरीत की उम्मीद की जाएगी।) विलक्स प्रमेय के मेरे आवेदन के साथ क्या गलत है जो यह पूर्वाग्रह पैदा कर रहा है?