MLE विधि उन मामलों में लागू की जा सकती है जहां कोई व्यक्ति पीडीएफ के मूल कार्यात्मक रूप को जानता है (उदाहरण के लिए, यह गाऊसी, या लॉग-सामान्य, या घातांक, या जो भी हो), लेकिन अंतर्निहित पैरामीटर नहीं; उदाहरण के लिए, वे पीडीएफ में और के मूल्यों को नहीं जानते हैं : या जो भी अन्य प्रकार के पीडीएफ वे मान रहे हैं। MLE विधि का काम अज्ञात मापदंडों के लिए सबसे अच्छा (यानी, सबसे प्रशंसनीय) मूल्यों को चुनना है, विशेष डेटा माप जो वास्तव में देखे गए थे। । तो अपने पहले सवाल का जवाब देने के लिए, हाँ, आप हमेशा किसी से क्या पूछना चाहते हैं, आपके अधिकार में हैंσ च ( एक्स | μ , σ ) = 1μσएक्स1,एक्स2,x3,। । ।
च( x | μ , σ) = 12 πσ2----√exp[ - ( x - μ )22 σ2]
एक्स1, एक्स2, एक्स3, । । ।पीडीएफ के
रूप में वे अपने अधिकतम संभावना अनुमान के लिए मान रहे हैं; वास्तव में, अनुमानित पैरामीटर मान जो वे बताते हैं कि वे तब तक सार्थक नहीं हैं जब तक कि वे पहली बार उस संदर्भ को संवाद नहीं करते हैं।
ईएम एल्गोरिथ्म, जैसा कि मैंने देखा है कि यह अतीत में लागू किया गया है, एक तरह का मेटा एल्गोरिथ्म है, जहां कुछ मेटाडेटा गायब है, और आपको यह भी अनुमान लगाना होगा। इसलिए, उदाहरण के लिए, शायद मेरे पास एक पीडीएफ है जो कई गौसियों का मिश्रण है, जैसे: सतही तौर पर, सिवाय आयाम पैरामीटर , यह पिछली समस्या की तरह बहुत कुछ दिखता है, लेकिन क्या होगा अगर मैंने आपको बताया कि हम भी के मूल्य को नहीं जानते हैं (यानी, गौसियन मिश्रण में मोड की संख्या) और हम अनुमान लगाना चाहते हैं कि डेटा माप सेएककश्मीरएनx1,x2,x3,। । ।
च( एक्स | ए1, । । । , एएन, μ1, । । । , μएन, σ1, । । । σएन) = ∑के = १एनएक2 πσ2क----√exp[ - ( एक्स - μक)22 σ2क]
एकएनएक्स1, एक्स2, एक्स3, । । । भी?
इस मामले में, आपके पास एक समस्या है, क्योंकि प्रत्येक संभावित मूल्य (यह "मेटा" हिस्सा है जिसे मैं ऊपर से बता रहा था) वास्तव में कुछ अर्थों में एक अलग मॉडल उत्पन्न करता है। यदि , तो आपके पास तीन मापदंडों ( , , ) के साथ एक मॉडल है, जबकि यदि , तो आपके पास छह पैरामीटर ( मॉडल हैं , , , , , )। आपके लिए सबसे अच्छा फिट मान ( , , )एन = 1 ए 1 μ 1 σ 1 एन = 2 एक 1 एक 2 μ 1 μ 2 σ 1 σ 2 ए 1 μ 1 σ 1 एन = 1 एन = 2एनएन= 1ए1μ1σ1एन= २ए1ए2μ1μ2σ1σ2ए1μ1σ1एन= 1 मॉडल की तुलना सीधे उन सर्वोत्तम फिट मानों से नहीं की जा सकती है जो आप मॉडल में उन्हीं मापदंडों के लिए प्राप्त करते हैं , क्योंकि वे अलग-अलग मॉडल हैं जिनमें अलग-अलग संख्या में स्वतंत्रता होती है ।एन= २
ईएम एल्गोरिदम की भूमिका उन प्रकार की तुलना करने के लिए एक तंत्र प्रदान करना है (आमतौर पर "जटिलता जुर्माना" जो छोटे मूल्यों को ) ताकि हम लिए सर्वोत्तम समग्र मूल्य चुन सकें ।एनएनएन
इसलिए, आपके मूल प्रश्न का उत्तर देने के लिए, EM एल्गोरिथ्म को पीडीएफ के रूप में कम सटीक विनिर्देश की आवश्यकता होती है; कोई कह सकता है कि यह वैकल्पिक विकल्पों की एक श्रेणी पर विचार करता है (उदाहरण के लिए, विकल्प जहाँ , , , आदि) लेकिन फिर भी आपको उन विकल्पों के मूल गणितीय रूप के बारे में कुछ निर्दिष्ट करना होगा - आपको अभी भी कुछ अर्थों में, संभव पीडीएफ़ के "परिवार" को निर्दिष्ट करना है, भले ही आप एल्गोरिथ्म को आपके लिए निर्णय लेने दे रहे हैं कि परिवार का कौन सा "सदस्य" डेटा को सबसे अच्छा फिट प्रदान करता है।एन = 2 एन = 3एन= 1एन= २एन= ३