बिशप की पीआरएमएल पुस्तक में, वह कहते हैं कि, ओवरफिटिंग अधिकतम संभावना अनुमान (एमएलई) के साथ एक समस्या है, और बेयसियन इससे बच सकते हैं।
लेकिन मुझे लगता है, ओवरफिटिंग मॉडल चयन के बारे में अधिक समस्या है, पैरामीटर अनुमान करने के लिए इस्तेमाल की जाने वाली विधि के बारे में नहीं। यह है, मान लीजिए कि मेरे पास एक डेटा सेट , जो f ( x ) = s i n ( x ) के माध्यम से उत्पन्न होता है , , अब मैंडेटा फिट करने और यह पता लगाने के लिएअलग-अलग मॉडल H i चुन सकता हूं किकौन सा सबसे अच्छा है। और विचाराधीन मॉडल विभिन्न आदेशों के साथ बहुपद हैं, एच 1 ऑर्डर 1 है, एच 2 ऑर्डर 2 है, एच 3 ऑर्डर 9 है।
अब मैं डेटा फिट करने के लिए कोशिश 3 मॉडलों में से प्रत्येक के साथ, प्रत्येक मॉडल अपनी पैरामीटर, के रूप में निरूपित किया गया है w मैं के लिए एच मैं ।
एमएल का उपयोग करते हुए, मेरे पास मॉडल पैरामीटर का एक बिंदु अनुमान होगा , और एच 1 बहुत सरल है और हमेशा डेटा को कम करेगा, जबकि एच 3 बहुत जटिल है और डेटा को ओवरफिट करेगा, केवल एच 2 डेटा को अच्छी तरह से फिट करेगा।
मेरे प्रश्न हैं,
1) मॉडल डेटा से आगे निकल जाएगा, लेकिन मुझे नहीं लगता कि यह एमएल की समस्या है, लेकिन मॉडल की समस्या प्रति से। क्योंकि, H 1 , H 2 के लिए ML का उपयोग करने से ओवरफिटिंग नहीं होती है। क्या मैं सही हू?