आरएमएसई से संभावना की गणना


13

मेरे पास कई मापदंडों के साथ एक प्रक्षेपवक्र (समय के एक समारोह के रूप में x) की भविष्यवाणी करने के लिए एक मॉडल है। फिलहाल, मैं अनुमानित प्रक्षेप पथ और प्रयोगात्मक रूप से दर्ज किए गए प्रक्षेपवक्र के बीच मूल माध्य वर्ग त्रुटि (RMSE) की गणना करता हूं। वर्तमान में, मैं इस अंतर (RMSE) को सिम्प्लेक्स (matlab में fminsearch) का उपयोग करके कम करता हूं। जबकि यह विधि अच्छा फिट देने के लिए काम करती है, मैं कई अलग-अलग मॉडलों की तुलना करना चाहूंगा, इसलिए मुझे लगता है कि मुझे संभावना की गणना करने की आवश्यकता है ताकि मैं आरएमएसई को कम करने के बजाय अधिकतम संभावना अनुमान का उपयोग कर सकूं (और फिर एआईसी या बीआईसी का उपयोग करके मॉडल की तुलना करूं )। क्या ऐसा करने का कोई मानक तरीका है?

जवाबों:


20

मूल मतलब चुकता त्रुटि और संभावना वास्तव में निकटता से संबंधित हैं। मान लें कि आपके पास जोड़े का डेटासेट है और आप मॉडल f का उपयोग करके उनके रिश्ते को मॉडल बनाना चाहते हैं । आप द्विघात त्रुटि को कम करने का निर्णय लेते हैं{xi,zi}f

i(f(xi)zi)2

क्या यह विकल्प पूरी तरह से मनमाना नहीं है? निश्चित रूप से, आप उन अनुमानों को दंडित करना चाहते हैं जो पूरी तरह से गलत हैं जो सही हैं। लेकिन चुकता त्रुटि का उपयोग करने के लिए एक बहुत अच्छा कारण है।

1Zexp(xμ)22σ2Zz

L=i1Zexp(f(xi)zi)22σ2

अब अगर आप इसका लघुगणक लेते हैं ...

logL=i(f(xi)zi)22σ2logZ

... यह पता चला है कि यह बहुत निकट से संबंधित है rms: केवल अंतर कुछ निरंतर शब्द हैं, एक वर्गमूल और एक गुणन।

लंबी कहानी छोटी: रूट का मतलब न्यूनतम चुकता त्रुटि डेटा के लॉग संभावना को अधिकतम करने के बराबर है।


स्पष्ट स्पष्टीकरण के लिए धन्यवाद। इसलिए अगर मैं बीआईसी का उपयोग करके दो (गैर-एम्बेडेड) मॉडल की तुलना करना चाहता हूं, तो संभावना की गणना करते समय मैं सिग्मा ^ 2 और जेड शब्द (प्रभावी रूप से वे सभी मॉडलों में समान हैं) को छोड़ सकते हैं?
जेसन

σσ

1
logL=i(f(xi)zi)22σ2logZ

2
क्या गॉसियन वितरण में एक नकारात्मक संकेत गायब है?
मनोज

1
σ
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.