एक संभावना मॉडल त्रिक के होते हैं है, जहां नमूना अंतरिक्ष, है है एक -algebra (घटनाओं) और पर एक प्रायिकता उपाय है ।(Ω,F,P)ΩFσPF
सहज व्याख्या । एक संभाव्यता मॉडल को एक ज्ञात यादृच्छिक चर रूप में व्याख्या किया जा सकता है । उदाहरण के लिए, को माध्य और विचरण साथ सामान्य रूप से वितरित यादृच्छिक चर माना जाता है । इस मामले में संभाव्यता माप माध्यम से संचयी वितरण समारोह (सीडीएफ) साथ जुड़ा हुआ हैXX01PF
F(x)=P(X≤x)=P(ω∈Ω:X(ω)≤x)=∫x−∞12π−−√exp(−t22)dt.
सामान्यीकरण । प्रायिकता मॉडल की परिभाषा संभाव्यता की गणितीय परिभाषा पर निर्भर करती है, उदाहरण के लिए देखें नि: शुल्क संभावना और क्वांटम संभावना ।
एक सांख्यिकीय मॉडल संभाव्यता मॉडल का एक सेट है, यह नमूना अंतरिक्ष पर प्रायिकता उपायों / वितरण का एक सेट है ।SΩ
प्रायिकता वितरण का यह सेट आमतौर पर एक निश्चित परिघटना के लिए चुना जाता है जहाँ से हमारे पास डेटा होता है।
सहज व्याख्या । एक सांख्यिकीय मॉडल में, पैरामीटर और वितरण जो एक निश्चित घटना का वर्णन करते हैं, दोनों अज्ञात हैं। इसका एक उदाहरण माध्य और variance साथ सामान्य वितरण का , यह दोनों पैरामीटर अज्ञात हैं और आप आमतौर पर उपयोग करना चाहते हैं मापदंडों का आकलन करने के लिए डेटा सेट (यानी एक तत्व का चयन )। वितरण के इस सेट को किसी भी और पर चुना जा सकता है , लेकिन, अगर मैं गलत नहीं हूं, तो एक वास्तविक उदाहरण में केवल एक ही जोड़ी पर परिभाषित लोग उचित हैं विचार करें।μ∈Rσ2∈R+SΩF(Ω,F)
सामान्यीकरण । यह पेपर सांख्यिकीय मॉडल की एक बहुत ही औपचारिक परिभाषा प्रदान करता है, लेकिन लेखक का उल्लेख है कि "बायेसियन मॉडल को एक पूर्व वितरण के रूप में एक अतिरिक्त घटक की आवश्यकता होती है ... हालांकि बायेसियन योग इस पेपर का प्राथमिक ध्यान नहीं हैं"। इसलिए सांख्यिकीय मॉडल की परिभाषा इस बात पर निर्भर करती है कि हम किस तरह के मॉडल का उपयोग करते हैं: पैरामीट्रिक या नॉनपैरामेट्रिक। पैरामीट्रिक सेटिंग में भी, परिभाषा इस बात पर निर्भर करती है कि मापदंडों का इलाज कैसे किया जाता है (जैसे शास्त्रीय बनाम बेयसियन)।
अंतर यह है: एक संभावना मॉडल में आप वास्तव में संभावना उपाय पता है, उदाहरण के लिए एक , जहां में जाना जाता है पैरामीटर, एक सांख्यिकीय में है। मॉडल जिसे आप वितरण के सेट मानते हैं, उदाहरण के लिए , जहां अज्ञात पैरामीटर हैं।Normal(μ0,σ20)μ0,σ20Normal(μ,σ2)μ,σ2
उनमें से किसी को भी डेटा सेट की आवश्यकता नहीं है, लेकिन मैं कहूंगा कि आमतौर पर मॉडलिंग के लिए एक सांख्यिकीय मॉडल का चयन किया जाता है।