एक सांख्यिकीय मॉडल और एक संभावना मॉडल के बीच अंतर?


29

अनुप्रयुक्त संभाव्यता संगणनीय संभाव्यता सहित संभाव्यता में एक महत्वपूर्ण शाखा है। चूंकि आंकड़े डेटा से निपटने के लिए मॉडल के निर्माण के लिए संभाव्यता सिद्धांत का उपयोग कर रहे हैं, मेरी समझ के रूप में, मैं सोच रहा हूं कि सांख्यिकीय मॉडल और संभावना मॉडल के बीच आवश्यक अंतर क्या है? संभाव्यता मॉडल को वास्तविक डेटा की आवश्यकता नहीं है? धन्यवाद।

जवाबों:


29

एक संभावना मॉडल त्रिक के होते हैं है, जहां नमूना अंतरिक्ष, है है एक -algebra (घटनाओं) और पर एक प्रायिकता उपाय है ।(Ω,F,P)ΩFσPF

सहज व्याख्या । एक संभाव्यता मॉडल को एक ज्ञात यादृच्छिक चर रूप में व्याख्या किया जा सकता है । उदाहरण के लिए, को माध्य और विचरण साथ सामान्य रूप से वितरित यादृच्छिक चर माना जाता है । इस मामले में संभाव्यता माप माध्यम से संचयी वितरण समारोह (सीडीएफ) साथ जुड़ा हुआ हैXX01PF

F(x)=P(Xx)=P(ωΩ:X(ω)x)=x12πexp(t22)dt.

सामान्यीकरण । प्रायिकता मॉडल की परिभाषा संभाव्यता की गणितीय परिभाषा पर निर्भर करती है, उदाहरण के लिए देखें नि: शुल्क संभावना और क्वांटम संभावना

एक सांख्यिकीय मॉडल संभाव्यता मॉडल का एक सेट है, यह नमूना अंतरिक्ष पर प्रायिकता उपायों / वितरण का एक सेट है ।SΩ

प्रायिकता वितरण का यह सेट आमतौर पर एक निश्चित परिघटना के लिए चुना जाता है जहाँ से हमारे पास डेटा होता है।

सहज व्याख्या । एक सांख्यिकीय मॉडल में, पैरामीटर और वितरण जो एक निश्चित घटना का वर्णन करते हैं, दोनों अज्ञात हैं। इसका एक उदाहरण माध्य और variance साथ सामान्य वितरण का , यह दोनों पैरामीटर अज्ञात हैं और आप आमतौर पर उपयोग करना चाहते हैं मापदंडों का आकलन करने के लिए डेटा सेट (यानी एक तत्व का चयन )। वितरण के इस सेट को किसी भी और पर चुना जा सकता है , लेकिन, अगर मैं गलत नहीं हूं, तो एक वास्तविक उदाहरण में केवल एक ही जोड़ी पर परिभाषित लोग उचित हैं विचार करें।μRσ2R+SΩF(Ω,F)

सामान्यीकरणयह पेपर सांख्यिकीय मॉडल की एक बहुत ही औपचारिक परिभाषा प्रदान करता है, लेकिन लेखक का उल्लेख है कि "बायेसियन मॉडल को एक पूर्व वितरण के रूप में एक अतिरिक्त घटक की आवश्यकता होती है ... हालांकि बायेसियन योग इस पेपर का प्राथमिक ध्यान नहीं हैं"। इसलिए सांख्यिकीय मॉडल की परिभाषा इस बात पर निर्भर करती है कि हम किस तरह के मॉडल का उपयोग करते हैं: पैरामीट्रिक या नॉनपैरामेट्रिक। पैरामीट्रिक सेटिंग में भी, परिभाषा इस बात पर निर्भर करती है कि मापदंडों का इलाज कैसे किया जाता है (जैसे शास्त्रीय बनाम बेयसियन)।

अंतर यह है: एक संभावना मॉडल में आप वास्तव में संभावना उपाय पता है, उदाहरण के लिए एक , जहां में जाना जाता है पैरामीटर, एक सांख्यिकीय में है। मॉडल जिसे आप वितरण के सेट मानते हैं, उदाहरण के लिए , जहां अज्ञात पैरामीटर हैं।Normal(μ0,σ02)μ0,σ02Normal(μ,σ2)μ,σ2

उनमें से किसी को भी डेटा सेट की आवश्यकता नहीं है, लेकिन मैं कहूंगा कि आमतौर पर मॉडलिंग के लिए एक सांख्यिकीय मॉडल का चयन किया जाता है।


2
@HonglangWang कुछ हद तक सही है। मुख्य अंतर यह है कि एक संभावना मॉडल केवल एक (ज्ञात) वितरण है, जबकि एक सांख्यिकीय मॉडल संभावना मॉडल का एक सेट है; डेटा का उपयोग इस सेट से एक मॉडल का चयन करने के लिए किया जाता है या मॉडल का एक छोटा सबसेट जो बेहतर (एक निश्चित अर्थ में) घटना (डेटा के प्रकाश में) का वर्णन करता है।

2
(+1) यह एक अच्छा जवाब है, हालांकि मेरे पास कुछ टिप्पणियां हैं। सबसे पहले, मुझे लगता है कि यह संभाव्य को थोड़ा कम बेच सकता है। यह एक असामान्य मॉडल में संभाव्यता रिक्त स्थान के एक सेट पर विचार करने के लिए बिल्कुल भी असामान्य नहीं है, और वास्तव में, संभव उपाय भी यादृच्छिक हो सकते हैं (एक उपयुक्त बड़े स्थान पर निर्मित)। दूसरा, एक बायेसियन (विशेष रूप से) को यह उत्तर थोड़ा असंगत लग सकता है कि बायेसियन सांख्यिकीय मॉडल को अक्सर उपयुक्त उत्पाद स्थान पर एकल संभावना मॉडल के रूप में देखा जा सकता है । Ω×Θ
कार्डिनल

1
@ गंग यह एक अधिक माप-सिद्धांत-संबंधित प्रश्न है। आपके पहले प्रश्न के बारे में, वास्तव में CDF के माध्यम से परिभाषित किया गया है। अब, की व्याख्या कठिन है क्योंकि, औपचारिक रूप से, अर्थ है , तब अवलोकनीय मूल्य नहीं हैं। एक बीजगणित है जो कि तहत Borel बीजगणित की पूर्व-छवि है , फिर से यह अवलोकनीय नहीं है। मुझे समझ नहीं आ रहा है कि इसे सहज स्तर पर कैसे समझा जाए। PΩP(Xx)P(ωΩ:X(ω)x)ΩFσσX

2
@gung आवेदन पर निर्भर करता है ; यह सिद्धांत द्वारा निर्धारित नहीं है। उदाहरण के लिए, एक वित्तीय व्युत्पन्न की कीमत का वर्णन करने वाले ब्राउनियन गतियों का एक सेट हो सकता है और एक निश्चित समय पर प्राप्त मूल्य हो सकता । किसी अन्य एप्लिकेशन में लोगों का एक सेट हो सकता है और उनके अग्रभाग की लंबाई हो सकती है। आम तौर पर, अध्ययन की भौतिक वस्तुओं का एक गणितीय मॉडल है और उन वस्तुओं का एक संख्यात्मक गुण है। संभावित घटनाओं का समूह है: वे परिस्थितियाँ जिनके लिए हम संभाव्यता का वर्णन करना चाहते हैं।ΩΩXtΩXΩXF
whuber

2
@ गंग _ गणित एक सिग्मा बीजगणित है : यह सबसेट ("घटनाओं") का एक संग्रह है। वित्तीय अनुप्रयोग में, यह मूल्य इतिहास का एक सेट है; प्रकोष्ठ माप आवेदन में, घटनाओं लोगों के सेट होगा अगर आप चैट रूम में चाहें तो हम इस बारे में बात कर सकते हैं। F
whuber
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.