संभाव्यता सूचनाओं का अर्थ


27

अंकन और बीच के अर्थ में क्या अंतर है जो आमतौर पर कई पुस्तकों और कागजात में उपयोग किया जाता है?P(z;d,w)P(z|d,w)


13
f (x; () f (x |,) के समान है, बस इसका अर्थ है कि θ एक निश्चित पैरामीटर है और फ़ंक्शन f x का एक फ़ंक्शन है। f (x, (), OTOH, फ़ंक्शंस के एक परिवार (सेट) का एक तत्व है, जहाँ तत्वों को Θ द्वारा अनुक्रमित किया जाता है। एक सूक्ष्म अंतर, शायद, लेकिन एक महत्वपूर्ण एक, esp। जब ज्ञात डेटा x के आधार पर अज्ञात पैरामीटर θ का अनुमान लगाने का समय आता है; उस समय, and भिन्न होता है और x निश्चित होता है, जिसके परिणामस्वरूप "संभावना फ़ंक्शन" होता है। का उपयोग "|" सांख्यिकीविदों में अधिक सामान्य है, ";" गणितज्ञों के बीच।
jbowman

हां जुम्मन सही है। हम कभी-कभी इसे एक्स sometimes का घनत्व कहते हैं।
माइकल आर। चेर्निक

@jbowman क्यों नहीं एक जवाब के रूप में पोस्ट? मेरा एकमात्र प्रश्न है - वे दोनों का उपयोग क्यों करेंगे, लेकिन मुझे लगता है कि इसका संदर्भ के साथ कुछ लेना-देना है ("|" का उपयोग "पी" और "?" के साथ " ") के साथ किया जाता है। f
अबे

अच्छी सोच, अबे; शायद यही है। अधिक सामान्य है, मुझे लगता है। f
जुम्मन

जवाबों:


12

मेरा मानना ​​है कि इसका मूल कारण प्रतिमान है (हालांकि मैंने नीचे की वास्तविक ऐतिहासिक शुद्धता की जांच नहीं की है, यह समझने का एक उचित तरीका है कि आईओटी कैसे आया)।

मान लें कि एक प्रतिगमन सेटिंग में, आपके पास एक वितरण होगा: p (Y | x, beta) जिसका अर्थ है: यदि आप x और बीटा मानों को जानते हैं तो Y का वितरण।

यदि आप बेटस का अनुमान लगाना चाहते हैं, तो आप संभावना को अधिकतम करना चाहते हैं: एल (बीटा; वाई; एक्स) = पी (वाई | एक्स, बीटा) अनिवार्य रूप से, अब आप अभिव्यक्ति पी (वाई | एक्स, बीटा) के रूप में देख रहे हैं। बीटा का एक फ़ंक्शन, लेकिन इसके अलावा, कोई अंतर नहीं है (गणितीय सही अभिव्यक्ति के लिए जिसे आप ठीक से प्राप्त कर सकते हैं, यह एक आवश्यकता है --- हालांकि व्यवहार में कोई परेशान करता है)।

फिर, बायेसियन सेटिंग्स में, मापदंडों और अन्य चर के बीच का अंतर जल्द ही फीका पड़ जाता है, इसलिए किसी ने आपको दोनों नोटों का उपयोग करना शुरू कर दिया है।

तो, संक्षेप में: कोई वास्तविक अंतर नहीं है: वे दोनों बाईं ओर चीज़ के सशर्त वितरण को इंगित करते हैं, दाईं ओर चीज़ (ओं) पर सशर्त।


23

f(x;θ) बिंदु पर यादृच्छिक चर का घनत्व हैXx के साथ, वितरण का पैरामीटर जा रहा है। ( एक्स , θ ) के संयुक्त घनत्व है एक्स और Θ बिंदु पर ( एक्स , θ ) और केवल समझ में आता है, तो Θ एक यादृच्छिक चर रहा है। ( एक्स | θ ) की सशर्त वितरण है एक्स दिया Θ , और फिर से, सिर्फ तभी समझ में आता है Θθf(x,θ)XΘ(x,θ)Θf(x|θ)XΘΘएक यादृच्छिक चर है। यह बहुत स्पष्ट हो जाएगा जब आप पुस्तक में आगे बढ़ेंगे और बेयसियन विश्लेषण को देखेंगे।


Uhhhh ... की सशर्त वितरण है x दी θ सही भावना भले ही बनाता है θ एक यादृच्छिक चर नहीं है। शास्त्रीय आंकड़ों में यह बहुत अधिक मानक संकेतन है, जहां ation एक यादृच्छिक चर नहीं है। f(x|θ)xθθθ
जूलमैन

उह्ह्ह .... यदि आप इसका मतलब यह समझते हैं कि पी [θ = =] = 1 (बाएं Θ एक यादृच्छिक चर है, दायां variable एक स्थिर है) तो मैं सहमत हूं। अन्यथा मैं नहीं ... किस लिए तो P [do = mean] सशर्त वितरण की परिभाषा के हर में होगा?
पीटरआर

भाजक? मैं लिख सकते हैं जहां Bayes के नियम के संदर्भ के बिना एक सामान्य वितरण है। μ और σ तय कर रहे हैं। अन्य लोग भी, उदाहरण के लिए, ll.mit.edu/mission/ दूरसंचार / ist / publications / xf(x|μ,σ)fμσ
जूलमैन

जूम्मन, तो सशर्त घनत्व के रूप में आपके f (x | μ, as) की परिभाषा क्या है जब μ और (निश्चित संख्याएं हैं (यानी यादृच्छिक चर नहीं)?
पीटर

1
शब्द "सशर्त", संकेतन f (X | Y) के साथ जुड़ा हुआ है, इसे "कुछ यादृच्छिक घटना होने पर सशर्त" के रूप में परिभाषित किया गया है। यदि आप इसका उपयोग कुछ और करने के लिए कर रहे हैं, जैसे कि "दिए गए", जैसे कि "f (x) दिए गए (विशिष्ट मानों μ) और μ" के रूप में, तो ठीक है, यही कारण है कि संकेतन f (x; μ; σ) के लिए है। चूंकि ओपी इस बारे में पूछ रहा था कि नोटेशन का क्या मतलब है, हमें जवाब में नोटेशन के बारे में सटीक होना चाहिए।
पीटर

18

f(x;θ) के रूप में ही हैf(x|θ) , बस जिसका अर्थ है किθ एक निश्चित पैरामीटर है और समारोहf की एक समारोह हैxf(x,Θ) , OTOH, कार्यों में से एक परिवार के (या सेट), जहां तत्वों द्वारा अनुक्रमित रहे हैं का एक तत्व हैΘ । एक सूक्ष्म अंतर, शायद, लेकिन एक महत्वपूर्ण एक, esp। जबज्ञात डेटा x के आधार परअज्ञात पैरामीटरθ का अनुमान लगाने का समय आता है; उस समय, θ बदलता है और xxθxतय किया गया है, जिसके परिणामस्वरूप "संभावना समारोह" है। का प्रयोग सांख्यिकीविदों के बीच आम है, जबकि है ;गणितज्ञों के बीच।


1
कैसे की जाती है मौखिक रूप से बोली जाने वाली? क्या आप कहते हैं "f of x दिए गए of"? f(x;θ)
stackoverflowuser2010

@ stackoverflowuser2010 - हाँ, बिल्कुल।
जूलमैन

2
मैंने कुछ कौरसेरा वीडियो में पाया कि स्टैनफोर्ड के प्रोफेसर एंड्रयू एनजी ने अर्धविराम को "द्वारा मानकीकृत" के रूप में सत्यापित किया है। देखें: class.coursera.org/ml-005/lecture/34 । इसलिए उदाहरण को "थीटा द्वारा निर्धारित एक्स के पैरामीटर" के रूप में बोला जाएगा।
stackoverflowuser2010

5
"पैरामीटर" से "दिया" या "सशर्त" बहुत अलग (सामान्य रूप से) है। अगर किसी ने यह देखा और मुझे लगा कि दोनों बराबर हैं तो मुझे नफरत होगी। "पैरामीटराइज़्ड" कहना केवल तभी उचित होता है जब मात्रा को वातानुकूलित किया जा रहा हो, पहले टर्म में वेरिएबल के पीडीएफ को इंडेक्स करने वाला पैरामीटर होता है। दो चरों के लिए (जैसे, f (x; y)), उस शब्द का उपयोग करना गलत होगा।
एटीजे

2
@ मायकेविलियम्सन - निश्चित रूप से, एक संकेतन चुनें जहाँ आप जानते हैं कि सब कुछ क्या मतलब है और इसके साथ रहें! इस तरह से जब आप कुछ ऐसा करते हैं जो आपने पहले किया था, जैसे मेरे अनुभव में 4 घंटे पहले, आपको यह पता लगाने की ज़रूरत नहीं है कि जब आप इसका उपयोग करते थे तो आपका क्या मतलब होता है "" | मैं सहमत हूं, यह कष्टप्रद है, लेकिन थोड़ी देर के बाद आप केवल अंकन के पहले उपयोग को देखते हैं और इसे बाकी कागज या पुस्तक के लिए याद करते हैं; भेद आमतौर पर महत्वपूर्ण नहीं हैं, वैसे भी।
जुम्मन

9

हालांकि यह हमेशा इस तरह, इन दिनों नहीं किया गया है आम तौर पर जब प्रयोग किया जाता है , डब्ल्यू (है, जो कहना है कि वे जाने जाते रहे हैं नहीं है जरूरी) यादृच्छिक परिवर्तनीय नहीं हैं। पी ( z |, डब्ल्यू ) के मूल्यों पर कंडीशनिंग इंगित करता है , डब्ल्यू । कंडीशनिंग रैंडम वेरिएबल्स पर एक ऑपरेशन है और इस तरह इस नोटेशन का उपयोग करते हुए जब d , w रैंडम वैरिएबल नहीं हैं (और दुखद आम है)।P(z;d,w)d,wP(z|d,w)d,wd,w

@Nick Sabbe बताते हैं मनाया डेटा के नमूने वितरण के लिए एक आम अंकन है y । कुछ आव्रजनकर्ता इस संकेतन का उपयोग करेंगे, लेकिन जोर देते हैं कि random एक यादृच्छिक चर नहीं है, जो एक दुरुपयोग आईएमओ है। लेकिन उनका वहां कोई एकाधिकार नहीं है; मैंने देखा है कि Bayesians भी इसे करते हैं, सशर्त के अंत में फिक्स्ड हाइपरपरमेटर्स से निपटते हैं।p(y|X,Θ)yΘ


2
अपने दूसरे पैराग्राफ को फिर से देखें, यह इंगित करने के लायक है कि ठेठ सांख्यिकीय स्थितियों में (कहते हैं, एक प्रतिगमन मॉडल फिटिंग), को या तो यादृच्छिक चर नहीं माना जाता है, लेकिन ज्ञात स्थिरांक का एक सेट। एक्स
गूँज - मोनिका
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.