क्या वास्तव में एक वितरण है?


16

मैं संभाव्यता और सांख्यिकी के बारे में बहुत कम जानता हूं, और सीखने की इच्छा रखता हूं। मुझे "वितरण" शब्द सभी जगह अलग-अलग संदर्भों में इस्तेमाल होता है।

उदाहरण के लिए, एक असतत यादृच्छिक चर में "संभाव्यता वितरण" होता है। मुझे पता है कि यह क्या है। एक सतत यादृच्छिक चर के लिए फिर एक प्रायिकता घनत्व समारोह है, xR से अभिन्न, करने के लिए प्रायिकता घनत्व समारोह का संचयी बंटन फ़ंक्शन पर मूल्यांकन किया जाता है ।xx

और जाहिरा तौर पर सिर्फ "वितरण समारोह" "संचयी वितरण समारोह" का पर्याय है, कम से कम जब निरंतर यादृच्छिक चर के बारे में बात करते हैं (प्रश्न: क्या वे हमेशा समानार्थी हैं?)।

फिर कई प्रसिद्ध वितरण हैं। वितरण वितरण, आदि लेकिन वास्तव में एक वितरण क्या है? क्या यह एक यादृच्छिक चर का संचयी वितरण कार्य है ? या एक यादृच्छिक चर की संभावना घनत्व समारोह ?χ 2 गामा गामाΓχ2ΓΓΓ

लेकिन तब एक परिमित डेटा सेट की आवृत्ति वितरण एक हिस्टोग्राम प्रतीत होता है।

लंबी कहानी छोटी: संभाव्यता और सांख्यिकी में, "वितरण" शब्द की परिभाषा क्या है?

मैं गणित में वितरण की परिभाषा जानता हूं (आगमनात्मक सीमा टोपोलॉजी से लैस परीक्षण कार्यों के संग्रह के दोहरे स्थान का एक तत्व), लेकिन संभावना और सांख्यिकी नहीं।


1
इसी विकिपीडिया लेख विषय में एक अच्छा परिचय हो रहा है।
१३:१५ बजे

1
कड़ाई से, 'वितरण' और 'सीएफडी' को समानार्थक शब्द माना जाना चाहिए, लेकिन 'वितरण' का उपयोग अक्सर बहुत ढीले अर्थों में किया जाता है और अक्सर इसका उपयोग वास्तव में घनत्व / पीएमएफ के लिए किया जाता है।
Glen_b -Reinstate Monica

3
वितरण की आपकी समझ संभावना में एक के करीब है; मुख्य अंतर यह है कि संभावना वाले लोग कुछ अतिरिक्त गुणों (सकारात्मक होने और एकता के लिए सामान्यीकृत) का आनंद लेते हैं। कनेक्शन यह है कि आपकी परिभाषा संबंधित अपेक्षा ऑपरेटर के संदर्भ में एक वितरण स्थापित करती है। आंकड़ों में प्रचलित भाषा का एक (गंभीर) दुरुपयोग भी है, जो वितरण के एक पैरामीटर वाले परिवार को "वितरण" भी कहता है। अंत में, कोई भी परिमित डेटासेट, इसके "अनुभवजन्य वितरण" से प्राप्त किए गए वितरण को निर्धारित करता है।
whuber

@whuber जो मदद करता है, धन्यवाद विशेष रूप से, भाषा का दुरुपयोग। यह एक फ़ंक्शन के अनिश्चितकालीन इंटीग्रल ... एक फ़ंक्शन को कॉल करने जैसा होगा।
danzibr

अच्छे उत्तरों के साथ एक समान प्रश्न: आंकड़े.stackexchange.com/questions/210403/…
kjetil b halvorsen

जवाबों:


7

निम्नलिखित मूल्यवान यादृच्छिक-चर के लिए है। यदि आप रुचि रखते हैं तो अन्य स्थानों का विस्तार सीधे आगे है। मैं तर्क दूंगा कि घनत्व, द्रव्यमान और संचयी वितरण कार्यों को देखते हुए अलग-अलग सामान्य परिभाषा निम्न से अधिक सहज है।R

मैं इसे सही करने के लिए पाठ में कुछ गणितीय / संभाव्य शब्द शामिल करता हूं। यदि कोई उन शर्तों से परिचित नहीं है, तो अंतर्ज्ञान को "बोरेल सेट्स" के केवल " किसी भी सबसेट जो मैं सोच सकता हूं " के रूप में सोचकर समान रूप से अच्छी तरह से समझा जाता है , और यादृच्छिक चर के साथ कुछ प्रयोग के संख्यात्मक परिणाम सम्भावना।R


चलो (Ω,F,P) एक संभावना अंतरिक्ष और हो एक आर - इस स्थान पर यादृच्छिक चर मूल्यवान।X(ω)R

सेट समारोह , जहां एक के वितरण एक बोरेल सेट है, कहा जाता है एक्सQ(A):=P(ωΩ:X(ω)A)AX

शब्दों में, वितरण आपको बताता है (शिथिल बोलना), किसी भी सबसेट के लिए , संभावना है कि एक्स उस सेट में एक मूल्य पर लेता है। एक साबित कर सकता है कि क्यू फ़ंक्शन एफ ( एक्स ) : = पी ( एक्स that एक्स ) और इसके विपरीत द्वारा पूरी तरह से निर्धारित है । ऐसा करने के लिए - और मैं यहाँ विवरण छोड़ता हूँ - सभी सेट के लिए संभाव्यता F ( x ) निर्दिष्ट करने वाले बोरेल सेट पर एक माप का निर्माण करेंRXQF(x):=P(Xx)F(x) और तर्क है कि यह परिमित उपाय के साथ सहमत हैं क्यू एक पर(,x)Q बोरेल bra - बीजगणित कोउत्पन्न करने वाली प्रणाली।πσ

यह इतना होता है कि के रूप में लिखा जा सकता है क्यू ( ) = एक( एक्स ) एक्स तो के लिए एक घनत्व समारोह है क्यू और आप देख सकते हैं, हालांकि यह घनत्व विशिष्ट निर्धारित नहीं है (पर परिवर्तन करने पर विचार लेब्सेग के सेट शून्य को मापते हैं), यह एक्स के वितरण के रूप में एफ की बात भी करता है । आमतौर पर, हालांकि, हम इसे एक्स की संभावना घनत्व फ़ंक्शन कहते हैं ।Q(A)Q(A)=Af(x)dxfQfXX

इसी तरह, यह इतना है कि अगर के रूप में लिखा जा सकता है क्यू ( ) = Σ मैं { ... , - 1 , 0 , 1 , ... }( मैं ) , तो यह भावना की बात करता है एक्स के वितरण के रूप में हालांकि हम आमतौर पर इसे प्रायिकता मास फ़ंक्शन कहते हैं।Q(A)Q(A)=iA{,1,0,1,}f(i)fX

इस प्रकार, जब भी आप कुछ ऐसा पढ़ते हैं जैसे " [ 0 , 1 ] पर एक समान वितरण का अनुसरण करता है , " तो इसका सीधा सा अर्थ है कि फ़ंक्शन Q ( A ) , जो आपको संभावना बताता है कि X निश्चित सेटों में मान लेता है, की विशेषता है संभाव्यता घनत्व फ़ंक्शन f ( x ) = I [ 0 , 1 ] या संचयी वितरण फ़ंक्शन F ( x ) = X[0,1]Q(A)Xf(x)=I[0,1]F(x)=xf(t)dt

मामले पर एक अंतिम नोट जहां यादृच्छिक चर का कोई उल्लेख नहीं है, लेकिन केवल एक वितरण। कोई यह साबित कर सकता है कि दिया गया वितरण फ़ंक्शन (या द्रव्यमान, घनत्व या संचयी वितरण फ़ंक्शन), एक यादृच्छिक चर के साथ एक संभावना स्थान मौजूद है जिसमें यह वितरण है। इस प्रकार, वितरण के बारे में बोलने में, या उस वितरण वाले यादृच्छिक चर के बारे में अनिवार्य रूप से कोई अंतर नहीं है। यह सिर्फ एक ध्यान देने की बात है।


3

चलो एक संभावना स्थान हो, चलो ( एक्स , बी ) होना एक औसत दर्जे का अंतरिक्ष, और एक्स : Ω एक्स एक औसत दर्जे का समारोह हो, जिसका अर्थ है कि एक्स - 1 ( बी ) = { ω : एक्स ( ω ) बी } एफ हर के लिए बी बीके वितरण एक्स संभावना उपाय है μ(Ω,F,P)(X,B)X:ΩXX1(B)={ω:X(ω)B}FBB X से अधिक ( एक्स , बी ) द्वारा परिभाषित μ एक्स ( बी ) = पी ( एक्स बी ) । जब एक्स = आर और बी बोरल सिग्मा-फ़ील्ड है, तो हम फ़ंक्शन एक्स को एक यादृच्छिक "चर" के रूप मेंसंदर्भित करते हैं।μX(X,B)μX(B)=P(XB)X=RBX


1
संभावना और आँकड़ों के अल्प ज्ञान वाले लोगों के लिए बहुत स्पष्ट होना चाहिए :)
एलेक्सी ग्रिगोरोव

3
ठीक है, ओपी को उन्नत गणित के सामान मालूम होते हैं जैसे "आगमनात्मक सीमा टॉपिंग से लैस परीक्षण कार्यों के संग्रह के दोहरे स्थान का तत्व"। उसके प्रश्न के अंत की जाँच करें।
ज़ेन

2
यह वास्तव में मेरे लिए एक अच्छी प्रतिक्रिया थी। मुझे संभावना स्थान की परिभाषा की जांच करने की आवश्यकता थी, लेकिन गणित की पृष्ठभूमि वाले व्यक्ति के लिए यह स्पष्ट था। मैंने उत्तर के निष्कर्ष की सराहना की, केवल दूसरे उत्तर में विस्तार के कारण इसे स्वीकार नहीं किया।

1

अब तक के प्रश्न और उत्तर सैद्धांतिक वितरण पर केंद्रित प्रतीत होते हैं। अनुभवजन्य वितरण वितरण की अधिक सहज समझ प्रदान करते हैं।

उदाहरण

रस्सी लंघन में एक वर्ग टूर्नामेंट के दौरान हम एक कक्षा लंघन रस्सी में सभी बच्चों का निरीक्षण करते हैं। पहला बच्चा दो बार कूदने में सक्षम है, दूसरा चार बार, अगले एक पंद्रह बार, आदि हम कूदने की संख्या रिकॉर्ड करते हैं। पांच बच्चों में से प्रत्येक ने आठ बार छलांग लगाई, लेकिन केवल एक बच्चे ने दो बार छलांग लगाई। हम कहते हैं कि आठ बार कूदना दो बार कूदने की तुलना में अलग तरह से वितरित किया जाता है।

एक मनाया वितरण के लिए एक गहन परिभाषा एक चर के प्रत्येक मनाया मूल्य के लिए घटनाओं की आवृत्ति है।

हीनतापूर्ण आँकड़ों में हम तब देखे गए वितरण के लिए सैद्धांतिक वितरण को फिट करने का प्रयास करते हैं, क्योंकि हम सैद्धांतिक वितरण की मान्यताओं के साथ काम करना चाहते हैं। आप "प्रेक्षित" को "पर्यवेक्षक" के साथ या अधिक सटीक: "अपेक्षित" के स्थान पर सैद्धांतिक वितरण के लिए एक समान परिभाषा तक पहुंच सकते हैं।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.