कुछ वितरणों के अपरिभाषित होने का क्या मतलब है?


21

कई PDF माइनस से सकारात्मक अनंत तक होते हैं, फिर भी कुछ साधन परिभाषित होते हैं और कुछ नहीं। क्या सामान्य लक्षण कुछ कम्प्यूटेशनल बनाता है?


14
अभिन्न अभिन्न।
साइकोरैक्स का कहना है कि

1
यह वितरण गणितीय सार हैं। यदि अभिन्न अभिसरण नहीं करता है तो इसका मतलब परिभाषित नहीं है। हालांकि, नीचे दिए गए उत्तरों में जो उल्लेख नहीं किया गया है, वह यह है कि पीडीएफ इनफिनिटी से प्लस इन्फिनिटी वाले पीडीएफ वास्तविक डेटा स्रोतों को मॉडल नहीं कर सकते। वास्तविक जीवन में इस तरह के डेटा को उत्पन्न करने के लिए ऐसी कोई शारीरिक प्रक्रिया नहीं है। मेरी राय में सभी वास्तविक डेटा स्रोत बाध्य हो जाएंगे और आप औसत का अनुमान लगा पाएंगे।
कागदस ओजेंक

3
@ कागदास की टिप्पणी सही प्रतीत नहीं होती है। काफी भारी पूंछ वाली प्रक्रियाएं होती हैं। लंबी अवधि के औसत में उनकी भिन्नताएं अत्यधिक परिवर्तनशीलता के रूप में प्रकट होती हैं। उदाहरण के लिए, कॉची मॉडल के एक ठोस अनुप्रयोग के लिए, डॉग्स ज़ारे की पोस्ट आँकड़े.स्टैकएक्सचेंज . com / a / 36037 / 919 पर देखें
whuber

2
@CagdasOzgenc: आपको यह समझने के लिए कि क्या गलत है, तालेब द्वारा ब्लैक स्वान को पढ़ना चाहिए। जबकि आनुवंशिक रूप से ऐसी कोई प्रक्रिया नहीं हो सकती है जो पूरी तरह से अपरिभाषित माध्य या अनंत माध्य के साथ एक वितरण उत्पन्न करती है, ऐसे बहुत से उदाहरण हैं जहाँ लोग केवल इस बात को कम आंकते हैं कि पूंछ उनके वितरण की कितनी मोटी है और साधनों की गणना करने के लिए आगे बढ़ती है, जबकि वास्तविक वितरण में एक है इसका मतलब है कि पूरी तरह से अलग है और आमतौर पर सही तिरछा है। इस तरह के अनुचित तर्क के कारण वित्त में कई जोखिम-आकलन वाले गैफ हो गए, जहां परिमाण के कई आदेशों से जोखिम को कम करके आंका जाता है।
एलेक्स आर।

1
@ कगदास ओजेंक: एक चर्चा के लिए कि आपका तर्क गलत क्यों है आँकड़े
kjetil b halvorsen

जवाबों:


23

एक वितरण का मतलब एक अभिन्न के रूप में परिभाषित किया गया है (मैं इसे लगातार वितरण के रूप में लिखूंगा - एक रीमैन अभिन्न के रूप में, कहता हूं - लेकिन यह मुद्दा अधिक आम तौर पर लागू होता है; हम डील करने के लिए Stieltjes या Lebesgue एकीकरण के लिए आगे बढ़ सकते हैं; ये ठीक से और सभी एक बार):

E(X)=xf(x)dx

लेकिन इसका क्या मतलब है? यह प्रभावी रूप से एक आशुलिपि है

a,blimabxf(x)dx

या

alima0xf(x)dx+blim0bxf(x)dx

(हालांकि आप इसे 0 पर ही नहीं कहीं भी तोड़ सकते हैं)

समस्या तब आती है जब उन अभिन्नों की सीमाएं परिमित नहीं होती हैं।

तो उदाहरण के लिए, मानक काऊची घनत्व पर विचार करें, जो 1 के अनुपात में है ... ध्यान दें11+x2

blim0bx1+x2dx

चलो , इसलिए d u = 2 xu=1+x2du=2xdx

=blim1211+b21udu

=blim12ln(u)|11+b2

=blim12ln(1+b2)

जो परिमित नहीं है। निचले आधे में सीमा भी परिमित नहीं है; इस तरह की उम्मीद अपरिभाषित है।

या अगर हमारे पास हमारे यादृच्छिक चर के रूप में एक मानक कॉची का पूर्ण मूल्य है, तो इसकी पूरी उम्मीद उस सीमा के आनुपातिक होगी जो हमने अभी देखा था (यानी )।blim12ln(1+b2)

दूसरी ओर, कुछ अन्य घनत्व "अनन्तता" तक जारी रहते हैं, लेकिन उनकी अभिन्नता की सीमा होती है।


1
आप (निश्चित रूप से) समान असतत संभावना वितरण में एक ही चीज़ देख सकते हैं। एक वितरण लें जहां पूर्णांक n > 0 के लिए घटित होने की संभावना , 1 के अनुपात में हैnn>0 । सम्भावनाओं का योग परिमित है (जो कि केवल तभी से है जब तक इसकी सीमा 1 की आवश्यकता है: वास्तव में हमारे स्थिरांक को6होना चाहिए1n2 या जो कुछ भी यह है), लेकिन की राशि के बाद से16π2 इसका कोई मतलब नहीं है। जबकि अगर हम1 केलिए आनुपातिकता का चयन करते हैं1n तब माध्य में1 कायोग होता है1n3 और हम ठीक हैं, यह "छोटा पर्याप्त" है जो इसे रूपांतरित करता है। 1n2
स्टीव जेसोप

1
हाँ, उस के लिए स्केलिंग स्थिरांक है (इसे योग 1 बनाने के लिए)। 6π2
Glen_b -Reinstate Monica

8

अन्य उत्तर अच्छे हैं, लेकिन हर किसी को मना नहीं कर सकते हैं, विशेष रूप से ऐसे लोग जो कॉची वितरण पर एक नज़र डालते हैं ( ) और कहते हैं कि यह अभी भी सहज रूप से स्पष्ट है कि इसका मतलब शून्य होना चाहिए।x0=0

गणितीय परिप्रेक्ष्य से सहज उत्तर सही नहीं होने का कारण रीमैन रीक्रेंजमेंट प्रमेय (वीडियो) है

प्रभावी रूप से जब आप एक कॉची को देख रहे हैं और कह रहे हैं कि "शून्य होना चाहिए" का अर्थ यह है कि आप शून्य पर "केंद्र" को विभाजित कर रहे हैं, और फिर दो आकारों के क्षणों का दावा करते हैं। या दूसरे शब्दों में, आप संक्षेप में "आधा" शब्द सकारात्मक (प्रत्येक बिंदु पर दाईं ओर स्थित) और "आधा" शब्द नकारात्मक (बाईं ओर प्रत्येक बिंदु पर क्षण) और इसे दावा करने के साथ एक अनंत योग कर रहे हैं। शून्य में गाया जाता है। (तकनीकी रूप से दिमाग के लिए: )0f(x0+r)rdr0f(x0r)rdr=0

रीमैन पुनर्व्यवस्था प्रमेय का कहना है कि इस प्रकार की अनंत राशि (सकारात्मक और नकारात्मक दोनों शब्दों में से एक) केवल संगत है यदि दो श्रृंखला (केवल सकारात्मक शब्द और केवल नकारात्मक शब्द) स्वतंत्र रूप से लिए जाने पर प्रत्येक अभिसरण हैं। यदि दोनों पक्ष (पॉजिटिव और नेगेटिव) अपने आप ही अलग हैं, तो आप शर्तों के समन के एक क्रम के साथ आ सकते हैं, जैसे कि यह किसी भी संख्या में होता है। (ऊपर वीडियो, 6:50 से शुरू)

तो, हाँ, यदि आप 0 से संतुलित तरीके से योग करते हैं, तो कॉची वितरण के पहले क्षण रद्द हो जाते हैं। हालांकि, माध्य की (मानक) परिभाषा समन के इस आदेश को लागू नहीं करती है। आपको किसी भी क्रम में क्षणों को योग करने में सक्षम होना चाहिए और यह समान रूप से मान्य होना चाहिए। इसलिए, कैची वितरण का मतलब अपरिभाषित है - विवेकपूर्ण रूप से यह चुनकर कि आप कैसे क्षणों का योग करते हैं, आप उन्हें व्यावहारिक रूप से किसी भी बिंदु पर "संतुलन" (या नहीं) बना सकते हैं।

तो एक वितरण परिभाषित के माध्य बनाने के लिए, दो पल अभिन्न प्रत्येक स्वतंत्र रूप से हो अभिसरण (परिमित) के आसपास की जरूरत प्रस्तावित मतलब (जो है, जब आप गणित, वास्तव में सिर्फ कहने का कि पूर्ण अभिन्न (एक और तरीका है ) अभिसारी होना चाहिए)। यदि पूंछ एक तरफ अनंत बनाने के लिए "वसा" पर्याप्त है, तो आप कर रहे हैं। आप इसे दूसरी तरफ अनंत क्षण के साथ संतुलित नहीं कर सकते।f(x)xdx


मुझे यह उल्लेख करना चाहिए कि कॉची वितरण जैसी चीजों का "काउंटर सहज" व्यवहार पूरी तरह से अनंत के बारे में सोचते समय समस्याओं के कारण है। कॉची वितरण ले लो और पूंछ को काट लें - यहां तक ​​कि मनमाने ढंग से बहुत दूर, जैसे कि प्लस / माइनस पर एक्सकैंडी नंबर - और (एक बार फिर से सामान्यीकृत) आपको अचानक कुछ ऐसा मिलता है जो अच्छी तरह से व्यवहार किया गया है और एक परिभाषित मतलब है। यह अपने आप में एक मुद्दा है कि वसा पूंछ नहीं है, यह है कि उन पूंछों व्यवहार करते हैं जैसा कि आप अनंत दृष्टिकोण।


अच्छा लगा। मुझे आश्चर्य है कि अगर इसका एक संभावित "ऑर्डर ऑफ समन" देना संभव हो जाए, जो दो को कहता है।
मैथ्यू ड्र्यू

@MatthewDrury: p_i और n_i सकारात्मक और नकारात्मक संख्याओं को दर्शाते हैं। सफलतापूर्वक p_i और n_i ढूंढें ताकि [n_i, p_i] पर अभिन्न 2+ (1 / i) हो और [n_ {i + 1}, p_i] पर अभिन्न 2- (1 / i) हो। यह स्पष्ट रूप से R, matlab या mathematica का उपयोग करके किया जा सकता है, लेकिन केवल शर्तों की एक सीमित संख्या के लिए।
डेविड एपस्टीन

7

जनरल अब्रियल और ग्लेन_ बी के पास सटीक उत्तर थे। मैं आपको एक छोटा सा डेमो जोड़ना चाहता हूं ताकि आप यह बता सकें कि कॉची वितरण का मतलब मौजूद नहीं है / अभिसरण नहीं करता है।

निम्नलिखित प्रयोग में, आप देखेंगे, यहां तक ​​कि आप एक बड़ा नमूना प्राप्त करते हैं और नमूना से अनुभवजन्य मतलब को शांत करते हैं, संख्या प्रयोग से प्रयोग करने के लिए काफी भिन्न होती है।

set.seed(0)
par(mfrow=c(1,2))
experiments=rep(1e5,100)
mean_list_cauchy=sapply(experiments, function(n) mean(rcauchy(n)))
mean_list_normal=sapply(experiments, function(n) mean(rnorm(n)))
plot(mean_list_cauchy,ylim=c(-10,10))
plot(mean_list_normal,ylim=c(-10,10))

enter image description here

आप देख सकते हैं कि हमारे पास प्रयोग हैं, और प्रत्येक प्रयोग में, हम दो वितरणों से 1 × 10 5 अंक का नमूना लेते हैं , इतने बड़े नमूने के आकार के साथ, विभिन्न प्रयोगों के दौरान अनुभवजन्य मतलब वास्तविक अर्थ के काफी करीब होना चाहिए। परिणामों से पता चलता है कि कॉची वितरण में एक अभिसरण साधन नहीं है, लेकिन सामान्य वितरण है।1001×105

संपादित करें:

जैसा कि @ mark999 चैट में उल्लेख किया गया है, हमें तर्क देना चाहिए कि प्रयोग में उपयोग किए गए दो वितरण समान हैं "विचरण" (कारण मैं उद्धरण का उपयोग करता हूं क्योंकि कॉची वितरण विचलन भी अपरिभाषित है।)। यहाँ औचित्य है: उनके पीडीएफ समान हैं।

ध्यान दें, कॉची वितरण के पीडीएफ को देखकर, हम अनुमान लगाते हैं कि यह , लेकिन प्रयोगों से हम देख सकते हैं, यह मौजूद नहीं है। यह डेमो का बिंदु है।0

curve(dnorm, -8,8)
curve(dcauchy, -8,8)

enter image description here


4
मुझे नहीं लगता कि इससे पता चलता है कि कॉची वितरण का कोई मतलब नहीं है। आप समान परिणाम प्राप्त कर सकते हैं यदि आप एक साधारण वितरण के साथ सामान्य वितरण द्वारा कैची वितरण को प्रतिस्थापित करते हैं।
mark999

अच्छा बिंदु @ mark999, मैं इस समस्या का समाधान करने के लिए अपना उत्तर संपादित करूंगा।
हितैओ दू

क्या काउची वितरण के पीडीएफ से यह पता लगाना संभव है कि इसका कोई मतलब नहीं है, शायद यह वसा पूंछ को देखकर है?
ks1322

शायद आपके मन में ऐसा कुछ था? आंकड़े.stackexchange.com/questions/90531/…
कहना है कि मोनिका


2

dθ/2πθAS1length(A)/2πU(π,π)ππεπ+ε (=π+εmod2π)π। लेकिन समान वितरण का मतलब हैयू(-π,π) दो अलग-अलग अंतराल के संगत संघ पर, प्रत्येक लंबाई ε/2π, शून्य है।

Since the distribution on the circle is rotationally symmetric, there cannot be a mean, median or mode on the circle. Similarly, higher moments, such as variance, cannot make sense. This distribution arises naturally in many contexts. For example, my current project involves microscope images of cancerous tissue. The very numerous objects in the image are not symmetric and a "direction" can be assigned to each. The obvious null hypothesis is that these directions are uniformly distributed.

To disguise the simplicity, let S1 be the standard unit circle, and let p=(0,1)S1. We define x as a function of θ by stereographical projection of the circle from p onto the x-axis. The formula is x=tan(θ/2). Differentiating, we find dθ/2=dx/(1+x2). The infinitesimal probability is therefore dθπ(1+x2), the usual form of the Cauchy distribution, and "Hey, presto!", simplicity becomes a headache, requiring treatment by the subtleties of integration theory.

In S1{p}, we can ignore the absence of p (in other words, reinstate pS1) for any consideration such as mean or higher order moment, because the probability of p (its measure) is zero. So therefore the non-existence of mean and of higher moments carries over to the real line. However, there is now a special point, namely p=(0,1), which maps to 0R under stereographic projection and this becomes the median and mode of the Cauchy distribution.


2
The Cauchy distribution has a median and mode.
jkabrg

quite right. I got a bit carried away. But the argument for the non-existence of the mean is correct.. I will edit my answer.
David Epstein

Why is it that "there cannot be a mean because there isn't one on the circle"? There's a lot missing in your argument. I'm assuming what you mean by it being the uniform distribution "on the circle" is that θU(π,π) and X=tan(θ/2), but then E[θ]=0 so I don't understand what you're talking about.
jkabrg

@jkabrg: I hope the new edits make this more comprehensible
David Epstein
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.