सभी ज्ञात वितरण असमान क्यों हैं?


13

मैं किसी भी मल्टीमॉडल वितरण को नहीं जानता हूं।

सभी ज्ञात वितरण असमान क्यों हैं? क्या कोई "प्रसिद्ध" वितरण है जिसमें एक से अधिक मोड हैं?

बेशक, वितरण के मिश्रण अक्सर मल्टीमॉडल होते हैं, लेकिन मैं यह जानना चाहूंगा कि क्या कोई "गैर-मिश्रण" वितरण मौजूद है जिसमें एक से अधिक मोड हैं।


5
आप "ज्ञात" वितरण के बजाय "मानक" वितरण के बारे में बात कर रहे हैं।
स्टीफन लॉरेंट

12
कैसे के बारे में बीटा के साथ ? α=β=0.5
अमीबा का कहना है कि

1
आप घिरे कोई आपत्ति नहीं है bimodal वितरण , विकिपीडिया भी कहा गया है यू-द्विघात और arcsine वितरण । मुझे लगता है कि ये केवल बीटा वितरण के विशेष मामले हैं ... विकिपीडिया में मल्टीमॉडल वितरण के प्राकृतिक घटनाओं के कुछ उदाहरणों का भी उल्लेख है ।
निक स्टॉनर 27'14

12
@ StéphaneLaurent: मुझे "ब्रांड-नाम वितरण" पसंद है , यह बताने के लिए कि नाम रखने से वितरण के लिए कोई विशेष स्थिति नहीं है। "ज्ञात" वितरण यह ध्वनि देता है जैसे बाकी कहीं बाहर हो सकता है कहीं खोजा जा रहा हो, जैसे कि लोच-नेस राक्षस या डार्क मैटर।
Scortchi - को पुनः स्थापित मोनिका

5
उत्कृष्ट @Scortchi, महान शब्दावली! मेरे द्वारा सामना किए गए कई गैर-गणितज्ञ इस धारणा के तहत हैं कि बिना नाम का वितरण मौजूद नहीं है। शायद इसके पीछे एक संबंधित गहरा दार्शनिक तथ्य है, एक नाम की उलझन और इस नाम से निरूपित चीज़ (जैसा कि रसेल ने कहा, "शब्द 'कुत्ता' एक कुत्ते के समान नहीं है,")
स्टीयर लॉरेंट

जवाबों:


17

प्रश्न के पहले भाग में प्रश्न का उत्तर दिया गया है: "ब्रांड-नेम" के बहुत सारे वितरण मल्टीमॉडल हैं, जैसे कि किसी भी बीटा वितरण के साथ और । चलिए, फिर, प्रश्न के दूसरे भाग की ओर मुड़ते हैं।एक < 1 < 1(a,b)a<1b<1

सभी असतत वितरण स्पष्ट रूप से मिश्रण होते हैं (परमाणुओं के, जो कि असमान होते हैं)।

मैं दिखाऊंगा कि अधिकांश निरंतर वितरण भी असमान वितरण के मिश्रण हैं। इसके पीछे अंतर्ज्ञान सरल है: हम एक पीडीएफ के ऊबड़ ग्राफ से एक-एक करके "रेत बंद" कर सकते हैं, जब तक कि ग्राफ क्षैतिज नहीं है। धक्कों मिश्रण घटक बन जाते हैं, जिनमें से प्रत्येक स्पष्ट रूप से एकरूपता है।

नतीजतन, शायद कुछ असामान्य वितरणों को छोड़कर, जिनके पीडीएफ अत्यधिक असंतुलित हैं, प्रश्न का उत्तर "कोई नहीं" है: सभी बहुविध वितरण जो बिल्कुल निरंतर हैं, असतत हैं, या उन दोनों का एक संयोजन असमान वितरण का मिश्रण है।


निरंतर वितरण पर विचार करें जिनके पीडीएफ निरंतर हैं (ये "बिल्कुल निरंतर" वितरण हैं)। (निरंतरता एक सीमा से अधिक नहीं है, इसे और अधिक सावधानीपूर्वक विश्लेषण द्वारा और अधिक आराम दिया जा सकता है, केवल यह मानते हुए कि असंतोष के बिंदु असतत हैं।) एफFf

हो सकने वाले निरंतर मूल्यों के "पठारों" से निपटने के लिए, एक "मोड" को एक अंतराल (जो कि एकल बिंदु हो सकता है जहां )x l = x um=[xl,xu]xl=xu

  1. m , yf का पर स्थिर मान है कहना है ।m,y

  2. f किसी भी अंतराल पर स्थिर नहीं है जिसमें कड़ाई से शामिल है ।m

  3. एक सकारात्मक संख्या मौजूद है ऐसी है कि का अधिकतम मान पर प्राप्त कर ली के बराबर होती है ।[ एक्स एल - ε , x यू + ε ] yϵf[xlϵ,xu+ϵ]y

चलो के किसी भी मोड होना । क्योंकि निरंतर है, वहाँ अंतराल होते हैं युक्त जिसके लिए में nondecreasing है और में nonincreasing (एक उचित अंतराल, न सिर्फ एक बिंदु है) (जो एक उचित अंतराल भी है)। मान लें कि Prime ऐसे सभी मानों का और ऐसे सभी मानों का सर्वोच्च है।[ एक्स ' एल , एक्स ' यू ] मीटर [ एक्स ' एल , एक्स एल ] [ x यू , एक्स ' यू ] एक्स ' एल एक्स ' यूm=[xl,xu]ff[xl,xu]mf[xl,xl][xu,xu]xlxu

इस निर्माण के ग्राफ पर एक "कूबड़" परिभाषित किया गया है से विस्तार को । को और से बड़ा होने दें । निर्माण करके, अंक के सेट में जिसके लिए एक उचित अंतराल है सख्ती से युक्त (क्योंकि यह या तो के पूरे होते हैं या )।एक्स ' एल एक्स ' यू y ( एक्स ' एल ) ( एक्स ' यू ) एक्स [ एक्स ' एल , एक्स ' यू ] ( एक्स ) y मीटर ' मीटर [ एक्स ' एल , एक्स एल ] [ एक्स यू , x u ]fxlxuyf(xl)f(xu)x[xl,xu]f(x)ymm[xl,xl][xu,xu]

आकृति

मल्टीमॉडल पीडीएफ के इस चित्रण में, क्षैतिज अक्ष पर एक लाल बिंदु द्वारा एक मोड की पहचान की जाती है। भराव के लाल हिस्से की क्षैतिज सीमा अंतराल : यह मोड द्वारा निर्धारित कूबड़ का आधार है । उस कूबड़ का आधार ऊँचाई पर है । मूल पीडीएफ लाल भरण और नीला भरण का योग है। ध्यान दें कि नीली भराव में केवल पास एक मोड है ; पर मूल मोड को हटा दिया गया है।मीटर ' मी y 0.16 2 [ 0 , 0 ]m=[0,0]mmy0.162[0,0]

लेखन की लंबाई के लिए , परिभाषित करेंमी |m|m

pm=PrF(m)y|m|

तथा

fm(x)=f(x)ypm

जब और अन्यथा। (यह एक निरंतर कार्य करता है, संयोग से।) अंश वह राशि है जिसके द्वारा ऊपर उठता है और भाजक और के ग्राफ के बीच का क्षेत्र है । इस प्रकार गैर-ऋणात्मक है और इसका कुल क्षेत्रफल : यह संभाव्यता वितरण का पीडीएफ है। निर्माण करके यह एक अद्वितीय मोड है ।xmfm(x)=0fmfypmfyfm1m

निर्माण द्वारा भी, समारोह

fm(x)=f(x)pmfm(x)1pm

एक PDF है प्रदान किया गया है । (जाहिर है अगर में का कुछ भी नहीं बचा है जिसे शुरू करने के लिए होना चाहिए।) इसके अलावा, यह अंतराल में कोई मोड नहीं है (जहां यह स्थिर है, यही कारण है कि पिछली सावधान परिभाषा एक अंतराल के रूप में एक मोड आवश्यक था)। इसके अलावा,pm<1pm=1f,m

f(x)=pmfm(x)+(1pm)fm(x)

एक है मिश्रण unimodal पीडीएफ के और पीडीएफ ।fmfm

इस प्रक्रिया को (जो निरंतर कार्यों के रैखिक संयोजन के रूप में अभी भी एक निरंतर कार्य है, हमें पहले की तरह आगे बढ़ने के लिए सक्षम करता है) के साथ, मोड का एक क्रम का निर्माण ; वजन के संबंधित क्रम ; और PDFs सीमित परिणाम मौजूद है क्योंकि (ए) अंतराल जहां चपटा है एक उचित अंतराल शामिल है जो पूर्ववर्ती में समतल नहीं किया गया थाfmm=m1,m2,p1=pm,p2=pm2,f1=fm,f2=fm2,.fii1संचालन और (बी) वास्तविक संख्या को ऐसे अंतरालों की संख्या से अधिक संख्या में विघटित नहीं किया जा सकता है। सीमा में कोई मोड नहीं हो सकता है और इसलिए स्थिर है, जो शून्य होना चाहिए (अन्यथा इसके लिए अभिन्न विचलन होगा)। नतीजतन, को व्यक्त किया गया है (शायद विशिष्ट रूप से नहीं, क्योंकि जिस क्रम में मोड का चयन किया गया था) मिश्रण के रूप में मायने रखेगाf

f(x)=ipifi(x)

असमान वितरण, QED के।


7

अनिमॉडल द्वारा, मुझे लगता है कि ओपी स्पष्ट रूप से इसका मतलब है कि बस एक आंतरिक मोड है (यानी कोने के समाधान को छोड़कर)। सवाल इस प्रकार वास्तव में पूछ रहा है ...

why is it that brand name distributions do NOT have more than one interior mode?

यानी अधिकांश ब्रांड नाम वितरण कुछ इस तरह क्यों दिखते हैं:

यहाँ छवि विवरण दर्ज करें

... प्लस या माइनस कुछ तिरछापन या कुछ असंतोष? जब प्रश्न इस प्रकार रखा जाता है, तो बीटा वितरण एक वैध काउंटर उदाहरण नहीं होगा।

ऐसा प्रतीत होता है कि ओपी के अनुमान में कुछ वैधता है: अधिकांश सामान्य ब्रांड नाम वितरण एक से अधिक आंतरिक मोड के लिए अनुमति नहीं देते हैं। इसके सैद्धांतिक कारण हो सकते हैं। उदाहरण के लिए, कोई भी वितरण जो पियर्सन परिवार का सदस्य है (जिसमें बीटा शामिल है) आवश्यक रूप से (आंतरिक) एकतरफा होगा, जिसके परिणामस्वरूप पूरे परिवार को परिभाषित करने वाले मूल अंतर eqn का परिणाम होगा। और पियर्सन परिवार सबसे प्रसिद्ध ब्रांड नामों में से अधिकांश में घोंसला बनाता है।

फिर भी, यहां कुछ ब्रांड नाम काउंटर उदाहरण हैं ...

काउंटर उदाहरण

एक ब्रांड-नाम काउंटर-उदाहरण पीडीएफ के साथ वितरण है:Sinc2

f(x)=sin2(x)πx2

वास्तविक रेखा पर परिभाषित। यहाँ pdf का एक प्लॉट है :Sinc2

यहाँ छवि विवरण दर्ज करें

हम शायद इस वर्ग से संबंधित कार्डियोड और वितरण के परिवार को भी जोड़ सकते हैं ... जैसे पीडीएफ भूखंड:

यहाँ छवि विवरण दर्ज करें

परिलक्षित ब्रांड नाम वितरण का परिवार भी संभवतः ब्रांड नाम के दावेदार होंगे (हालांकि, इन्हें 'धोखा समाधान' के रूप में माना जा सकता है ... लेकिन वे अभी भी ब्रांड नाम हैं) जैसे कि रिफ्लेक्टेड वीबुल यहां दिखाया गया है:

यहाँ छवि विवरण दर्ज करें


1
मेरा, का वह कथानक सुनिश्चित है कि ऐसा लगता है कि इसमें कुछ नकारात्मक मूल्य हैं! (क्या वह एक प्लॉटिंग आर्टवर्क हो सकता है?) ... और कार्डियोइड डिस्ट्रीब्यूशन ऐसे दिखते हैं जैसे उनके पास एक ही इंटीरियर मोड हो। Sinc2
whuber

1
हाय @whuber ... सहमत होना चाहिए फिर से प्लॉटिंग आर्टिफैक्ट (मैं इसे मैथेमेटिका एसई पर ले जाऊंगा)। पुन: कार्डियोड परिवार: विचार यह है कि कोई भी ऐसे परिवारों के डोमेन को एक के रूप में विस्तारित कर सकता है, और एक साइन लहर की तरह, यह देता रहता है :)
भेड़िया

1
(+1) यह एक विचित्र कलाकृति है: आपका अंतिम कथानक (परावर्तित वितरण का) इसे प्रदर्शित नहीं करता है। आप प्लॉट पॉइंट की पीढ़ी को प्लॉट में देख सकते हैं कि वे कहाँ पर झूठ बोलते हैं; मुझे संदेह है कि थोड़े से नकारात्मक मान थोड़े से अंकों की एक सीमा तक की निगरानी कर सकते हैं। Sinc2
whuber

मुझे लगता है कि यह सिर्फ इसलिए है क्योंकि प्लॉटेड लाइन अक्ष रेखा से अधिक मोटी है, इसलिए शून्य के करीब होने पर धुरी को 'ओवरशूट' करना प्रतीत होता है। यदि रेखा को पतले प्लॉट किया जाता है, तो आर्टिफैक्ट गायब हो जाता है।
भेड़िए

लेकिन आपके नीचे की आकृति में ऐसी कोई कलाकृति नहीं है, जिसमें अक्ष की तुलना में मोटी रेखाएं भी हों।
whuber

3

आप किसी के बारे में नहीं सोच सकते हैं इसका मतलब यह नहीं है कि कोई भी नहीं हैं।

मैं "ज्ञात" वितरणों को नाम दे सकता हूं जो कि असमान नहीं हैं।

उदाहरण के लिए, एक बीटा वितरण और दोनों ।αβ<1

http://en.wikipedia.org/wiki/Beta_distribution

और देखें

http://en.wikipedia.org/wiki/U-quadratic_distribution

(यह बीटा वितरण का एक विशेष मामला नहीं है, टिप्पणी के बावजूद जो यह कहता है। दोनों परिवारों के पास कुछ ओवरलैप हैं, हालांकि)।

मिश्रण वितरण निश्चित रूप से ज्ञात हैं, और उनमें से कई मल्टीमॉडल हैं।


U- द्विघात एक काटे गए बीटा वितरण है।
बीको

1

अल्फा-स्क्यू-नॉर्मल डिस्ट्रीब्यूशन (Elal-Olivero 2010) में एक पीडीएफ है:

(1αxμσ)2+12+α2φ(xμσ),

जहां एक मानक गाऊसी का पीडीएफ है।φ

के लिए वितरण बिमोडल है। लिए परीक्षा प्लॉट :|α|>1.34μ=1,σ=0.5,a=2

यहाँ छवि विवरण दर्ज करें

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.