क्या एक बहुराष्ट्रीय (1 / n,…, 1 / n) को एक विरूद्ध डिरिचलेट (1, .., 1) के रूप में चित्रित किया जा सकता है?


24

तो यह सवाल थोड़ा गड़बड़ है, लेकिन मैं उस के लिए रंगीन रेखांकन शामिल करूंगा! पहले पृष्ठभूमि फिर प्रश्न (ओं)।

पृष्ठभूमि

मान लें कि आपके पास श्रेणियों पर समान प्रोबायलेट्स के साथ एक आयामी बहुआयामी वितरण है । चलो सामान्यीकृत मायने रखता है (हो है कि वितरण से), यह है कि:nnπ=(π1,,πn)c

(c1,,cn)Multinomial(1/n,,1/n)πi=cin

अब वितरण में -simplex पर समर्थन है, लेकिन असतत चरणों के साथ। उदाहरण के लिए, इस वितरण में निम्नलिखित समर्थन (लाल बिंदु) हैं:πnn=3

यहाँ छवि विवरण दर्ज करें

इसी तरह के समर्थन के साथ एक और वितरण -dimensional वितरण है, जो कि यूनिट सिंप्लेक्स पर एक समान वितरण है। उदाहरण के लिए, यहां 3-dimesional से यादृच्छिक ड्रॉ हैं :डिरिचलेट ( 1 , , 1 ) डिरिचलेट ( 1 , 1 , 1 )nDirichlet(1,,1)Dirichlet(1,1,1)

यहाँ छवि विवरण दर्ज करें

अब मुझे यह पता था कि का वितरण the वितरण को एक से ड्रा के रूप में दिखाया जा सकता है जो के असतत समर्थन के लिए । मेरे मन में जो विवेक था (और जो अच्छी तरह से काम करता है) को सिम्प्लेक्स में प्रत्येक बिंदु पर ले जाना और निकटतम बिंदु पर "इसे बंद करना" है जो कि के समर्थन में है । 3-आयामी सिंप्लेक्स के लिए आपको निम्नलिखित विभाजन मिलता है जहां प्रत्येक रंगीन क्षेत्र में बिंदुओं को निकटतम लाल बिंदु पर "राउंड ऑफ" होना चाहिए:बहुराष्ट्रीय ( 1 / n , , 1 / n ) डिरिचलेट ( 1 , , 1 ) ial ialπMultinomial(1/n,,1/n)Dirichlet(1,,1)ππ

यहाँ छवि विवरण दर्ज करें

चूंकि डिरिचलेट वितरण एक समान है, जिसके परिणामस्वरूप प्रत्येक बिंदु के लिए घनत्व / संभावना क्षेत्र / मात्रा के अनुपात में है जो प्रत्येक बिंदु पर "गोल बंद" हो जाता है। दो आयामी और तीन आयामी मामलों के लिए ये संभावनाएँ हैं:

यहाँ छवि विवरण दर्ज करें ( ये संभावनाएँ मोंटे कार्लो सिमुलेशन से हैं )

तो ऐसा लगता है, कम से कम 2 और 3 आयामों के लिए, इस विशेष तरीके से से परिणामी संभाव्यता वितरण लिए प्रायिकता वितरण के समान है । वह एक सामान्य का परिणाम है वितरण। मैंने 4-आयामों के साथ भी कोशिश की है और यह वहाँ काम करने लगता है।π Multinomial ( 1 / n , ... , 1 / n )Dirichlet(1,,1)πMultinomial(1/n,,1/n)

प्रशन)

तो मेरा मुख्य प्रश्न है:

इस तरह से एक समान डिरिक्लेट का विवेकाधिकार करते समय, क्या आगे के आयामों के लिए साथ संबंध है ? क्या रिश्ता बिल्कुल पकड़ में आता है? (मैंने केवल मोंटे कार्लो सिमुलेशन का उपयोग करके यह कोशिश की है ...)Multinomial(1/n,,1/n)

इसके अलावा मुझे आश्चर्य है:

  • यदि यह संबंध धारण करता है, तो क्या यह एक ज्ञात परिणाम है? और क्या कुछ स्रोत है जो मैं इसके लिए उद्धृत कर सकता हूं?
  • यदि एक समान डिरिचलेट के विवेकाधिकार का बहुराष्ट्रीय के साथ यह संबंध नहीं है। क्या कुछ ऐसा ही निर्माण है?

कुछ प्रसंग

इस प्रश्न को पूछने का मेरा कारण यह है कि मैं गैर पैरामीट्रिक बूटस्ट्रैप और बायेसियन बूटस्ट्रैप के बीच समानता देख रहा हूं, और फिर यह आया। मैंने यह भी देखा है कि उपरोक्त 3-डिमेशिनल सिम्प्लेक्स पर रंगीन क्षेत्रों पर पैटर्न एक वोरोनोई आरेख जैसा दिखता है (और होना चाहिए)। एक तरीका (मुझे आशा है) आप इस बारे में सोच सकते हैं कि यह पास्कल के त्रिभुज / सिमपेक्स ( http://www.math.rutgers.edu/~erowland/pascalssimplices.html ) के अनुक्रम के रूप में है । जहां रंगीन क्षेत्रों का आकार 2-डी मामले में पास्कल के त्रिकोण की दूसरी पंक्ति का अनुसरण करता है, 3-डी मामले में पास्कल के टेट्राहेड्रोन की तीसरी पंक्ति, और इसी तरह। यह बहुराष्ट्रीय वितरण के साथ संबंध की व्याख्या करेगा, लेकिन यहां मैं वास्तव में गहरे पानी में हूं ...


2
मज़ा! (हमेशा की तरह।) लेकिन मुझे मोज़े के कनेक्शन की याद आती है।
शीआन

खैर, मैंने प्रतिस्थापन के साथ मोजे खींचना शुरू कर दिया। लेकिन फिर मैंने बायेसियन बूस्ट्रैप के बारे में सोचना शुरू कर दिया, एक बात दूसरे के लिए प्रेरित करती है, और इस तरह मैं यहाँ समाप्त हो गया :)
रासमस बैथ

2
@ शीआन शायद यह मोज़े हैं बल्कि पिल्लों कि बायेसियन शुभंकर बनना चाहिए?
टिम

जवाबों:


14

वे दो वितरण हर लिए अलग-अलग हैं ।n4

नोटेशन

मैं एक फैक्टर द्वारा आपके सिम्प्लेक्स को पुनर्विक्रय करने जा रहा हूं , ताकि जाली बिंदुओं में पूर्णांक निर्देशांक हों। यह कुछ भी नहीं बदलता है, मुझे लगता है कि यह संकेतन को थोड़ा कम बोझिल बनाता है।n

चलो हो -simplex, अंकों की उत्तल पतवार के रूप में दिया , ..., में । दूसरे शब्दों में, ये ऐसे बिंदु हैं जहाँ सभी निर्देशांक नकारात्मक नहीं हैं, और जहाँ निर्देशांक योग हैं ।( एन - 1 ) ( एन , 0 , , 0 ) ( 0 , , 0 , एन ) आर एन एनS(n1)(n,0,,0)(0,,0,n)Rnn

Let के सेट को निरूपित जाली अंक यानी में उन बिंदुओं, एस जहां सभी निर्देशांक अभिन्न अंग हैं।ΛS

अगर जाली बिंदु है, हम करते हैं वी पी अपने निरूपित Voronoi सेल , में उन बिंदुओं के रूप में परिभाषित एस जो कर रहे हैं (सख्ती) के करीब पी में किसी भी अन्य मुद्दे पर से ΛPVPSPΛ

हम दो संभावना वितरण डालते हैं हम distribut पर रख सकते हैं । एक बहुपद वितरण, जहां बिंदु है ( एक 1 , , एक एन ) संभावना है 2 - एन एन ! / ( 1 ! एन ! ) । अन्य हम फोन करेगा Dirichlet मॉडल , और यह प्रत्येक के लिए प्रदान करती है पी Λ एक संभावना की मात्रा के लिए आनुपातिक वी पीΛ(a1,...,an)2nn!/(a1!an!)PΛVP

बहुत अनौपचारिक औचित्य

मैं दावा कर रहा है कि बहुपद मॉडल और Dirichlet मॉडल पर अलग वितरण देना , जब भी n 4Λn4

इसे देखने के लिए, केस पर विचार करें , और अंक A = ( 2 , 2 , 0 , 0 ) और B = ( 3 , 1 , 0 , 0 ) । मेरा दावा है कि वी और वी बी वेक्टर ( 1 , - 1 , 0 , 0 ) द्वारा अनुवाद के माध्यम से बधाई हैं । इसका मतलब है कि वी और वी बीn=4A=(2,2,0,0)B=(3,1,0,0)VAVB(1,1,0,0)VAVBएक ही वॉल्यूम है, और इस प्रकार और बी की ड्यूरिचलेट मॉडल में समान संभावना है। दूसरी ओर, बहुपद मॉडल में, वे विभिन्न संभावनाओं है ( 2 - 44 ! / ( 2 ! 2 ! ) और 2 - 44 ! / 3 ! ), और यह इस प्रकार है कि वितरण समान नहीं हो सकता है।AB244!/(2!2!)244!/3!

तथ्य यह है कि और वी बी निम्नलिखित प्रशंसनीय लेकिन गैर-स्पष्ट (और कुछ हद तक अस्पष्ट) से बधाई हैं:VAVB

प्रशंसनीय दावा : आकार और के आकार के केवल की "तत्काल पड़ोसियों" से प्रभावित है पी , (यानी में उन बिंदुओं Λ जो से अलग पी एक सदिश द्वारा इस तरह दिखता है ( 1 , - 1 , 0 , ... , 0 ) , जहां 1 और - 1 अन्य स्थानों पर हो सकता है)VPPΛP(1,1,0,,0)11

यह देखना आसान है कि और बी के "तत्काल पड़ोसियों" के कॉन्फ़िगरेशन समान हैं, और यह तब अनुसरण करता है कि वी और वी बी बधाई हैं।ABVAVB

मामले में , हम के साथ एक ही खेल, खेल सकते हैं एक = ( 2 , 2 , एन - 4 , 0 , ... , 0 ) और बी = ( 3 , 1 , एन - 4 , 0 , ... , 0 ) , उदाहरण के लिए।n5A=(2,2,n4,0,,0)B=(3,1,n4,0,,0)

मुझे नहीं लगता कि यह दावा पूरी तरह से स्पष्ट है, और मैं इसे थोड़ा अलग रणनीति के बजाय साबित करने जा रहा हूं। हालांकि, मुझे लगता है कि ऐसा क्यों वितरण के लिए अलग हैं करने के लिए एक अधिक सहज जवाब है n4

कठोर प्रमाण

ऊपर के अनौपचारिक औचित्य में और बी को लें । हमें केवल यह साबित करने की जरूरत है कि V A और V B एकरूप हैं।ABVAVB

P=(p1,,pn)ΛWPWP(x1,,xn)Sवी मैं = एक मैं - पी मैं डब्ल्यू पी वी मैंmax1in(aipi)min1in(aipi)<1vi=aipiWPvi

हम दिखाएंगे कि ।VP=WP

चरण 1

दावा करें:VPWP

यह काफी आसान है: मान लीजिए कि में नहीं है । बता दें कि , और मान लें (सामान्यता की हानि के बिना) कि , । चूंकि , हम यह भी जानते हैं कि ।डब्ल्यू पीX=(x1,,xn)WPv 1 = max 1vi=xipiv1=max1inviवी 1 - वी 21 Σ n मैं = 1 वी मैं = 0 वी 1 > 0 > v v2=min1inviv1v21i=1nvi=0v1>0>v2

अब । चूंकि और दोनों में गैर-नकारात्मक निर्देशांक हैं, इसलिए करता है , और यह उस अनुसरण करता है , और इसलिए । दूसरी ओर, । इस प्रकार, कम से कम के करीब है के रूप में , इसलिए । यह दिखाता है (पूरक लेकर) कि ।Q=(p1+1,p21,p3,,pn)एक्स क्यू 1 - वी 1 ) 2 ( -PXQक्यू Λ d मैं रों टी 2 ( एक्स , पी ) - मैं रों टी 2 ( एक्स , क्यू ) = v 2 1 + v 2 2 - (QSQΛएक्स क्यू पी एक्स वी पी वी पीडब्ल्यू पीdist2(X,P)dist2(X,Q)=v12+v22(1v1)2(1+v2)2=2+2(v1v2)0XQPXVPVpWP

चरण 2

दावा : जोड़ीदार ।WP

मान लीजिए अन्यथा। चलो और में विशिष्ट अंक हो , और । के बाद से और में अलग है और दोनों कर रहे हैं , वहाँ होना चाहिए एक सूचकांक जहां , और एक जहां । व्यापकता के नुकसान के बिना, हम मानते हैं कि , और । पुन: व्यवस्थित करने और एक साथ जोड़ने पर, हमें ।क्यू = ( क्यू 1 , ... , क्ष n ) ΛP=(p1,,pn)Q=(q1,,qn)ΛXWPWQक्यू Λ मैं पी मैंक्ष मैं + 1 पी मैंक्ष मैं - 1 पी 1क्ष 1 + 1 पी 2क्ष 2 -PQΛipiqi+1piqi1p1q1+1क्ष 1 - पी 1 + पी 2 - क्ष 22p2q21q1p1+p2q22

अब संख्याओं पर विचार करें और । इस तथ्य से कि , हमारे पास । इसी प्रकार, तात्पर्य है कि । इन्हें एक साथ जोड़ने पर, हमें , और हमारे पास एक विरोधाभास है।एक्स 2 एक्स डब्ल्यू पी एक्स 1 - पी 1x1x2XWPएक्स डब्ल्यू क्यू एक्स 2 - क्ष 2 - ( एक्स 1 - क्यू 1 ) < 1 क्ष 1 - पी 1 + पी 2 - क्यू < x1p1(x2p2)<1XWQx2q2(x1q1)<1q1p1+p2q2<2

चरण 3

हमने दिखाया है कि , और हैं। कवर उपाय शून्य का एक सेट अप करने के लिए है, और यह इस प्रकार है कि (उपाय शून्य का एक सेट अप करने के लिए)। [चूंकि और दोनों खुले हैं, हमारे पास वास्तव में है, लेकिन यह आवश्यक नहीं है।]डब्ल्यू पी वी पी एस डब्ल्यू पी = वी पी डब्ल्यू पी वी पी डब्ल्यू पी = वी पीVPWPWPVPSWP=VPWPVPWP=VP

अब, हम लगभग हो चुके हैं। अंकों पर विचार करें और । यह देखना आसान है कि और एक-दूसरे के और अनुवाद हैं: एकमात्र तरीका जो वे अलग-अलग हो सकते हैं, यदि की सीमा (चेहरे के अलावा और दोनों झूठ बोलते हैं) `` कट ऑफ '' होगा या तो या लेकिन अन्य नहीं। लेकिन की सीमा के ऐसे हिस्से तक पहुंचने के लिए , हमें कम से कम 1 द्वारा या एक समन्वय को बदलना होगा, जो हमें बाहर निकालने की गारंटी देने के लिए पर्याप्त होगा।बी = ( 3 , 1 , एन - 4 , 0 , ... , 0 ) डब्ल्यू डब्ल्यू बी एस बी डब्ल्यू डब्ल्यू बी एस बी डब्ल्यू डब्ल्यू बी एस बी बी डब्ल्यू A=(2,2,n4,0,,0)B=(3,1,n4,0,,0)WAWBSABWAWBSABWAऔर वैसे भी। इस प्रकार, भले ही , सहूलियत अंक और से अलग दिखता है , अंतर और की परिभाषाओं द्वारा उठाए जाने के लिए बहुत दूर हैं , और इस प्रकार और हैं।WBSABWAडब्ल्यू डब्ल्यू बीWBWAWB

इसके बाद यह कि और में एक ही वॉल्यूम है, और इस प्रकार Dirichlet मॉडल उन्हें एक ही प्रायिकता प्रदान करता है, भले ही उनके मल्टीनेशनल मॉडल में अलग-अलग संभावनाएं हों।वी बीVAVB


वाह, कठोर! धन्यवाद! तो मैं जिस मामूली पत्राचार की उम्मीद कर रहा था वह आकस्मिक था मुझे लगता है ...
रासमस बैस्ट
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.