प्रतिस्थापन के बिना स्वतंत्र यादृच्छिक नमूनों के प्रतिच्छेदन के कार्डिनैलिटी का वितरण क्या है?


10

S के साथ कुछ सेट हैnN तत्वों, औरa1,a2,...,am धनात्मक पूर्णांक तय से कम या उसके बराबर हैंn

के तत्वों के साथ S समान रूप से होने की संभावना जा रहा है, m के नमूने L1,L2,...,Lm अलग और स्वतंत्र रूप से से लिए गए हैं S प्रतिस्थापन के बिना जिनमें से आकार के होते हैं, a1,a2,...,am , क्रमशः।

|L1L2 ... Lm|{0,1,...,min{a1,a2,...,am}}


मैं आपको इसे पुनरावर्ती रूप से गणना करने के लिए एक नुस्खा प्रदान कर सकता हूं लेकिन मुझे एक बंद फॉर्म समाधान के बारे में पता नहीं है। क्या वह पर्याप्त होगा, या क्या आप और दिए गए वितरण फ़ंक्शन की स्पष्ट अभिव्यक्ति चाहते हैं ? a1,,amn
ब्रिजबर्नर

@Bridgeburners एक नुस्खा अच्छा होगा, कम से कम यह इस समस्या और संबंधित पर हमला करने का कोई तरीका / तरीका प्रदान करेगा।
21:39

जवाबों:


3

यहाँ एक और दृष्टिकोण है, एक जिसमें पुनरावृत्ति शामिल नहीं है। यह अभी भी रकम और उत्पादों का उपयोग करता है जिनकी लंबाई मापदंडों पर निर्भर करती है, हालांकि। पहले मैं अभिव्यक्ति दूंगा, फिर समझाऊंगा।

हमारे पास

P(|L1L2Lm|=k)=(nk)i=1n(nai)j=0min(a1,,am)k(1)j(nkj)l=1n(njkaljk).

संपादित करें: यह सब लिखने के अंत में, मैंने महसूस किया कि हम द्विपद गुणांक को अति-ज्यामितीय संभावनाओं और ट्रिनोमियल गुणांक में जोड़कर अभिव्यक्ति को थोड़ा ऊपर कर सकते हैं। इसका मूल्य क्या है, इसके लिए संशोधित अभिव्यक्ति यहाँ एक hypergeometric यादृच्छिक चर जहां है ड्रॉ आकार की आबादी से लिया जाता है होने सफलता राज्यों।

j=0min(a1,,am)k(1)j(nj,k,njk)l=1nP(Hyp(n,j+k,al)=j+k).
Hyp(n,j+k,al)alnj+k

व्युत्पत्ति

चलिए जुझारू तर्कों को ट्रैक (उम्मीद) करने के लिए थोड़ा आसान बनाने के लिए कुछ संकेतन प्राप्त करते हैं। कुल मिलाकर, हम और तय करते हैं। हम ऑर्डर किए गए -tuples के संग्रह को दर्शाने के लिए का उपयोग करेंगे , जहां प्रत्येक , संतोषजनकSa1,,amC(I)m(L1,,Lm)LiS

  • |Li|=ai ; तथा
  • L1Lm=I

हम एक संग्रह समान के लिए उपयोग करेंगे, सिवाय इसके कि हमें समानता के बजाय की आवश्यकता होगी।C(I)L1LmI

एक प्रमुख अवलोकन यह है कि को गिनना अपेक्षाकृत आसान है। इसका कारण यह है शर्त है के बराबर है सभी के लिए , तो एक अर्थ में अलग के बीच इस बातचीत को हटा मान। प्रत्येक , आवश्यकता को पूरा करने वाली संख्या , चूँकि हम ऐसे निर्माण कर सकते हैं, जो आकार के का उपसमूह चुनकरऔर फिर साथ मिलन । यह इस प्रकार है कि C(I)L1LmILiIiiiLi(|S||I|ai|I|)LiSIai|I|I

|C(I)|=i=1n(|S||I|ai|I|).

अब हमारी मूल संभाव्यता इस प्रकार व्यक्त की जा सकती है: इस प्रकार है: C

P(|L1L2Lm|=k)=I:|I|=k|C(I)|all IS|C(I)|.

हम यहां दो सरलीकरण कर सकते हैं। सबसे पहले, भाजक के समान है दूसरा, एक क्रमपरिवर्तन तर्क दिखाता है किकेवल कार्डिनलिटी के माध्यम से पर निर्भर करता है। के बाद से देखते हैं के सबसेट प्रमुखता होने , यह इस प्रकार है कि जहां एक मनमाना, की तय सबसेट है होने प्रमुखता

|C()|=i=1n(|S|ai)=i=1n(nai).
|C(I)|I|I|(nk)Sk
I:|I|=k|C(I)|=(nk)|C(I0)|,
I0Sk

एक कदम पीछे लेते हुए, हमने अब उस को दिखाने की समस्या को कम कर दिया है

|C(I0)|=j=0min(a1,,am)k(1)j(nkj)l=1n(njkaljk).

चलो के विशिष्ट सबसेट जा के लिए ठीक एक तत्व जोड़कर गठन । फिर (यह सिर्फ कह रहा है कि अगर , तो शामिल लेकिन इसमें कोई अतिरिक्त तत्व भी नहीं है।) अब हमने बदल दिया है-समस्या को a -counting समस्या में, जिसे हम संभालना अधिक जानते हैं। विशेष रूप से, हमारे पास है J1,,JnkSI0

C(I0)=C(I0)(i=1nkC(Ji)).
L1Lm=I0L1LmI0CC
|C(I0)|=|C(I0)||i=1nkC(Ji)|=l=1n(nkalk)|i=1nkC(Ji)|.

हम ऊपर दिए गए संघ अभिव्यक्ति के आकार को संभालने के लिए समावेश-बहिष्करण लागू कर सकते हैं। यहां महत्वपूर्ण संबंध यह है कि किसी भी गैर- , यह इसलिए है क्योंकि यदि में की संख्या है , तो इसमें उनका संघ भी शामिल है। हम यह भी ध्यान दें कि सेट का आकार है। इसलिये I{1,,nk}

iIC(Ji)=C(iIJi).
L1LmJiiIJi|I0|+|I|=k+|I|
|i=1nkC(Ji)|=I{1,,nk}(1)|I|1|iIC(Ji)|=j=1nkI:|I|=j(1)j1l=1n(njkaljk)=j=1nk(1)j1(nkj)l=1n(njkaljk).
(हम सीमित कर सकते हैं द्विपद गुणांकों के उत्पाद के बाद से यहाँ मान शून्य है, जब तक कि सभी के लिए , यानी ।)jjalkljmin(a1,,am)k

अंत में, समीकरण में अंत में अभिव्यक्ति को प्रतिस्थापित करकेउपरोक्त और योग को मजबूत करते हुए, हम जैसा कि दावा किया गया है।|C(I0)|

|C(I0)|=j=0min(a1,,am)k(1)j(nkj)l=1n(njkaljk)

+1 सभी प्रयासों और समाधान के लिए, लेकिन मुझे इस सबसे (और दूसरे उत्तर) को समझने के लिए अपने गणित को चमकाने की आवश्यकता होगी। धन्यवाद
llrs

4

मैं इसे हल करने के लिए एक विश्लेषणात्मक तरीके से अवगत नहीं हूं, लेकिन परिणाम की गणना करने के लिए एक पुनरावर्ती तरीका है।

के लिए आप चयन करते हैं से बाहर तत्वों जिनमें से पहले चुना गया है। तत्वों को चुनने की संभावना जो आपके दूसरे ड्रॉ में साथ प्रतिच्छेद करते हैं, वितरण द्वारा दिया जाता है:m=2a2n, a1kmin{a1,a2}L1

P(kn,a1,a2)=(a1k)(na1a2k)(na2).

हम परिणाम को कह सकते हैंहम को खोजने के लिए एक ही तर्क का उपयोग कर सकते हैं जहां तीन नमूनों के प्रतिच्छेदन की है। फिर,b2.P(b3=kn,b2,a3),b3

P(b3=k)=l=0min(a1,a2)P(b3=kn,b2=l,a3)P(b2=ln,a1,a2).

प्रत्येक के लिए इसे । बाद की गणना संख्यात्मक रूप से कठिन नहीं है, क्योंकि बस पिछली गणना का परिणाम है और का एक आह्वान है हाइपरजोमेट्रिक वितरण।k{0,1,2,,min(a1,a2,a3)}P(b2=ln,a1,a2)P(b3=kn,b2=l,a3)

सामान्य तौर पर, को खोजने के लिए आप निम्न पुनरावर्ती सूत्र लागू कर सकते हैं: लिए और जो केवल यह कहना है किP(bm)

P(bi=k)=l=0min(a1,a2,,ai1)P(bi=kn,bi1=l,ai)P(bi1=l),
P(bi=kn,bi1=l,ai)=(lk)(nlaik)(nai),
i{2,3,,m},
P(b1)=δa1b1,
b1=a1.

यहाँ यह R में है:

hypergeom <- function(k, n, K, N) choose(K, k) * choose(N-K, n-k) / choose(N, n)

#recursive function for getting P(b_i) given P(b_{i-1})
PNext <- function(n, PPrev, ai, upperBound) {
  l <- seq(0, upperBound, by=1)
  newUpperBound <- min(ai, upperBound)
  kVals <- seq(0, newUpperBound, by=1)
  PConditional <- lapply(kVals, function(k) {
    hypergeom(k, ai, l, n)
  })
  PMarginal <- unlist(lapply(PConditional, function(p) sum(p * PPrev) ))
  PMarginal
}

#loop for solving P(b_m)
P <- function(n, A, m) {
  P1 <- c(rep(0, A[1]), 1)
  if (m==1) {
    return(P1)
  } else {
    upperBound <- A[1]
    P <- P1
    for (i in 2:m) {
      P <- PNext(n, P, A[i], upperBound)
      upperBound <- min(A[i], upperBound)
    }
    return(P)
  }
}

#Example
n <- 10
m <- 5
A <- sample(4:8, m, replace=TRUE)
#[1] 6 8 8 8 5

round(P(n, A, m), 4)
#[1] 0.1106 0.3865 0.3716 0.1191 0.0119 0.0003
#These are the probabilities ordered from 0 to 5, which is the minimum of A

आपके समाधान के लिए धन्यवाद, और आपका कोड। मैं इनाम देने से पहले अन्य उत्तर दृष्टिकोणों (यदि वे आते हैं) की प्रतीक्षा करता हूं।
llrs
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.