सहसंबद्ध द्विपद यादृच्छिक चर उत्पन्न करना


21

मैं सोच रहा था कि क्या रैखिक परिवर्तन दृष्टिकोण के बाद सहसंबद्ध यादृच्छिक द्विपद चर उत्पन्न करना संभव हो सकता है?

नीचे, मैंने आर में कुछ सरल करने की कोशिश की और यह कुछ सहसंबंध पैदा करता है। लेकिन मैं सोच रहा था कि क्या ऐसा करने का कोई राजसी तरीका है?

X1 = rbinom(1e4, 6, .5) ; X2 = rbinom(1e4, 6, .5) ;  X3 = rbinom(1e4, 6, .5) ; a = .5

Y1 = X1 + (a*X2) ; Y2 = X2 + (a*X3) ## Y1 and Y2 are supposed to be correlated

cor(Y1, Y2)

2
Y1 और सहसंबद्ध हो सकते हैं, लेकिन वे अब द्विपद नहीं होंगे। उदाहरण, तो इसलिए द्विपद यादृच्छिक चर नहीं हो सकता। मेरा सुझाव है कि आप बहुराष्ट्रीय वितरण में ध्यान दें। X 1 = X 2 = 1 Y 1 = 1.5 Y iY2X1=X2=1Y1=1.5Yमैं
knrumsey - मोनिका

1
प्रश्न का संक्षिप्त उत्तर कीवर्ड की तलाश करना है copula, जो निश्चित मार्जिन के साथ आश्रित चर उत्पन्न करने में मदद करता है।
शीआन

जवाबों:


32

द्विपद चर आमतौर पर स्वतंत्र बर्नौली चर द्वारा बनाए जाते हैं। आइए देखें कि क्या हम सहसंबद्ध बर्नौली चर की एक जोड़ी के साथ शुरू कर सकते हैं और वही काम कर सकते हैं।(एक्स,Y)

मान लीजिए कि एक बर्नौली चर है (अर्थात, और ) और एक बर्नौली चर है। उनके संयुक्त वितरण को कम करने के लिए हमें परिणामों के सभी चार संयोजनों को निर्दिष्ट करने की आवश्यकता है। लेखन हम आसानी से संभावना के स्वयंसिद्धों से बाकी का पता लगा सकते हैं:( p ) Pr ( X = 1 ) = p Pr ( X = 0 ) = 1 - p Y ( q ) Pr ( ( X , Y )एक्स(पी)Pr(X=1)=पीपीआर(एक्स=0)=1-पीY(क्ष)पीआर ( ( एक्स , वाई ) = ( 1 , 0 ) ) = 1 - q

पीआर((एक्स,Y)=(0,0))=,
पीआर((एक्स,Y)=(1,0))=1-क्ष-,पीआर((एक्स,Y)=(0,1))=1-पी-,पीआर((एक्स,Y)=(1,1))=+पी+क्ष-1।

इसे सहसंबंध गुणांक लिए सूत्र में हल करना और हलएक = ( 1 - पी ) ( 1 - क्ष ) + ρ ρ

(1)=(1-पी)(1-क्ष)+ρपीक्ष(1-पी)(1-क्ष)

बशर्ते सभी चार संभावनाएं गैर-नकारात्मक हैं, यह एक मान्य संयुक्त वितरण देगा - और यह समाधान सभी बीवरिएट बर्नौली वितरणों को मापता है। (जब , और बीच सभी गणितीय रूप से सार्थक सहसंबंधों के लिए एक समाधान है ।) जब हम इन चरों के को जोड़ते हैं, तो सहसंबंध समान रहता है - लेकिन अब सीमांत वितरण द्विपद और हैं द्विपद , इच्छानुसार।- 1पी=क्ष-1n ( n , p ) ( n , q )1n(n,पी)(n,क्ष)

उदाहरण

चलो , , , और हम सहसंबंध को कहेंगे । का समाधान (और अन्य संभावनाएं , और आसपास हैं )। यहाँ संयुक्त वितरण से वास्तविकताओं की एक साजिश है :पी = 1 / 3 क्ष = 3 / 4 ρ = - 4 / 5 ( 1 ) एक = .०,०३,३६,७३५ 0.247 0.663 0.087 1000n=10पी=1/3क्ष=3/4ρ=-4/5(1)=0.003367350.2470.6630.0871000

स्कैटर प्लॉट

लाल रेखाएँ नमूने के साधनों को इंगित करती हैं और बिंदीदार रेखा प्रतिगमन रेखा है। वे सभी अपने इच्छित मूल्यों के करीब हैं। ओवरलैप्स को हल करने के लिए इस छवि में बेतरतीब ढंग से अंक बनाए गए हैं: आखिरकार, द्विपद वितरण केवल अभिन्न मूल्यों का उत्पादन करते हैं, इसलिए बहुत अधिक मात्रा में ओवरप्लेटिंग होगा।

इन चर को उत्पन्न करने का एक तरीका यह है कि चयनित संभावनाओं के साथ से बार नमूना लिया जाए और फिर प्रत्येक को , प्रत्येक को , प्रत्येक में परिवर्तित करें। में , और प्रत्येक में । परिणाम (वैक्टर के रूप में) का एक साकार प्राप्त करने के लिए ।{ 1 , 2 , 3 , 4 } 1 ( 0 , 0 ) 2 ( 1 , 0 ) 3 ( 0 , 1 ) 4 ( 1 , 1 ) ( एक्स , वाई )n{1,2,3,4}1(0,0)2(1,0)3(0,1)4(1,1)(एक्स,Y)

कोड

यहाँ एक Rकार्यान्वयन है।

#
# Compute Pr(0,0) from rho, p=Pr(X=1), and q=Pr(Y=1).
#
a <- function(rho, p, q) {
  rho * sqrt(p*q*(1-p)*(1-q)) + (1-p)*(1-q)
}
#
# Specify the parameters.
#
n <- 10
p <- 1/3
q <- 3/4
rho <- -4/5
#
# Compute the four probabilities for the joint distribution.
#
a.0 <- a(rho, p, q)
prob <- c(`(0,0)`=a.0, `(1,0)`=1-q-a.0, `(0,1)`=1-p-a.0, `(1,1)`=a.0+p+q-1)
if (min(prob) < 0) {
  print(prob)
  stop("Error: a probability is negative.")
}
#
# Illustrate generation of correlated Binomial variables.
#
set.seed(17)
n.sim <- 1000
u <- sample.int(4, n.sim * n, replace=TRUE, prob=prob)
y <- floor((u-1)/2)
x <- 1 - u %% 2
x <- colSums(matrix(x, nrow=n)) # Sum in groups of `n`
y <- colSums(matrix(y, nrow=n)) # Sum in groups of `n`
#
# Plot the empirical bivariate distribution.
#
plot(x+rnorm(length(x), sd=1/8), y+rnorm(length(y), sd=1/8),
     pch=19, cex=1/2, col="#00000010",
     xlab="X", ylab="Y",
     main=paste("Correlation is", signif(cor(x,y), 3)))
abline(v=mean(x), h=mean(y), col="Red")
abline(lm(y ~ x), lwd=2, lty=3)

क्या बाइनरी चर की किसी भी संख्या को उत्पन्न करने के लिए इस दृष्टिकोण को बढ़ाया जा सकता है? - दिए गए सहसंबंध मैट्रिक्स को फिट करने के लिए (या इसे फिट करने के लिए अधिकतम करीब)?
ttnphns

1
@ttnphns हां, लेकिन विकल्प फटते हैं: संभाव्यता तालिका सीमान्त मापदंडों, योग-से-एक बाधा, और (इसलिए) अतिरिक्त मापदंडों द्वारा निर्धारित की जानी चाहिए । जाहिर है आपको उन मापदंडों का चयन करने (या विवश) करने की बहुत अधिक स्वतंत्रता होगी, जो आप बनाना चाहते हैं। इसके अलावा, एक समान दृष्टिकोण का उपयोग उनके " " मापदंडों के विभिन्न मूल्यों के साथ सहसंबद्ध द्विपद चर बनाने के लिए किया जा सकता है । परवीन: मेरा मानना ​​है कि "जब हम इन चरों के को जोड़ते हैं" तो स्पष्ट रूप से समझाता है कि क्या दर्शाता है। 22--1nnn
whuber

यह एक अच्छा परिणाम है। बस अपने पहले वाक्य पर थोड़ा चुनना है। स्वतंत्र बर्नौली चर से एक द्विपद प्राप्त करने के लिए उन्हें एक ही पी की आवश्यकता नहीं है? इसका इस बात पर कोई प्रभाव नहीं पड़ता है कि आपने क्या किया है क्योंकि यह आपके दृष्टिकोण के लिए एक प्रेरणा है।
माइकल आर। चेरिक

1
@ मिचेल धन्यवाद - आप काफी सही कह रहे हैं। एक अन्य कारण यह विधि यहां उनका उल्लेख से कोई संबंध नहीं है कि इस पद्धति अभी भी एक आम पैरामीटर के साथ Bernoulli चर संक्षेप शामिल है: पैरामीटर है सभी के लिए चर और सभी के लिए चर। पद को यथोचित रूप से कम रखने के लिए मैंने सीमांत वितरण के हिस्टोग्राम को यह प्रदर्शित करने के लिए प्रस्तुत नहीं किया कि वे वास्तव में द्विपद हैं (लेकिन मैंने वास्तव में अपने मूल विश्लेषण में यह सुनिश्चित करने के लिए कि वे काम कर रहे थे!)। पीएक्सक्षY
whuber

@whuber अच्छा तरीका! क्या आप मुझे बता सकते हैं कि क्या कोई कागज है जिसका मैं उल्लेख कर सकता हूँ ??
टी निक
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.