फी, मैथ्यू और पियर्सन सहसंबंध गुणांक के बीच संबंध


13

क्या Phi और मैथ्यू सहसंबंध गुणांक समान अवधारणा हैं? वे कैसे संबंधित या दो बाइनरी चर के लिए पियर्सन सहसंबंध गुणांक के बराबर हैं? मुझे लगता है कि बाइनरी मान 0 और 1 हैं।


दो बर्नौली यादृच्छिक चर और बीच पियर्सन का संबंध है:एक्सy

ρ=E[(xE[x])(yE[y])]Var[x]Var[y]=E[xy]E[x]E[y]Var[x]Var[y]=n11nn1n1n0n1n0n1

कहाँ पे

[एक्स]=n1nवार[एक्स]=n0n1n2[y]=n1nवार[y]=n0n1n2[एक्सy]=n1 1n

फी विकिपीडिया से गुणांक :

आँकड़ों में, phe गुणांक (इसे "माध्य वर्ग आकस्मिक गुणांक" के रूप में भी संदर्भित किया जाता है और या द्वारा निरूपित किया जाता है ) कार्ल पियर्सन द्वारा पेश किए गए दो बाइनरी चर के लिए संगति का एक उपाय है। यह उपाय इसकी व्याख्या में पियर्सन सहसंबंध गुणांक के समान है। वास्तव में, दो बाइनरी चर के लिए अनुमानित एक पियर्सन सहसंबंध गुणांक फी गुणांक लौटाएगा ...आर ϕφआरφ

अगर हमारे पास दो यादृच्छिक चर और लिए 2 × 2 तालिका हैएक्सy

यहाँ छवि विवरण दर्ज करें

फी गुणांक जो और के जुड़ाव का वर्णन करता है, वह है y φ = n 11 एन 00 - एन 10 एन 01एक्सy

φ=n1 1n00-n10n01n1n0n0n1

मैथ्यू सहसंबंध गुणांक विकिपीडिया से:

मैथ्यूज सहसंबंध गुणांक (MCC) की गणना सीधे भ्रम मैट्रिक्स से सूत्र का उपयोग करके की जा सकती है:

एमसीसी=टीपी×टीएन-एफपी×एफएन(टीपी+एफपी)(टीपी+एफएन)(टीएन+एफपी)(टीएन+एफएन)

इस समीकरण में, टीपी सच पॉज़िटिव की संख्या है, टीएन सच्ची निगेटिव की संख्या है, एफपी झूठी पॉज़िटिव की संख्या और एफएन झूठे नकारात्मक की संख्या है। यदि भाजक में चार में से कोई भी शून्य है, तो भाजक को मनमाने ढंग से एक में सेट किया जा सकता है; यह शून्य के एक मैथ्यू सहसंबंध गुणांक में परिणाम करता है, जिसे सही सीमित मान दिखाया जा सकता है।

जवाबों:


14

हाँ, वे समान हैं। मैथ्यूस सहसंबंध गुणांक पियरसन सहसंबंध गुणांक की एक विशेष अनुप्रयोग एक भ्रम तालिका के लिए है।

एक आकस्मिक तालिका केवल अंतर्निहित डेटा का सारांश है। आप इसे आकस्मिक तालिका में दर्शाई गई गणनाओं से प्रति पंक्ति एक पंक्ति में परिवर्तित कर सकते हैं।

विकिपीडिया लेख में 5 वास्तविक सकारात्मकता, 17 सही नकारात्मक, 2 झूठी सकारात्मक और 3 झूठी नकारात्मक के साथ उपयोग किए जाने वाले उदाहरण भ्रम मैट्रिक्स पर विचार करें

> matrix(c(5,3,2,17), nrow=2, byrow=TRUE)
     [,1] [,2]
[1,]    5    3
[2,]    2   17
> 
> # Matthews correlation coefficient directly from the Wikipedia formula
> (5*17-3*2) / sqrt((5+3)*(5+2)*(17+3)*(17+2))
[1] 0.5415534
> 
> 
> # Convert this into a long form binary variable and find the correlation coefficient
> conf.m <- data.frame(
+ X1=rep(c(0,1,0,1), c(5,3,2,17)),
+ X2=rep(c(0,0,1,1), c(5,3,2,17)))
> conf.m # what does that look like?
   X1 X2
1   0  0
2   0  0
3   0  0
4   0  0
5   0  0
6   1  0
7   1  0
8   1  0
9   0  1
10  0  1
11  1  1
12  1  1
13  1  1
14  1  1
15  1  1
16  1  1
17  1  1
18  1  1
19  1  1
20  1  1
21  1  1
22  1  1
23  1  1
24  1  1
25  1  1
26  1  1
27  1  1
> cor(conf.m)
          X1        X2
X1 1.0000000 0.5415534
X2 0.5415534 1.0000000

धन्यवाद, पीटर! गणितीय रूप से, फी और मैथ्यू दो बाइनरी यादृच्छिक चर के लिए पियर्सन के बराबर क्यों हैं?
टिम

यदि आप पियर्सन सहसंबंध की परिभाषा लेते हैं और इसमें हेरफेर करते हैं तो यह व्यक्तिगत टिप्पणियों और साधनों के बीच अंतर के योगों के बजाय मायने रखता है, आपको मैथ्यू सूत्र मिलता है। मैंने वास्तव में ऐसा नहीं किया है, लेकिन यह सीधा होना चाहिए।
पीटर एलिस

2

[एक्सy]n1n1n2

n1 1n×1×1+n10n×1×0+n01n×0×1+n00n×0×0=n1 1n

ρ=φ

n1 1n-n1n1=n1 1(n01+n10+n1 1+n00)-(n1 1+n10)(n1 1+n01)=n1 1n00-n10n01
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.