यदि A और B का C से संबंध है, तो A और B आवश्यक रूप से सहसंबद्ध क्यों नहीं हैं?


62

मैं अनुभव से जानता हूं कि यह मामला है। मैंने अभी-अभी ऐसे मॉडल विकसित किए हैं, जो इस कॉन्डम में चलते हैं। मुझे यह भी संदेह है कि यह जरूरी नहीं कि हां / कोई जवाब नहीं है। मेरा मतलब है कि यदि ए और बी दोनों सी के साथ सहसंबद्ध हैं, तो ए और बी के बीच संबंध के बारे में कुछ निहितार्थ हो सकते हैं। लेकिन, यह निहितार्थ कमजोर हो सकता है। यह सिर्फ एक संकेत दिशा हो सकती है और कुछ नहीं।

यहाँ मेरा मतलब है ... मान लीजिए कि A और B दोनों का C के साथ 0.5 सहसंबंध है। यह देखते हुए कि A और B के बीच सहसंबंध 1.0 हो सकता है। मुझे लगता है कि यह 0.5 या उससे भी कम हो सकता है। लेकिन, मुझे लगता है कि यह संभावना नहीं है कि यह नकारात्मक होगा। क्या आप इससे सहमत हैं?

इसके अलावा, यदि आप मानक पियर्सन सहसंबंध गुणांक पर विचार कर रहे हैं या इसके बजाय स्पीयरमैन (रैंक) सहसंबंध गुणांक पर विचार कर रहे हैं? मेरे हाल के अनुभवजन्य अवलोकन स्पीयरमैन सहसंबंध गुणांक से जुड़े थे।


38
एक उदाहरण , , और । हम ले जा सकते हैं और स्वतंत्र होने के लिए, फिर भी दोनों और के साथ (सकारात्मक, पियर्सन) सहसंबद्ध होते हैं । बी = वाई सी = एक्स + वाई एक्स वाई बी सीA=XB=YC=X+YXYABC

1
धन्यवाद, यह वास्तव में एक महान टिप्पणी है। लघु, लेकिन यह इस कारण के सार को पकड़ लेता है कि ऐसा क्यों है।
सिमपा

जवाबों:


53

क्योंकि सहसंबंध बहुभिन्नरूपी वितरण की एक गणितीय संपत्ति है, कुछ अंतर्दृष्टि विशुद्ध रूप से गणना के माध्यम से हो सकती है, चाहे उन वितरणों की सांख्यिकीय उत्पत्ति की परवाह किए बिना।

के लिए पियर्सन सहसंबंध , पर विचार multinormal चर , , । ये काम करने के लिए उपयोगी हैं क्योंकि कोई भी गैर-नकारात्मक निश्चित मैट्रिक्स वास्तव में कुछ बहुराष्ट्रीय वितरणों का सहसंयोजक मैट्रिक्स है, जिससे अस्तित्व प्रश्न का समाधान होता है। यदि हम विकर्ण पर साथ मेट्रिक्स से चिपके रहते हैं , तो सहसंयोजक मैट्रिक्स की ऑफ-विकर्ण प्रविष्टियां उनके सहसंबंध होंगी। और के सहसंबंध को रूप में लिखना , और के रूप में सहसंबंध, और और के सहसंबंध के रूप मेंवाई जेड 1 एक्स वाई ρ वाई जेड τ एक्स जेड σXYZ1XYρYZτXZσ , हम गणना करते हैं

  • 1+2ρστ(ρ2+σ2+τ2)0 (क्योंकि यह सहसंबंध मैट्रिक्स का निर्धारक है और यह ऋणात्मक नहीं हो सकता है)।

  • जब तात्पर्य है कि । इसे दूसरे तरीके से रखने के लिए: जब दोनों और परिमाण में बड़े होते हैं, तो और में नॉनजेरो सहसंबंध होना चाहिएρ 2 + τ 21 ρ τ एक्स जेडσ=0ρ2+τ21ρτXZ

  • यदि , तो के किसी भी गैर-नकारात्मक मान (के बीच और निश्चित रूप से) संभव है।σ 0 1ρ2=τ2=1/2σ01

  • जब , नकारात्मक मूल्य स्वीकार्य हैं। उदाहरण के लिए, जब , कहीं भी और बीच हो सकता है ।σ ρ = τ = 1 / 2 σ - 1 / 2 1ρ2+τ2<1σρ=τ=1/2σ1/21

इन विचारों का तात्पर्य है कि वास्तव में आपसी सहसंबंधों पर कुछ अड़चनें हैं। बाधाएं (जो केवल सहसंबंध मैट्रिक्स के गैर-नकारात्मक निश्चितता पर निर्भर करती हैं, चर के वास्तविक वितरण पर नहीं) को अविभाजित वितरण के बारे में मान्यताओं के आधार पर कड़ा किया जा सकता है। उदाहरण के लिए, यह देखना (और साबित करना) आसान है कि जब और के वितरण समान स्थान-स्तरीय परिवार में नहीं होते हैं, तो उनके सहसंबंधों को आकार में से कम होना चाहिए । (प्रमाण: का सहसंबंध का अर्थ है कि और रैखिक रूप से संबंधित हैं)वाई 1 ± 1 एक्स वाईXY1±1XY

जहां तक स्पीयरमैन रैंक सहसंबंध जाना, तीन trivariate टिप्पणियों पर विचार , , और के । उनके आपसी रैंक सहसंबंध हैं , 1 / 2 , और - 1 / 2 । इस प्रकार यहां तक ​​कि वाई और जेड के रैंक सहसंबंध का संकेत एक्स और वाई और एक्स और जेड के सहसंबंधों के संकेतों के विपरीत हो सकता है ।( 2 , 3 , 1 ) ( 3 , 2 , 3 ) ( एक्स , वाई , जेड ) 1 / 2(1,1,2)(2,3,1)(3,2,3)(X,Y,Z)1/21/21/2YZXYXZ


व्हीलर, "बहु-विषयी चर" क्या हैं?
सिमपा


हमेशा की तरह, एक पूरी तरह से स्पष्टीकरण आपको एक अच्छी तरह से योग्य "सर्वश्रेष्ठ उत्तर" चेक मार्क मिलता है।
सिमपा

@ जीतन सिंह आप बहुत दयालु हैं। मैंने इस प्रश्न के सभी उत्तर पढ़ने में आनंद लिया है (और उन सभी को चिह्नित किया है)।
whuber

88

मैं अभी वार्षिक मछली पकड़ने की यात्रा पर हूँ। दिन मैं मछली के समय और मेरे द्वारा पकड़ी जाने वाली मछली की मात्रा के बीच एक संबंध है। मेरे द्वारा उपयोग किए जाने वाले चारा के आकार और मेरे द्वारा पकड़ी जाने वाली मछलियों की मात्रा के बीच एक संबंध भी है। चारा के आकार और दिन के समय के बीच कोई संबंध नहीं है।


तुलसी, मैं इसे प्यार करता हूँ! सादे अंग्रेजी स्पष्टीकरण के लिए +1।
सायम्पा

श्रेष्ठ। उत्तर। आँकड़ों पर ।stackexchange। एवर
क्रिस बीले

1
यह एक ऐसे मामले का वर्णन करता है, जहाँ सहसंबंधों की शुरुआत कम होती है, लेकिन यह उस मामले की व्याख्या नहीं करता है जहाँ सहसंबंध अधिक हैं। यदि दिन के समय के साथ 80% सहसंबंध है, और चारा के आकार के साथ 80% सहसंबंध है, तो मैं गारंटी दे सकता हूं कि आप दिन के दौरान बड़े चारा का उपयोग कर रहे हैं!
user35581

2
@ user35581 नहीं, आप नहीं कर सकते - आप पूरे बिंदु को याद कर रहे हैं। हर घंटे वह एक बार छोटे चारा के साथ और एक बार बड़े चारा के साथ मछली पकड़ सकता था। वह अभी भी दिन के कुछ हिस्सों (80% सहसंबंध) के दौरान अधिक मछली पकड़ सकता है और अधिक चारा (80% सहसंबंध) के साथ अधिक मछली पकड़ सकता है और चारा के आकार और दिन के समय के बीच 0 सहसंबंध है। यह एक नकारात्मक सहसंबंध भी हो सकता है अगर वह दिन के बुरे समय की भरपाई करने के लिए दिन के ऑफ-पीक समय के दौरान अधिक बार बड़े चारा का उपयोग करता है। तो आप वास्तव में दिन के समय और चारा के आकार के बीच संबंध के बारे में कुछ नहीं जानते हैं।
rysqui

2
@rysqui क्षमा करें, मेरी टिप्पणी ख़राब थी, लेकिन मैं जिस बिंदु को बनाने की कोशिश कर रहा था, वह यह है: जब सुविधाओं और लक्ष्य के बीच के संबंध बहुत अधिक हो जाते हैं, तो आपकी सुविधाओं का भी सहसंबंध होना चाहिए। इसलिए यदि आपका दिन के समय और पकड़ने के आकार के बीच एक सही संबंध है, और चारा के आकार और पकड़ने के आकार के बीच एक सही संबंध है, तो आपके पास चारा के आकार और दिन के समय के बीच एक सही संबंध होना चाहिए, इसलिए अंतिम विवरण "आप दिन के दौरान बड़े चारा का उपयोग कर रहे हैं"। ध्यान रखें कि यह एक किनारे का मामला है!
user35581

20

VA=AE(A)VB=BE(B)VAVBVCπ/2πVAVBVCVAVB


बहु-आयामी वैक्टर के बीच एक कोण के संदर्भ में +1 सहसंबंध मेरे लिए सहज है।
पेट्रस थेरॉन

2
भविष्य के पाठकों के संदर्भ के लिए, मैं इस ज्यामितीय उत्तर पर (चित्रों के साथ!) का विस्तार निम्न सूत्र में करता हूं
जेक वेस्टफॉल

18

व्हिबर के उत्तर के लिए एक ऐड-ऑन के रूप में: प्रस्तुत सूत्र

1+2ρστ(ρ2+σ2+τ2)0

निम्नलिखित असमानता में परिवर्तित किया जा सकता है (ओल्किन, 1981):

στ(1σ2)(1τ2)ρστ+(1σ2)(1τ2)

ρ

यहाँ छवि विवरण दर्ज करें


ओल्किन, आई (1981)। उत्पाद-क्षण सहसंबंध मैट्रिक्स के लिए सीमा प्रतिबंध। साइकोमेट्रिका, 46, 469-472। डीओआई: 10.1007 / BF02293804


क्या कोई मुझे बता सकता है कि क्या इनमें से कुछ उदाहरण बहुभिन्नरूपी वितरण हैं जिनके विशिष्ट सीमांत वितरण हैं जो घटकों के बीच संभावित सहसंबंधों की सीमा को सीमित करते हैं? इसका मतलब है कि सहसंबंध -1 से 1. तक पूरी सीमा नहीं ले सकता है। मुझे याद है कि फ्रीचेट कम से कम एक व्यक्ति था जिसने इसे 1950 के दशक में विकसित किया था। जैसा कि मैंने आज साहित्य की खोज की मुझे लगता है कि वे अब फ्रीचेट कॉपुलस कहलाते हैं।
माइकल चेरिक

14

मुझे लगता है कि यह पूछना बेहतर है "क्यों उन्हें सहसंबद्ध होना चाहिए?" या, शायद "किसी विशेष संबंध क्यों होना चाहिए?"

निम्नलिखित आर कोड एक ऐसे मामले को दर्शाता है जहां X1 और x2 दोनों को Y के साथ सहसंबद्ध किया गया है, लेकिन एक दूसरे के साथ 0 सहसंबंध है

x1 <- rnorm(100)
x2  <- rnorm(100)
y <- 3*x1 + 2*x2 + rnorm(100, 0, .3)

cor(x1,y)
cor(x2,y)
cor(x1,x2)

Y के साथ सहसंबंध को .3 से .1 या जो भी कम करके मजबूत बनाया जा सकता है


दुर्भाग्य से, मैं एक आर उपयोगकर्ता नहीं हूं। तो, ऊपर दिए गए कोड मेरे लिए कम से कम मतलब है कि वे आप से मतलब है।
सिमपा

2
x1x2y=3x1+2x2yx1x2

14

मैं उन लोगों के लिए सांख्यिकीय प्रदर्शन को छोड़ दूंगा जो मेरे लिए इससे बेहतर अनुकूल हैं ... लेकिन सहज रूप से कहते हैं कि घटना ए एक ऐसी प्रक्रिया एक्स उत्पन्न करती है जो घटना सी की पीढ़ी में योगदान करती है। फिर ए को सी (एक्स के माध्यम से) सहसंबद्ध किया जाता है। दूसरी ओर, B, Y को उत्पन्न करता है, जो C को भी आकार देता है। इसलिए A को C से संबद्ध किया जाता है, B को C से संबद्ध किया जाता है, लेकिन A और B का संबंध नहीं है।


1
@Nice। मुझे लगता है कि आपके अंतिम वाक्य के अंतिम भाग में "ए और बी परस्पर नहीं हैं " का मतलब है ।
सनकूलू डिस

हां, सनकोस्सू सुधार के साथ निको ... यह एक यथोचित अच्छा स्पष्टीकरण है। आप आंशिक रूप से पथ विश्लेषण का वर्णन कर रहे हैं।
सिम्पा

हां, क्षमा करें, मैं अक्षरों के साथ मिला हुआ हूं;)
निको

1

उन लोगों के लिए जो कुछ अंतर्ज्ञान चाहते हैं, एक सहसंबंध को कुछ कोण के कोसाइन के रूप में देखा जा सकता है। तो, 3 डी में तीन वैक्टर पर विचार करें, A, B और C को एक-एक चर कहते हैं। प्रश्न ए और सी के बीच संभावित कोणों की सीमा को निर्धारित करना है जब ए और बी के बीच के कोण के साथ-साथ बी एट सी के बीच के कोण को जाना जाता है। उसके लिए, आप किसी भी सॉफ़्टवेयर को स्थापित किए बिना एक ऑनलाइन टूल के साथ खेल सकते हैं। बस पृष्ठ http://www.montefiore.ulg.ac.be/~pierard/chained_correlations.pp पर जाएं


0

चलो एक उदाहरण लेते हैं:

A={x1,x2,x3,x4,x5,x6,x7,x8,x9}

B={x1,x2,x3,0,0,0,0,0,0}

C={0,0,0,x4,x5,x6,0,0,0}

कुछ x के लिए A और B में महत्वपूर्ण सहसंबंध होगा, इसी तरह A और C में भी महत्वपूर्ण सहसंबंध होगा लेकिन B और C का सहसंबंध महत्वपूर्ण नहीं होगा।

तो, यह जरूरी नहीं है कि यदि A और B सहसंबद्ध हैं और A और C सहसंबद्ध हैं तो B और C भी सहसंबद्ध हैं।

नोट: गहरी समझ के लिए, कृपया बड़े डेटा पर इस उदाहरण के बारे में सोचें।


BCx1x6ABCx1x9

मैं अभिषेक आनंद के उत्तर के साथ सहज हूं क्योंकि अंततः हर चीज का कुछ हद तक हर चीज से संबंध है। और, मुझे सांख्यिकीय महत्व के संदर्भ में वह जिस तरह से बेंचमार्क करता है वह मुझे पसंद है। एक बार जब आप उस रूपरेखा का उपयोग करते हैं, तो यह स्पष्ट है कि यदि A और B, C के साथ सांख्यिकीय रूप से महत्वपूर्ण रूप से सहसंबंधित हैं, तो A या B आवश्यक रूप से सांख्यिकीय रूप से काफी सहसंबद्ध नहीं हो सकते हैं (मेरे मूल प्रश्न के वास्तविक ढांचे का उपयोग करके)। मुझे लगता है कि वेंट डायग्राम उस अवधारणा के एक उत्कृष्ट दृश्य स्पष्टीकरण के लिए बना सकते हैं।
सिम्पा

@ जब भी मैं आपसे सहमत हूँ। इसका सिर्फ एक नमूना उदाहरण है, जो समझाता है कि इसकी आवश्यकता क्यों नहीं है
अभिषेक आनंद

यह ठीक है - लेकिन आपको लगता है कि इन वैक्टरों के बीच क्या संबंध हैं, इस बारे में गलत धारणा है। कोई भी बयान के बारे में आप इन वैक्टर की सहसंबंध गुणांक बनाने के आम तौर पर सही हैं।
whuber
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.