स्वतंत्रता का तात्पर्य शून्य सहसंबंध क्यों है?


16

सबसे पहले, मैं यह नहीं पूछ रहा हूँ:

शून्य सहसंबंध स्वतंत्रता का अर्थ क्यों नहीं है?

इसे यहां (बल्कि अच्छी तरह से) संबोधित किया गया है: /math/444408/why-does-zero-correlation-not-imply-ind dependence

मैं जो पूछ रहा हूं वह इसके विपरीत है ... कहते हैं कि दो चर एक दूसरे से पूरी तरह स्वतंत्र हैं।

क्या वे दुर्घटना से एक छोटे से संबंध नहीं रख सकते थे?

क्या यह नहीं होना चाहिए ... स्वतंत्रता का अर्थ है बहुत बड़ा संबंध?


5
यहां तक ​​कि स्वतंत्र चर भी लगभग हमेशा एक शून्य शून्य सहसंबंध होगा, हालांकि यह अभी भी शून्य के करीब होगा।
jsk

10
जैसा कि @jsk ने बताया, आप अपेक्षित सहसंबंध के साथ नमूना संबंध को भ्रमित कर सकते हैं
डेविड

1
@ डेविड आपको समझा सकता है? मैं अभी भी आंकड़ों में बहुत शुरुआती हूं।
जोशुआ रॉनिस

3
@JoshuaRonis नमूना सहसंबंध वह सहसंबंध है जिसका आप डेटा के एक समूह के साथ काम करते समय निरीक्षण करते हैं। आप इसका उपयोग यह जानने के लिए करते हैं कि दो चर के बीच "सही" सहसंबंध क्या है। जितना बड़ा नमूना, उतना ही बेहतर अनुमान। उदाहरण के लिए, दो पासा के परिणामों के बीच सहसंबंध स्वतंत्र है, इसलिए असंबंधित है, भले ही आप उन्हें दस बार एक साथ रोल करते हैं, आपको सहसंबंध (यादृच्छिक मौका के कारण) मिल सकता है, लेकिन कृपया महसूस करें कि सकारात्मक या नकारात्मक सहसंबंध के लिए कोई वरीयता नहीं है (यानी आपके पास प्रत्येक का समान मौका है)
डेविड

जवाबों:


36

सहसंबंध गुणांक की परिभाषा के अनुसार, यदि दो चर स्वतंत्र हैं तो उनका सहसंबंध शून्य है। तो, यह दुर्घटना से कोई संबंध नहीं हो सकता है!

ρX,Y=E[XY]E[X]E[Y]E[X2][E[X]]2 E[Y2][E[Y]]2

यदि X और Y स्वतंत्र हैं, तो E[XY]=E[X]E[Y] अर्थ है । इसलिए, इस मामले में ρX,Y का अंश शून्य है।

इसलिए, यदि आप सहसंबंध का अर्थ नहीं बदलते हैं, जैसा कि यहां बताया गया है, तो यह संभव नहीं है। जब तक, सहसंबंध क्या है से अपने बचाव को स्पष्ट करें।


2
और फिर भी, हमारे पास स्पष्ट रूप से समुद्री लुटेरों की संख्या और वैश्विक औसत तापमान के बीच एक (उलटा) सहसंबंध दिखाने वाले चार्ट हैं। जैसा कि अन्य टिप्पणियां
बताती

@ ओएमजी "यदि आप सहसंबंध का अर्थ नहीं बदलते हैं, जैसा कि यहां उल्लेख किया गया है" जब मैंने ओपीएस प्रश्न पढ़ा, तो मुझे "सहसंबंध" का एक बहुत ही अलग अर्थ मिला। मेरे लिए: "क्या वे दुर्घटना से एक छोटे से सहसंबंध नहीं कर सकते थे?" बहुत दृढ़ता से 'मापने' सहसंबंध का तात्पर्य है, और जब आप वास्तविकता में सहसंबंध को मापते हैं तो आप अक्सर "दुर्घटना से एक छोटा सा सहसंबंध" पाएंगे।
उद्योग 7

1
@ इंडस्ट्री 7 मैं देख रहा हूं। लेकिन इसे एक औपचारिक विधि में परिभाषित किया जाना चाहिए। यह गुणात्मक है और हम यहां इसके बारे में बात नहीं कर सकते।
ओमजी

@CarlWitthoft समुद्री लुटेरों की संख्या और वैश्विक औसत तापमान स्वतंत्र नहीं हैं। उनके पास एक सामान्य कारण (यानी, समय, विकास, आधुनिकीकरण, आदि) है जो उनके बीच एक निर्भरता बनाता है। "स्वतंत्रता" का मतलब यह नहीं है "कारण नहीं है"; इसका अर्थ है "असंबद्ध", और स्पष्ट रूप से वे चार्ट एसोसिएशन को प्रदर्शित करते हैं।
नूह

@ नोहा मुझे डर है कि क्या हुआ। venganza.org
कार्ल विटथॉफ्ट 12

19

नमूना सहसंबंध पर टिप्पणी । एक ही आकार के दो छोटे स्वतंत्र नमूनों की तुलना में, नमूना सहसंबंध अक्सर से भिन्न होता है [ जनसंख्या के सहसंबंध पर @ ओमजी का उत्तर (+1) कुछ भी नहीं विरोधाभासी हैr=0.ρ.]

दर साथ घातीय वितरण से आकार के स्वतंत्र नमूनों के एक लाख जोड़े के बीच संबंध पर विचार करेंn=51.

set.seed(616)
r = replicate( 10^6, cor(rexp(5), rexp(5))  )
mean(abs(r) > .5)
[1] 0.386212
mean(r)
[1] -0.0005904455

hist(r, prob=T, br=40, col="skyblue2")
  abline(v=c(-.5,.5), col="red", lwd=2)

यहाँ छवि विवरण दर्ज करें

उदाहरण के लिए, यहां आकार 5, के नमूने के दस लाख जोड़े में से पहला का बिखराव है , जिसके लिए r=0.5716.

यहाँ छवि विवरण दर्ज करें

इस संबंध में घातांक वितरण के बारे में कुछ खास नहीं है। मूल वितरण को मानक सामान्य में बदलने से निम्नलिखित परिणाम प्राप्त हुए।

set.seed(2019)
...
mean(abs(r) > .5)
[1] 0.391061
mean(r)
[1] 1.43269e-05

यहाँ छवि विवरण दर्ज करें

इसके विपरीत, यहां आकार n = 20 के सामान्य नमूनों के जोड़े के लिए सहसंबंधों के संबंधित हिस्टोग्राम है n=20.

यहाँ छवि विवरण दर्ज करें

नोट: इस साइट के अन्य पृष्ठ r के वितरण पर अधिक विस्तार से चर्चा करते हैं ; उनमें से एक यह प्रश्नोत्तर है


6
छोटे नमूने के आकार के लिए, आपको ऐसे नमूना सहसंबंध मिलने की संभावना है जो "ध्यान देने योग्य" शून्य से अलग हैं, लेकिन आप उन सहसंबंधों को खोजने की अधिक संभावना नहीं रखते हैं जो शून्य से काफी अलग हैं । हालांकि आपका बिंदु अनुमान शून्य से बहुत दूर है, फिर भी आपके पास यह दावा करने के लिए बहुत कम डेटा है कि आप किसी भी चीज के कारण नॉनजरो सहसंबंध देख रहे हैं। केवल 5 जोड़े के साथ, यहां तक ​​कि सहसंबंधों का गुणांक 0.8 से अधिक नहीं हो सकता है जो 0. से अलग हो सकता है
परमाणु वांग

11

सरल उत्तर: यदि 2 चर स्वतंत्र हैं, तो जनसंख्या सहसंबंध शून्य है, जबकि नमूना सहसंबंध आमतौर पर छोटा, लेकिन गैर-शून्य होगा।

ऐसा इसलिए है क्योंकि नमूना जनसंख्या का सही प्रतिनिधित्व नहीं है।

नमूना जितना बड़ा होगा, यह आबादी का उतना ही बेहतर प्रतिनिधित्व करेगा, इसलिए आपके पास जितना छोटा संबंध होगा। एक अनन्त नमूने के लिए, सहसंबंध शून्य होगा।


1
pϵnnϵp

हाँ, बिलकुल सही! मैंने अपना उत्तर यथासंभव सरल और वैचारिक रखने का प्रयास किया।
डेव

1

शायद यह कुछ लोगों के लिए उसी सहज समझ को साझा करने में मददगार हो। हम सभी ने कुछ ऐसा देखा है:

यहाँ छवि विवरण दर्ज करें

r=0.66

जैसा कि दूसरों ने पहले ही बताया है, नमूना मूल्यों को सहसंबद्ध किया जाता है, लेकिन इसका मतलब यह नहीं है कि जनसंख्या में गैर-सहसंबंध है।

बेशक, इन दोनों को स्वतंत्र होना चाहिए- निकोलस केज इस साल रिकॉर्ड -10 फिल्मों में दिखाई दिए, हमें सुरक्षा उद्देश्यों के लिए गर्मियों के लिए स्थानीय पूल को बंद नहीं करना चाहिए।

लेकिन जब हम जांचते हैं कि इस साल कितने लोग डूबते हैं, तो एक छोटा सा मौका है कि इस साल रिकॉर्ड-सेटिंग वाले 1000 लोग डूब गए।

इस तरह के सहसंबंध की संभावना नहीं है। शायद एक हजार में से एक। लेकिन यह संभव है, भले ही दोनों स्वतंत्र हों। लेकिन यह सिर्फ एक मामला है। इस बात पर विचार करें कि वहाँ लाखों संभावित घटनाओं को मापने के लिए है, और आप मौका देख सकते हैं कि एक उच्च सहसंबंध देने के लिए होने वाले कुछ दो की संभावना काफी अधिक है (इसलिए ग्राफ़ का अस्तित्व जैसे ऊपर है)।

इसे देखने का एक और तरीका यह है कि दो स्वतंत्र घटनाओं को हमेशा असंबद्ध मान देने की गारंटी देना स्वयं प्रतिबंधात्मक है। दो स्वतंत्र पासा, और पहले के परिणामों को देखते हुए, दूसरे पासा के लिए परिणामों का एक निश्चित (बड़े आकार का) सेट होता है जो कुछ गैर-अक्षीय सहसंबंध देगा। पहले के साथ शून्य सहसंबंध देने के लिए दूसरे पासा के परिणामों को प्रतिबंधित करना स्वतंत्रता का स्पष्ट उल्लंघन है, क्योंकि पहले पासा के रोल अब परिणामों के वितरण को प्रभावित कर रहे हैं।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.