शून्य सहसंबंध क्यों जरूरी स्वतंत्रता का अर्थ नहीं है


41

यदि दो चर में 0 संबंध हैं, तो वे आवश्यक रूप से स्वतंत्र क्यों नहीं हैं? क्या शून्य सहसंबंधित चर विशेष परिस्थितियों में स्वतंत्र हैं? यदि संभव हो तो, मैं एक सहज व्याख्या की तलाश कर रहा हूं, एक उच्च तकनीकी नहीं।


10
सहसंबंध रैखिक निर्भरता (संघ) का एक उपाय है। दो रैंडम वैरिएबल के बिना असंबद्ध लेकिन गैर-निर्भर रूप से निर्भर होना संभव है।
मार्क एल स्टोन


6
शून्य सहसंबंध स्वतंत्रता का अर्थ है अगर चर बहुभिन्नरूपी सामान्य हैं। यह प्रत्येक चर के सामान्य होने जैसा नहीं है - शून्य-सहसंबद्ध लेकिन आश्रित सामान्य चर के प्रत्येक
बिखराव के

1
सहसंबंध (अयोग्य) रैंक सहसंबंध, आदि शामिल कर सकता है, जिसके लिए मोनोटोनिक निर्भरता मुद्दा है, और आगे।
निक कॉक्स

1
दृष्टिकोण के लिए, मैं आपको स्वतंत्रता के एक उपाय के रूप में विकिपीडिया "दूरी सहसंबंध" देखने की सलाह दूंगा।
ttnphns

जवाबों:


41

सहसंबंध दो दिए गए चर के बीच रैखिक एसोसिएशन को मापता है और यह संघ के किसी अन्य रूप का पता लगाने के लिए कोई दायित्व नहीं है।

इसलिए वे दो चर कई अन्य गैर-रेखीय तरीकों से जुड़े हो सकते हैं और सहसंबंध स्वतंत्र मामले से अलग नहीं हो सकता है।

XP(X=x)=1/3x=1,0,1Y=X2


1
मैं यादृच्छिक रूपांतरों के साक्ष्य की तलाश कर रहा था, लेकिन यह अभी तक निर्भर नहीं था कि मेरे प्रश्न के प्रत्यक्ष उत्तरों में से कोई भी सहज ज्ञान युक्त तथ्य नहीं है। दूसरी ओर, आपका जवाब, मुझे इसके बारे में सोचने के लिए बहुत अच्छा कोण देता है, बहुत बहुत धन्यवाद!
स्टकैश

1
@stucash मेरी खुशी! यह एक पुराना काउंटर उदाहरण था जिसे मैंने सीखा
मार्सेलो वेंचुरा

23

साधारण शब्द "सहसंबंध" के उपयोग में कठोरता का सामान्य रूप से अभाव है क्योंकि इसमें व्यापक रूप से भिन्न धारणाएं और अर्थ हो सकते हैं। सबसे सरल, शिथिल और सबसे आम उपयोग यह है कि यादृच्छिक दंतकथाओं की एक स्थिर जोड़ी के बीच कुछ अस्पष्ट संबंध, स्वतंत्रता की कमी या संबंध है।

यहाँ, सामान्य रूप से निर्दिष्ट मेट्रिक आमतौर पर पियर्सन सहसंबंध है, जो दो निरंतर वितरित चर के बीच युग्मक, रैखिक संघ का एक मानकीकृत उपाय है । में से एक पियर्सन की आम दुरुपयोग एक प्रतिशत के रूप में यह रिपोर्ट करने के लिए है। यह निश्चित रूप से प्रतिशत नहीं है। पियर्सन सहसंबंध, आर , के बीच -1.0 और +1.0 जहां 0 का अर्थ नहीं पर्वतमाला रैखिक संघ। अन्य पियरसन सहसंबंध का उपयोग करने के साथ व्यापक रूप से मान्यता प्राप्त मुद्दे नहीं हैं क्योंकि डिफ़ॉल्ट रूप से यह वास्तव में काफी कठोर है, रैखिकता के गैर-मजबूत माप को इनपुट के रूप में अंतराल-स्केल वाले चर की आवश्यकता होती है (पॉल एंब्रेट्स के उत्कृष्ट पेपर देखें)जोखिम प्रबंधन में सहसंबंध और निर्भरता: गुण और नुकसान यहाँ: https://people.math.ethz.ch/~embrecht/ftp/pitashes.pdf )।

इम्ब्रैच्ट्स नोट करते हैं कि निर्भरता के बारे में बहुत सी गलत धारणाएं हैं जो इन संरचनाओं की अंतर्निहित संरचना और ज्यामितीय आकार की धारणाओं से शुरू होती हैं:

ये पतन एक भोली धारणा से उत्पन्न होते हैं जो अण्डाकार दुनिया की निर्भरता गुण गैर-अण्डाकार दुनिया में भी रखती हैं

करने के लिए Embrechts अंक copulas वित्त और जोखिम प्रबंधन, जिनमें से में इस्तेमाल निर्भरता मैट्रिक्स की एक बहुत व्यापक वर्ग के रूप में पियर्सन सहसंबंध सिर्फ एक प्रकार है।

कोलंबिया के सांख्यिकी विभाग ने शैक्षणिक वर्ष 2013-2014 को निर्भरता संरचनाओं की गहरी समझ विकसित करने पर ध्यान केंद्रित किया: उदाहरण के लिए, रैखिक, nonlinear, मोनोटोनिक, रैंक, पैरामीट्रिक, गैरपारंपरिक, संभवतः अत्यधिक जटिल और स्केलिंग में व्यापक अंतर रखने। इस वर्ष का समापन 3 दिवसीय कार्यशाला और सम्मेलन के साथ हुआ जिसने इस क्षेत्र के अधिकांश शीर्ष योगदानकर्ताओं को एक साथ लाया ( http://datascience.columbia.edu/workshop-and-conference-nonparametric-measures-d dependence-apr- 28- may- २ )।

इन योगदानकर्ताओं में रेशे ब्रदर्स शामिल थे, जो अब 2011 में बड़े डेटा सेट्स में नोवेल एसोसिएशंस का पता लगाने वाले विज्ञान के पेपर के लिए प्रसिद्ध हैं । http://www.uvm.edu/~cdanfort/csc-reading-group/reshef-correlation-cicience-2011.pdf कि व्यापक रूप से आलोचना की गई है (एक अच्छा अवलोकन के लिए एंड्रयूगेलमैन.कॉम देखें, कोलंबिया घटना के साथ एक साथ प्रकाशित: http://andrewgelman.com/2014/03/14/maximal-information-coeffic )। Reshefs ने अपनी प्रस्तुति (कोलंबिया सम्मेलन वेबसाइट पर उपलब्ध) में इन सभी आलोचनाओं को संबोधित किया, साथ ही साथ एक अधिक कुशल एमआईसी एल्गोरिथ्म भी।

इस कार्यक्रम में कई अन्य प्रमुख सांख्यिकीविदों ने प्रस्तुत किया, जिसमें गैबोर स्काईली शामिल हैं, जो अब डीसी में एनएसएफ में हैं। उसकी दूरी और आंशिक दूरी के सहसंबंधों को विकसित किया । दीप मुखोपाध्याय, मंदिर यू, अपने यूनिफाइड स्टैटिस्टिकल अल्गोरिद्म - डेटा विज्ञान के एकीकृत एल्गोरिदम के लिए एक रूपरेखा - यूजीन फ्रेंज़ेन http://www.fox.temple.edu/mcm_people/bubhadeep-mukhopadhyay/ के साथ किए गए काम पर आधारित है । और बहुत सारे। मेरे लिए, अधिक दिलचस्प विषयों में से एक विस्तृत लीवरेज और कर्नेल हिल्बर्ट स्पेस (आरकेएचएस) और ची-स्क्वायर का उपयोग था। यदि इस सम्मेलन में निर्भरता संरचनाओं के लिए एक मामूली दृष्टिकोण था, तो यह आरकेएचएस था।

सामान्य परिचय आँकड़े पाठ्यपुस्तकें निर्भरता के अपने उपचार में सिद्ध होती हैं, जो आम तौर पर वृत्ताकार या परवलयिक संबंधों के विज़ुअलाइज़ेशन के समान सेट की प्रस्तुतियों पर निर्भर होती हैं। अधिक परिष्कृत ग्रंथों को Anscombe की चौकड़ी में तब्दील किया जाएगा , चार अलग-अलग डेटासेट का एक दृश्य, समान सांख्यिकीय गुण, लेकिन बेहद अलग-अलग संबंध: https://en.wikipedia.org/wiki/Anscombe%27_cartet

इस कार्यशाला के बारे में महान चीजों में से एक निर्भरता संरचनाओं और रिश्तों की भीड़ थी, जो मानक, परफेक्ट उपचार से बहुत दूर जा रही थी। उदाहरण के लिए, Reshefs में दर्जनों थंबनेल ग्राफिक्स थे, जो संभव गैर-विशिष्टताओं के नमूने का प्रतिनिधित्व करते थे। दीप मुखोपाध्याय के पास अत्यधिक जटिल रिश्तों के आश्चर्यजनक दृश्य थे जो हिमालय के उपग्रह दृश्य की तरह दिखते थे। आँकड़े और डेटा विज्ञान की पाठ्यपुस्तक के लेखकों को ध्यान देने की आवश्यकता है।

इन अत्यधिक जटिल, जोड़ीदार निर्भरता संरचनाओं के विकास और विज़ुअलाइज़ेशन के साथ कोलंबिया सम्मेलन से बाहर आते हुए, मुझे इन गैर-विशिष्टताओं और जटिलताओं को पकड़ने के लिए बहुभिन्नरूपी सांख्यिकीय मॉडल की क्षमता पर सवाल उठाया गया था।


2
मैं अभी Quora: quora.com/…
माइक हंटर

6

यह "सहसंबंध" की आपकी सटीक परिभाषा पर निर्भर करता है, लेकिन पतित मामलों का निर्माण करना बहुत कठिन नहीं है। "स्वतंत्र" का अर्थ कुछ भी हो सकता है जैसे "कोई भविष्य कहनेवाला शक्ति, बिल्कुल भी, कभी" जितना "रैखिक संबंध"।

y=sin(2000x)x[0,1)


3

असल में, X पर Y की निर्भरता का अर्थ है Y के मूल्यों का वितरण, X के मूल्य के किसी न किसी तरीके पर निर्भर करता है। यह निर्भरता Y के मध्यमान मूल्य पर हो सकती है (अधिकांश उत्तरों में प्रस्तुत किया गया सामान्य मामला) या अन्य जो भी विशेषता हो वाई

उदाहरण के लिए, X को 0 या 1. यदि X = 0 तो Y को 0 होने दें, यदि X = 1 को Y को -1, 0 या 1 (समान संभावना) होने दें। X और Y असंबंधित हैं। मतलब है, Y, X पर निर्भर नहीं करता है क्योंकि जो भी मूल्य X है, Y का अर्थ 0. है। लेकिन स्पष्ट रूप से Y के मूल्यों का वितरण X मूल्य पर निर्भर करता है। इस मामले में, उदाहरण के लिए, Y का विचरण 0 होता है जब X = 0 और> 0 होता है जब X = 1 होता है, इस प्रकार, कम से कम, विचरण पर निर्भरता होती है, यानी एक निर्भरता होती है।

तो, रैखिक सहसंबंध केवल मीन (रैखिक निर्भरता) पर निर्भरता का एक प्रकार दिखाते हैं, कि बदले में केवल निर्भरता का एक विशेष मामला है।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.