क्या कार्य का तात्पर्य सहसंबंध है?


118

सहसंबंध का कोई कारण नहीं है, क्योंकि सहसंबंध के लिए कई स्पष्टीकरण हो सकते हैं। लेकिन क्या करणीय का तात्पर्य सहसंबंध है? सहज रूप से, मुझे लगता है कि कार्य-कारण की उपस्थिति का अर्थ है कि आवश्यक रूप से कुछ सहसंबंध है। लेकिन मेरे अंतर्ज्ञान ने हमेशा आंकड़ों में मेरी अच्छी तरह से सेवा नहीं की है। क्या कार्य का तात्पर्य सहसंबंध है?


5
समस्या यह है कि, यदि आप एक शब्दकोष में "नापसंद" करते हैं, तो आप "सुझाव" और "आवश्यक" दोनों देखेंगे।
23land में rolando2

6
सहसंबंध का कोई कारण नहीं होता है, लेकिन यह '' वहाँ पर देखो '' का संकेत देते हुए अपनी भौंहों को संकेत और हावभाव से छेड़ता है। xkcd.com/552
jchristie

1
प्रश्न स्वयं एक विशिष्ट, तथ्यात्मक उत्तर की तलाश में नहीं दिखता है, जैसा कि शब्द के उपयोग से संकेत मिलता है। उपरोक्त संदर्भ एक परम शायद जैसा है। या शायद एक और अधिक की तरह, लेकिन मैं इसे साबित नहीं कर सकता।
jchristie

जवाबों:


96

जैसा कि ऊपर दिए गए कई जवाबों में कहा गया है, कार्य-कारण का रैखिक संबंध नहीं है । चूंकि बहुत से सहसंबंध अवधारणाएं उन क्षेत्रों से आती हैं जो रैखिक आंकड़ों पर बहुत अधिक निर्भर करती हैं, आमतौर पर सहसंबंध को रैखिक सहसंबंध के बराबर देखा जाता है। विकिपीडिया लेख इस के लिए एक ठीक स्रोत है, मैं वास्तव में इस छवि की तरह:

सहसंबंध उदाहरण

नीचे की पंक्ति में कुछ आंकड़े देखें, उदाहरण के लिए 4 उदाहरण में परबोला-ईश आकार। यह @StasK उत्तर (थोड़े से शोर के साथ) में होता है। Y पूरी तरह से X के कारण हो सकता है लेकिन यदि संख्यात्मक संबंध रैखिक और सममित नहीं है, तो भी आपके पास 0 का सहसंबंध होगा।

आप जिस शब्द की तलाश कर रहे हैं वह आपसी जानकारी है : यह सहसंबंध के सामान्य गैर-रैखिक संस्करण की तरह है। उस स्थिति में, आपका कथन सत्य होगा: कार्य-कारण का अर्थ उच्च पारस्परिक जानकारी है


3
यह आमतौर पर होता है, लेकिन यह हमेशा सच नहीं होता है कि उच्च पारस्परिक जानकारी कार्य-कारण के साथ होती है। @ गंग का उत्तर देखें जहां "यदि कारण बिल्कुल विपरीत प्रभाव के साथ किसी अन्य कारण चर के साथ पूरी तरह से जुड़ा हुआ है।"
नील जी

5
विपरीत प्रभाव वाले दो कारणों का तर्क जो हमेशा एक-दूसरे को रद्द करते हैं, एक कारण के रूप में मेरे लिए बहुत मायने नहीं रखते हैं । मैं हमेशा मान सकता हूं कि कुछ कारण पैदा करने वाले गेंडे हैं, और gremlins उनके प्रयासों को पूरी तरह से रद्द कर रहे हैं; मैं इससे बचता हूं क्योंकि यह मूर्खतापूर्ण है। लेकिन शायद मैं आपकी बात को गलत समझ रहा हूं।
आर्टेम काज़नाचेव

11
उसका उदाहरण जितना होना चाहिए, उससे कहीं अधिक चरम है। आपके लिए बूलियन चर और सी होना संभव है जैसे और बी सी के कारण हैं , और सी = + बी (मॉड 2)। फिर, बी , और सी के ज्ञान के अभाव में कोई पारस्परिक जानकारी नहीं है। B एक अनदेखा कन्फ़्यूडर है - जिसे आप "gremlins" कह रहे हैं, भले ही यह कुछ बहुत ही सामान्य हो। A,BCABCC=A+BBACB
नील जी

2
@ नील मैं आपके पहले वाक्य से सहमत हूं, लेकिन दूसरे से नहीं। सिर्फ इसलिए कि ए और बी सी का कारण बनता है, इसका मतलब यह नहीं है कि ए सी का कारण बनता है और बी सी का कारण बनता है। मुझे नहीं लगता कि क्यों कारण को अधिक से अधिक वितरण करना पड़ता है।
आर्टेम काज़नाचेव

4
कारण यह है कि A, फिर भी C का एक कारण है क्योंकि A को बदलना अभी भी C को बदल देगा। इसलिए, C A पर निर्भर है, जब भी हम B का अवलोकन नहीं करते हैं
Neil G

41

सख्त जवाब है "नहीं, कार्य-कारण जरूरी नहीं कि सहसंबंध हो"।

पर विचार करें और वाई = एक्स 2 ~ χ 2 1 । कारण को कोई मजबूत नहीं मिलता है: X, Y को निर्धारित करता है । फिर भी, X और Y के बीच सहसंबंध 0. प्रमाण है: (संयुक्त) इन चर के क्षण हैं: E [ X ] = 0 ; [ वाई ] = [ एक्स ] = ; सीXN(0,1)Y=X2χ12XYXYE[X]=0E[Y]=E[X2]=1

Cov[X,Y]=E[(X0)(Y1)]=E[XY]E[X]1=E[X3]E[X]=0
मानक सामान्य वितरण की संपत्ति का उपयोग करते हुए कि इसके विषम क्षण सभी शून्य के बराबर हैं (आसानी से इसके पल-जनरेटिंग-फ़ंक्शन से प्राप्त किया जा सकता है, कहते हैं)। इसलिए, सहसंबंध शून्य के बराबर है।

कुछ टिप्पणियों को संबोधित करने के लिए: केवल यही तर्क काम करता है क्योंकि का वितरण शून्य पर केंद्रित है, और लगभग 0. सममित है। वास्तव में, इन गुणों वाले किसी भी अन्य वितरण में पर्याप्त संख्या में क्षणों में काम किया होगा। की जगह एन ( 0 , 1 ) , जैसे, पर वर्दी ( - 10 , 10 ) या लाप्लास ~ exp ( - | x | ) । एक oversimplified तर्क के प्रत्येक सकारात्मक मूल्य के लिए वह यह है कि एक्स , वहाँ के एक समान रूप से होने की संभावना नकारात्मक मूल्य है एक्सXN(0,1)(10,10)exp(|x|)XXउसी परिमाण में, इसलिए जब आप स्क्वायर करते हैं , तो आप यह नहीं कह सकते कि X के अधिक मूल्य Y के अधिक या छोटे मूल्यों से जुड़े हैं । हालांकि, का कहना है कि अगर आप ले एक्स ~ एन ( 3 , 1 ) , तो [ एक्स ] = 3 , [ Y ] = [ एक्स 2 ] = 10 , [ एक्स 3 ] = 36 , और सी वी [ एक्सXXYXN(3,1)E[X]=3E[Y]=E[X2]=10E[X3]=36 । यह एकदम सही समझ में आता है: में से प्रत्येक के मूल्य के लिए एक्स शून्य से नीचे, वहाँ के एक दूर अधिक होने की संभावना मूल्य है - एक्स जो शून्य से ऊपर है, इसलिए के बड़े मान एक्स के बड़े मान के साथ जुड़े रहे वाई । (उत्तरार्द्ध एक हैगैर केंद्रीय χ 2 वितरणCov[X,Y]=E[XY]E[X]E[Y]=3630=60XXXYχ2; यदि आप रुचि रखते हैं तो आप विकिपीडिया पृष्ठ से विचरण को खींच सकते हैं और सहसंबंध की गणना कर सकते हैं।)


2
@DQdlM: मानक यादृच्छिक चर घनत्व की समता के कारण विषम केंद्रीय क्षण लुप्त हो गए हैं । मैथ्यू: जवाब नहीं है, जैसा कि स्टासक ने प्रदर्शित किया है, क्योंकि सहसंबंध केवल निर्भरता का एकमात्र प्रकार नहीं है।
Emre

3
@DQdlM: विकिपीडिया सहसंबंध पृष्ठ पर पहली छवि में नीचे का मध्य ग्राफ़ देखें । यही StasK का मामला है। यह केवल काम करता है जब एक्स समान रूप से (अर्थात यदि उत्पत्ति के बारे में वितरित किया जाता है , सहसंबंध काफी अधिक हो जाएगा)XN(3,1)
naught101

3
PS मुझे खुशी है कि आपने यह उत्तर पोस्ट किया है। यह विश्वास करना कठिन था कि इस उत्तर के बिना प्रश्न इतना लंबा चला गया। यह सटीक उदाहरण था जो मेरे दिमाग में आया था जब मैंने यह प्रश्न देखा था, लेकिन इसे लिखने का समय नहीं मिला। मुझे खुशी है कि आप कर रहा हूँ था समय लगता है। चीयर्स।
कार्डिनल

3
@कार्डिनल: हाँ, मुझे लगता है कि हम सभी ने इस तरह के सरल पाठक्रमों को ग्रेड स्कूल में सीखा ... और हाँ, सहसंयोजक की व्युत्पत्ति से, आपको शून्य होने के लिए केवल पहले और तीसरे क्षण की आवश्यकता है। यदि आपके पास असममित वितरण का एक गैर-तुच्छ उदाहरण है जिसमें शून्य तीसरा क्षण है (पांच या छह बिंदुओं पर बारीक संभावना वाले द्रव्यमान की गणना नहीं होती है), तो मैं इसे देखने के लिए बहुत उत्सुक हूं।
StasK

3
यहाँ 'कार्य-कारण' को एक कार्य के रूप में व्यक्त किया जा रहा है। यह है का कारण बनता है Y यदि और केवल यदि वहाँ एक औसत दर्जे का समारोह, मौजूद है , कि इस तरह के वाई = ( एक्स ) । मुझे लगता है कि हम इस तर्क की वैधता के बारे में चर्चा करने के लिए हमारे जीवन के बाकी खर्च कर सकते हैं। XYfY=f(X)

31

अनिवार्य रूप से, हाँ।

सहसंबंध का कारण कार्यानुभव नहीं है क्योंकि कारण से परे सहसंबंध के लिए अन्य स्पष्टीकरण हो सकते हैं। लेकिन ए में बी का कारण बनने के लिए उन्हें किसी तरह से जुड़ा होना चाहिए । मतलब उन दोनों के बीच एक संबंध है - हालांकि उस संबंध को रैखिक होने की आवश्यकता नहीं है।

जैसा कि कुछ टिप्पणीकारों ने सुझाव दिया है, यह सहसंबंध के बजाय 'निर्भरता' या 'संघ' जैसे शब्द का उपयोग करने के लिए अधिक उपयुक्त है। हालांकि जैसा कि मैंने टिप्पणियों में उल्लेख किया है, मैंने देखा है कि "सहसंबंध का मतलब कार्य-कारण नहीं है" सरल रेखीय सहसंबंध से परे विश्लेषण के जवाब में, और ऐसा कहने के प्रयोजनों के लिए, मैंने अनिवार्य रूप से किसी भी "सहसंबंध" को बढ़ाया है A और B के बीच संबंध।


16
मैं रैखिक सहसंबंध के लिए सहसंबंध शब्द को आरक्षित करता हूं , और गैर-संबंध संबंधों के लिए निर्भरता का उपयोग करता हूं , जिसमें रैखिक सहसंबंध हो सकता है या नहीं।
मेमोरियल

4
@Memming मैं भी, इस तथ्य के लिए बचाऊंगा कि लोग "सहसंबंध का कोई मतलब नहीं निकालते हैं" फिर से छेड़छाड़ करते हैं: काफी जटिल गैर-रेखीय संघ।
फोमाइट

मेमिंग सही है। यदि आपको पियर्सन सहसंबंध का मतलब नहीं है तो आपको सहसंबंध को परिभाषित करने की आवश्यकता है।
नील जी

1
@ नील या उस मामले के लिए, एक एक चर या दूसरे को बदलकर एक रैखिक पियरसन सहसंबंध प्राप्त करने में सक्षम हो सकता है। समस्या यह है कि कहावत ही अति-सरलीकृत है।
फोमाइट

1
@EpiGrad: दोनों अच्छे अंक। आम बोलचाल में, सहसंबंध ए बी के संयोग से अधिक होता है। मुझे लगता है कि आपके उत्तर से सहसंबंध की एक व्यापक परिभाषा का उपयोग करने से लाभ होगा।
नील जी

23

@EpiGrad के उत्तर में जोड़ना। मुझे लगता है, बहुत से लोगों के लिए, "सहसंबंध" का अर्थ "रैखिक संबंध" होगा। और nonlinear सहसंबंध की अवधारणा सहज नहीं हो सकती है।

तो, मैं कहूंगा कि "नहीं, उन्हें सहसंबद्ध होने की ज़रूरत नहीं है लेकिन उन्हें संबंधित होना चाहिए "। हम पदार्थ पर सहमत हैं, लेकिन पदार्थ को पार करने के सर्वोत्तम तरीके पर असहमत हैं।

इस तरह के एक कारण का एक उदाहरण (कम से कम लोगों को लगता है कि यह कारण है) यह आपके फोन और आय का जवाब देने की संभावना के बीच है। यह ज्ञात है कि आय स्पेक्ट्रम के दोनों सिरों पर लोगों को बीच में लोगों की तुलना में अपने फोन का जवाब देने की संभावना कम होती है। यह माना जाता है कि गरीबों के लिए कारण पैटर्न अलग है (जैसे बिल लेने वालों से बचें) और अमीर (जैसे लोगों से दान मांगने से बचें)।


21

XY

निम्नलिखित कारण मॉडल पर विचार करें:

XYU

XUY

अब छोडो:

Xbernoulli(0.5)Ubernoulli(0.5)Y=1XU+2XU

UP(Y|X)=P(Y)XYYX

XUYXUXYUY {X,U}YXYXYXYXYU

तो संक्षेप में मैं कहूंगा कि: (i) कार्य-कारण निर्भरता का सुझाव देता है; लेकिन, (ii) निर्भरता कार्यात्मक / संरचनात्मक निर्भरता है और यह उस विशिष्ट सांख्यिकीय निर्भरता में अनुवाद कर सकता है या नहीं कर सकता है, जिसके बारे में आप सोच रहे हैं।


कार्लोस, यह कहना सही है कि अगर हम कारण मॉडल में शामिल चर का पूरा सेट जानते हैं तो यह समस्या (सांख्यिकीय अदर्शन) गायब हो जाती है?
markowitz

@markowitz आपको नियतात्मक स्तर तक सब कुछ देखने की आवश्यकता होगी, इस प्रकार बहुत यथार्थवादी परिदृश्य नहीं।
कार्लोस सिनेली

मैं आपके उत्तर की "हाँ" के रूप में व्याख्या करता हूं। आप सही हैं, जो स्थिति मुझे चाहिए वह अवास्तविक है; मुझे इसकी जानकारी है। हालाँकि यह सवाल केवल उस तर्क से संबंधित था जिसे आपने वर्णित किया था और अंतिम रूप से इसे समझ लेना था। मेरा विश्वास कुछ इस तरह था "कार्यानुभव सांख्यिकीय एसोसिएशन" और अन्य इस पृष्ठ में इस तरह ध्वनि का जवाब। सब के बाद भी आपका उदाहरण थोड़ा अवास्तविक है लेकिन इस कारण के लिए नहीं। यह मुझे लगता है कि, सामान्य रूप से, सांख्यिकीय संघ के बिना कारण थोड़ा अवास्तविक है, लेकिन सैद्धांतिक रूप से दिलचस्प है।
markowitz

1
@markowitz "सांख्यिकीय अदर्शन" तब होता है जब मॉडल ग्राफ के लिए वफादार नहीं होता है। सटीक रद्द करने के लिए, यह मानकीकरण की एक विशिष्ट पसंद पर निर्भर करता है, इसलिए कुछ लोगों का तर्क है कि यह वास्तव में संभावना नहीं है। हालाँकि, निरस्तीकरण निकट हो सकता है क्योंकि यह मापदंडों के पड़ोस पर निर्भर करता है, इसलिए यह सभी संदर्भ पर निर्भर करता है। यहाँ बात सिर्फ इतनी है कि आपको अपनी कार्य-कारण मान्यताओं को स्पष्ट करने की आवश्यकता है क्योंकि, तार्किक रूप से, कार्य-कारण स्वयं से संबद्ध नहीं है - आपको अतिरिक्त मान्यताओं की आवश्यकता है।
कार्लोस Cinelli

13

जब तक कि वहाँ कोई भिन्नता है कारण और प्रभाव सहसंबद्ध किया जाएगा बिल्कुल घटनाओं और कारण की भयावहता और कोई बदलाव में बिल्कुल भी अपने कारण बल में। केवल दूसरी संभावना यह होगी कि कारण बिल्कुल विपरीत प्रभाव के साथ एक अन्य कारण चर के साथ पूरी तरह से सहसंबद्ध है। मूल रूप से, ये विचार-प्रयोग की स्थिति हैं। वास्तविक दुनिया में, कार्य-कारण किसी न किसी रूप में निर्भरता (हालांकि यह रैखिक संबंध नहीं हो सकता है) होगा।


3
@NeilG, मैं करने के लिए मेरे लत लिप्त तिर्छा
गंग

1
कुछ सिद्धांत वास्तव में इसका मतलब है, जैसे कई गेम सिद्धांत मॉडल। कुछ अनुभवजन्य परिस्थितियाँ जहाँ आप एक अंतर नहीं समझ सकते हैं (हालाँकि वास्तव में एक 'गंग-इटैलिक्स' में होगा) क्योंकि :-) दो अलग-अलग दिशाओं में विकासवादी चयन दबाव होने पर 'न्यूट्रल' नो जीन चेंज परिदृश्यों को शामिल करते हैं।
संयुक्ताक्षरी

1
मुझे पहला अपवाद पसंद है, लेकिन दूसरा अपवाद नहीं। मुझे लगता है कि स्विच को फ़्लिप करने से रोशनी चली जाती है, लेकिन अगर मैं केवल ब्लैकआउट के दौरान स्विच को फ्लिप करता हूं तो कुछ भी नहीं होता है। शायद वास्तव में एक कारण संबंध नहीं था।
एमोरी

1
@ naught101, आप एक अच्छा बिंदु उठाते हैं, जिसकी चर्चा इस पृष्ठ पर कहीं और की गई है। मैंने अपना उत्तर संपादित कर दिया है। हालाँकि, जब मैंने लोगों के साथ काम किया है, मुझे नहीं लगता कि उनके पास आवश्यक रूप से रैखिक के रूप में सहसंबंध का एक मजबूत गर्भाधान है, हालांकि मैं उन्हें बताता हूं कि। हालांकि वे इसे इन शब्दों में नहीं डालेंगे, लेकिन मुझे लगता है कि ज्यादातर लोग 'सहसंबंध' को 'कार्य' के करीब समझते हैं। फिर भी, मुझे अपनी शर्तों के उपयोग में स्पष्ट होना चाहिए, और शुरू से ही होना चाहिए।
गंग

2
@emory: प्रकाश के आने का कारण वास्तव में विद्युत सर्किट का बंद होना है (जो स्विच के फ़्लंटिंग के कारण होता है, जिसमें पर्यावरणीय स्थितियां भी शामिल हैं)। एक ब्लैकआउट के दौरान, स्विच को फ्लिक करने से सर्किट बंद नहीं होता है, क्योंकि यह कहीं और टूट गया है। तो एक अर्थ में, ब्लैकआउट "विपरीत" प्रभाव है जिसके बारे में गंग बात कर रहे थे (यानी प्रकाश चालू है, ब्लैकआउट बंद हो जाता है)। इसे एक अशक्त प्रभाव के रूप में भी सोचा जा सकता है।
naught101

2

यहां शानदार जवाब हैं। आर्टेम काज़नाचेव , फ़ोमाइट और पीटर फ्लॉम बताते हैं कि कार्य-कारण आमतौर पर रैखिक सहसंबंध के बजाय निर्भरता को प्रभावित करेगा। कार्लोस सिनेली एक उदाहरण देते हैं जहां कोई निर्भरता नहीं है, क्योंकि जनरेटिंग फ़ंक्शन कैसे सेट किया जाता है।

मैं एक बिंदु जोड़ना चाहता हूं कि यह निर्भरता व्यवहार में कैसे गायब हो सकती है, जिस प्रकार के डेटासेट में आप अच्छी तरह से काम कर सकते हैं। कार्लोस के उदाहरण जैसी स्थिति केवल "विचार-प्रयोग की स्थितियों" तक सीमित नहीं हैं।

आत्म-विनियमन प्रक्रियाओं में निर्भरता गायब हो जाती है । उदाहरण के लिए, होमोस्टैसिस यह सुनिश्चित करता है कि आपके शरीर का तापमान कमरे के तापमान से स्वतंत्र रहे। बाहरी गर्मी आपके शरीर के तापमान को सीधे प्रभावित करती है, लेकिन यह शरीर की शीतलन प्रणालियों (जैसे पसीना) को भी प्रभावित करती है जो शरीर के तापमान को स्थिर रखती हैं। यदि हम अत्यंत तीव्र अंतराल में तापमान का नमूना लेते हैं और अत्यंत सटीक मापों का उपयोग करते हैं, तो हमारे पास कारण निर्भरता का अवलोकन करने का एक मौका होता है, लेकिन सामान्य नमूने दरों पर, शरीर का तापमान और बाहरी तापमान स्वतंत्र दिखाई देते हैं।

जैविक प्रणालियों में स्व-विनियमन प्रक्रियाएं आम हैं; वे विकास द्वारा निर्मित हैं। स्तनधारी जो अपने शरीर के तापमान को विनियमित करने में विफल होते हैं उन्हें प्राकृतिक चयन द्वारा हटा दिया जाता है। जैविक डेटा के साथ काम करने वाले शोधकर्ताओं को पता होना चाहिए कि उनके डेटासेट में कारण निर्भरता गायब हो सकती है।


-3

क्या बिना किसी सहसंबंध के कोई कारण नहीं होगा?

जब तक स्वीकार किए गए उत्तर का अर्थ नहीं है, आप 'सहसंबंध' शब्द की अविश्वसनीय रूप से सीमित व्याख्या का उपयोग कर रहे हैं, यह एक मूर्खतापूर्ण सवाल है- अगर एक चीज़ 'दूसरे' का कारण बनती है, तो यह किसी तरह से प्रभावित परिभाषा से है, चाहे वह एक हो जनसंख्या में वृद्धि, या सिर्फ तीव्रता।

सही?

तो फिर, आप कुछ और चर्चा कर सकते हैं जैसे, किसी चीज़ के प्रभावित होने की दृश्यता कुछ और, जो मुझे लगता है कि कार्य-कारण की तरह दिखती है, लेकिन वास्तव में आप जो माप रहे हैं उसे आप नहीं माप रहे हैं ...

तो हाँ, मुझे लगता है कि संक्षिप्त उत्तर होगा, "हाँ, जब तक आप एन्ट्रापी नहीं बना सकते।"

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.