सहसंबंध और कारण के बीच संबंध


19

विकिपीडिया पृष्ठ शीर्षक से सहसंबंध का अर्थ कार्य-कारण नहीं है ,

किसी भी दो सहसंबद्ध घटनाओं के लिए, ए और बी, विभिन्न संभावित रिश्तों में शामिल हैं:

  1. ए कारण बी (प्रत्यक्ष कारण);
  2. बी का कारण ए (उल्टा कारण);
  3. ए और बी एक सामान्य कारण के परिणाम हैं, लेकिन एक दूसरे का कारण नहीं हैं;
  4. ए और बी दोनों सी का कारण बनता है, जो स्पष्ट रूप से या स्पष्ट रूप से है;
  5. ए और बी का कारण बनता है ए (द्विदिश या चक्रीय कारण);
  6. एक कारण C जो B (अप्रत्यक्ष करण) का कारण बनता है;
  7. ए और बी के बीच कोई संबंध नहीं है; सहसंबंध एक संयोग है।

चौथे बिंदु का क्या अर्थ है ए और बी दोनों सी का कारण बनते हैं, जो (स्पष्ट या निहित रूप से) वातानुकूलित है। यदि A और B C का कारण बनते हैं, तो A और B का परस्पर संबंध क्यों है।


8
आज्ञाकारी संबंधित xkcd: xkcd.com/552
टोड विलकॉक्स

2
यह कहने के बावजूद कि मैं सहसंबंध और कार्य के बीच एक उच्च संबंध होने की उम्मीद करूंगा ...
मेहरदाद


संभवतः इस बात पर भी चर्चा होती है कि क्या सहसंबंध का कोई कारण नहीं है?
2

जवाबों:


18

"कंडीशनिंग" प्रायिकता सिद्धांत का एक शब्द है: https://en.wikipedia.org/wiki/Conditional_probability

C पर कंडीशनिंग का मतलब है कि हम केवल उन मामलों को देख रहे हैं जहां C सत्य है। "स्पष्ट रूप से" का अर्थ है कि हम इस प्रतिबंध को स्पष्ट नहीं कर रहे हैं, कभी-कभी इसे करने के बारे में भी नहीं जानते हैं।

बिंदु का मतलब है कि, जब ए और बी दोनों सी का कारण बनते हैं, तो ए और बी के मामलों में जहां सी सच है, के बीच संबंध का निरीक्षण करते हुए, इसका मतलब यह नहीं है कि ए और बी के बीच एक वास्तविक संबंध है यह सी पर कंडीशनिंग है (शायद अनिच्छा से) एक कृत्रिम सहसंबंध बनाता है।

एक उदाहरण लेते हैं।

एक देश में दो तरह की बीमारियां मौजूद हैं, पूरी तरह से स्वतंत्र। कॉल ए: "व्यक्ति को पहली बीमारी है", बी: "व्यक्ति को दूसरी बीमारी है"। , पी ( बी ) = 0.1 मान लेंP(A)=0.1P(B)=0.1

अब किसी भी व्यक्ति को इनमें से कोई एक बीमारी है तो वह डॉक्टर को देखने जाता है और तब ही। कॉल सी: "व्यक्ति डॉक्टर को देखने जाता है"। हमारे पास C=A or B

अब कुछ संभावनाओं की गणना करते हैं:

  • P(C)=0.19
  • P(A|C)=P(B|C)=0.10.190.53
  • P(A and B|C)=0.010.190.053
  • P(A|C)P(B|C)0.28

स्पष्ट रूप से, जब C, और B पर वातानुकूलित किया जाता है, स्वतंत्र होने से बहुत दूर हैं। दरअसल, C, n o t A पर वातानुकूलित " B " को "कारण" लगता है ।ABnotAB

यदि आप उन व्यक्तियों की सूची का उपयोग करते हैं जो अपने डॉक्टर (ओं) द्वारा विश्लेषण के लिए डेटा स्रोत के रूप में दर्ज किए जाते हैं, तो बीमारियों और बी के बीच एक मजबूत सहसंबंध प्रतीत होता है । आप इस तथ्य से अवगत नहीं हो सकते हैं कि आपका डेटा स्रोत वास्तव में एक कंडीशनिंग है। इसे "चयन पूर्वाग्रह" भी कहा जाता है।AB


13

चौथा बिंदु बर्कसन के विरोधाभास का एक उदाहरण है , जिसे एक कोलाइडर पर कंडीशनिंग के रूप में भी जाना जाता है, जिसे समझा-समझा घटना के रूप में भी जाना जाता है

AttractiveAcceptCharming
AttractiveCharming दोनों कारणसीसीपीटी, जो 0 या 1 के मूल्यों पर ले जाता है अगर महिला क्रमशः तारीख प्रस्ताव को अस्वीकार या स्वीकार करती है।

हम उस से ऊपर माना जाता है टीटीआरसीटीमैंv तथा सीआरमैंnजी are independent in the population of date-proposing men. But are they still independent if we consider only the men whose proposals the woman accepted? In other words, we condition on Accept=1. Now suppose I tell you about a man who the woman agreed to date, and I tell you that he is (in the woman's opinion) not attractive at all. Well, we know that the woman agreed to date him anyway, so we would reasonably infer that he must be quite charming indeed. Conversely, if we learn about a man whose date proposal was accepted and who is not charming, we would reasonably infer that he must be quite attractive.

Do you see what's happened here? By conditioning on Accept=1, we've induced a negative correlation between Attractive and Charming, even though these two traits are (by assumption) marginally independent. From the perspective of the woman, the attractive men she dates tend to be less charming, and the charming men she dates tend to be less attractive. But this is because, by thinking only of the men she has dated, she is implicitly conditioning on Accept. If she would instead consider all the men who have proposed dates, regardless of whether she accepted the proposal, she would see that there is no statistical association between the two traits.


5

Simpson's paradox and Berkson's paradox can each give examples of "A and B both cause C, which is (explicitly or implicitly) conditioned on"

As an example suppose I have 1000 stamps in my collection of which 100 are rare (10%) and 200 are pretty (20%). If there is no intrinsic relationship between rarity and prettiness, it might turn out 20 of my stamps are both pretty and rare.

If I now display my 280 interesting stamps, i.e. those which are rare or pretty or both, there will be an apparent negative correlation between rarity and prettiness (20% of displayed rare stamps are pretty while 100% of displayed common stamps are pretty) due entirely to conditioning on being interesting.


This is an example Berkson's paradox, not Simpson's paradox (see my answer).
Jake Westfall

@JakeWestfall You are probably right - I knew I had written the stamps example before somewhere but forgotten where and it turns out to be the Wikipedia page for Berkson's paradox
Henry

4

The paragraph starts with "For any two correlated events, A and B,...", so my guess is that correlation is assumed at the beginning. In other words, they need not be correlated to simultaneously cause C, but if they were correlated and they did both cause C, it does not imply that there exists a causal relationship between them.

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.