एक ऑनलाइन मॉड्यूल मैं अध्ययन कर रहा हूं कि किसी को अनुपात डेटा के साथ पियर्सन सहसंबंध का उपयोग नहीं करना चाहिए । क्यों नहीं?
या, अगर यह कभी-कभी ठीक है या हमेशा ठीक है, क्यों?
एक ऑनलाइन मॉड्यूल मैं अध्ययन कर रहा हूं कि किसी को अनुपात डेटा के साथ पियर्सन सहसंबंध का उपयोग नहीं करना चाहिए । क्यों नहीं?
या, अगर यह कभी-कभी ठीक है या हमेशा ठीक है, क्यों?
जवाबों:
यह एक ऐसे मामले के लिए है जब प्रत्येक अवलोकन में कई चर एक साथ 1 हो जाते हैं। मेरा उत्तर अंतर्ज्ञान-स्तर होगा; यह जानबूझकर है (और यह भी, मैं संरचनागत डेटा का विशेषज्ञ नहीं हूं)।
आइए हमारे पास आइड (इसलिए शून्य-सहसंबद्ध) सकारात्मक-मूल्यवान चर हैं जिन्हें हम तब जोड़ते हैं और उस राशि के अनुपात के रूप में पुनर्मूल्यांकन करते हैं। फिर,
each V summing to 1 ( 100%)
माफ़ कीजियेगा? मैं तुम्हें समझ नहीं पाया। मैंने अलग-अलग V पर कोई बाधा नहीं डाली, केवल एक अंश था। हालाँकि, प्रारंभिक बाधा यह थी कि मेरा उदाहरण शून्य बनाम सहसंबंधों को भिन्नों में बदलना है।
आपकी टिप्पणी का वीडियो लिंक रचनाओं के संदर्भ को निर्धारित करता है , जिसे मिश्रण भी कहा जा सकता है । इन मामलों में, प्रत्येक घटक के अनुपात का योग 1 तक होता है। उदाहरण के लिए, वायु 78% नाइट्रोजन, 21% ऑक्सीजन, और 1% अन्य (कुल 100%) है। यह देखते हुए कि एक घटक की मात्रा पूरी तरह से दूसरों द्वारा निर्धारित की जाती है, किसी भी दो घटकों का एक आदर्श बहु-रैखिक संबंध होगा। वायु उदाहरण के लिए, हमारे पास:
तो फिर:
इसलिए यदि आप किसी दो घटक को जानते हैं, तो तीसरा तुरंत ज्ञात हो जाता है।
सामान्य तौर पर, मिश्रण पर बाधा है
आप दो घटकों के बीच एक सहसंबंध की गणना कर सकते हैं, लेकिन जानकारीपूर्ण नहीं है , क्योंकि वे हमेशा सहसंबद्ध होते हैं। आप आनुपातिक रचना के रूप में मापा गया विश्लेषण डेटा में रचना विश्लेषण के बारे में अधिक पढ़ सकते हैं ।
आप अनुपात का उपयोग कर सकते हैं जब अनुपात डेटा विभिन्न डोमेन से होते हैं। कहें कि आपकी प्रतिक्रिया एलसीडी स्क्रीन पर मृत पिक्सेल का अंश है। आप इसे सहसंबद्ध करने की कोशिश कर सकते हैं, कहते हैं, स्क्रीन के रासायनिक प्रसंस्करण चरण में उपयोग किए जाने वाले हीलियम का अंश।
Given that the amount of one component is completely determined by the others, any two components will have a perfect co-linear relationship
स्पष्ट नहीं है। क्या आप इसका विस्तार कर सकते हैं?
यह एक गहरा प्रश्न है, और कुछ सूक्ष्मताओं के साथ जो कहा जाना चाहिए। मैं अपनी पूरी कोशिश करूँगा, लेकिन फिर भी मैंने इस विषय पर प्रकाशित किया है ( आनुपातिकता: सापेक्ष डेटा के लिए सहसंबंध के लिए एक वैकल्पिक विकल्प ) मैं हमेशा केवल सापेक्ष जानकारी वाले डेटा के विश्लेषण पर नई अंतर्दृष्टि से आश्चर्यचकित होने के लिए तैयार हूं।
जैसा कि इस धागे के योगदानकर्ताओं ने बताया है, संरचना संबंधी डेटा पर लागू होने के दौरान सहसंबंध कुख्यात (कुछ मंडलियों में) निरर्थक होता है जो तब उत्पन्न होता है जब घटकों का एक सेट निरंतर में जोड़ने के लिए विवश होता है (जैसा कि हम अनुपात, प्रतिशत के साथ देखते हैं,) भागों-प्रति-मिलियन, आदि)।
कार्ल पियर्सन ने इस बात को ध्यान में रखते हुए शब्द का सहसंबंध बनाया । (ध्यान दें: टायलर विगेन के लोकप्रिय स्पुरियस सहसंबंध साइट के बारे में इतना नहीं है कि यह सहसंबंध के रूप में " सहसंबंध का अर्थ है कारण " गिरावट )।
Aitchison's की धारा 1.7 (2003) कम्पोजल डेटा एनालिसिस के लिए एक संक्षिप्त गाइड इस संबंध में क्लासिकल डेटा (सुविधा के लिए, इस पूरक सूचना में उद्धृत के लिए सहसंबंध का एक अनुचित माप क्यों है) का एक क्लासिक चित्रण प्रदान करता है ।
समग्र डेटा न केवल तब उत्पन्न होता है जब गैर-नकारात्मक घटकों का एक सेट एक स्थिर राशि के लिए बनाया जाता है; जब भी वे केवल सापेक्ष जानकारी ले जाते हैं, तो डेटा को रचना कहा जाता है।
मुझे लगता है कि डेटा की सहसंबंध के साथ मुख्य समस्या जो केवल सापेक्ष जानकारी लेती है, परिणाम की व्याख्या में है। यह एक ऐसा मुद्दा है जिसे हम एक एकल चर के साथ चित्रित कर सकते हैं; मान लीजिए कि दुनिया के देशों में "डोनट्स प्रति डॉलर जीडीपी का उत्पादन होता है"। यदि एक राष्ट्र का मूल्य दूसरे से अधिक है, तो ऐसा इसलिए है क्योंकि
...कौन कह सकता है?
बेशक, जैसा कि लोग इस धागे पर टिप्पणी करते हैं, एक वर्णनात्मक चर के रूप में चर के इन प्रकारों के सहसंबंधों की गणना कर सकता है । लेकिन ऐसे सहसंबंधों का क्या मतलब है?
मेरा भी यही सवाल था। मुझे यह संदर्भ बायोरैक्सिव उपयोगी लगा:
लवेल डी।, वी। पॉलोव्स्की-ग्लेन, जे। इगोज़क्यिफ़, एस। मार्गुएरेट, जे। ब्हलर (2014),
"आनुपातिकता: रिश्तेदार डेटा के लिए सहसंबंध का एक वैध विकल्प"
इस पत्र (लवेल, डेविड, एट अल; डीयू: dx.doi.org/10.1101/008417) की सहायक जानकारी में, लेखकों का उल्लेख है कि रिश्तेदार बहुतायत के बीच संबंध कुछ मामलों में कोई जानकारी प्रदान नहीं करते हैं। वे दो mRNA अभिव्यक्तियों के सापेक्ष बहुतायत का उदाहरण देते हैं। चित्रा S2 में, दो अलग-अलग mRNAs के सापेक्ष बहुतायत पूरी तरह से नकारात्मक रूप से सहसंबद्ध हैं, भले ही इन दो mRNA का पूर्ण मूल्यों में संबंध नकारात्मक रूप से संबंधित नहीं है (हरे बिंदु और बैंगनी बिंदु)।
शायद यह आपकी मदद कर सके।