एक सामान्य और एक सतत यादृच्छिक चर के बीच सहयोग की गैर-पैरामीट्रिक माप


12

मैं समस्या को यहाँ फेंक रहा हूँ जैसा कि मैंने प्राप्त किया।

मेरे पास दो यादृच्छिक चर हैं। जिनमें से एक निरंतर (Y) है और दूसरा वह जो असतत है और उसे ordinal (X) के रूप में जाना जाएगा । मैंने क्वेरी के साथ प्राप्त किए गए प्लॉट के नीचे रखा।

यहाँ छवि विवरण दर्ज करें

वह व्यक्ति जो मुझे डेटा भेजता है, वह X और Y के बीच जुड़ाव की ताकत को मापना चाहता है । मैं उन विचारों की तलाश कर रहा हूं जो डेटा उत्पन्न करने वाली प्रक्रियाओं के बारे में मान्यताओं से भरा हुआ नहीं होगा। ध्यान दें कि यह संबंध की ताकत (बूटस्ट्रैप में) का परीक्षण करने के लिए एक गैर पैरामीट्रिक तरीका खोजने के बारे में नहीं है, बल्कि इसे मापने के लिए एक गैर पैरामीट्रिक तरीका खोजने के बारे में है।

दूसरी ओर, दक्षता कोई समस्या नहीं है क्योंकि बहुत सारे डेटा बिंदु हैं।


1
X (असतत चर) क्रमिक है या नहीं?
पीटर Flom

@PeterFlom: धन्यवाद। हाँ। मैं इसे सवाल से जोड़ता हूं।
user603

क्या "नॉनपैमेट्रिक" से आपका मतलब यहाँ है कि माध्य या विचरण की कोई गणना की अनुमति नहीं है?
tnnphns

जवाबों:


8

परिभाषा के अनुसार, क्रमिक पैमाना वह गेज होता है जिसमें पायदानों के बीच की सही दूरी 1 2 3 4अज्ञात होती है। यह ऐसा है जैसे आप ड्रग्स / अल्कोहल के तहत एक शासक को देख रहे हैं। सच्ची दूरियां कोई भी हो सकती हैं। यह हो सकता है 1 2 3 4या 1 2 3 4या जो कुछ भी। हम एक आंकड़े की गणना नहीं कर सकते - जैसे कि सहसंबंध - जब तक कि दूरी तय न करें, उन्हें ठीक करें।

rrhorrhor

rr"इष्टतम स्केलिंग को श्रेणीबद्ध प्रतिगमन (CATREG) में किया जा सकता है। हालांकि, श्रेणीबद्ध प्रतिगमन के लिए आवश्यक है कि अन्य इनपुट चर असतत हो (जरूरी नहीं कि सामान्य हो) और इसलिए यदि यह लगातार कई अनूठे मान रखता है तो आपको मनमाने ढंग से बायन करना होगा। ।

अन्य दृष्टिकोण भी हैं। लेकिन किसी भी तरह से, हम क्रमिक पैमाने को "इसलिए ..." (कुछ धारणा या कुछ लक्ष्य) के रूप में बदल देते हैं, क्योंकि एक अनजान तरीके से अध्यादेश पैमाने हमारे लिए विकृत है। मूल रूप से एक और निर्णय पहले "शांत" करना होगा और यह तय करना होगा कि यह या तो विकृत नहीं है (यानी यह अंतराल है), या ज्ञात तरीके से विकृत है (कोई भी नहीं है), या नाममात्र है।

कुछ असममित दृष्टिकोणों में अन्य (अंतराल / निरंतर) एक द्वारा क्रमिक चर के क्रमिक प्रतिगमन शामिल हो सकते हैं। या क्रमिक एक द्वारा उत्तरार्द्ध का रैखिक प्रतिगमन, उस मॉडल के साथ जहां भविष्यवक्ता को बहुपद विपरीत (यानी, के रूप में दर्ज किया गया b1X + b2X^2 + b3X^3,...) के रूप में लिया जाता है । इन तरीकों की कमजोरी यह है कि वे असममित हैं: एक चर निर्भर है, दूसरा स्वतंत्र है।


धन्यवाद; बहुत अच्छा विचार, केवल एक चर पर रैंकों की गणना करना।
user603

6

di=xiyixiyi

rS=16i=1ndi2n(n21)

XY


संदर्भ

रेशेफ, डी।, रेशेफ, वाई।, फिनकेन, एच।, ग्रॉसमैन, एस।, मैकवेन, जी।, टर्नबॉफ, पी।, लैंडर, ई।, मिटज़ेनमाकर, एम।, और सबेटी, पी। (2011)। बड़े डेटा सेट में उपन्यास संघों का पता लगाना। विज्ञान , 334 (6062): 1518-1524।

रेशेफ, डी।, रेशेफ, वाई।, मिटज़ेनमाकर, एम।, और सबेटी, पी। (2013)। तुलना के साथ, अधिकतम जानकारी गुणांक की समानता विश्लेषणarXiv , 14 अगस्त।


दोनों बहुत अच्छे विचारों की तरह दिखते हैं। वास्तव में, जिन दो तरीकों का आप प्रस्ताव करते हैं, वे एक दूसरे के पूरक भी हैं । मैं थोड़ी देर बाद भी सवाल खुला छोड़ दूंगा।
user603
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.