दो क्रमिक चर के बीच संबंध को दर्शाने के लिए एक उपयुक्त ग्राफ क्या है?
कुछ विकल्प जो मैं सोच सकता हूं:
- एक दूसरे को छिपाने वाले बिंदुओं को रोकने के लिए जोड़ा गया यादृच्छिक घबराना के साथ स्कैटर प्लॉट। जाहिर तौर पर एक मानक ग्राफिक - मिनिटैब इसे "व्यक्तिगत मूल्यों की साजिश" कहता है। मेरी राय में यह भ्रामक हो सकता है क्योंकि यह नेत्रहीन रूप से क्रमिक स्तरों के बीच एक प्रकार के रैखिक प्रक्षेप को प्रोत्साहित करता है, जैसे कि डेटा अंतराल पैमाने से था।
- स्कैटर प्लॉट को अनुकूलित किया गया ताकि बिंदु का आकार (क्षेत्र) प्रत्येक नमूना इकाई के लिए एक बिंदु को खींचने के बजाय स्तरों के उस संयोजन की आवृत्ति का प्रतिनिधित्व करे। मैंने कभी-कभी व्यवहार में ऐसे भूखंड देखे हैं। वे पढ़ने में कठिन हो सकते हैं, लेकिन अंक एक नियमित रूप से फैलाने वाले जाली पर झूठ बोलते हैं जो कुछ हद तक घबराए हुए तितर बितर साजिश की आलोचना को खत्म करता है कि यह नेत्रहीन "डेटा को बाधित करता है"।
- विशेष रूप से यदि चर में से एक को आश्रित माना जाता है, तो स्वतंत्र चर के स्तरों द्वारा वर्गीकृत एक बॉक्स प्लॉट। आश्रित दिखने के लिए यदि आश्रित चर के स्तर की संख्या पर्याप्त रूप से अधिक नहीं है (बहुत "फ्लैट" लापता मूंछ या बहुत खराब ढहने वाली चतुर्थक के साथ जो कि मध्ययुगीन की दृश्य पहचान को असंभव बनाता है) नहीं है, लेकिन कम से कम मध्ययुगीन और चतुर्थक पर ध्यान आकर्षित करता है जो कि हैं एक प्रासंगिक चर के लिए प्रासंगिक वर्णनात्मक आँकड़े।
- आवृत्ति को इंगित करने के लिए हीट टेबल के साथ मूल्यों की तालिका या कोशिकाओं के रिक्त ग्रिड। दृष्टि भिन्न और वैचारिक रूप से फ़्रीक्वेंसी दिखाने वाले बिंदु क्षेत्र के साथ स्कैटर प्लॉट के समान है।
क्या अन्य विचार या विचार हैं, जिन पर भूखंड बेहतर हैं? क्या अनुसंधान के ऐसे कोई क्षेत्र हैं जिनमें कुछ निश्चित-आर्डिनल-ऑर्डिनल भूखंडों को मानक माना जाता है? (मुझे याद है कि आवृत्ति हीटमैप जीनोमिक्स में व्यापक है, लेकिन संदेह है कि नाममात्र-बनाम-नाममात्र के लिए अधिक बार है।) एक अच्छे मानक संदर्भ के लिए सुझाव भी बहुत स्वागत करेंगे, मैं एगेस्टी से कुछ अनुमान लगा रहा हूं।
यदि कोई किसी प्लॉट के साथ चित्रण करना चाहता है, तो फर्जी नमूना डेटा के लिए आर कोड।
"आपके लिए व्यायाम कितना महत्वपूर्ण है?" 1 = सभी महत्वपूर्ण नहीं, 2 = कुछ महत्वहीन, 3 = न तो महत्वपूर्ण और न ही महत्वहीन, 4 = कुछ महत्वपूर्ण, 5 = बहुत महत्वपूर्ण।
"आप नियमित रूप से 10 मिनट या उससे अधिक समय तक कैसे दौड़ते हैं?" 1 = कभी नहीं, 2 = एक पखवाड़े से कम, 3 = एक बार हर एक या दो सप्ताह, प्रति सप्ताह 4 = दो या तीन बार, प्रति सप्ताह 5 = चार या अधिक बार।
यदि एक आश्रित चर के रूप में "अक्सर" और एक स्वतंत्र चर के रूप में "महत्व" का व्यवहार करना स्वाभाविक होगा, अगर एक भूखंड दोनों के बीच अंतर करता है।
importance <- rep(1:5, times = c(30, 42, 75, 93, 60))
often <- c(rep(1:5, times = c(15, 07, 04, 03, 01)), #n=30, importance 1
rep(1:5, times = c(10, 14, 12, 03, 03)), #n=42, importance 2
rep(1:5, times = c(12, 23, 20, 13, 07)), #n=75, importance 3
rep(1:5, times = c(16, 14, 20, 30, 13)), #n=93, importance 4
rep(1:5, times = c(12, 06, 11, 17, 14))) #n=60, importance 5
running.df <- data.frame(importance, often)
cor.test(often, importance, method = "kendall") #positive concordance
plot(running.df) #currently useless
निरंतर चर के लिए एक संबंधित प्रश्न मुझे उपयोगी लगा, शायद एक उपयोगी प्रारंभिक बिंदु: दो संख्यात्मक चर के बीच संबंध का अध्ययन करते समय स्क्रैपप्लेट के विकल्प क्या हैं?