मेरे क्षेत्र में युग्मित डेटा को प्लॉट करने का सामान्य तरीका पतली ढलान वाली रेखा सेगमेंट की एक श्रृंखला के रूप में है, यह दो समूहों के लिए माध्यिका और CI के मध्य के साथ ओवरले करता है:
हालाँकि, इस तरह के कथानक को पढ़ना बहुत कठिन हो जाता है क्योंकि डेटापॉइंट की संख्या बहुत बड़ी हो जाती है (मेरे मामले में मेरे पास 10000 जोड़े के आदेश पर है):
अल्फा को कम करने से थोड़ी मदद मिलती है, लेकिन यह अभी भी महान नहीं है। एक समाधान की खोज करते हुए मैं इस पत्र के पार आया , और 'समानांतर लाइन प्लॉट' को लागू करने का प्रयास करने का निर्णय लिया। फिर, यह छोटे अंकों के लिए बहुत अच्छी तरह से काम करता है:
लेकिन इस तरह के कथानक को बनाने के लिए यह और भी कठिन है जब बहुत बड़ी है:
मुझे लगता है कि मैं अलग से दो समूहों के लिए वितरण दिखा सकता हूँ, उदाहरण के लिए बॉक्सप्लॉट्स या वायलिन के साथ, और दो मध्यस्थों / CI को दिखाने वाले शीर्ष पर एररबार के साथ एक लाइन प्लॉट कर सकता हूं, लेकिन मुझे वास्तव में यह विचार पसंद नहीं है, क्योंकि यह व्यक्त नहीं करेगा। डेटा की युग्मित प्रकृति।
मैं 2 डी स्कैटर प्लॉट के विचार के बारे में अधिक उत्सुक नहीं हूं: मैं एक अधिक कॉम्पैक्ट प्रतिनिधित्व पसंद करूंगा, और आदर्श रूप से एक जिसमें दो समूहों के लिए मान एक ही अक्ष के साथ प्लॉट किए जाते हैं। पूर्णता की खातिर, यहाँ डेटा एक 2D बिखराव जैसा दिखता है:
क्या किसी को बहुत बड़े नमूना आकार के साथ युग्मित डेटा का प्रतिनिधित्व करने का एक बेहतर तरीका पता है? क्या आप मुझे कुछ उदाहरणों से जोड़ सकते हैं?
संपादित करें
क्षमा करें, मैंने स्पष्ट रूप से यह समझाने के लिए एक अच्छा काम नहीं किया है कि मैं क्या देख रहा हूँ। हां, 2 डी स्कैटर प्लॉट काम करता है, और ऐसे कई तरीके हैं जिनसे अंकों के घनत्व को बेहतर बनाने के लिए इसमें सुधार किया जा सकता है - मैं कर्नेल घनत्व अनुमान के अनुसार डॉट्स को कलर-कोड कर सकता हूं, मैं 2 डी हिस्टोग्राम कर सकता हूं , मैं डॉट्स इत्यादि के शीर्ष पर कंट्रोल्स को प्लॉट कर सकता था, आदि ...
हालाँकि, मुझे लगता है कि यह संदेश के लिए ओवरकिल है जिसे मैं व्यक्त करने की कोशिश कर रहा हूं। मैं वास्तव में प्रति अंक के 2 डी घनत्व को दिखाने के बारे में परवाह नहीं करता हूं - मुझे बस इतना करना है कि यह दिखाने के लिए कि 'बार' के लिए मान आमतौर पर 'डॉट्स' के लिए उन लोगों की तुलना में बड़े होते हैं, जितना संभव हो उतना सरल और स्पष्ट तरीका है। , और डेटा की आवश्यक बनती प्रकृति को खोए बिना। आदर्श रूप से मैं ऑर्थोगोनल कुल्हाड़ियों के बजाय एक ही साथ दो समूहों के लिए युग्मित मूल्यों की साजिश करना चाहता हूं, क्योंकि इससे उनकी तुलना करना आसान हो जाता है।
शायद स्कैटर प्लॉट से बेहतर कोई विकल्प नहीं है, लेकिन मैं जानना चाहूंगा कि क्या कोई विकल्प है जो काम कर सकता है।
bar
क्षैतिज औरdot
ऊर्ध्वाधर अक्ष पर स्कैल्पलॉट के रूप में संबंधित मानों को प्लॉट करने की कोशिश की है ?