मैं एक डेटा विज़ुअलाइज़ेशन बना रहा हूं। प्रत्येक डेटाम को एक वर्ग द्वारा दर्शाया गया है। अंतर्निहित डेटा को सहज रूप से सुपाठ्य बनाने के लिए प्रत्येक वर्ग की लंबाई या प्रत्येक वर्ग के क्षेत्र को उस प्रतिनिधित्व करने वाले डेटम के आनुपातिक होना चाहिए?
मैं एक डेटा विज़ुअलाइज़ेशन बना रहा हूं। प्रत्येक डेटाम को एक वर्ग द्वारा दर्शाया गया है। अंतर्निहित डेटा को सहज रूप से सुपाठ्य बनाने के लिए प्रत्येक वर्ग की लंबाई या प्रत्येक वर्ग के क्षेत्र को उस प्रतिनिधित्व करने वाले डेटम के आनुपातिक होना चाहिए?
जवाबों:
यदि आप, निर्माता, अनिश्चित हैं, तो पाठक को कैसे पता चलेगा कि यह कौन है?
संक्षिप्त उत्तर: मूल्य पृष्ठ पर 1: 1 रंग की मात्रा से जुड़ा होना चाहिए । तो आपके उदाहरण में, यह क्षेत्र होना चाहिए। लेकिन इससे कहीं अधिक है: आपको भ्रामक संकेतों से बचने की भी आवश्यकता है जो एक पाठक को गलत तरीके से पढ़ा सकता है, और आपको यह जानने की आवश्यकता है कि आप लंबाई (जैसे बार चार्ट) के बजाय क्षेत्र का उपयोग क्यों कर रहे हैं, क्योंकि इसमें वास्तविक पेशेवरों और विपक्ष हैं।
सबसे पहले, कभी भी लंबाई और चौड़ाई (यानी क्षेत्र) दोनों में परिवर्तन नहीं होता है जब वास्तव में चर केवल एक तरफ की लंबाई से जुड़ा होता है। यदि X डबल वाई है, लेकिन पेज पर Y का रंग चार गुना है, तो आप अपने पाठकों को भ्रमित कर रहे हैं। इस तरह की विकृति को कभी-कभी " झूठ कारक " के रूप में जाना जाता है , और अक्सर मतभेदों को भ्रमित करने और अतिरंजित करने के लिए एक जानबूझकर प्रयास माना जाता है।
यदि आप एक उपाय के रूप में क्षेत्र का उपयोग करते हैं तो मैं दृढ़ता से अनुशंसा करूंगा:
यह जानते हुए कि आप क्षेत्र का उपयोग क्यों कर रहे हैं । लंबाई जैसे रैखिक आयाम के बजाय क्षेत्र का उपयोग करके, आप:
क्षेत्र के लिए हलकों का उपयोग करने पर विचार करें, वर्गों पर नहीं, केंद्र संरेखित करें :
उदाहरण के लिए, ऊपर, "5" लेबल वाले वर्ग को तीन चौथाई "10" लेबल वाले वर्ग की ऊंचाई के रूप में नहीं देखना मुश्किल है, इसलिए यह संभावित रूप से भ्रामक है।
मंडलियां इस तरह की तुलना को आमंत्रित नहीं करती हैं: यह एक आंत-स्तर से अधिक है, तुरंत "यह बूँद अगले बूँद की तुलना में बहुत बड़ी है"।
उपयोगकर्ता के परीक्षण से लेकर छोटे स्तर के अध्ययन तक कई तरह के सबूत हैं (बाद में कुछ उदाहरणों का शिकार करने की कोशिश करेंगे) कि इस तरह के सहज ज्ञान युक्त क्षेत्र-आधारित तुलना अधिक आकर्षक हो सकती है, कम व्यस्त दर्शकों के लिए प्रवेश में बाधा को कम कर सकती है, और कर सकती है नंबरों की ठंड minutiae के बजाय विषय पर पाठक का ध्यान केंद्रित रखने में मदद करें। लेकिन यह अधिक संख्यात्मक रूप से दिमाग के विश्लेषण के रास्ते में आने की लागत पर आता है।
सौंदर्य कारणों से एक-आयाम (लंबाई या दूरी) और दो-आयाम (क्षेत्र) के बीच चयन न करें: अपने दर्शकों और संदेश के आधार पर उनके बीच चयन करें।
जो संचार के लिए अधिक उपयुक्त है: "जो बहुत बड़ा है" के स्तर पर तत्काल आंत-स्तर की तुलना, या "जो कि अन्य एक का लगभग 80% है" के स्तर पर अधिक संख्यात्मक तुलना की जाती है?
या क्या व्यावहारिक कारण हैं कि आपको क्षेत्र का उपयोग करने की आवश्यकता क्यों है?
फिर, जब आपने व्यावहारिक कारणों के लिए चुना है, तो सौंदर्यशास्त्र लागू करें।
मैं क्षेत्र कहूंगा। वैकल्पिक रूप से, एक वर्ग जिसमें दो बार लंबे समय के रूप में एक क्षेत्र के रूप में 4 बार बड़ा दिखाता है। आकस्मिक प्रेक्षक क्षेत्र से संबंधित होंगे, यहां तक कि आपकी किंवदंती को पढ़े बिना भी।
एक अच्छा उदाहरण है xkcd के रैंडल मुनरो द्वारा किया गया यह शानदार ग्राफ :
हम क्षेत्र में अंतर को देखते हुए उतने अच्छे नहीं हैं जितना कि हम लंबाई में हैं। हम लंबाई को एक छद्म के रूप में उपयोग करते हैं और इसलिए क्षेत्रों में अंतर को कम आंकते हैं।
इस कारण से, एक सर्कल जिसमें वास्तव में 2x है, दूसरे का क्षेत्र बहुत छोटा दिखाई देता है क्योंकि हमारा मस्तिष्क उनकी त्रिज्या से संबंधित है, जो 1.4x के कारक से भिन्न होता है।
इस घटना को समेटने के दिलचस्प प्रयास हैं, जैसे कि आनुपातिक प्रतीक मानचित्रण आर में , जो प्रतीकों की अवधारणात्मक स्केलिंग को और अधिक बारीकी से संरेखित करने का प्रस्ताव करता है कि हम लंबाई और क्षेत्रों को कैसे आंकते हैं।
यहाँ इस पत्र से अंजीर 2 है
व्यक्तिगत रूप से मुझे इससे कोई अनुभव नहीं है और यदि मात्रात्मक निर्णय आवश्यक हैं तो क्षेत्रों का उपयोग करने से बचें।
एक दिलचस्प स्पर्शरेखा मात्रा और लंबाई की धारणा के बीच का संबंध है। हम इनको कैसे समझते हैं, इसका अंतर और भी अधिक है। यह स्टार आकार की तुलना के इस वीडियो में चित्रित किया जा सकता है ।
जब तक आप सबसे बड़े तारे तक पहुँच जाते हैं, जो कि सूर्य के व्यास से लगभग 1,700x है, आप इस धारणा से बचे हुए हैं कि यह 1,700x से बहुत बड़ा है।
क्षेत्रों और लंबाई में अंतर को समझने में हमारी त्रुटि को और अधिक व्यवस्थित रूप से देखने के लिए, क्राउडसोर्सिंग ग्राफिकल धारणा: जेफरी हीर और माइकल बोस्कॉक द्वारा विज़ुअलाइज़ेशन डिज़ाइन का आकलन करने के लिए मैकेनिकल तुर्क का उपयोग करना ।
मेरी राय में क्षेत्र (डी), प्रत्येक पक्ष (ई) नहीं।
यदि आप लंबाई 2 के किनारे का उपयोग कर रहे हैं, तो क्षेत्र का 4 गुना मूल्य होगा और आपके पास एक अतिव्यापी ग्राफ़ होगा। (इ)
जब आपके पास एक सामान्य बार ग्राफ (ए) होता है, तो डेटा रैखिक होता है, और बार के साथ सिर्फ एस्थेटिक के लिए होता है। (बी)
उन मामलों में क्षेत्र फिर से डेटा का प्रतिनिधि है क्योंकि सलाखों के साथ समान हैं। आपके पास एक 3D बार हो सकता है और फिर भी बार की मात्रा डेटा (C) का प्रतिनिधित्व करने वाला है
Tufte ने इससे बड़े पैमाने पर निपटा। देख:
चित्रमय अखंडता के कुछ सिद्धांत:
- संख्याओं का प्रतिनिधित्व, जैसा कि भौतिक रूप से ग्राफ की सतह पर मापा जाता है, का प्रतिनिधित्व संख्यात्मक मात्राओं के सीधे आनुपातिक होना चाहिए
- स्पष्ट, विस्तृत और संपूर्ण लेबलिंग का उपयोग ग्राफिकल विरूपण और अस्पष्टता को हराने के लिए किया जाना चाहिए। ग्राफ पर डेटा के स्पष्टीकरण को ही लिखें। डेटा में महत्वपूर्ण घटनाओं को लेबल करें।
- डेटा भिन्नता दिखाएं, डिज़ाइन भिन्नता नहीं।
- पैसे की समय-श्रृंखला के प्रदर्शन में, मौद्रिक माप की अपस्फीति और मानकीकृत इकाइयां नाममात्र इकाइयों की तुलना में लगभग हमेशा बेहतर होती हैं।
- दर्शाई गई जानकारी (चर) आयामों की संख्या डेटा में आयामों की संख्या से अधिक नहीं होनी चाहिए। ग्राफिक्स को संदर्भ से बाहर डेटा उद्धृत नहीं करना चाहिए।
अपने मामले में आपको अपने आप से पूछना होगा कि क्या डेटा को 2 डी या 3 डी छवि या एक पंक्ति द्वारा बेहतर रूप से दर्शाया गया है। एक घन, एक वर्ग और एक रेखा समान नहीं हैं। यही कारण है कि 3 डी बार चार्ट इतनी बार भ्रामक हैं।