या तो क्षेत्र या एक वर्ग की लंबाई उस डेटा के आनुपातिक होनी चाहिए जो कल्पना की जा रही है?


16

मैं एक डेटा विज़ुअलाइज़ेशन बना रहा हूं। प्रत्येक डेटाम को एक वर्ग द्वारा दर्शाया गया है। अंतर्निहित डेटा को सहज रूप से सुपाठ्य बनाने के लिए प्रत्येक वर्ग की लंबाई या प्रत्येक वर्ग के क्षेत्र को उस प्रतिनिधित्व करने वाले डेटम के आनुपातिक होना चाहिए?


1
अभी नहीं। क्या यह व्यापक है? मैं उम्मीद कर रहा था कि उत्तर निश्चित था (मैं इसे "क्षेत्र" मान रहा हूं), लेकिन उस लोक में अधिक ग्राफिक डिजाइन और अवधारणात्मक मनोविज्ञान ज्ञान होगा जो इसे वापस करेगा।
dumbledad

1
IIRC यह एक जर्मन पुस्तक में कवर किया गया था, जिसे मैंने एक बार पढ़ा था, "so lgg man mit Statistik" by en.wikipedia.org/wiki/Walter_Krämer - अगर एक अंग्रेजी समकक्ष नहीं है, तो सुनिश्चित करें। टीएल; डीआर - इस बात पर निर्भर करता है कि आप अपने पाठकों को विज़ुअलाइज़ेशन से क्या पढ़ना चाहते हैं।
माइकल शूमाकर

उत्तर निश्चित रूप से निश्चित नहीं है। यह सब बारीकियों पर निर्भर करता है - अर्थात् आप जो डेटा प्रस्तुत कर रहे हैं, आप कैसे प्रस्तुत कर रहे हैं, और आप क्या कहा डेटा के साथ संवाद करना चाहते हैं।
DA01

क्या आप ऐसे उदाहरण दे सकते हैं, जहां हम विशिष्ट या पाठकों को विज़ुअलाइज़ेशन से पढ़ना चाहते हैं, जो हमें वर्ग के क्षेत्र के बजाय डेटम के लिए एक वर्ग के आनुपातिक की लंबाई बनाने के लिए चुनने का नेतृत्व करेंगे?
dumbledad

5
+1 क्यों हर दिलचस्प सवाल कम से कम एक करीबी वोट को आकर्षित करता है? <grump>
user56reinstatemonica8

जवाबों:


10

यदि आप, निर्माता, अनिश्चित हैं, तो पाठक को कैसे पता चलेगा कि यह कौन है?

संक्षिप्त उत्तर: मूल्य पृष्ठ पर 1: 1 रंग की मात्रा से जुड़ा होना चाहिए । तो आपके उदाहरण में, यह क्षेत्र होना चाहिए। लेकिन इससे कहीं अधिक है: आपको भ्रामक संकेतों से बचने की भी आवश्यकता है जो एक पाठक को गलत तरीके से पढ़ा सकता है, और आपको यह जानने की आवश्यकता है कि आप लंबाई (जैसे बार चार्ट) के बजाय क्षेत्र का उपयोग क्यों कर रहे हैं, क्योंकि इसमें वास्तविक पेशेवरों और विपक्ष हैं।


सबसे पहले, कभी भी लंबाई और चौड़ाई (यानी क्षेत्र) दोनों में परिवर्तन नहीं होता है जब वास्तव में चर केवल एक तरफ की लंबाई से जुड़ा होता है। यदि X डबल वाई है, लेकिन पेज पर Y का रंग चार गुना है, तो आप अपने पाठकों को भ्रमित कर रहे हैं। इस तरह की विकृति को कभी-कभी " झूठ कारक " के रूप में जाना जाता है , और अक्सर मतभेदों को भ्रमित करने और अतिरंजित करने के लिए एक जानबूझकर प्रयास माना जाता है।

यहाँ छवि विवरण दर्ज करें


यदि आप एक उपाय के रूप में क्षेत्र का उपयोग करते हैं तो मैं दृढ़ता से अनुशंसा करूंगा:

  • यह जानते हुए कि आप क्षेत्र का उपयोग क्यों कर रहे हैं । लंबाई जैसे रैखिक आयाम के बजाय क्षेत्र का उपयोग करके, आप:

    • गणितीय रूप से मतभेदों को स्पष्ट रूप से देखने की क्षमता का त्याग करें (आप आसानी से नहीं कह सकते हैं "देखो, यह एक दूसरे से दोगुना है")
    • अपने पाठकों को एक सहज रोज़मर्रा के गैर-संख्यात्मक तरीके से देखने के लिए आमंत्रित करें जिस तरह से लोग, उदाहरण के लिए, एक दुकान में पाई के आकार की तुलना करें। कम परिष्कृत, लेकिन अधिक तत्काल। अधिक आंत, कम सिर।
    • बहुत समान संख्याओं के बीच छोटे अंतर लगभग अदृश्य हो जाते हैं।
    • जब एक चर दूसरे की तुलना में कई गुना छोटा होता है, तो बहुत छोटा एक बार चार्ट में उतना बुरी तरह से गायब नहीं होता है, जो लेआउट में अधिक लचीलेपन की अनुमति दे सकता है।

यहाँ छवि विवरण दर्ज करें

  • क्षेत्र के लिए हलकों का उपयोग करने पर विचार करें, वर्गों पर नहीं, केंद्र संरेखित करें :

    • सर्किल क्योंकि यह बार चार्ट और समान के साथ भ्रम को आमंत्रित नहीं करता है। ऊँचाई और चौड़ाई सामने से कम है: ऐसा लगता है कि आप ऊँचाई या चौड़ाई आधारित तुलना को आमंत्रित कर रहे हैं।
    • केंद्र-गठबंधन क्योंकि यह लोगों को ऊंचाई की तुलना करने के लिए आमंत्रित नहीं करता है

यहाँ छवि विवरण दर्ज करें

उदाहरण के लिए, ऊपर, "5" लेबल वाले वर्ग को तीन चौथाई "10" लेबल वाले वर्ग की ऊंचाई के रूप में नहीं देखना मुश्किल है, इसलिए यह संभावित रूप से भ्रामक है।

मंडलियां इस तरह की तुलना को आमंत्रित नहीं करती हैं: यह एक आंत-स्तर से अधिक है, तुरंत "यह बूँद अगले बूँद की तुलना में बहुत बड़ी है"।


उपयोगकर्ता के परीक्षण से लेकर छोटे स्तर के अध्ययन तक कई तरह के सबूत हैं (बाद में कुछ उदाहरणों का शिकार करने की कोशिश करेंगे) कि इस तरह के सहज ज्ञान युक्त क्षेत्र-आधारित तुलना अधिक आकर्षक हो सकती है, कम व्यस्त दर्शकों के लिए प्रवेश में बाधा को कम कर सकती है, और कर सकती है नंबरों की ठंड minutiae के बजाय विषय पर पाठक का ध्यान केंद्रित रखने में मदद करें। लेकिन यह अधिक संख्यात्मक रूप से दिमाग के विश्लेषण के रास्ते में आने की लागत पर आता है।

सौंदर्य कारणों से एक-आयाम (लंबाई या दूरी) और दो-आयाम (क्षेत्र) के बीच चयन न करें: अपने दर्शकों और संदेश के आधार पर उनके बीच चयन करें।

जो संचार के लिए अधिक उपयुक्त है: "जो बहुत बड़ा है" के स्तर पर तत्काल आंत-स्तर की तुलना, या "जो कि अन्य एक का लगभग 80% है" के स्तर पर अधिक संख्यात्मक तुलना की जाती है?

या क्या व्यावहारिक कारण हैं कि आपको क्षेत्र का उपयोग करने की आवश्यकता क्यों है?

फिर, जब आपने व्यावहारिक कारणों के लिए चुना है, तो सौंदर्यशास्त्र लागू करें।


'पृष्ठ पर रंग की मात्रा का आनुपातिक' एक बहुत ही उपयोगी नियम-से-अंगूठे (कम से कम 2 डी में) है; इसके लिए धन्यवाद कि मैं इसका उपयोग करूंगा। मैं जिस डिजाइन की ओर बढ़ रहा हूं, वह मंडलियों पर आधारित है, मुझे लगता है कि आप वहीं हैं
डंबलड

5

मैं क्षेत्र कहूंगा। वैकल्पिक रूप से, एक वर्ग जिसमें दो बार लंबे समय के रूप में एक क्षेत्र के रूप में 4 बार बड़ा दिखाता है। आकस्मिक प्रेक्षक क्षेत्र से संबंधित होंगे, यहां तक ​​कि आपकी किंवदंती को पढ़े बिना भी।

एक अच्छा उदाहरण है xkcd के रैंडल मुनरो द्वारा किया गया यह शानदार ग्राफ :

यहाँ छवि विवरण दर्ज करें ( विशाल, सुपाठ्य संस्करण )


4

हम क्षेत्र में अंतर को देखते हुए उतने अच्छे नहीं हैं जितना कि हम लंबाई में हैं। हम लंबाई को एक छद्म के रूप में उपयोग करते हैं और इसलिए क्षेत्रों में अंतर को कम आंकते हैं।

इस कारण से, एक सर्कल जिसमें वास्तव में 2x है, दूसरे का क्षेत्र बहुत छोटा दिखाई देता है क्योंकि हमारा मस्तिष्क उनकी त्रिज्या से संबंधित है, जो 1.4x के कारक से भिन्न होता है।

इस घटना को समेटने के दिलचस्प प्रयास हैं, जैसे कि आनुपातिक प्रतीक मानचित्रण आर में , जो प्रतीकों की अवधारणात्मक स्केलिंग को और अधिक बारीकी से संरेखित करने का प्रस्ताव करता है कि हम लंबाई और क्षेत्रों को कैसे आंकते हैं।

यहाँ इस पत्र से अंजीर 2 है

यहाँ छवि विवरण दर्ज करें

व्यक्तिगत रूप से मुझे इससे कोई अनुभव नहीं है और यदि मात्रात्मक निर्णय आवश्यक हैं तो क्षेत्रों का उपयोग करने से बचें।

एक दिलचस्प स्पर्शरेखा मात्रा और लंबाई की धारणा के बीच का संबंध है। हम इनको कैसे समझते हैं, इसका अंतर और भी अधिक है। यह स्टार आकार की तुलना के इस वीडियो में चित्रित किया जा सकता है ।

जब तक आप सबसे बड़े तारे तक पहुँच जाते हैं, जो कि सूर्य के व्यास से लगभग 1,700x है, आप इस धारणा से बचे हुए हैं कि यह 1,700x से बहुत बड़ा है।

क्षेत्रों और लंबाई में अंतर को समझने में हमारी त्रुटि को और अधिक व्यवस्थित रूप से देखने के लिए, क्राउडसोर्सिंग ग्राफिकल धारणा: जेफरी हीर और माइकल बोस्कॉक द्वारा विज़ुअलाइज़ेशन डिज़ाइन का आकलन करने के लिए मैकेनिकल तुर्क का उपयोग करना


4

मेरी राय में क्षेत्र (डी), प्रत्येक पक्ष (ई) नहीं।

यदि आप लंबाई 2 के किनारे का उपयोग कर रहे हैं, तो क्षेत्र का 4 गुना मूल्य होगा और आपके पास एक अतिव्यापी ग्राफ़ होगा। (इ)

जब आपके पास एक सामान्य बार ग्राफ (ए) होता है, तो डेटा रैखिक होता है, और बार के साथ सिर्फ एस्थेटिक के लिए होता है। (बी)

उन मामलों में क्षेत्र फिर से डेटा का प्रतिनिधि है क्योंकि सलाखों के साथ समान हैं। आपके पास एक 3D बार हो सकता है और फिर भी बार की मात्रा डेटा (C) का प्रतिनिधित्व करने वाला है

अवधारणात्मक अंतर और ओवरलैप के आकार का चित्रण रेखांकन


4 बार? क्या यह रैखिक और वर्ग के बीच का अंतर नहीं है?
dumbledad

मुझे ilustrate और पोस्ट को संपादित करने दें।
राफेल

मान लीजिए डेटम 81 है। यदि हम एरिया का उपयोग करते हैं तो दोनों पक्षों की लंबाई 9 है, 81 का एक क्षेत्र है। यदि हम पक्षों को करते हैं, तो वे लंबाई 81 के हैं और क्षेत्र 6,561 है। 81 4 बार 9 नहीं है और 6,561 4 बार 81 नहीं है। आप 4 कहाँ से प्राप्त करते हैं?
dumbledad

"यदि आप लंबाई 2 के पक्ष का उपयोग कर रहे हैं, तो क्षेत्र 4 गुना मूल्य होगा" मैं नहीं बता सकता कि आप वहां क्या कहना चाह रहे हैं। मुझे लगता है कि आपका मतलब है कि, यदि आप डेटा की परिमाण का प्रतिनिधित्व करने के लिए पक्ष की लंबाई का उपयोग कर रहे हैं, तो डेटा मूल्य को दोगुना करना क्षेत्र को चार से गुणा करता है।
डेविड रिचेर्बी

डेविड - यही मेरा संपादन है! राफेल के मूल पोस्ट में कहा गया है "यदि आप एक पक्ष का उपयोग कर रहे हैं, तो क्षेत्र 4 गुना मूल्य होगा"। यदि आप स्पष्ट करने का एक बेहतर तरीका जानते हैं कि कृपया करें।
डंबलडेड

1

Tufte ने इससे बड़े पैमाने पर निपटा। देख:

  • मात्रात्मक जानकारी का दृश्य प्रदर्शन,
  • सूचना और अन्य की परिकल्पना।

चित्रमय अखंडता के कुछ सिद्धांत:

  1. संख्याओं का प्रतिनिधित्व, जैसा कि भौतिक रूप से ग्राफ की सतह पर मापा जाता है, का प्रतिनिधित्व संख्यात्मक मात्राओं के सीधे आनुपातिक होना चाहिए
  2. स्पष्ट, विस्तृत और संपूर्ण लेबलिंग का उपयोग ग्राफिकल विरूपण और अस्पष्टता को हराने के लिए किया जाना चाहिए। ग्राफ पर डेटा के स्पष्टीकरण को ही लिखें। डेटा में महत्वपूर्ण घटनाओं को लेबल करें।
  3. डेटा भिन्नता दिखाएं, डिज़ाइन भिन्नता नहीं।
  4. पैसे की समय-श्रृंखला के प्रदर्शन में, मौद्रिक माप की अपस्फीति और मानकीकृत इकाइयां नाममात्र इकाइयों की तुलना में लगभग हमेशा बेहतर होती हैं।
  5. दर्शाई गई जानकारी (चर) आयामों की संख्या डेटा में आयामों की संख्या से अधिक नहीं होनी चाहिए। ग्राफिक्स को संदर्भ से बाहर डेटा उद्धृत नहीं करना चाहिए।

अपने मामले में आपको अपने आप से पूछना होगा कि क्या डेटा को 2 डी या 3 डी छवि या एक पंक्ति द्वारा बेहतर रूप से दर्शाया गया है। एक घन, एक वर्ग और एक रेखा समान नहीं हैं। यही कारण है कि 3 डी बार चार्ट इतनी बार भ्रामक हैं।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.