III संपादित करें: मुझे मल्टीवार्जेबल क्वांटिटेटिव डेटा विज़ुअलाइज़ेशन का एक बहुत खूबसूरत उदाहरण मिला, और इसे जोड़ना पड़ा। आपको यह "एडिट III (नोबेल पुरस्कार विजेता)" शीर्षक के तहत मिलेगा।
संपादित करें II: थोड़ी गलतफहमी हो गई है, और मैंने यह स्पष्ट करने की कोशिश करने के लिए संपादित किया है कि मैं डेटा के इच्छित उपयोग की व्याख्या कैसे करता हूं। मैंने दो छवियों को बदल दिया है और एक खंड जोड़ा है "क्या आप उस के साथ फ्राइज़ चाहते हैं?"
ग्राफिक्स डेटा को प्रकट करते हैं।
एडवर्ड टफ्टे:
अव्यवस्था और भ्रम डिजाइन की विफलताएं हैं जो जानकारी की विशेषता नहीं हैं। अव्यवस्था डिजाइन समाधान के लिए कॉल करती है, सामग्री में कमी नहीं। अक्सर, अधिक गहन विस्तार, अधिक से अधिक स्पष्टता और समझ, क्योंकि अर्थ और तर्क लगातार संपर्क में हैं। कम एक बोर है।
हम डेटा की कल्पना क्यों करते हैं?
- सोचने के लिए उपकरण
- तीव्र देखने का परिणाम दिखाने के लिए
- एक समस्या को समझने के लिए, एक निर्णय लेने के लिए
- तुलना दिखाएँ, कार्य-कारण दिखाएँ
- विश्वास करने के लिए कारण प्रदान करें
कैसे?
- डेटा दिखाएं
- दर्शक को पदार्थ के बारे में सोचने के लिए प्रेरित करें न कि कार्यप्रणाली, ग्राफिक डिजाइन, ग्राफिक उत्पादन की तकनीक या कुछ और के बारे में
- डेटा का क्या कहना है, इसे विकृत करने से बचें
- एक छोटी सी जगह में कई संख्याएँ प्रस्तुत करें
- बड़े डेटा सेट सुसंगत बनाते हैं
- डेटा के विभिन्न टुकड़ों की तुलना करने के लिए आंख को प्रोत्साहित करें
- एक विस्तृत अवलोकन से ठीक संरचना तक, विस्तार के कई स्तरों पर डेटा प्रकट करें।
- एक स्पष्ट रूप से स्पष्ट उद्देश्य की सेवा करें: विवरण, अन्वेषण, सारणीकरण या सजावट।
- डेटा सेट के सांख्यिकीय और मौखिक विवरण के साथ घनिष्ठता से जुड़ा होना चाहिए।
कुछ परिभाषाएँ:
डेटा:
आमतौर पर "डेटाबेस में सॉर्ट किए गए सामान" के रूप में सोचा जाता है। यह निश्चित रूप से संख्या, चित्र, ध्वनि, वीडियो आदि हो सकता है। डेटा वह है जो संग्रहणीय है, अक्सर मात्रात्मक है। अपने कच्चे रूप में यह पचाने में कठिन है; अंकों की सिर्फ दीवारें। तुम्हे पता हैं; मैट्रिक्स । सामान्य शब्दों में, हम, शून्य से मिलकर सब सामान हम करते हैं के लिए बड़े पैमाने पर डेटाबेस नहीं है नहीं कभी कभी सामान हमारे पास नहीं है सामान है कि सबसे अधिक कर रहे हैं, भले ही है, जानकारीपूर्ण । इसलिए यह देखने के लिए कि हमारे पास क्या नहीं है, हमें यह कल्पना करने की आवश्यकता है कि हमारे पास क्या है।
जानकारी:
वह है जो आप डेटा से निकाल सकते हैं । किसी तरह डेटा प्रदर्शित करके, हम जानकारी को चमका सकते हैं । जिन उदाहरणों का मैं अक्सर उपयोग करता हूं, उनमें से एक यह है कि अगर मैं आपको दुनिया के देशों की सूची देता हूं और आपको बताऊं कि दो गायब हैं, तो यह बहुत कम संभावना है कि आप उन्हें उस सूची के आधार पर पाएंगे। हालाँकि, अगर मैं इसे उन सभी देशों में रंग देता हूँ जो मेरे पास हैं, तो आप तुरंत देखेंगे कि मैंने सेंट्रल अफ्रीकन रिपब्लिक और न्यू कैलेडोनिया को छोड़ दिया है। यह "शोर को कम करना" है और सबसे प्रभावी तरीके से एक कहानी बता रहा है।
इन्फोग्राफिक्स और डेटा विज़ुअलाइज़ेशन:
मुझे आपके उदाहरण को इन्फोग्राफिक्स कहने में संकोच है। मुझे पता है कि इसे अक्सर डेटा विज़ुअलाइज़ेशन, सूचना डिज़ाइन या सूचना वास्तुकला के समानार्थक शब्द के रूप में देखा जाता है, लेकिन मैं असहमत हूं। इन्फ़ोग्राफ़िक्स - मेरे लिए - रेखांकन, चित्र और की एक श्रृंखला है चित्र कि अच्छी तरह से डेटा को पढ़ने के लिए कैसे पर पक्षपातपूर्ण बयान का एक समूह हो सकता है। यह कम उद्देश्य है, डेटा को छोड़ने के लिए अधिक संभावना है जो निर्माता के "हित" में नहीं हैं: आपको एक निष्कर्ष की ओर निर्देशित किया जाता है कि कोई पूर्वनिर्धारित। उनके पास मनोरंजन मूल्य है, और उनके पास अक्सर उन चित्रों का अत्यधिक उपयोग होता है जो डेटा से कुछ ध्यान हटाते हैं। यह ठीक है लेकिन मुझे लगता है कि हमें थोड़ा अंतर करना चाहिए।
उदाहरण
बड़ा डाटा:
ध्यान रखें कि बड़ा डेटा जटिल डेटा के समान नहीं है। बहुत से डेटा केवल बहुत सारे हो सकते हैं, जैसे कि यह लिंक्डइन मैप: कोर डेटा समान है, लेकिन फ़िल्टर (टैगिंग द्वारा) हैं। दो चर हैं: भूगोल और कुछ प्रकार के टैग लोगों को व्यवसायों / हितों / संबंधों में परिभाषित करते हैं। डेटा की पागल राशि; लेकिन केवल दो चर।
मल्टिवेरियेबल:
यहां डेटा के बहुपरत दृश्य का एक उदाहरण है। यह चार्ल्स मिनार्ड का 1869 का चार्ट है, जो नेपोलियन की 1812 की रूसी अभियान सेना में पुरुषों की संख्या, उनकी हरकतों और साथ ही वापसी के रास्ते में आने वाले तापमान को दर्शाता है।
यहां बड़ा संस्करण
कोड को क्रैक करने में थोड़ा समय लगता है, लेकिन जब आप ऐसा करते हैं तो यह शानदार होता है। कवर किए गए चर हैं:
- सेना का आकार (जीवित / मृतकों की संख्या)
- भौगोलिक स्थान
- दिशा (पूर्व - पश्चिम)
- तापमान
- समय (तारीखें)
- कारण (लड़ाई और ठंड में मृत्यु)
यह एक सरल, दो रंग के नक्शे में जानकारी की एक अद्भुत राशि है। भौगोलिक भाग को अन्य चर के लिए जगह देने के लिए शैलीबद्ध किया गया है, लेकिन हमें इसे प्राप्त करने में कोई समस्या नहीं है।
यहाँ एक और अधिक मुश्किल है। यह पढ़ने में बहुत आसान होगा यदि आप बुनियादी विकासवादी विज़ुअलाइज़ेशन, क्लैडोग्राम, फ़ाइलॉगनिक्स और बायोग्राफी के सिद्धांतों से परिचित हैं। भालू को ध्यान में रखते हुए इसे परिचित लोगों के लिए बनाया गया है, इसलिए यह एक विशेषज्ञ, वैज्ञानिक चार्ट है। यह वही है जो दिखाता है: दक्षिण अमेरिका से जहर मेंढक की एक फिजियोलॉजिकल छवि। बाईं ओर के नक्शे मुख्य बायोग्राफिकल क्षेत्रों को दिखाते हैं, क्योंकि वे समय के माध्यम से बदलते हैं और दाईं ओर की छवि उनके जीवनी मूल के संदर्भ में मेंढक को दिखाती है। (सैंटोस जेसी, कोलोमा एलए, समर्स के, कैलडवेल जेपी, री आर, एट अल। [CC-BY-SA-2.5 (www.creativecommons.org/licenses/by-sa/2.5)], विकिमीडिया कॉमन्स के माध्यम से)। जब आप "कोड क्रैक" करते हैं तो यह बेतहाशा, आश्चर्यजनक रूप से सूचनात्मक होता है।
छोटे गुणक, स्पार्कलाइन्स:
मैं इसे पर्याप्त तनाव नहीं दे सकता: जानकारी को दोहराने, या इसे अलग-अलग समान विज़ुअलाइज़ेशन में विभाजित करने के मूल्य को कभी कम मत समझो। जब तक एक ग्राफ को दूसरे के साथ तुलना करना काफी आसान होता है, यह पूरी तरह से ठीक है। हम पैटर्न खोजने की मशीन हैं। इसे अक्सर छोटी बहु के रूप में जाना जाता है। हमें इन छवियों का विश्लेषण करने में बहुत कम समस्याएं हैं, और हर चीज को एक बड़े ग्राफ में समेटना अक्सर व्यर्थ होता है जब दस छोटे लोग भी बेहतर काम करेंगे:
और एक:
और एक जो अलग लेकिन दोहराए जाने वाले ग्राफिक्स का उपयोग करता है:
स्पार्कलाइन एक शब्द है जिसे एडवर्ड टफ्टे द्वारा गढ़ा गया है, और यह
पूरी तरह से कार्यशील, पूरी तरह से अनुकूलन जावास्क्रिप्ट पुस्तकालय में भी विकसित हुआ है । वे मूल रूप से छोटे चार्ट हैं जिन्हें पाठ में डाला जा सकता है, पाठ के हिस्से के रूप में और "बाहरी" वस्तु के रूप में नहीं। यहाँ डिफ़ॉल्ट रूप क्या है:
III संपादित करें (नोबेल पुरस्कार विजेता)
मुझे सिर्फ इस डेटा विज़ुअलाइज़ेशन को जोड़ना था जो मुझे मिला, यह बस बहुत अच्छा है: यह नोबेल पुरस्कार विजेताओं को दर्शाता है। क्या विश्वविद्यालय, क्या संकाय, विषय, वर्ष, उम्र, गृहनगर, यह साझा किया गया था डिग्री स्तर। सुंदर साक्ष्य वास्तव में। ये सभी मात्रात्मक डेटा हैं। यहां अधिक।
आपका डेटा
सभी सवाल @ जवी पोज़ बेहद महत्वपूर्ण हैं।
आप जो करने की कोशिश कर रहे हैं वह सोचने के लिए एक दृश्य उपकरण है। ऐसा करने के लिए, आपको शोर अनुपात के लिए सिग्नल की सर्वोत्तम गुणवत्ता को निकालना होगा। आप जिस चीज से जूझ रहे हैं , वह है कि डेटा को अलग-अलग करने के लिए कैसे अलग-अलग चर हैं, जानकारी में । यहाँ एक सवाल है: क्या लगभग सही होने की आवश्यकता है और क्या बिल्कुल सही होने की आवश्यकता है? उद्देश्य क्या है?
मैं यह मानने जा रहा हूं कि आप बहुत अधिक पूर्वाग्रह के बिना डेटा प्रदर्शित करना चाहते हैं: आप चाहते हैं कि पाठक स्वयं सहसंबंधों को ढूंढें, अगर कोई सहसंबंध होना था। आपका उद्देश्य लोगों को यह बताना नहीं है कि बर्गर उनके लिए बुरा है या कि महिलाएं पुरुषों की तुलना में कम बर्गर खाती हैं, बल्कि उन्हें यह देखने के लिए "यदि" है कि डेटा में क्या है (कल्पना करें कि क्या वे तीन लोग एक परिवार थे।) पूरे बर्गर-खाने के ग्राफ पर हमारे विचार को स्विंग करें)।
आपका डेटासेट बहुत छोटा है, आप बस इसे एक तालिका में रख सकते हैं और यह ठीक होगा। लेकिन निश्चित रूप से यह सामान्य विचार के बारे में है:
थोड़ा विस्तार: समय (उम्र) कुछ ऐसा होता है जिसे हम बाएं से दाएं (समय रेखा) के रूप में क्षैतिज देखते हैं। वजन कुछ है जो ऊपर-नीचे है, इसलिए अपने x - y को बदलना एक अच्छा विचार होगा।
1. अद्वितीय, निश्चित इकाइयाँ क्या हैं?
2. (एह) चर चर क्या हैं?
- वजन (किग्रा)
- युग (वर्ष)
- बर्गर की संख्या (पूर्णांक)
- बर्गर का प्रकार (पूर्णांक)
नोट: आपके डेटा में पूरी तरह से इकाइयाँ हैं। अलग मानसिक पैमाने पर प्रत्येक, गणना योग्य, मात्रात्मक। किलो, आयु, वजन और संख्या। और डेटाबेस-स्पोक में, उनके नाम कुंजी हैं। जब आपको स्पेस-टाइम विज़ुअलाइज़ेशन बनाना शुरू होता है, तो यह एक वास्तविक सिरदर्द बन जाता है। कल्पना करें कि आपको जन्मस्थान, वर्तमान घर आदि को जोड़ना चाहिए।
यहाँ केवल दो का सहसंबंध है, बर्गर और विदर की संख्या है या नहीं यह एक कॉम्बो है। अन्य सभी चर स्वतंत्र हैं, और केवल एक निश्चित (नाम) है। कुछ बिंदु पर, बड़े डेटासेट के साथ, यहां तक कि नाम भी निर्बाध हो जाते हैं, और जनसांख्यिकीय, आयु, लिंग या इस तरह के स्थान पर बदल जाते हैं।
उस छोटे डेटासेट के साथ, आप इसे सभी एक ग्राफ में प्राप्त कर सकते हैं, उदाहरण के लिए:
या आप अक्ष और नाम-बबल सामग्री को बदल सकते हैं:
व्यक्तिगत टिप्पणी: मुझे लगता है कि यह दो में से बेहतर है, क्योंकि x और y में एक मनुष्य के "भौतिक" गुण हैं। यहां बुलबुले में परिवर्तन बर्गर की संख्या है।
आप ग्राफ़ के अलावा पाई चार्ट भी जोड़ सकते हैं, या केवल पाई चार्ट भी रख सकते हैं। व्यक्तिगत रूप से मेरे पास दोनों होंगे, जैसा कि छोटी बहुओं के बारे में बताया गया है:
क्या आप उस के साथ फ्राईज चाहते हैं?
मेरी धारणा यह थी कि हम खाने के लिए बर्गर के अनुपात को भी जानना चाहते थे। हर भोजन में बर्गर होता है। सभी भोजन कंघी नहीं होते हैं।
- क्या हम केवल यह जानना चाहते हैं कि क्या कोई व्यक्ति कभी-कभी कंघी खाता है?
- या हम यह जानना चाहते हैं कि बर्गर खाने में से कितने कंघी हैं?
अगर 1., नाम / कुंजी / आईडी पर लागू एक बूलियन करेगा।
जेन कभी-कभी कंघी खाती है? सही गलत।
यदि 2., हम प्रत्येक भोजन के लिए एक बूलियन लागू कर सकते हैं:
1 चीज़बर्गर, कॉम्बोमियल = सच
1 चीज़बर्गर, कॉम्बोमियल = सच
1 चीज़बर्गर, कॉम्बोमियल = झूठा
1 चीज़बर्गर, कॉम्बोमियल = झूठा
1 चीज़बर्गर, कॉम्बोमियल = झूठा
1 चीज़बर्गर, कॉम्बोमियल = झूठा
1 चीज़बर्गर, कॉम्बोमियल = झूठा
1 बीफबर्गर, कॉम्बोमियल = सच
1 बीफबर्गर, कॉम्बोमियल = सच
1 बीफबर्गर, कॉम्बोमियल = गलत
यह बहुत थकाऊ है, इसलिए हम इसे नीचे तक तोड़ सकते हैं:
जेन 10 बर्गर खाता है। इनमें से, तीन कॉम्बो हैं ("क्या आप उस के साथ फ्राइज़ चाहते हैं?")।
कॉम्बोमियल में से एक बीफ़बर्गर मेनू है।
कंघी के दो चीज़बर्गर मेनू हैं।
बाकी सिंगल बर्गर हैं। 5 पनीर, दो गोमांस।
यह पाइचार्ट कल्पना करने का एक प्रयास था। मैंने इस संस्करण में पाई स्लाइस को स्पष्ट करने के लिए रखा है। इसके बारे में बात यह है कि बड़े डेटासेट और% को लागू करना शुरू करने के लिए यह कोई छलांग नहीं होगी:
लेकिन मुझे लगता है कि सबसे अच्छा तरीका पुनर्विचार है।
इसे देखने का एक और तरीका है, यह वास्तव में सरल करना है। यहां यह देखना आसान है कि कौन से आयु समूह, कौन से वजन समूह और आपके पास "नहीं" के सभी डेटा हमें बता सकते हैं। आपके पास जो डेटा है, वह अंतरिक्ष से संबंधित नहीं है, यह केवल इकाइयाँ है (किलो, वर्ष, संख्या + कुंजी / आईडी / नाम):
(संपादित करें: मेरे चेहरे पर अंडा: मैंने इन चित्रों को अधिक सही लोगों के साथ बदल दिया है, जैसे कि "सभी भोजन बर्गर हैं, सभी भोजन कॉम्बो नहीं हैं")
अधिक लोगों के साथ विस्तार करना बहुत आसान होगा:
या, और भी बेहतर, यदि आप 10, 20 और 30 वर्ष के आयु वर्ग के बच्चों की तुलना करते हैं, तो आप स्टैटिस्टिक विज़ुअलाइज़ेशन पढ़ने के लिए बहुत सरल बना सकते हैं:
..और जितना संभव हो उतना स्पष्ट होने के लिए; यहाँ इस तरह से सोचने का एक उदाहरण है। यह चार्ट टाइटैनिक के बचे हुए लोगों, चालक दल, वर्ग, पुरुषों, महिलाओं के अनुपात को दर्शाता है।
अन्य समाधानों का भार होगा, ये केवल कुछ विचार हैं।
मैं आगे और आगे बढ़ सकता था, लेकिन अब मैंने खुद को और शायद सभी को समाप्त कर दिया है।
साथ खेलने के लिए उपकरण:
gephi
गैपमिंदर हंस रोसलिंग की इस अभूतपूर्व TED प्रस्तुति को देखें
- उस लड़के से प्यार करें
गूगल चार्ट
somvis
Raphaël
MIT एक्ज़िबिट (जिसे पहले सिमिलि कहा जाता था)
d3
Highcharts
आगे की पढाई:
पीजे ओनोरी; कठिन की रक्षा में
एडवर्ड टफ्टे: सुंदर साक्ष्य
एडवर्ड टफ्टे: जानकारी की कल्पना करना
एडवर्ड टफ्टे: मात्रात्मक जानकारी का दृश्य प्रदर्शन
दृश्य स्पष्टीकरण: चित्र और मात्राएँ, साक्ष्य और कथा
माले, एलन।, 2007 इलस्ट्रेशन एक सैद्धांतिक और प्रासंगिक परिप्रेक्ष्य लॉज़ेन, स्विट्जरलैंड; न्यूयॉर्क, एनवाई: एवीए एकेडेमिया
आइल्स, सी। और रॉबर्ट्स, आर।, 1997। कला, विज्ञान और रोजमर्रा की आधुनिक कला ऑक्सफोर्ड में दृश्य प्रकाश, फोटोग्राफी और वर्गीकरण।
कार्ड, एसके, मैकिनले, जे। एंड शनीडरमैन, बी। एड।, 1999. रीडिंग इन इन्फोर्मेशन विज़ुअलाइज़ेशन: यूज़ विज़न टु थिंक 1 एड।, मॉर्गन कॉफ़मैन।
ग्राफ्टन, ए। और रोसेनबर्ग, डी।, 2010। कार्टोग्राफी ऑफ़ टाइम: ए हिस्ट्री ऑफ़ द टाइमलाइन, प्रिंसटन आर्किटेक्चरल प्रेस।
लीमा, एम।, 2011। विजुअल कॉम्प्लेक्सिटी: मैपिंग पैटर्न ऑफ इंफॉर्मेशन, प्रिंसटन आर्किटेक्चरल प्रेस।
बाउन्फोर्ड, टी।, 2000. डिजिटल आरेख: कैसे डिजाइन और वर्तमान सांख्यिकीय जानकारी को प्रभावी ढंग से 0 एड।, वाटसन-गुप्टिल।
स्टील, जे। एंड इलिंस्की, एन। एड।, 2010। ब्यूटीफुल विज़ुअलाइज़ेशन: डेटा को देखते हुए एक्सपर्ट्स 1 एड। ओ रेली मीडिया।
ग्लीक, जे।, 2011. सूचना: ए हिस्ट्री, ए थ्योरी, ए फ्लड, पेंथियन