आर का उपयोग करके आकर्षण की कल्पना करने का सबसे अच्छा तरीका?


15

इस साइट के माध्यम से मैंने हाल ही में Sankey Diagrams की खोज की है, जो एक पारंपरिक प्रवाह चार्ट में क्या हो रहा है, यह कल्पना करने का एक शानदार तरीका है ।

जॉर्ज एम। व्हाईटसाइड्स और जॉर्ज डब्ल्यू। क्रैब्री , ऊर्जा में दीर्घकालिक मौलिक अनुसंधान मत भूलना स्रोत द्वारा सेंकेई आरेख का एक अच्छा उदाहरण यहां दिया गया है ; ऊर्जा , विज्ञान में लंबे समय तक मौलिक अनुसंधान को मत भूलना 9 फरवरी 2007: वॉल्यूम। 315. नहीं। 5813, पीपी। 796 - 798।

के बाद मुझे एहसास हुआ कि कोई सैंकेई आर-पैकेज नहीं था, मुझे एक आर स्क्रिप्ट ऑनलाइन मिली , दुर्भाग्य से यह स्क्रिप्ट काफी कच्ची और कुछ हद तक सीमित है। उच्च आशाओं के साथ मैंने स्टैकओवरफ्लो में एक सैंकी आर-पैकेज या एक अधिक परिपक्व फ़ंक्शन के लिए कहा, लेकिन मेरे आश्चर्य के लिए ऐसा लगता है कि हमारे पास आर में सैन्के डायग्राम्स के निर्माण के लिए एक परिपक्व कार्य नहीं है।

चूँकि मैंने एक तेज़ गीक पर एसिड डाला था, मौजूदा स्क्रिप्ट पर एक छोटी सी हैक का सुझाव देने के लिए पर्याप्त था जिसने इसे मेरे विशिष्ट उद्देश्य के लिए कम या ज्यादा काम किया।

सुधारित आर-स्क्रिप्ट ने इस आरेख का निर्माण किया, Geek On Acid का R-Sankey Diagram स्रोत; stackoverflow.com

लेकिन, क्या R पैकेज की कमी से संकेत मिलता है कि Sankey Diagrams एक डेटा प्रवाह में R का उपयोग करते हुए आकर्षण की कल्पना करने का ऐसा अद्भुत तरीका नहीं है, जो ऊपर दिए गए आरेख में प्रस्तुत किया गया है ( डेटा और R कोड के लिए प्रारंभिक स्टैकओवरफ़्लो प्रश्न देखें) । ध्यान आकर्षित करने के लिए एक बेहतर तरीका है।

आपको क्या लगता है कि R का उपयोग करके डेटा प्रवाह में अटकलबाजी की कल्पना करने का सबसे अच्छा तरीका है?


7
यह है बहुत मुश्किल (पहला उदाहरण संभावना कलाकार मैन्युअल नोड्स रखकर किया गया था) किसी भी स्वचालित तरीके से नज़र अच्छा करने के लिए चित्र प्राप्त करने के लिए। कार्यक्रम के लिए एक ग्राफिकल टूल के रूप में इसकी उपयोगिता से कोई लेना देना नहीं है। दृश्य प्रवाह के बारे में जीआईएस साइट पर मेरे इस पोस्ट पर आपको अधिक प्रेरणा मिल सकती है। इस साइट के उत्तर पर मैं पार्सेट्स और डॉट प्लॉट के कुछ उदाहरण भी देता हूं ।
एंडी डब्ल्यू

@AndyW, बहुत उपयोगी टिप्पणी के लिए धन्यवाद। मैं विभिन्न तरीकों की जांच करूंगा और अपने डेटा के साथ प्रयोग करूंगा। धन्यवाद।
एरिक फेल

यह शीर्ष आरेख एक महान विचार है, लेकिन यह मुझे ऐसा लगता है जैसे कि सूत्रों का योग सिंक के योग के बराबर नहीं है (मान ऊंचाई का वर्णन करता है)
n

आह .. कोई बात नहीं, मैंने इसे गलत पढ़ा ... सूत्रों पर लाइटर बिट्स सिर्फ लेबल हैं, डेटा का हिस्सा नहीं। थोड़ा भ्रमित ..
n

जवाबों:


4

मैं @gung से सहमत हूं। Sankey आरेख जो आपने पोस्ट किया है, मुझे लगता है, एक बहुत अच्छा उदाहरण जहां तकनीक मदद कर सकती है। हालांकि यह जटिल है, संदर्भ (ऊर्जा इनपुट और आउटपुट) भी जटिल है और उपयोग की कई श्रेणियों में इनपुट-टू-आउटपुट-एक्टिंग-एज़-न्यू-इनपुट के रास्तों को देखने के एक अच्छे तरीके के बारे में सोचना मुश्किल है।

अब, आपके द्वारा पोस्ट किए गए अटैचमेंट उदाहरण के लिए, जैसा कि अन्य ने नोट किया है कि यह सैंके आरेख का उपयोग करने के लिए सहायक नहीं है। मुझे लगता है कि अगर आप वैकल्पिक विज़ुअलाइज़ेशन पर एक अच्छी सिफारिश चाहते हैं, तो आपको अपने चर का पूरा सेट पोस्ट करने की आवश्यकता है। यदि आप साइटों और चिकित्सकों के बीच आकर्षण स्रोतों में अंतर दिखाना चाहते हैं, तो डॉट प्लॉट्स की एक छोटी-सी-बहु श्रृंखला आपके दर्शकों के लिए समझने और आपके लिए इसे लागू करने के लिए सबसे आसान हो सकती है ( इस उदाहरण को देखें , जहां आपके मामले में समूह हो सकते हैं। साइटें, समूहों के भीतर के तत्व एट्रिशन का कारण होंगे, और क्षैतिज अक्ष 0-100% होगा)।

यदि Sankey आरेख कुछ है जिसे आप उपयोग करना चाहते हैं, और आप एक अन्य उच्च स्तरीय भाषा में डब करने के लिए तैयार हैं, तो पायथन प्लॉटिंग पैकेज, matplotlib के लिए गैलरी पर एक अच्छा उदाहरण (कोड के साथ) है


3

मैं जरूरी नहीं मानूंगा कि एक विधि की कमी का तात्पर्य है कि यह विधि महत्वहीन है या उपयोगी नहीं है। आखिरकार, सभी तरीकों के लिए जो वर्तमान में आर में मौजूद हैं, एक समय था (काफी संभवतः हाल ही में - आर केवल ~ 10 साल पुराना है) जब इसके लिए कोई पैकेज नहीं था।

हालांकि, मुझे यह सोचना चाहिए कि डेटा की कल्पना करने के कितने भी तरीके हैं जैसे कि एट्रिशन। आपके चार्ट को देखकर मेरा पहला विचार यह है कि इसे डॉट प्लॉट के साथ प्रस्तुत किया जा सकता है । अन्य संभावनाएं भी मौजूद हैं। Sankey Diagram की अतिरिक्त कार्यक्षमता तब चलन में आने वाली है जब आपके पास एक बिंदु पर किसी विशेष कारण के कारण कुछ आकर्षण होता है, और फिर उसी कारण से बाद में अन्य इनपुट और आउटपुट के बीच में होता है। यह मानक भूखंडों द्वारा प्रतिनिधित्व करने के लिए अधिक जटिल होगा (यह एक सेंकेई आरेख के साथ भी पालन करना कठिन है - उदाहरण के लिए, पृष्ठ के शीर्ष पर पढ़ने के लिए काफी काम लेता है)। चूँकि आपको ऐसा प्रतीत नहीं होता है, सैंकी आरेख बहुत सुंदर लग रहा है, लेकिन ओवरकिल।


1
दिया गया पहला ग्राफिक कमाल का IMO है। इसमें बहुत अधिक विवरण हैं जो डॉट भूखंडों की एक श्रृंखला में इतने सहज रूप से कैप्चर करना मुश्किल होगा। इसके अलावा Sankey आरेख से प्रवाह और विभिन्न नोड्स (प्रयुक्त ऊर्जा और खो ऊर्जा में फिर से संयोजन) की कल्पना करना अच्छा है ।
एंडी डब्ल्यू

@AndyW, मेरा मतलब उस आंकड़े को खटखटाना नहीं है। यह काफी हद तक बी / सी पढ़ने के लिए बहुत काम है इसमें बहुत सारी जानकारी शामिल है। कि यह आपको खींचता है और आपको कुछ समय के लिए रोक कर रखता है, एक वास्तविक प्लस हो सकता है - मेरे विवरण के नकारात्मक होने के लिए मेरा मतलब नहीं था। ओटीओएच, ओपी का डेटा बिल्कुल सीधा है कि सरल भूखंड उन्हें बता सकते हैं।
गंग -

अच्छी बात है, अगर ओपी का डेटा दिए जाने से ज्यादा जटिल नहीं है, तो शायद यह ज्यादा परेशानी की बात है कि यह इसके लायक है! हालांकि मैं मूल ऊर्जा आरेख को डॉट प्लॉट की श्रृंखला में परिवर्तित करने के बारे में सोचना भी नहीं चाहूंगा।
एंडी डब्ल्यू

@gung, मेरी पोस्ट का जवाब देने के लिए धन्यवाद। मैं मानता हूं, विधि की कमी को एक निश्चित संकेत के रूप में नहीं लिया जाना चाहिए कि विधि अच्छी या उपयोगी नहीं है, और मैंने निश्चित रूप से Sankey आरेख (SD) पर ऑप नहीं दिया है। मेरे डेटा के संबंध में, जो आप आरेख में देखते हैं, वह मेरे डेटा का केवल शीर्ष आयाम है, मेरे पास 4 अलग-अलग साइटों और 7 अलग-अलग चिकित्सकों द्वारा एकत्र किए गए डेटा हैं और मैं इस जानकारी को अपने प्लॉट में शामिल करना चाहूंगा, जैसे कुछ प्रकार समग्र प्रवाह के भीतर उपविभाजन। यह वर्तमान डेटा के साथ ओवरकिल की तरह लग सकता है, लेकिन मेरा मानना ​​है कि अगर मैं अपने सभी चर शामिल करता हूं तो एक एसडी उपयोगी होगा।
एरिक फेल

डब्ल्यू / अधिक से अधिक जटिलता, Sankey आरेख शायद तुम्हारा सबसे अच्छा शर्त है। यह आपके लायक भी है, जब आप ऊपर दिए गए लिंक की तरह @ AndyW के कुछ पोस्ट देख सकते हैं। उसने बहुत सारे अच्छे उत्तर दिए हैं जो प्रासंगिक हो सकते हैं। उदाहरण के लिए, यदि आप उसके पृष्ठ पर नेविगेट करने के लिए उसके नाम पर क्लिक करते हैं, तो वहां डेटा-विज़ुअलाइज़ेशन टैग पर क्लिक करें, आप उसके पोस्ट देख सकते हैं।
गंग -

1

अपने डेटा और एक सरल लेआउट के अनुसार सेट किए गए तीर की चौड़ाई के साथ एसवीजी फ़ाइल लिखने के लिए आर कोड का उपयोग करने के बारे में कैसे। फिर इंक्सस्केप में लोड करें और आस-पास के तीरों को मोड़ें, कुछ सुंदर बनाने के लिए अपने दिल की सामग्री आदि में लेबल आदि जोड़ें।

स्पष्ट समस्या: यदि आपके डेटा में बदलाव होता है, तो आपको इनस्कैप में अपने सभी पूर्वाभ्यास को फिर से करना होगा (हालाँकि आप अपने सुंदर एसवीजी को इंक्सस्केप से एक टेम्पलेट के रूप में उपयोग कर सकते हैं और नए तीर की चौड़ाई को बदल सकते हैं)।

लेकिन ईमानदारी से, अगर शीर्ष पर स्ट्रगलिंग मल्टीग्लस का वह बहुरंगी गड़बड़ एक अच्छा सेंकी डायग्राम है, तो मैं एक बुरे व्यक्ति को पूर्ण पेट पर देखने से घृणा करूंगा [हालांकि इसे कुछ और मिनटों तक घूरने से मुझे एक सुराग मिला है। यह किस बारे में है, एक अच्छे ग्राफिक को इसकी आवश्यकता नहीं होनी चाहिए]।


2
मुझे उस डेटा को देखने का एक बेहतर तरीका देखने में दिलचस्पी होगी। उस भूखंड (और कई अलग-अलग चर) में बहुत सारी जानकारी है, इसलिए निश्चित रूप से यह जटिल होने जा रहा है ...
n

2
डैन कार्र के माइक्रो मैप्स पूरे ग्राफिक को पचाने में समय लेते हैं, इसलिए कोई भी विस्तृत रोड मैप करता है। जरूरी नहीं कि कोई बुरी चीज हो। जेम्स चेसायर के ब्लॉग पोस्ट, फास्ट थिंकिंग और स्लो थिंकिंग विज़ुअलाइज़ेशन देखें
एंडी डब्ल्यू
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.