कई सेट के चौराहों की कल्पना


30

क्या एक विज़ुअलाइज़ेशन मॉडल है जो कई सेटों के प्रतिच्छेदन ओवरलैप दिखाने के लिए अच्छा है?

मैं वेन आरेखों की तरह कुछ सोच रहा हूं, लेकिन किसी तरह बड़ी संख्या में सेट जैसे 10 या अधिक के लिए खुद को बेहतर उधार दे सकता है। विकिपीडिया कुछ उच्च सेट वेन आरेख दिखाता है, लेकिन यहां तक ​​कि 4 सेट आरेख बहुत कुछ लेने के लिए हैं।

डेटा के अंतिम परिणाम के रूप में मेरा अनुमान है कि कई सेट ओवरलैप नहीं होंगे, इसलिए यह संभव है कि वेन आरेख ठीक होंगे - लेकिन मैं एक कंप्यूटर टूल ढूंढना चाहूंगा जो इसे उत्पन्न करने में सक्षम होगा। इसकी तरह मुझे लगता है कि Google चार्ट कई सेट की अनुमति नहीं देता है।


1
संबंधित, लेकिन सेट की छोटी संख्या के लिए (संदर्भ के लिए): आंकड़े.stackexchange.com/questions/4211/…

जवाबों:


18

जब आपके पास बड़ी संख्या में सेट होते हैं, तो मैं कुछ ऐसा प्रयास करूंगा जो अधिक रैखिक हो और सीधे लिंक दिखाता है (जैसे नेटवर्क ग्राफ)। फ्लेयर और प्रोटॉविस दोनों के पास इन दृश्यों को संभालने के लिए उपयोगिताओं हैं।

कुछ उदाहरणों के लिए यह प्रश्न देखें :

वैकल्पिक शब्द


(+1) अच्छा जवाब! - मैं विशेष रूप से ग्राफिक्स पसंद करता हूं। मैं सोच रहा था कि क्या आर में ऐसा करने का कोई तरीका है?
सनकूलू

1
मैं इसे करने के लिए किसी भी तरह से अवगत नहीं हूँ; मेरा वेबवीस पैकेज प्रोटॉविस के लिए एक आवरण प्रदान करता है, लेकिन यह इस ग्राफिक को बनाने के लिए बहुत काम आएगा। संयोग से, यह पत्र "चाप आरेख" का परिचय देता है जो संबंधित है: ieg.ifs.tuwien.ac.at/~aigner/teaching/ws06/infovis_ue/papers/…
Shane

1
@suncoolsu, R पैकेज आरेख वही "आर्क आरेख" करने में सक्षम हो सकता है जिसे शेन ने इंगित किया था। ऐसा लगता है कि यद्यपि "प्लॉट वेब" प्राप्त करना कठिन होगा, हालांकि ऊपर के दृश्य की तरह दिखाई देगा। cran.r-project.org/web/packages/diagram/vignettes/diagram.pdf
एंडी डब्ल्यू

और एंडी। आपके जवाबों के लिये धन्यवाद। @ शेन, मैंने आपका वेबवीस पैकेज देखा है। लेकिन मुझे अभी भी इसे और तलाशने की जरूरत है। मुझे प्रोटॉविस ग्राफ बहुत पसंद हैं। उनके पास एक बेहतरीन वेबसाइट है।
सनकूलू

1
अच्छा ग्राफ, लेकिन यह प्रारंभिक प्रश्न का उत्तर नहीं देता है, क्योंकि आप 3 या अधिक सेट के चौराहे का प्रतिनिधित्व नहीं कर सकते हैं। क्या इसका कोई संस्करण है जो करता है?
nassimhddd

11

यह @ शेन के जवाब के साथ प्रतिस्पर्धा नहीं करेगा क्योंकि उच्च-आयामी डेटासेट के साथ जटिल संबंधों को प्रदर्शित करने के लिए परिपत्र प्रदर्शन वास्तव में अच्छी तरह से अनुकूल हैं।

venn()K=4

K=4

आगे के संदर्भ के लिए, आप में रुचि हो सकती है

केस्टलर एट अल।, सामान्यीकृत वेन आरेख: जटिल आनुवंशिक सेट संबंधों , जैव सूचना विज्ञान, 21 (8), 1592-1595 (2004) की कल्पना करने की एक नई विधि

वेन आरेखों की अपनी सीमाएँ हैं, हालाँकि। इस संबंध में, मुझे Sightings: A Vennerable Challenge में या समानांतर सेट्स के साथ रॉबर्ट कोसारा द्वारा लिया गया दृष्टिकोण पसंद है (लेकिन एंड्रयू जेलमैन वेबलॉग पर यह चर्चा भी देखें )।


अच्छा लग रहा है। मुझे यह अच्छा लगता अगर यह नॉन न्यूमेरिकल को स्वीकार करता। ऐसा लगता है कि किसी को अपने डेटा को पहले एक संख्यात्मक सूची में बदलना है।
इस्टाफ्री

व्यावहारिक उद्देश्यों के लिए, यह कुछ
स्केंग्रेब्स

7

हमने सेट-चौराहों के लिए एक मैट्रिक्स-आधारित दृष्टिकोण विकसित किया है जिसे उपसेट कहा जाता है, आप इसे देख सकते हैं http://vcg.github.io/upset/ । यहाँ एक उदाहरण है:

अपसेट स्क्रीनशॉट

बाईं ओर का मैट्रिक्स चौराहे की पहचान करता है जो एक पंक्ति का प्रतिनिधित्व करता है, यहां अंतिम पंक्ति, उदाहरण के लिए, "एक्शन, एडवेंचर, और चिल्ड्रन" मूवी शैलियों का प्रतिच्छेदन है। दाईं ओर की पट्टियाँ आपको चौराहे के आकार को दिखाती हैं, 4 इस उदाहरण में।

आप चौराहों या अन्य चयनों की विशेषताओं को भी प्लॉट कर सकते हैं, आदि विवरण के लिए वेबसाइट देखें।

R के लिए अब एक स्टैटिक वर्जन भी है जिसे आप ऊपर बताई गई वेबसाइट पर या यहाँ जाकर देख सकते हैं: https://github.com/hms-dbmi/UpSetR/

सेट विज़ुअलाइज़ेशन पर कला रिपोर्ट की एक स्थिति http://www.cvast.tuwien.ac.at/SetViz पर सुलभ है - इनमें से अधिकांश हालांकि अकादमिक हैं और आसानी से उपलब्ध कोड के साथ नहीं आते हैं।


1
मेरे लिए छवि आप पोस्ट बल्कि overplotting, बहुत ज्यादा जानकारी के साथ का एक उदाहरण एक ही प्लॉट पर पैक किया है ...
टिम

1
@Tim। जब मैं समझता हूं कि आप क्या कह रहे हैं, यह वास्तव में नहीं है क्योंकि सभी दृश्य तत्व स्पष्ट रूप से दिखाई और अलग हो जाते हैं। आप तर्क दे सकते हैं कि कथानक बहुत आसानी से जटिल है, लेकिन यह सिर्फ आपके साथ संबंधित हो सकता है कि आपको कथानक का उपयोग करने में प्रशिक्षित नहीं किया जा रहा है - सभी विज़ुअलाइज़ेशन अप्रशिक्षित उपयोगकर्ताओं के उद्देश्य से नहीं किए जा सकते हैं या नहीं होने चाहिए, क्योंकि सरलीकरण अक्सर सीमित दायरे में आते हैं (जैसे
वेन

@ थॉमसपी 85 में बहुत अधिक शोध था, जिससे पता चलता है कि लोग पाई चार्ट जैसे बुनियादी सामानों सहित भूखंडों (यहां तक ​​कि "विशेषज्ञों") की दृश्य व्याख्या में वास्तव में खराब हैं । ज्यादातर मामलों में जटिल दृश्य गलत व्याख्या और गलतफहमी पैदा करते हैं।
टिम

@ मैं मानता हूँ कि सरल हमेशा बेहतर होता है, लेकिन जटिल प्रश्नों के कभी-कभी जटिल उत्तर होते हैं। यह प्रश्न पहली बार में सामने आया था कि इस तिथि तक, बड़ी संख्या में सेट चौराहों से निपटने के लिए सम्मोहक, सरल दृश्य तकनीक नहीं है। स्वीकृत उत्तर केवल 2-डिग्री वाले चौराहों के साथ ही चिंता करता है जो सेट की संख्या में वृद्धि के साथ, कुल संख्या के छोटे और छोटे भाग हैं।
थॉमसपी ५५

... और पाई चार्ट के साथ आपका उदाहरण इस तथ्य से संबंधित है कि मनुष्य (विशेषज्ञ या नहीं) कोणों की तुलना करने में भयानक हैं, यही कारण है कि पाई चार्ट का उपयोग कभी नहीं किया जाना चाहिए
थॉमसपी 85
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.