आकस्मिक तालिकाओं के लिए चलनी / मोज़ेक भूखंडों के लिए वैकल्पिक


17

मैंने एक बार इंटरनेट पर श्रेणीबद्ध डेटा (यानी आकस्मिक तालिकाओं) के लिए एक प्रकार के कथानक में ठोकर खाई थी, जो मुझे वास्तव में पसंद आया था, लेकिन मैंने इसे फिर कभी नहीं पाया है, और मुझे यह भी नहीं पता कि इसे क्या कहा जाता है। यह अनिवार्य रूप से एक छलनी की साजिश की तरह था, जिसमें पंक्ति की ऊंचाई और स्तंभ की चौड़ाई सीमांत संभावनाओं के सापेक्ष मापी गई थी। इस प्रकार, प्रत्येक बॉक्स को स्वतंत्रता के तहत अपेक्षित सापेक्ष आवृत्ति में बढ़ाया गया था। हालाँकि, यह प्रत्येक बॉक्स के भीतर क्रॉस-हैचिंग की साजिश रचने के बजाय, एक छलनी के प्लाट से भिन्न था, इसने एक बिंदु (जैसे स्कैटलपॉट) में एक स्थान पर बेतरतीब ढंग से प्रत्येक अवलोकन के लिए एक द्विभाजित वर्दी से चुना। इस तरह, बिंदुओं का घनत्व प्रतिबिंबित करता है कि देखे गए गणना अपेक्षित गणना से कितनी अच्छी तरह मेल खाते हैं। यही है, यदि घनत्व प्रत्येक बॉक्स में समान था, तो नल मॉडल उचित है, ) नल मॉडल के तहत बहुत संभावना नहीं हो सकती है। क्योंकि बिंदुओं को क्रॉस-हैचिंग के बजाय प्लॉट किया जाता है, प्लॉट किए गए तत्व और मनाया गणना के बीच एक सरल और सहज पत्राचार होता है, जो जरूरी नहीं कि छलनी भूखंडों के लिए सही है (नीचे देखें)। इसके अलावा, अंकों का यादृच्छिक स्थान प्लॉट को एक 'जैविक' एहसास देता है। इसके अलावा, रंग का उपयोग बक्से / कोशिकाओं को उजागर करने के लिए किया जा सकता है जो कि अशक्त मॉडल से दृढ़ता से हटते हैं, और कई अलग-अलग चर के बीच युग्मक संबंधों की जांच करने के लिए एक प्लॉट मैट्रिक्स का उपयोग किया जा सकता है, इसलिए यह समान भूखंडों के लाभों को शामिल कर सकता है। मैं,जे

  • क्या किसी को पता है कि इस साजिश को क्या कहा जाता है?
  • क्या कोई पैकेज / फ़ंक्शन है जो R, या अन्य सॉफ़्टवेयर (जैसे, मोंड्रियन) में यह आसानी से करेगा? मुझे vcd में ऐसा कुछ नहीं मिला । बेशक, यह खरोंच से कठोर कोडित हो सकता है, लेकिन यह एक दर्द होगा।

यहां एक छलनी की साजिश का एक सरल उदाहरण है, ध्यान दें कि यह देखना आसान है कि विभिन्न श्रेणियों के लिए अपेक्षित गणनाओं को शून्य मॉडल के तहत कैसे खेलना चाहिए, लेकिन वास्तविक संख्याओं के साथ क्रॉस-हैचिंग को समेटना मुश्किल है, एक भूखंड की उपज नहीं है पढ़ने में काफी आसान और सौंदर्य से लबरेज:

    B ~B
 A 38  4
~A  3 19

यहाँ छवि विवरण दर्ज करें
इसके लायक होने के लिए, एक मोज़ेक प्लॉट में विपरीत समस्या होती है: हालाँकि यह देखना आसान है कि कौन सी कोशिकाओं में 'बहुत अधिक' या 'बहुत कम' मायने रखता है (अशक्त मॉडल के सापेक्ष), यह पहचानना कठिन है कि दोनों के बीच के रिश्ते क्या हैं अपेक्षित मायने रखता है। विशेष रूप से, स्तंभ की चौड़ाई सीमांत संभाव्यता के सापेक्ष मापी जाती है, लेकिन पंक्ति ऊंचाइयां नहीं होती हैं, जिससे जानकारी का वह टुकड़ा निकालना लगभग असंभव हो जाता है।
यहाँ छवि विवरण दर्ज करें
और अब पूरी तरह से अलग...

  • क्या किसी को पता है कि 'बहुत सारे' के लिए नीले रंग का उपयोग करने और 'बहुत कम' के लिए लाल रंग का सम्मेलन कहां से आता है? यह मेरे लिए हमेशा से ही उल्टा रहा है। मुझे ऐसा लगता है कि असाधारण उच्च घनत्व (या बहुत अधिक टिप्पणियों) के साथ चला जाता गर्म , और कम घनत्व के साथ चला जाता ठंड , और कहा कि (मंच प्रकाश में कम से कम) लाल कर रहे हैं warms और उदास हैं कूल्स

अपडेट: अगर मुझे सही से याद है, तो मैंने जो प्लॉट देखा था, वह एक किताब के एक अध्याय (परिचय या ch1) के एक पीडीएफ में था, जो मार्केटिंग टीज़र के रूप में ऑनलाइन मुफ्त में उपलब्ध कराया गया था। यहाँ इस विचार का एक मोटा संस्करण है जिसे मैंने खरोंच से कोडित किया है:
यहाँ छवि विवरण दर्ज करें
इस कच्चे संस्करण के साथ भी, मुझे लगता है कि छलनी की साजिश की तुलना में पढ़ना आसान है, और कुछ मायनों में मोज़ेक की साजिश की तुलना में आसान है (उदाहरण के लिए, यह पहचानना आसान है कि रिश्ते क्या हैं सेल आवृत्तियों के बीच स्वतंत्रता के तहत होगा)। यह एक समारोह है कि अच्छा होगा: a। किसी भी आकस्मिक तालिका, बी के साथ स्वचालित रूप से ऐसा करेगा प्लॉट मैट्रिक्स के बिल्डिंग ब्लॉक के रूप में इस्तेमाल किया जा सकता है, और सी। अच्छी विशेषताएं होंगी जो उपरोक्त भूखंडों के साथ आती हैं (जैसे मोज़ेक भूखंड पर मानकीकृत अवशिष्ट किंवदंती)।


तो, आप अनिवार्य रूप से एक अलग तरह के भराव के साथ एक मोज़ेक साजिश चाहते हैं? क्या Rफ़ंक्शन assocplotआपके मतलब के करीब आता है? यदि नहीं, तो मैं शर्त लगा Rसकता हूं कि एक प्रोग्रामर या तो जो चाहे कर सकता है या mosaicplotजो आप चाहते हैं उसे संशोधित कर सकता है ।
पीटर Flom - को पुनः स्थापित मोनिका

1
ब्याज के संबंधित संदर्भ, विज़ुअलाइज़िंग के लिए अवशिष्ट-आधारित छायांकन (सशर्त) स्वतंत्रता ( ज़ीलिस एट अल। 2007 ), पीडीएफ यहां , और कुछ संदर्भों के साथ आकस्मिक तालिकाओं को देखने पर यहां एक और धागा । मेरा मानना ​​है कि ज़ाइलिस लेख में रंग पर एक अच्छी चर्चा है जो आपके अंतिम प्रश्न का उत्तर दे सकता है (यह संदर्भों को देखने के लिए अच्छा हो सकता है यह देखने के लिए कि क्या वे आपके द्वारा बताए गए चार्ट का हवाला देते हैं)।
एंडी डब्ल्यू 12

यह विपरीत है, @PeterFlom, मैं अनिवार्य रूप से एक अलग तरह के भराव के साथ एक छलनी की साजिश चाहता हूं। वैकल्पिक रूप से, आप कह सकते हैं कि मुझे एक मोज़ेक भूखंड चाहिए जहां प्रदर्शित बक्से स्वतंत्रता के तहत अपेक्षित आवृत्तियों के सापेक्ष स्केल किए गए हैं (और संभवतः एक अलग प्रकार के भरण के रूप में भी)।
गंग -

"क्या किसी को पता है कि 'बहुत अधिक' के लिए नीले रंग का उपयोग करने और 'बहुत कम' के लिए लाल रंग का सम्मेलन कहां से आता है? यह मेरे लिए हमेशा से उचित रहा है।" अच्छी बात। यह वास्तव में प्रति-सहज है। प्रकाश स्पेक्ट्रम सही पर लाल करने के लिए छोड़ दिया (छोटे तरंग दैर्ध्य के साथ जुड़े) पर नीले रंग से मोटे तौर पर चला जाता है (बड़ा तरंग दैर्ध्य के साथ जुड़े)। मोज़ेक के डिस्प्ले को इसके सिर पर उल्टा लगता है ...
लैंड्रोनी

छलनी आरेख का विचार यह है कि प्रत्येक कोशिका में बक्से की संख्या मनाया आवृत्ति के लिए आनुपातिक है, इसलिए सापेक्ष घनत्व अपेक्षित आवृत्ति से अधिक या कम दिखाता है। यदि आपको रंग पसंद नहीं हैं, तो आप उन्हें आसानी से चूक से बदल सकते हैं। यदि आपको डिफ़ॉल्ट छलनी शेडिंग फ़ंक्शन पसंद नहीं है, तो आप आसानी से अपना स्वयं का लिख ​​सकते हैं, जैसे, shading.points()आप जो चाहते हैं, वह स्ट्रचप्लेट ढांचे के भीतर जो ऊपर उद्धृत किया गया था और vcdपैकेज में एक विगनेट के रूप में उपलब्ध है ।
user101089

जवाबों:


15

आपने जिस पुस्तक का वर्णन किया है वह ऐसा लगता है, जैसे 'विज़ुअलाइज़िंग श्रेणीबद्ध डेटा,' माइकल फ्रेंडली। आपके अनुरोध से मेल खाने वाले प्रथम अध्याय में वर्णित कथानक को आकस्मिक टेबल डेटा को देखने के लिए एक प्रकार का वैचारिक मॉडल के रूप में वर्णित किया गया था (लेखक द्वारा अवलोकन घनत्व के साथ एक गतिशील दबाव मॉडल के रूप में वर्णित), और इसे Google पूर्वावलोकन में देखा जा सकता है के लिए Ch 1. पुस्तक SAS उपयोगकर्ताओं की ओर तैयार है।

इस विषय पर एक पेपर यहां दिया गया है: www.datavis.ca/papers/koln/kolnpapr.pdf

'माइकल फ्रेंडली कॉन्सेप्टुअल मॉडल्स फॉर विज़ुअलाइज़िंग कॉन्टैन्सी टेबल डेटा ’।

http://i47.tinypic.com/148n5n7.jpg

यहाँ छवि विवरण दर्ज करें

* संयोग से, लेखक को vcd पैकेज के लेखकों में से एक के रूप में भी सूचीबद्ध किया गया है (जैसा कि ऊपर उल्लेखित उनकी पुस्तक से विशेष रूप से प्रेरित था) - शायद आप उनसे सीधे पूछ सकते हैं कि क्या इसमें निर्मित कार्यों में से एक साधारण संशोधन है जो स्पष्ट रूप से स्पष्ट नहीं है।

** रंग योजना स्वतंत्रता से सकारात्मक विचलन के साथ रंग नीला से संबंधित है, और नकारात्मक विचलन के लिए लाल है। हालांकि लाल योजना उस संदर्भ में समझ में आती है, शायद यह सकारात्मक विचलन का प्रतिनिधित्व करने के लिए हरे रंग का उपयोग करने के लिए अधिक उपयुक्त है।

http://www.datavis.ca/papers/asa92.html


2
अच्छा काम रहस्य सुलझाया है! मुझे वास्तव में विभिन्न टिड-बिट्स में पूर्वावलोकन करने के बजाय पुस्तक खरीदने की आवश्यकता है और मेरी लाइब्रेरी मुझे हर बार अध्यायों को भेजती है। IMO के इस प्रकार के विज़ुअलाइज़ेशन से मुझे पता चलता है कि कार्टोग्राफर "डॉट मैप्स" को क्या कहते हैं, और एक व्यक्ति साहित्य का उपयोग यह बताने के लिए कर सकता है कि कैसे लाइनें और क्रॉस-हैचिंग की तुलना में डॉट्स एक बेहतर विज़ुअलाइज़ेशन टूल हैं। यह डॉट्स के अधिमान्य स्थानों के संदर्भ में एक अच्छा साहित्य भी है।
एंडी डब्ल्यू

इससे मुझे अच्छी शुरुआत मिलती है। आपकी सहायता के लिए धन्यवाद।
गूँग - मोनिका

1

हो सकता है कि आपने जो न देखा हो, लेकिन कल्पना के लिए स्वतंत्रता पत्राचार भूखंडों के तहत अपेक्षित प्रस्थान के अच्छी तरह से प्रेरित हों।

http://www.jstatsoft.org/v20/i03/

(एक तरफ, एसएएस और एम फ्रेंडली की पुस्तक को अनुशंसित समायोजन के बारे में गलत माना गया था और कई भूखंडों में कलाकृतियां थीं और यह उनके कथित मूल्य से विचलित हो सकता है।)


आपकी मदद के लिए धन्यवाद, मुझे पत्राचार भूखंड पसंद हैं। क्या आप इस अनुशंसित समायोजन के बारे में अधिक कह सकते हैं जो गलत था? क्या समायोजन था? यह कैसे गलत था? और भूखंडों में क्या गलत था?
गंग -

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.