मैंने एक बार इंटरनेट पर श्रेणीबद्ध डेटा (यानी आकस्मिक तालिकाओं) के लिए एक प्रकार के कथानक में ठोकर खाई थी, जो मुझे वास्तव में पसंद आया था, लेकिन मैंने इसे फिर कभी नहीं पाया है, और मुझे यह भी नहीं पता कि इसे क्या कहा जाता है। यह अनिवार्य रूप से एक छलनी की साजिश की तरह था, जिसमें पंक्ति की ऊंचाई और स्तंभ की चौड़ाई सीमांत संभावनाओं के सापेक्ष मापी गई थी। इस प्रकार, प्रत्येक बॉक्स को स्वतंत्रता के तहत अपेक्षित सापेक्ष आवृत्ति में बढ़ाया गया था। हालाँकि, यह प्रत्येक बॉक्स के भीतर क्रॉस-हैचिंग की साजिश रचने के बजाय, एक छलनी के प्लाट से भिन्न था, इसने एक बिंदु (जैसे स्कैटलपॉट) में एक स्थान पर बेतरतीब ढंग से प्रत्येक अवलोकन के लिए एक द्विभाजित वर्दी से चुना। इस तरह, बिंदुओं का घनत्व प्रतिबिंबित करता है कि देखे गए गणना अपेक्षित गणना से कितनी अच्छी तरह मेल खाते हैं। यही है, यदि घनत्व प्रत्येक बॉक्स में समान था, तो नल मॉडल उचित है, ) नल मॉडल के तहत बहुत संभावना नहीं हो सकती है। क्योंकि बिंदुओं को क्रॉस-हैचिंग के बजाय प्लॉट किया जाता है, प्लॉट किए गए तत्व और मनाया गणना के बीच एक सरल और सहज पत्राचार होता है, जो जरूरी नहीं कि छलनी भूखंडों के लिए सही है (नीचे देखें)। इसके अलावा, अंकों का यादृच्छिक स्थान प्लॉट को एक 'जैविक' एहसास देता है। इसके अलावा, रंग का उपयोग बक्से / कोशिकाओं को उजागर करने के लिए किया जा सकता है जो कि अशक्त मॉडल से दृढ़ता से हटते हैं, और कई अलग-अलग चर के बीच युग्मक संबंधों की जांच करने के लिए एक प्लॉट मैट्रिक्स का उपयोग किया जा सकता है, इसलिए यह समान भूखंडों के लाभों को शामिल कर सकता है।
- क्या किसी को पता है कि इस साजिश को क्या कहा जाता है?
- क्या कोई पैकेज / फ़ंक्शन है जो R, या अन्य सॉफ़्टवेयर (जैसे, मोंड्रियन) में यह आसानी से करेगा? मुझे vcd में ऐसा कुछ नहीं मिला । बेशक, यह खरोंच से कठोर कोडित हो सकता है, लेकिन यह एक दर्द होगा।
यहां एक छलनी की साजिश का एक सरल उदाहरण है, ध्यान दें कि यह देखना आसान है कि विभिन्न श्रेणियों के लिए अपेक्षित गणनाओं को शून्य मॉडल के तहत कैसे खेलना चाहिए, लेकिन वास्तविक संख्याओं के साथ क्रॉस-हैचिंग को समेटना मुश्किल है, एक भूखंड की उपज नहीं है पढ़ने में काफी आसान और सौंदर्य से लबरेज:
B ~B
A 38 4
~A 3 19
इसके लायक होने के लिए, एक मोज़ेक प्लॉट में विपरीत समस्या होती है: हालाँकि यह देखना आसान है कि कौन सी कोशिकाओं में 'बहुत अधिक' या 'बहुत कम' मायने रखता है (अशक्त मॉडल के सापेक्ष), यह पहचानना कठिन है कि दोनों के बीच के रिश्ते क्या हैं अपेक्षित मायने रखता है। विशेष रूप से, स्तंभ की चौड़ाई सीमांत संभाव्यता के सापेक्ष मापी जाती है, लेकिन पंक्ति ऊंचाइयां नहीं होती हैं, जिससे जानकारी का वह टुकड़ा निकालना लगभग असंभव हो जाता है।
और अब पूरी तरह से अलग...
- क्या किसी को पता है कि 'बहुत सारे' के लिए नीले रंग का उपयोग करने और 'बहुत कम' के लिए लाल रंग का सम्मेलन कहां से आता है? यह मेरे लिए हमेशा से ही उल्टा रहा है। मुझे ऐसा लगता है कि असाधारण उच्च घनत्व (या बहुत अधिक टिप्पणियों) के साथ चला जाता गर्म , और कम घनत्व के साथ चला जाता ठंड , और कहा कि (मंच प्रकाश में कम से कम) लाल कर रहे हैं warms और उदास हैं कूल्स ।
अपडेट: अगर मुझे सही से याद है, तो मैंने जो प्लॉट देखा था, वह एक किताब के एक अध्याय (परिचय या ch1) के एक पीडीएफ में था, जो मार्केटिंग टीज़र के रूप में ऑनलाइन मुफ्त में उपलब्ध कराया गया था। यहाँ इस विचार का एक मोटा संस्करण है जिसे मैंने खरोंच से कोडित किया है:
इस कच्चे संस्करण के साथ भी, मुझे लगता है कि छलनी की साजिश की तुलना में पढ़ना आसान है, और कुछ मायनों में मोज़ेक की साजिश की तुलना में आसान है (उदाहरण के लिए, यह पहचानना आसान है कि रिश्ते क्या हैं सेल आवृत्तियों के बीच स्वतंत्रता के तहत होगा)। यह एक समारोह है कि अच्छा होगा: a। किसी भी आकस्मिक तालिका, बी के साथ स्वचालित रूप से ऐसा करेगा । प्लॉट मैट्रिक्स के बिल्डिंग ब्लॉक के रूप में इस्तेमाल किया जा सकता है, और सी। अच्छी विशेषताएं होंगी जो उपरोक्त भूखंडों के साथ आती हैं (जैसे मोज़ेक भूखंड पर मानकीकृत अवशिष्ट किंवदंती)।
shading.points()
आप जो चाहते हैं, वह स्ट्रचप्लेट ढांचे के भीतर जो ऊपर उद्धृत किया गया था और vcd
पैकेज में एक विगनेट के रूप में उपलब्ध है ।
R
फ़ंक्शनassocplot
आपके मतलब के करीब आता है? यदि नहीं, तो मैं शर्त लगाR
सकता हूं कि एक प्रोग्रामर या तो जो चाहे कर सकता है याmosaicplot
जो आप चाहते हैं उसे संशोधित कर सकता है ।