आप 3 श्रेणीबद्ध चर के बीच संबंध की कल्पना कैसे कर सकते हैं?


21

मेरे पास तीन श्रेणीगत चर के साथ एक डेटासेट है और मैं एक ग्राफ में तीनों के बीच के रिश्ते की कल्पना करना चाहता हूं। कोई विचार?

वर्तमान में मैं निम्नलिखित तीन ग्राफ़ का उपयोग कर रहा हूं: यहाँ छवि विवरण दर्ज करें

प्रत्येक ग्राफ आधारभूत अवसाद (माइल्ड, मॉडरेट, गंभीर) के स्तर के लिए है। फिर प्रत्येक ग्राफ के भीतर मैं उपचार (0,1) और अवसाद में सुधार (कोई नहीं, मध्यम, पर्याप्त) के बीच संबंध देखता हूं।

ये 3 रेखांकन 3-तरफ़ा संबंध को देखने के लिए काम करते हैं, लेकिन क्या एक ग्राफ के साथ ऐसा करने का एक ज्ञात तरीका है?


4
डेटा पोस्ट करने से लोग खेलते हैं।
निक कॉक्स

1
आपके पास 3 बेसलाइन श्रेणियां, 2 उपचार श्रेणियां और 3 अवसाद परिणाम हैं। आखिरी दिया। प्रत्येक अवसाद के प्रकार के अनुपात को त्रिकोणीय (ट्रिलिनियर, टर्नरी) भूखंड पर 6 बिंदुओं द्वारा प्रदर्शित किया जा सकता है।
निक कॉक्स

4
इन रेखांकन में क्या गलत है?
Aksakal

क्या आप @NickCox अनुरोधों के अनुसार डेटा प्रदान कर सकते हैं? मैं इकट्ठा करता हूं यह केवल 18 नंबर है।
गूँग - मोनिका

जवाबों:


12

यह एक दिलचस्प डेटा है जो आंशिक रूप से, क्योंकि यह वास्तव में स्पष्ट नहीं है, रेखांकन का प्रतिनिधित्व करने की कोशिश करने के लिए सेट है। दोनों 3-लेवल के कारक ऑर्डिनल हैं और उनके बीच संभावित इंटरप्ले है (संभवतया, यह एक के mild baselineलिए कठिन है substantial improvement- या शायद substantial improvementप्रत्येक के लिए कुछ अलग है baseline)।

कई चर के साथ, आमतौर पर एक भी दृश्य नहीं होता है जो उन सभी विशेषताओं को दिखाता है जिनकी आप परवाह कर सकते हैं। कुछ कारक दूसरों की तुलना में आसान होंगे। मुझे लगता है कि आपका मूल दृष्टिकोण अच्छा है और निक कॉक्स के सुझावों के साथ बेहतर होगा: डुप्लिकेट किंवदंतियों को दूर करना और एक ऑर्डिनल रंग पैमाने का उपयोग करना।

यदि आप उपचारों के बीच के अंतर को देखने में सबसे दिलचस्प हैं, तो आप स्टैक्ड सलाखों के बजाय एक स्टैक्ड एरिया प्लॉट का उपयोग करके परिवर्तन पर जोर दे सकते हैं।

यहाँ छवि विवरण दर्ज करें

मैं आम तौर पर स्टैकिंग से सावधान रहता हूं क्योंकि मध्यम मूल्यों को पढ़ना मुश्किल है, लेकिन यह इस डेटा की निश्चित-राशि को फिर से लागू करता है। और यह प्रासंगिक होने पर योग moderate+ को पढ़ना आसान बनाता है substantial। मैंने improvementस्तरों के क्रम को फ़्लिप किया है ताकि उच्च आवृत्ति के लिए बेहतर हो।

स्टैकिंग के बिना, समकक्ष एक ढलान ग्राफ है।

यहाँ छवि विवरण दर्ज करें

प्रत्येक स्तर को पढ़ना आसान है, लेकिन इंटरप्ले को समझना कठिन है। आपको यह ध्यान रखना होगा कि तीसरी पंक्ति सीधे अन्य दो पर निर्भर है।

डेटा की क्रमिक प्रकृति को देखते हुए, improvementमूल्य को एक संख्यात्मक स्कोर में बदलने में मदद मिल सकती है , जैसा कि अक्सर लिकर्ट डेटा के साथ किया जाता है । उदाहरण के लिए, , none=0, ।moderate=1 substantial=2फिर आप उस वैरिएबल को लगातार स्केल पर ग्राफ कर सकते हैं। नकारात्मक पक्ष यह है कि आपको एक उचित स्कोरिंग ढूंढना होगा (जैसे, शायद 0, 1 और 5 ट्रूर प्रतिनिधित्व होगा)।

यहाँ छवि विवरण दर्ज करें

Colophon : ये प्लॉट सॉफ्टवेयर पैकेज JMP (जिसे मैं विकसित करने में मदद करता हूं) में ग्राफ बिल्डर फीचर के साथ बनाया गया था । हालांकि, अंतःक्रियात्मक रूप से बनाया गया है, उदाहरण के लिए, रंग साजिश के बिना क्षेत्र की साजिश के लिए, एक स्क्रिप्ट है:

Graph Builder(
    Graph Spacing( 15 ),
    Variables( X( :treatment ), Y( :frequency ),
        Group X( :baseline ), Overlay( :improvement )
    ),
    Elements( Area( X, Y ) )
);

2
+1। कुछ बेहतरीन विचार यहाँ। हालांकि मैं स्टैकिंग के बारे में उत्सुक हूं, मुझे लगता है कि पहला ग्राफ सबसे अच्छा काम करता है। यह दिलचस्प बातचीत को सामने लाता है: उपचार 1 हमेशा पर्याप्त सुधार के अधिक उदाहरण और कोई नहीं से अधिक उत्पादन करता है!
निक कॉक्स

महान पद। क्या वैसे भी कोई आर में आपके द्वारा प्रदर्शित 1 ग्राफ का निर्माण कर सकता है? मैंने थोड़ी देर में JMP का उपयोग नहीं किया है।
अलेजांद्रो ओचोआ

1
@AlejandroOchoa ggplot में एक एरिया जियोम है। Ggplot2 का उपयोग करके स्टैक्ड एरिया प्लॉट बनाना देखें ।
xan

10

सबसे पहले, यहां उन लोगों के लिए डेटा प्रदान किए गए ग्राफ़ से मेरा पढ़ना है जो खेलना चाहते हैं (प्रयोग, यदि आपको पसंद है)। एनबी ऑफ-बाय-वन त्रुटियां निश्चित रूप से संभव हैं, क्योंकि सकल त्रुटियां हैं।

    improvement  treatment   baseline   frequency  
           none          0       mild          5  
       moderate          0       mild         41  
    substantial          0       mild          4  
           none          1       mild         19  
       moderate          1       mild         19  
    substantial          1       mild         12  
           none          0   moderate         19  
       moderate          0   moderate         24  
    substantial          0   moderate          7  
           none          1   moderate         20  
       moderate          1   moderate         14  
    substantial          1   moderate         16  
           none          0     severe          7  
       moderate          0     severe         21  
    substantial          0     severe         22  
           none          1     severe         12  
       moderate          1     severe         15  
    substantial          1     severe         23  

यहाँ मूल डिजाइन का एक पुनर्संयोजन है। मूल डेटा का एक विवरण चीजों को सरल बनाता है: पूर्वसूचक संयोजनों में से प्रत्येक में लोगों की संख्या समान है, इसलिए प्लॉटिंग आवृत्तियों और प्लॉटिंग पर्केंट्स समान हैं। यहाँ एक स्टैक्ड (उपविभाजित, खंडित) बार चार्ट के बजाय, हम दो-तरफ़ा बार चार्ट या टेबल डिज़ाइन डिज़ाइन में बार को अलग करते हैं।

ग्राफिक्स में विस्तार का बस इतना ही है, विस्तार। एक ग्राफ में कई छोटी कमजोरियां इसकी प्रभावशीलता को कम कर सकती हैं और कई छोटे सुधार भी मदद कर सकते हैं।

यहाँ छवि विवरण दर्ज करें

इसे वर्तनी के लिए:

  1. कुल्हाड़ियों, किंवदंती और पाठ की पुनरावृत्ति के साथ यहां तीन पैनलों की आवश्यकता नहीं है।

  2. एक किंवदंती हमेशा अभिशाप के रूप में अच्छी तरह से आशीर्वाद देती है, पाठक को मानसिक रूप से "आगे और पीछे" जाने के लिए बाध्य करती है (या किंवदंती को याद करती है, ऐसा कुछ नहीं जो अपील करता है, हालांकि आसान हो सकता है)। सलाखों द्वारा सूचनात्मक पाठ का पालन करना आसान है।

  3. फ्रूट सलाद कलर कोडिंग डिस्पेंसेबल है। यह भी मनमाना लगता है: "पर्याप्त" सुधार एक बड़ी बात है, लेकिन मुझे यहां तक ​​कि मजबूत पीले एक मातहत रंग भी मिलते हैं। जब हमें समझाने के लिए पाठ होता है तो हमें रंग की आवश्यकता नहीं होती है।

  4. हालाँकि कुछ लोग चित्र और तालिका के बीच के अंतर का उल्लंघन करते हुए डरावनी दिखेंगे, हम आवृत्तियों को भी दिखा सकते हैं। यह "इस श्रेणी के 4 लोगों" को सोचने में सक्षम होने में मददगार है।

  5. यहां मूल रूप में, ऊर्ध्वाधर अक्ष पर प्रतिक्रिया की पारंपरिक साजिश रचने के लिए यहां श्रद्धांजलि है।

सभी ने कहा, इन आंकड़ों में बहुत संरचना देखना मुश्किल है। जब ऐसा होता है, तो बहुत संरचना के बिना (ए) डेटा के बीच दोष को साझा करना भी मुश्किल होता है और (बी) न केवल भविष्यवक्ता प्रभाव बल्कि संभावित बातचीत को बाहर निकालने के लिए एक चित्रमय डिजाइन की कमजोरियों को भी साझा करता है। आधारभूत स्थिति की तुलना में उपचार कम महत्वपूर्ण लगता है। लेकिन फिर, अगर आधारभूत "सौम्य" था, तो "पर्याप्त" सुधार के लिए कितना स्कोप था? मैं मानसिक स्वास्थ्य डेटा का अध्ययन निश्चित रूप से एक विशेषवाद नहीं है, खासकर अगर डेटा नकली होने की संभावना है, तो मैं खुद को मूर्ख बनाने से रोकने के लिए वहां रुकूंगा। लेकिन अगर वे असली हैं, तो हम बहुत बड़े नमूना आकार के साथ कर सकते हैं। (हम आमतौर पर ऐसा कहते हैं, लेकिन आप वहां जाते हैं।)

संपादित करें ग्राफ अगर स्वाभाविक रूप से एक वांछित रंग योजना द्वारा जटिल हो सकता है:

यहाँ छवि विवरण दर्ज करें

रिकॉर्ड के लिए: रेखांकन ने Stata कोड का उपयोग किया, जिसमें मेरे अपने प्रोग्राम को tabplotडाउनलोड करने योग्य का उपयोग करना शामिल है ssc inst tabplot

tabplot improvement group [w=frequency] , showval ///
xmla(1.5 "mild" 3.5 "moderate" 5.5 "severe", noticks labgap(*4) labsize(medsmall)) ///
xla(1 "0" 2 "1" 3 "0" 4 "1" 5 "0" 6 "1") ///
xtitle(baseline and treatment) xsc(titlegap(*4)) bfcolor(emerald*0.2)

tabplot improvement group [w=frequency] , showval ///
xmla(1.5 "mild" 3.5 "moderate" 5.5 "severe", noticks labgap(*4) labsize(medsmall)) ///
xla(1 "0" 2 "1" 3 "0" 4 "1" 5 "0" 6 "1") ///
xtitle(baseline and treatment) xsc(titlegap(*2)) ///
sep(improvement2) bar3(bfcolor(emerald*0.2)) bar2(bfcolor(emerald*0.6)) ///
bar1(bfcolor(emerald)) barall(blcolor(green)) 

वैसे भी क्या आप अपने ग्राफ को एक रंग योजना के साथ अपलोड कर सकते हैं जो डेटा की क्रमिक प्रकृति को दर्शाता है? इसके अलावा आपने विज़ुअल बनाने के लिए किस सॉफ्टवेयर का उपयोग किया?
अलेजांद्रो ओचोआ

ये बहुत सुंदर भूखंड हैं
छायाकार

4

मैं इस तरह के डेटा के लिए 2-स्तरीय एक्स-अक्ष का उपयोग करने का शौकीन हूं। तो एकल चार्ट के लिए आपकी x- अक्ष श्रेणियां हो सकती हैं:

  • उपचार = 0, बेसलाइन = हल्का
  • उपचार = ०, आधार रेखा = मध्यम
  • उपचार = 0, बेसलाइन = गंभीर
  • उपचार = 1, बेसलाइन = हल्का
  • उपचार = 1, बेसलाइन = मध्यम
  • उपचार = 1, बेसलाइन = गंभीर

... श्रेणियों में एक ही मायने रखता है [कोई नहीं / मध्यम / पर्याप्त] हिस्टोग्राम बार।


+1। मैं यहां मुख्य विचार से सहमत हूं, जैसा कि मेरे उत्तर में लागू किया गया है। मैं नहीं बता सकता कि मेरा बार चार्ट डिज़ाइन कितना करीब है जो आप कल्पना कर रहे थे।
निक कॉक्स

धन्यवाद, आपका चार्ट बहुत अच्छा लग रहा है। क्या आपने बाहरी श्रेणी के रूप में उपचार 0/1 के साथ इसे देखने की कोशिश की, और एक्सलाइन के करीब के रूप में बेसलाइन = माइल्ड / मॉडरेट / गंभीर श्रेणी? मुझे लगता है कि अगर आपने इसे इस तरह से प्रस्तुत किया, तो आपको एक स्पष्ट पैटर्न दिखाई देगा - उपचार के लिए = 0 के लिए, "पर्याप्त" सुधार पट्टियाँ तेजी से बढ़ती हैं क्योंकि बेसलाइन हल्के / हल्के / गंभीर से उगता है। और आपको उपचार = 1 के भीतर एक ही पैटर्न (कुछ हद तक) दिखाई देगा। सामान्य तौर पर मैंने चर को कम श्रेणियों (उदाहरण के लिए यहां उपचार) के साथ रखा। लेकिन शायद आपने इसे इस तरह से देखा।
मैक्स पावर

मैंने दूसरे तरीके की कोशिश नहीं की, लेकिन मेरे मन में था कि शोधकर्ता सबसे अधिक आधारभूत उपचारों के प्रभावों की तुलना करना चाहते हैं, जो कि मेरे द्वारा किए जाने वाले तरीके से आसान होनी चाहिए।
निक कॉक्स

मेरे लिए उसका मतलब बनता है।
मैक्स पावर

4

क्या मोज़ेक साजिश विशेष रूप से इस उद्देश्य के लिए नहीं बनाई गई है?

R में ऐसा होगा

library(vcd)
d = read.table("data.dat", header=TRUE)
tab = xtabs(frequency ~ treatment+baseline+improvement, data=d)
mosaic(data=tab,~ treatment+baseline+improvement, shade=TRUE, cex=2.5)

प्रत्येक श्रेणीगत चर वर्ग के एक किनारे पर जाता है, जिसे इसके लेबल द्वारा उप-विभाजित किया जाता है। (इस प्रकार, यदि आप प्रत्येक किनारे को केवल एक स्तर पर उपविभाजित करते हैं, तो अधिकतम 4 श्रेणीबद्ध चर का प्रतिनिधित्व किया जा सकता है। IMHO, 3 से परे यह गन्दा और व्याख्या करने में कठिन हो जाता है)। आयतों का आकार आवृत्ति के समानुपाती होता है। मोज़ेक प्लॉट के पीछे यह मुख्य विचार है और यह इस जवाब में और पावेल क्लेका के उत्तर में समान है।

अंतर उन आयतों के लेआउट में हैं और इस प्रकार के कथानक के लिए उपयोग किए जाने वाले एक विशिष्ट आर-पैकेज द्वारा प्रदान की गई "निकेट्स" हैं। जैसा कि आप पवेल क्लेका के उत्तर से देखते हैं, graphicsपैकेज दाहिने किनारे का उपयोग करने के बजाय ऊपरी स्तर को 2 स्तरों पर विभाजित करता है। मैंने vcdडिफ़ॉल्ट विकल्पों के साथ पैकेज का उपयोग किया , ताकि रंग चर के बीच एसोसिएशन की डिग्री को इंगित करता है। ग्रे का मतलब है कि डेटा के साथ संगत हैं (आप चर स्वतंत्रता की परिकल्पना को अस्वीकार नहीं कर सकते हैं)। ब्लू का अर्थ है कि "गंभीर" आधार रेखा और "0" और "1" दोनों उपचारों के लिए "पर्याप्त" सुधार के बीच सकारात्मक सहयोग मौजूद है। (आश्चर्य, आश्चर्यचकित! मैं इसे निम्नानुसार अनुवाद करता हूं: यदि आपके पास एक गंभीर अवसाद है, तो आपको संभवतः बेहतर इलाज मिलेगा कि आपके पास इलाज है या नहीं।

व्यक्ति अपनी आवश्यकताओं के अनुसार भूखंड को समायोजित कर सकता है, उदाहरण के लिए, यहां देखें । पैकेज में कई vignettes, google "vcd मोज़ेक उदाहरण" हैं (जैसा कि मैंने अभी किया था)। शुरुआत में उद्धृत विकिपीडिया लेख यह भी बताता है कि इस प्रकार के कथानक और इसके पीछे अंतर्ज्ञान का निर्माण कैसे किया जाता है।

यहाँ छवि विवरण दर्ज करें

जब आप मेरी तस्वीर की तुलना पावेल क्लेका के उत्तर में चित्र से करते हैं, तो इससे कोई फर्क नहीं पड़ता, कि प्रत्येक चित्र के बाएं किनारे पर 'उपचार' है। आप मेरे कोड की अंतिम पंक्ति को बदलकर और अपनी आवश्यकताओं के अनुसार लेआउट को समायोजित करके आसानी से किनारे का स्थान बदल सकते हैं। सामान्य प्रथा यह है कि बाईं ओर सबसे महत्वपूर्ण चर या चर कम से कम संख्या के साथ चर जाता है। आप लेबल के क्रम को भी बदल सकते हैं (उदाहरण के लिए, इसलिए, कि दाएं किनारे पर आर क्रमबद्ध रूप से फैक्टर वेरिएबल बनाकर और उसके स्तरों को समायोजित करके "कोई भी मध्यम पर्याप्त नहीं है") ।


मोज़ेक भूखंडों पर दो उत्तर लिखने के समय होते हैं। यह उपयोगी होगा यदि आप में से प्रत्येक अपने भूखंड को दिखाता है और क्यों यह सहायक है, कम से कम विस्तार होगा क्योंकि भूखंड काफी भिन्न हैं।
निक कॉक्स

@NickCox यह निश्चित रूप से दूसरों से अलग दिखता है। वे शायद ही समान प्रदर्शन कर रहे हैं
छायाकार 13

इन दोनों का y अक्ष पर उपचार है। उनके समर्थकों का सोना कैसा होगा, यह प्रत्येक प्रदर्शन के फायदे और सीमाओं पर टिप्पणी है।
निक कॉक्स

आपके उत्तर का विस्तार करने के लिए धन्यवाद। मुझे लगता है कि उपचार और बेसलाइन की प्रतिक्रियाओं की तुलना में यहां की रुचि की संभावना है। मैं स्वाभाविक रूप से सहमत हूं कि आप किस चर के साथ टिंकर कर सकते हैं, लेकिन क्या आपने अन्य संभावनाओं की कोशिश की, और जो सबसे अच्छा काम करता है? यहां प्रतिक्रिया को देखते हुए पाठक को ब्लॉकों की दो पंक्तियों की एक साथ तुलना करनी होगी।
निक कॉक्स

@ निक कॉक्स आपकी टिप्पणी के लिए धन्यवाद। यह एकमात्र ऐसी चीज थी जिसने मुझे विस्तार करने के लिए प्रेरित किया। मैंने अन्य संभावनाओं की कोशिश नहीं की। वास्तव में, मुझे लगता है, यदि प्रश्न के लेखक को इस प्रकार की साजिश उपयोगी लगती है, तो उसे सब कुछ करने की कोशिश करनी चाहिए, फिर समुदाय के लिए परिणाम पोस्ट करें और समझाएं। वैसे, मैं यह नहीं कह रहा हूं कि इस प्रकार का प्लॉट दूसरों की तुलना में बेहतर है। मुद्दा यह है: यह विशेष रूप से श्रेणीबद्ध चर के लिए और स्वतंत्रता और / या स्वतंत्रता के उल्लंघन की कल्पना के लिए बनाया गया था।
lanenok

3

मैं मोज़ेक प्लॉट का उपयोग करता हूं

mosaicplot(table(moz), sort = c(3,1,2), color = T)

mosaicplot ()


मोज़ेक भूखंडों पर दो उत्तर लिखने के समय होते हैं। यह उपयोगी होगा यदि आप में से प्रत्येक अपने भूखंड को दिखाता है और क्यों यह सहायक है, कम से कम विस्तार होगा क्योंकि भूखंड काफी भिन्न हैं।
निक कॉक्स

2

एक विकल्प जो मैं समझता हूं कि समानांतर सेट का उपयोग करना है। कुछ की तुलना दूसरों की तुलना में आसान होगी, लेकिन आप अभी भी तीन श्रेणीबद्ध चर के बीच संबंधों को देख सकते हैं।

यह टाइटैनिक जीवन रक्षा डेटा के साथ एक उदाहरण है:

यहां टाइटैनिक सर्वाइवल डेटा के साथ एक उदाहरण दिया गया है।

R (आपके टैग दिए गए) में मैंने इसे लागू करने के लिए ggparallel का उपयोग किया है। कुछ लोगों ने सीवी पर यहां चर्चा की है कि इसे अन्य तरीकों से कैसे लागू किया जाए।


मुझे यह कल्पना करने में परेशानी हो रही है। किसी भी मौका तुम एक उदाहरण नकली होगा?
छायाकार

प्लॉट में एक लाइन की चौड़ाई दो श्रेणियों के सह-आवृत्तियों की आवृत्ति के अनुपात में है। मूल प्रश्न के भूखंडों में उपयोग किए गए डेटा के लिए, तीन क्षैतिज अक्ष होंगे: आधारभूत अवसाद, उपचार और अवसाद में सुधार। प्रत्येक में उस श्रेणी के प्रत्येक स्तर के लिए अलग-अलग क्षेत्र हैं। Coocurrences जुड़े हुए हैं, उनकी आवृत्ति का प्रतिनिधित्व करने वाली चौड़ाई के साथ।
नज़रो

2

निम्नलिखित सरल लाइन चार्ट का उपयोग करके भी जानकारी दी जा सकती है:

यहाँ छवि विवरण दर्ज करें

आधार रेखा समूह को रंगों में दिखाया गया है, जबकि सुधार को विभिन्न प्रकार के रेखाओं द्वारा दिखाया गया है। ये और एक्स-एक्सिस पैरामीटर (यहाँ उपचार) को वांछित होने पर आपस में बदला भी जा सकता है।


हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.