कुछ EDA करते समय मैंने एक कारक के दो स्तरों के बीच के अंतर को दर्शाने के लिए एक बॉक्स प्लॉट का उपयोग करने का निर्णय लिया।
जिस तरह से ggplot ने बॉक्स प्लॉट को प्रस्तुत किया वह संतोषजनक था, लेकिन थोड़ा सरल (नीचे पहला प्लॉट)। जबकि बॉक्स भूखंडों की विशेषताओं पर शोध करते हुए मैंने पायदान के साथ प्रयोग करना शुरू किया।
मैं समझता हूँ कि notches सीआई को माध्यिका के चारों ओर प्रदर्शित करता है, और अगर दो बक्सों के शिलालेख ओवरलैप नहीं होते हैं, तो 95% विश्वास स्तर पर 'मजबूत साक्ष्य' होते हैं - जो कि मीडियों में भिन्न होते हैं।
मेरे मामले में (दूसरा प्लॉट), notches सार्थक ओवरलैप नहीं है। लेकिन दाहिने हाथ की ओर बॉक्स के निचले हिस्से को वह अजीब रूप क्यों देता है?
वायलिन भूखंड में एक ही डेटा प्लॉट करना संबंधित वायलिन की संभावना घनत्व के बारे में कुछ भी असामान्य नहीं दर्शाता है।
ggplot2
। मुझे व्यक्तिगत डेटा बिंदुओं को भी प्लॉट करने का विचार पसंद है, लेकिन यह अभी तक निराश है क्योंकि अंधेरे बॉक्स के भीतर अंक अदृश्य बना दिए गए हैं।