हाँ तुम कर सकते हो। कम से कम एक अनुमानित अर्थ में।
मैं नीचे कुछ रूपरेखा और सीमाओं के साथ-साथ कैसे नीचे (और वास्तव में "बॉक्स-ओवरलैप" के लिए एक संबंध है)। लेकिन पहले आइए कुछ पृष्ठभूमि और संदर्भ के लिए कुछ पूर्वाग्रहों पर चर्चा करते हैं। (मुझे लगता है कि यहां एक उचित उत्तर पर उदाहरण के विवरणों पर ध्यान केंद्रित नहीं करना चाहिए - हालांकि वह शायद कुछ उल्लेखों को एक तरफ कर देता है - लेकिन बॉक्सप्लेट का उपयोग करने के केंद्रीय मुद्दे पर यह आकलन करने के लिए कि क्या स्पष्ट मतभेदों को आसानी से यादृच्छिक भिन्नता के रूप में दूर समझा जा सकता है या नहीं। ।)
यदि आपके पास डेटा तक पहुंच है, तो आप नॉटेड बॉक्सप्लाट्स खींच सकते हैं जो इस तरह की दृश्य तुलना के लिए डिज़ाइन किए गए हैं।
यहाँ नोकदार बॉक्सप्लेट गणना की चर्चा है । यदि पायदान-अंतराल दो समूहों की तुलना में ओवरलैप नहीं करता है, तो 5% के स्तर पर लगभग भिन्न होते हैं; गणना सामान्य पर गणना पर आधारित है, लेकिन वे बहुत मजबूत हैं और वितरण की एक सीमा के भीतर काफी अच्छी तरह से प्रदर्शन करते हैं। (यदि यह एक औपचारिक परीक्षण के रूप में माना जाता है कि शक्ति सामान्य पर इतनी अधिक नहीं है, लेकिन यह अधिक या कम "विशिष्ट" भारी-पूंछ वाले मामलों की एक किस्म के लिए बहुत अच्छा करना चाहिए।)
यह देखते हुए कि नोकदार बॉक्सप्लॉट कैसे काम करते हैं, आप अंगूठे के एक त्वरित नियम को समझ सकते हैं जो तब काम करेगा जब आपके पास प्रश्न में केवल एक प्रदर्शन होगा। जब नमूना का आकार 10 होता है और माध्यिका को बॉक्स के मध्य के करीब रखा जाता है, तो एक नोकदार बॉक्सप्लेट में पायस बॉक्स की चौड़ाई के बारे में होता है, इसलिए पायदान समाप्त होता है और बॉक्स लगभग उसी स्थान पर होता है।
अंगूठे का एक " " नियम कैसे बनता है, इसकी चर्चा के लिए यहां देखें ।n=10
हालाँकि, आपको इस तुलना के लिए बॉक्स के मध्य में माध्यिका की आवश्यकता नहीं है; केवल यह बताता है कि हम शासन में कैसे पहुंचे। यद्यपि हम नोकदार बॉक्सप्लेट्स से शुरू करते हैं और मध्यिका के लिए एक अंतराल की सामान्य-आधारित गणना करते हैं, अब हम सिर्फ पर "बॉक्स-ओवरलैप" नियम पर विचार कर रहे हैं और एक अशक्त (किसी भी आगे की मान्यताओं के साथ) में परिणाम होगा; समान निरंतर वितरण बनाम कुछ विकल्प जो बक्सों को अलग करना चाहते हैं (जरूरी नहीं कि शुद्ध स्थान परिवर्तन, हालांकि यह व्याख्या का सबसे आसान विकल्प है)।n=10
चतुर्थकों के संभावित सापेक्ष आदेशों की संभाव्यता (एक बॉक्सप्लॉट में टिका है जो नमूनों के आकार में टुकी की परिभाषा से चिपक जाता है) जहां वे एकल अवलोकनों पर होते हैं, नल के नीचे वितरण आकार पर निर्भर नहीं करते हैं। उस मामले में ( प्रत्येक नमूने में पर जैसे ) परीक्षण परीक्षण का यह संस्करण वितरण मुक्त है । पर यह वितरण मुक्त नहीं है (के बाद से सटे आदेश आँकड़ों के औसत का वितरण अब वितरण आकार से संबंधित है), लेकिन यह लगभग वितरण से मुक्त है।n=9एन = 10n=10
प्रकार I त्रुटि दर पासn=10 : आमतौर पर उपयोग किए जाने वाले वितरणों के एक नंबर पर अनुकार (दोनों सममित और तिरछा, भारी और हल्का पूंछ वाले) बताते हैं कि दो-नमूना बॉक्स-ओवरलैप परीक्षण में पर 2.3% महत्व स्तर है। (वितरणों में वास्तव में बहुत भिन्नता नहीं है) और यह पर 5.6% परीक्षण के बारे में है (यह पर 5% से कम है , संभवत: आदेश आँकड़ों के औसत से भिन्नता को कम करने के कारण। अवलोकन का नुकसान इसे बढ़ाता है)। यदि आपके पास 9 और 10 के नमूने हैं, तो महत्व स्तर 5% से कम है।n=10,10n=9,9n=8,8
अन्य नमूना आकार : यदि आप नमूना आकारों को जानते हैं तो आप यह पता लगा सकते हैं कि डिस्प्ले से सिर्फ पायदान कहां जाता है। यदि आपके पास नमूना आकारों पर एक कम बाध्य है, तो आप पायदान स्थानों पर एक ऊपरी बाध्य प्राप्त कर सकते हैं। लेकिन यहां तक कि अगर आप सभी जानते हैं कि कम से कम 10 है, तो आप बॉक्स-ओवरलैप के लिए जल्दी से जांच कर सकते हैं। पायदान-अंतराल की चौड़ाई समानुपाती होती है, इसलिए आप इस पर काम कर सकते हैं कि , मध्यिका से प्रत्येक चतुर्थांश के बारे में नोट लगभग आधा होना चाहिए।nn−−√n=40
अपने प्लॉट को देखते हुए:
ध्यान दें कि हम इस प्रश्न में भूखंड की उपस्थिति से बता सकते हैं कि नमूना आकार कम से कम 5 होना चाहिए; यदि वे 5 से कम थे, तो व्यक्तिगत-नमूना बॉक्सप्लॉट्स के अलग-अलग सुराग होंगे कि वे एक कम नमूना आकार के थे (जैसे कि प्रत्येक बॉक्स के मध्य में मृत व्यक्ति का केंद्र या व्हिस्की की लंबाई 0 के होने पर)
वैकल्पिक रूप से यदि बक्से (चतुर्थांश को चिह्नित करना) एक-दूसरे को ओवरलैप नहीं करते हैं और नमूना का आकार कम से कम 10 है, तो तुलना किए जाने वाले दो समूहों में 5% स्तर पर अलग-अलग मंझला होना चाहिए (एकल जोड़ीदार तुलना के रूप में माना जाता है)।
यदि आपको पता नहीं है , क्योंकि हम जानते हैं कि नमूना का आकार कम से कम 5 होना चाहिए, तो आपको अंतराल को बक्से से थोड़ा बड़ा करने की जरूरत है, विशेष रूप से, यदि आप प्रत्येक बॉक्स को लगभग 40% बढ़ाते हैं माध्यिका से दूरी और वे अभी भी ओवरलैप नहीं करते हैं वे लिए एक महत्वपूर्ण अंतर का संकेत देते हैं - यहां एक तर्क के साथ-साथ नोक-बॉक्सप्लॉट तर्क से लौटकर व्यापक आधार के बजाय हम केवल बॉक्स की तुलना करने के लिए विचार कर सकते हैं।nn=5
[ध्यान दें, कि यह तुलना की संख्या का कोई हिसाब नहीं रखता है, इसलिए यदि आप कई तुलना कर रहे हैं तो आपकी समग्र प्रकार I त्रुटि बड़ी होगी। यह औपचारिक परीक्षण के बजाय एक दृश्य निरीक्षण के लिए है; फिर भी इसमें शामिल विचारों को अधिक औपचारिक दृष्टिकोण के लिए अनुकूलित किया जा सकता है, जिसमें कई तुलनाओं के लिए समायोजन भी शामिल है।]
संबोधित किया जा सकता है कि क्या आप कर सकते हैं , यह विचार करना उचित होगा कि क्या आपको चाहिए । शायद नहीं; संभावित पी-हैकिंग का मुद्दा वास्तविक है, लेकिन यदि आप इसका उपयोग यह जानने के लिए कर रहे हैं कि क्या, उदाहरण के लिए, अनुसंधान के मुद्दे पर नए डेटा एकत्र करने के लिए और आपके पास एक पेपर में एक बॉक्सप्लॉट है - कहते हैं - यह हो सकता है शोर के कारण भिन्नता से आसानी से समझाया जा सकता है या नहीं, इसके बारे में कुछ आकलन करने में सक्षम होने के लिए काफी उपयोगी है। लेकिन उस मुद्दे पर गहराई से विचार करने के लिए वास्तव में एक अलग सवाल का जवाब देना होगा।