मैं एक ही डेटा सेट से मूल्यों के दो समूहों को अलग करने की कोशिश कर रहा हूं। मैं मान सकता हूं कि आबादी में से एक सामान्य रूप से वितरित की गई है और नमूने का कम से कम आधा आकार है। दूसरे वाले का मान पहले वाले (वितरण अज्ञात है) से मानों की तुलना में कम या अधिक है। मैं जो करने की कोशिश कर रहा हूं वह ऊपरी और निचली सीमाओं को खोजने के लिए है जो दूसरे से सामान्य रूप से वितरित आबादी को संलग्न करेगा।
मेरी धारणा मुझे शुरुआती बिंदु प्रदान करती है:
- नमूने की इंटरक्वेर्टाइल रेंज के भीतर सभी बिंदु सामान्य रूप से वितरित जनसंख्या से हैं।
जब तक वे सामान्य रूप से वितरित आबादी के 3 st.dev में फिट नहीं होते हैं, तब तक मैं उन्हें बाकी के नमूने से बाहर ले जाने वाले outliers के लिए परीक्षण करने की कोशिश कर रहा हूं। जो आदर्श नहीं है, लेकिन उचित पर्याप्त परिणाम उत्पन्न करने के लिए लगता है।
क्या मेरी धारणा सांख्यिकीय ध्वनि है? इससे बेहतर तरीका क्या हो सकता है?
पीएस कृपया टैग किसी को ठीक करें।