मुझे पता है कि यह थोड़ा रोपे हो सकता है, सांख्यिकीय रूप से, लेकिन यह मेरी समस्या है।
मेरे पास बहुत सी श्रेणी के डेटा हैं, जो एक चर का न्यूनतम, अधिकतम और नमूना आकार कहना है। इन आंकड़ों में से कुछ के लिए मेरे पास एक मतलब है, लेकिन बहुत से नहीं। मैं प्रत्येक श्रेणी की परिवर्तनशीलता को निर्धारित करने के लिए इन सीमाओं की एक दूसरे से तुलना करना चाहता हूं, और साधनों की तुलना करना भी चाहता हूं। मेरे पास यह मानने का एक अच्छा कारण है कि वितरण माध्य के चारों ओर सममित है, और यह कि डेटा का गौसियन वितरण होगा। इस कारण से मैं सोच रहा हूं कि वितरण के मध्य-बिंदु का उपयोग इस अर्थ के लिए एक प्रॉक्सी के रूप में कर सकता हूं, जब यह अनुपस्थित हो।
जो मैं करना चाहता हूं वह प्रत्येक श्रेणी के लिए एक वितरण का पुनर्निर्माण करना है, और फिर उस वितरण के लिए एक मानक विचलन या मानक त्रुटि प्रदान करने के लिए इसका उपयोग करें। मेरे पास एकमात्र जानकारी एक नमूना से अधिकतम और न्यूनतम देखी गई है, और मध्य बिंदु के लिए एक प्रॉक्सी के रूप में मतलब है।
इस प्रकार मैं आशा करता हूं कि प्रत्येक समूह के लिए भारित साधनों की गणना करने में सक्षम होने के लिए, और प्रत्येक समूह के लिए भिन्नता के गुणांक के रूप में अच्छी तरह से काम करने के लिए, मेरे पास डेटा और मेरी मान्यताओं (एक सममित और सामान्य वितरण) के आधार पर।
मुझे ऐसा करने के लिए R का उपयोग करने की योजना है, इसलिए किसी भी कोड की मदद की सराहना की जाएगी।