माध्यिका की मानक त्रुटि


14

यदि मैं सामान्य वितरण (मैं अजगर का उपयोग कर रहा हूं) के साथ एक छोटे से नमूने के मामले में निम्न सूत्र सही है कि क्या मैं माध्यिका की मानक त्रुटि को मापना चाहता हूं?

 sigma=np.std(data)
 n=len(data)
 sigma_median=1.253*sigma/np.sqrt(n)

जवाबों:


12

@ मेरी की कुछ टिप्पणियों के आधार पर मुझे लगता है कि निम्नलिखित उचित है। वह माध्यिका का चयन करती दिख रही है क्योंकि नमूना छोटा है।

यदि आप माध्यिका का चयन कर रहे थे क्योंकि यह एक छोटा सा नमूना है जो एक अच्छा औचित्य नहीं है। आप माध्यिका का चयन करें क्योंकि माध्यिका एक महत्वपूर्ण मूल्य है। यह मतलबी से अलग कुछ कहता है। आप इसे कुछ सांख्यिकीय गणनाओं के लिए भी चुन सकते हैं क्योंकि यह आउटलेयर या तिरछी जैसी कुछ समस्याओं के खिलाफ मजबूत है। हालांकि, छोटे नमूने का आकार उन समस्याओं में से एक नहीं है जिनके खिलाफ यह मजबूत है। उदाहरण के लिए, जब नमूना आकार छोटा हो जाता है, तो यह वास्तव में मीन से अधिक तिरछा संवेदनशील होता है।


धन्यवाद जॉन! वास्तव में मैंने माध्य का उपयोग करने के लिए चुना है जिस कारण से आपने अभी तक लिखा है। मेरे पास अलग-अलग नमूने हैं, उन सभी में गैर-गाऊसी वितरण है। 50 से अधिक बिंदु वाले नमूने हैं, अन्य में 10 से कम अंक हैं, लेकिन उन सभी के लिए मुझे लगता है कि आपकी टिप्पणी मान्य है, है न?
मेरी

इतने कम अंकों के साथ मुझे यकीन नहीं है कि आप अंतर्निहित वितरण के बारे में क्या कह सकते हैं। यदि आप 50 से कम नमूनों वाले 10 से कम नमूनों की तुलना कर रहे हैं और अंतर्निहित वितरण सममित नहीं है, तो एक माध्य एक प्रभाव दिखाएगा, भले ही एक न हो, क्योंकि इसमें बड़े की तुलना में छोटे नमूने में अधिक पूर्वाग्रह होंगे। मतलब नहीं होगा।
जॉन

भविष्य के मांस में अपने प्रश्नों को बेहतर ढंग से समझें और इस बारे में अधिक पूछें कि आपको वास्तव में क्या जानना है। कहो कि आपने अब तक क्या किया है और उस डेटा का वर्णन करें जो आपके पास अच्छा है। आपको बेहतर उत्तर मिलेंगे।
जॉन

1
" छोटे नमूने का आकार उन समस्याओं में से एक नहीं है जिनके खिलाफ यह मजबूत है " अपने आप में एक +1 के लायक है; बाकी एक बोनस है
Glen_b -Reinstate Monica

तथ्य की बात के रूप में, ह्यूबर अपनी पुस्तक में एक बिंदु बनाता है कि मजबूती की कोई एक अवधारणा नहीं है। आउटलेरस के लिए मजबूती है (और यह वही है जो औसत के लिए मजबूत है)। एक अन्य दृश्य, हालांकि, माप त्रुटि के लिए मजबूती है, और इसका मतलब यह है कि इन माप त्रुटियों को औसत करने के लिए यह मजबूत है। हालांकि, माध्यिका माप माप में उतार-चढ़ाव के लिए अतिसंवेदनशील है, क्योंकि वे वितरण के मध्य को केवल पूंछ की तरह बुरी तरह प्रभावित कर सकते हैं।
StasK

12

सोकल और रोहेल्फ़ ने अपनी पुस्तक बायोमेट्री (पृष्ठ 139) में यह सूत्र दिया है । "प्रयोज्यता पर टिप्पणियाँ" के तहत वे लिखते हैं: सामान्य आबादी से बड़े नमूने। इस प्रकार, मुझे डर है कि आपके प्रश्न का उत्तर नहीं है। यह भी देखें यहाँ

गैर-सामान्य वितरण वाले छोटे नमूनों में मंझला के लिए मानक त्रुटि और विश्वास अंतराल प्राप्त करने का एक तरीका बूटस्ट्रैपिंग होगा यह पोस्ट बूटस्ट्रैपिंग के लिए पायथन पैकेज के लिंक प्रदान करता है।

चेतावनी

@ व्हीबर ने बताया कि छोटे नमूनों में माध्यिका को बूटस्ट्रैप करना बहुत जानकारीपूर्ण नहीं है क्योंकि बूटस्ट्रैप के औचित्य विषम हैं (नीचे टिप्पणी देखें)।


आपके उत्तर के लिए धन्यवाद! मुझे पता है कि बूटस्ट्रैपिंग एक विकल्प होगा, मैं सिर्फ अनुमान लगा रहा था कि क्या एक अलग तरीके से माध्यिका की त्रुटि को मापने का एक तरीका है। क्या उत्तर एमईएएन (वही छोटे गैर गॉसियन नमूना) पर मानक त्रुटि के लिए भी नहीं है?
मेरी

@ मीरी माध्य की मानक त्रुटि के लिए, सोकल और रोहल लिखते हैं कि यह "[...] परिमित विचरण वाली किसी भी आबादी के लिए लागू है।" तो माध्य की मानक त्रुटि के लिए उत्तर हां लगता है , आप इसकी गणना कर सकते हैं। सिडेनोट: हालांकि ऐसे वितरण होते हैं (जैसे कि कॉची वितरण) जिसमें परिभाषित विचरण या माध्य नहीं होता है और ऐसे मामलों में, SEM की गणना नहीं की जा सकती है।
COOLSerdash

5
tटी

@whuber आपकी टिप्पणी के लिए धन्यवाद। यह जानकर अच्छा लगा। मैंने अपने उत्तर से माध्यिका को छोटे नमूनों में बूटस्ट्रैप करने की सलाह को हटा दिया।
COOLSerdash

1
मैं यह सुझाव देने की कोशिश नहीं कर रहा था कि यह बुरी सलाह है: मैं केवल इसकी (अपरिहार्य) सीमाओं को इंगित करना चाहता था। छोटे नमूनों से बहुत सीखना कठिन है। लेकिन छोटे नमूनों को बूटस्ट्रैप करना दोगुना है, क्योंकि इसका समर्थन करने के लिए कोई सैद्धांतिक औचित्य नहीं है (सभी औचित्य विषम है)।
whuber

12

As.Var.[m^]=14f(m)2n
mf(m)

m^

  1. कि छोटे नमूने के लिए विचरण के लिए असममित सूत्र काम करता है;
  2. यह अनुमान लगाया गया है कि अनुमानित मंझला सच्चे मंझले के करीब है;
  3. कि कर्नेल घनत्व अनुमानक एक सटीक मान देता है।

नमूना आकार जितना कम होगा, उतना अधिक संदिग्ध होगा।


3
शायद जोड़ने लायक है कि जादू की संख्या है π21.253314
हेनरी
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.