साधनों के विश्वास अंतराल की गणना कैसे करें?


19

कल्पना करें कि आप एक प्रयोग को तीन बार दोहराते हैं। प्रत्येक प्रयोग में, आप तीन प्रतियाँ मापते हैं। तीन प्रायोगिक साधनों के बीच के अंतरों की तुलना में ट्रिपलीकेट्स काफी करीब होते हैं। भव्य माध्य की गणना करना बहुत आसान है। लेकिन कोई भव्य मतलब के लिए एक विश्वास अंतराल की गणना कैसे कर सकता है?

नमूना डेटा:

प्रयोग 1: 34, 41, 39

प्रयोग 2: 45, 51, 52

प्रयोग 3: 29, 31, 35

मान लें कि किसी प्रयोग के भीतर प्रतिपल मान एक गाऊसी वितरण का अनुसरण करते हैं, जैसा कि प्रत्येक प्रयोग के माध्य मान से होता है। एक प्रयोग के भीतर भिन्नता का एसडी प्रयोगात्मक साधनों के बीच एसडी से छोटा है। यह भी मान लें कि प्रत्येक प्रयोग में तीन मूल्यों का कोई क्रम नहीं है। प्रत्येक पंक्ति में तीन मानों का बायां-दायां क्रम पूरी तरह से मनमाना है।

सरल दृष्टिकोण पहले प्रत्येक प्रयोग के साधनों की गणना करना है: 38.0, 49.3, और 31.7, और फिर उन तीन मूल्यों के माध्य और उसके 95% विश्वास अंतराल की गणना करें। इस पद्धति का उपयोग करते हुए, 17.7 से 61.9 तक 95% विश्वास अंतराल के साथ भव्य मतलब 39.7 है।

उस दृष्टिकोण के साथ समस्या यह है कि यह पूरी तरह से triplicates के बीच भिन्नता की अनदेखी करता है। मुझे आश्चर्य है कि अगर उस बदलाव के लिए कोई अच्छा तरीका नहीं है।


1
जवाब नहीं, सिर्फ एक सहज अवलोकन। सीआई एकत्रित डेटा के लिए (सभी नौ ओ बीएस) मतलब है का अर्थ है के आधार पर, सीआई केवल है ( 39.7 ± 12.83 ) । निश्चित नहीं है कि आपका सीआई क्या कर रहा है (टाइपो? 17 नहीं 27, और 51 नहीं 61?), मुझे तीन साधनों के एसटीडी के लिए 2.98 मिलता है, और 4.30 के रूप में 0.9 डी का 2 मात्रा के साथ टी डिस्टाइल। मुझे लगता है कि आप जो सीआई चाहते हैं, वह इन दोनों के बीच कहीं होगा - जैसा कि आपके पास आंशिक पूलिंग है। विचरण सूत्र V ( Y ) = E [ V ( Y ) के संदर्भ में भी सोच सकते हैं(39.7±2.13)(39.7±12.83)2.984.300.975 , प्रत्येक CI सूत्र का आधा उपयोग करता हैV(Y)=E[V(Y|Yg)]+V[E(Y|Yg)]
संभावना

2
@probabilityislogic: तीन प्रयोग के SEM का अर्थ है 5.168 (जैसा कि आपने लिखा था 2.98 नहीं), और मूल पद (17.4 से 61.9) में जो आत्मविश्वास अंतराल मैंने दिया है वह सही है। एसईएम की गणना एसडी (8.95) से एन के वर्गमूल (3 के वर्गमूल) से विभाजित करके की जाती है। आपने इसके बजाय n (3) से भाग दिया।
हार्वे मोटुलस्की

मेरी गलती, पूल किए गए अंतराल में से 6.40 तक बदलनी चाहिए (वही गलती)2.136.40
प्रायिकतालोगिक

निम्न लिंक इसका उत्तर देता है ' talkstats.com/showthread.php/11554-mean-of-means

@ टीएसटी, विकिपीडिया पर पूलित विचरण की एक कड़ी के अलावा कुछ भी नहीं प्रतीत होता है । विस्तृत करने के लिए परवाह?
chl

जवाबों:


6

वहाँ संतुलित यादृच्छिक एक तरह से एनोवा मॉडल में grandmean के लिए एक प्राकृतिक सही विश्वास अंतराल है वास्तव में, यह आसान जांच करने के लिए है कि मनाया साधन के वितरण ˉ y मैं है ˉ y मैं ~ आईआईडी एन ( μ , τ 2 ) के साथ τ 2 = σ 2 + σ 2 w

(yijμi)iidN(μi,σw2),j=1,,J,μiiidN(μ,σb2),i=1,,I.
y¯iy¯iiidN(μ,τ2) , और यह अच्छी तरह से जाना जाता है वर्गों का योग के बीच है किएसएसबीहै वितरणएसएसबी~जम्मूτ2χ 2 मैं - 1 और समग्र मनाया मतलब से स्वतंत्र है ˉ y~एन(μ,τ2τ2=σb2+σw2JSSb
SSbJτ2χI12
। इस प्रकारˉ -μ
y¯N(μ,τ2I)
काI केसाथएक छात्रtवितरण है-1डिग्री स्वतंत्रता, जिसमेंμ केबारे में सटीक आत्मविश्वास अंतराल प्राप्त करना आसान है।
y¯μ1ISSbJ(I1)
tI1μ

ध्यान दें कि यह विश्वास अंतराल के अलावा कुछ नहीं एक गाऊसी मतलब के लिए शास्त्रीय अंतराल केवल समूह साधन पर विचार कर रहा है टिप्पणियों के रूप मेंy¯i । इस प्रकार आपके द्वारा उल्लिखित सरल दृष्टिकोण:

सरल दृष्टिकोण पहले प्रत्येक प्रयोग के साधनों की गणना करना है: 38.0, 49.3, और 31.7, और फिर उन तीन मूल्यों के माध्य और उसके 95% विश्वास अंतराल की गणना करें। इस पद्धति का उपयोग करते हुए, 17.7 से 61.9 तक 95% विश्वास अंतराल के साथ भव्य मतलब 39.7 है।

सही है। और अनदेखा बदलाव के बारे में आपका अंतर्ज्ञान:

उस दृष्टिकोण के साथ समस्या यह है कि यह पूरी तरह से triplicates के बीच भिन्नता की अनदेखी करता है। मुझे आश्चर्य है कि अगर उस बदलाव के लिए कोई अच्छा तरीका नहीं है।

गलत है। मैंने /stats//a/72578/8402 में इस तरह के सरलीकरण की शुद्धता का भी उल्लेख किया है

अपडेट 12/04/2014

कुछ विवरण अब मेरे ब्लॉग पर लिखे गए हैं: आत्मविश्वास अंतराल प्राप्त करने के लिए एक मॉडल को कम करना


अजगर में इस समाधान को लागू करने में कोई मदद? stackoverflow.com/questions/45682437/…
ब्लोमैन

7

यह रैखिक मिश्रित प्रभाव मॉडल के भीतर अनुमान का सवाल है। समस्या यह है कि भव्य माध्य का विचरण दो भिन्न घटकों का एक भारित योग है, जिसे अलग से अनुमानित किया जाना चाहिए (डेटा के एनोवा के माध्यम से)। अनुमानों में स्वतंत्रता की अलग-अलग डिग्री है। इसलिए, हालांकि सामान्य छोटे-नमूने (स्टूडेंट टी) फॉर्मूले का उपयोग करते हुए इस मतलब के लिए एक आत्मविश्वास अंतराल का निर्माण करने का प्रयास किया जा सकता है, यह अपने नाममात्र कवरेज को प्राप्त करने की संभावना नहीं है क्योंकि माध्य से विचलन बिल्कुल एक छात्र टी वितरण का पालन नहीं करेंगे।

इवा जरोसोवा द्वारा हाल ही में (2010) लेख, रैखिक मिश्रित प्रभाव मॉडल के साथ अनुमान , इस मुद्दे पर चर्चा करता है। (2015 तक यह वेब पर उपलब्ध नहीं प्रतीत होता है।) एक "छोटे" डेटासेट के संदर्भ में (यहां तक ​​कि इस से लगभग तीन गुना बड़ा), वह दो अनुमानित सीआई गणनाओं का मूल्यांकन करने के लिए सिमुलेशन का उपयोग करता है (कुएं -सिद्धार्थवाइट सन्निकटन और "केनवर्ड-रोजर की विधि")। उसके निष्कर्ष में शामिल हैं

सिमुलेशन अध्ययन से पता चला है कि सहसंयोजक मापदंडों के आकलन की गुणवत्ता और फलस्वरूप छोटे नमूनों में आत्मविश्वास के अंतराल का समायोजन काफी खराब हो सकता है .... एक खराब अनुमान न केवल पारंपरिक अंतराल के सही आत्मविश्वास स्तर को प्रभावित कर सकता है, बल्कि यह समायोजन को भी असंभव बना सकता है। यह स्पष्ट है कि संतुलित डेटा के लिए भी तीन प्रकार के अंतराल [पारंपरिक, Satterthwaite, KR] काफी भिन्न हो सकते हैं। जब पारंपरिक और समायोजित अंतरालों के बीच एक अलग अंतर मनाया जाता है, तो सहसंयोजक पैरामीटर अनुमानों की मानक त्रुटियों की जांच की जानी चाहिए। दूसरी ओर, जब [तीन] प्रकार के अंतराल के बीच का अंतर छोटा होता है, तो समायोजन अनावश्यक प्रतीत होता है।

संक्षेप में, एक अच्छा दृष्टिकोण प्रतीत होता है

  1. विचरण घटकों के अनुमानों का उपयोग करके एक पारंपरिक सीआई की गणना करें और एक टी-वितरण लागू करने का ढोंग करें।

  2. समायोजित सीआई की कम से कम एक गणना करें।

  3. यदि संगणनाएँ "पास" हैं, तो पारंपरिक CI को स्वीकार करें। अन्यथा, रिपोर्ट करें कि एक विश्वसनीय सीआई का उत्पादन करने के लिए अपर्याप्त डेटा हैं।


विचरण घटकों का उपयोग करने से वही आत्मविश्वास अंतराल होता है जिसकी गणना मैंने मूल पोस्ट में की थी। ANOVA टेबल में 2 df के साथ 480.7 के कॉलम के बीच एक SS है, जिसका अर्थ है कि MS 240.3 है। SD sqrt (MSbetween / n) = sqrt (240.3 / 3) = 8.95 है, जो उसी CI की ओर ले जाता है जिसे मैंने मूल रूप से पोस्ट किया था (17.4 से 61.9)। मैंने यह पाया कि जरासोवा पेपर का अनुसरण करना आपके लिए बहुत कठिन है, और मुझे पूरी तरह से यकीन नहीं है कि यह यहां प्रासंगिक है (यह दोहराया उपायों के डिजाइन के बारे में लगता है)। ???
हार्वे मोटुलस्की

@ आपका विवरण निश्चित रूप से मेरे लिए दोहराया उपायों की तरह लगता है! मेरा मानना ​​है कि जारसोवा कागज पर हाजिर है।
whuber

1
मैं प्रयोगशालाओं में सामान्य स्थिति के बारे में सोच रहा हूं, जहां ट्रिपलीकेट्स केवल तीन अलग-अलग परीक्षण ट्यूब (या कुएं) हैं। तालिका में प्रस्तुत तीनों का क्रम मनमाना है। पहले प्रयोग में प्रतिकृति # 2 के बीच कोई संबंध या सहसंबंध नहीं है, दूसरे या तीसरे प्रयोगों में # 2 को दोहराने के साथ। प्रत्येक प्रयोग में सिर्फ तीन माप हैं। तो वास्तव में दोहराया उपायों नहीं। सही?
हार्वे मोटुलस्की

whuber, यहाँ एक सटीक छात्र वितरण है। मेरा जवाब देखिए।
स्टीफन लॉरेंट

@ ईवा जरासोवा के लेख के लिए आपके द्वारा आपूर्ति की गई लिंक मृत है और Google खोज में कुछ भी नहीं मिला। क्या आप संदर्भ को सही कर सकते हैं?
प्लासिडिया

0

आपके पास एक विश्वास अंतराल नहीं हो सकता है जो आपकी दोनों समस्याओं को हल करता है। आपको एक चुनना होगा। आप या तो प्रयोग चर के भीतर एक मतलब वर्ग त्रुटि शब्द से प्राप्त कर सकते हैं जो आपको इस बारे में कुछ कहने की अनुमति देता है कि आप प्रयोग के भीतर मूल्यों का सही अनुमान लगा सकते हैं या आप इसे बीच में कर सकते हैं और यह प्रयोगों के बीच होगा। अगर मैं सिर्फ पूर्व करता था तो मैं इसे 0 के आसपास के बजाय ग्रैंड माध्य के बजाय प्लॉट करना चाहता था क्योंकि यह आपको वास्तविक मतलब मूल्य के बारे में कुछ भी नहीं बताता है, केवल एक प्रभाव के बारे में (इस मामले में 0)। या आप बस दोनों की साजिश कर सकते हैं और बता सकते हैं कि वे क्या करते हैं।

आप एक के बीच में एक संभाल लिया है। भीतर यह सिर्फ एक ANOVA में त्रुटि शब्द की गणना करने के लिए एक MSE के साथ काम करने के लिए और वहाँ से CI के लिए एसई अभी sqrt (MSE / n) (n = 3 इस मामले में) की तरह है।


वास्तव में आपके पास प्रत्येक माध्य और भव्य माध्य के लिए एक विश्वसनीय अंतराल हो सकता है। बस एक बायेसियन बहुस्तरीय मॉडल का उपयोग करें। कभी-कभी इस तरह के अनुमान को आंशिक पूलिंग कहा जाता है। मुझे लगता है कि समस्या थी छोटा सा नमूना है।
मैनलो गेल्डिनो

आप प्रत्येक माध्य और भव्य माध्य के लिए एक विश्वास अंतराल हो सकते हैं ... लेकिन वे अलग चीजें हैं ... जैसे विश्वसनीय अंतराल हैं। मैंने सीआई के बारे में अध्ययन के विचरण और एक समग्र के रूप में बीच के संबंध में प्रश्न की व्याख्या की। यह सब अभी भी आपको अलग-अलग CI के अर्थ अलग-अलग चीजों के साथ छोड़ देता है। (मैं भी शाब्दिक रूप से n नहीं लेता)
जॉन

1
इसके अलावा, मेरा मतलब यह नहीं है कि वास्तव में "नहीं" हो सकता है। आप किसी भी तरह एक एकल समीकरण के साथ आ सकते हैं जो हर चीज के लिए एक आत्मविश्वास अंतराल की गणना करता है। यह सिर्फ समझदार कुछ भी मतलब नहीं होगा। यही कारण है कि मैं नहीं कर सकता था।
जॉन

अपनी टिप्पणी लिखने के कुछ ही मिनटों बाद मुझे एहसास हुआ कि हम शाब्दिक रूप से n लेना नहीं चाहते थे। लेकिन इसे संपादित करने के लिए देर हो गई =)।
मनोएल गाल्डिनो

0

मुझे लगता है कि मूल मतलब के लिए CI बहुत व्यापक है [17,62] यहां तक ​​कि मूल डेटा की सीमा के लिए भी।

यह प्रयोग रसायन विज्ञान में बहुत आम हैं। उदाहरण के लिए, संदर्भ सामग्री के प्रमाणन में आपको कुछ बोतलों को पूरे तरीके से यादृच्छिक तरीके से चुनना होता है, और आपको प्रत्येक बोतल पर प्रतिकृति विश्लेषण करना होगा। आप संदर्भ मूल्य और इसकी अनिश्चितता की गणना कैसे करते हैं? इसे करने के लिए बहुत सारे तरीके हैं, लेकिन सबसे अधिक परिष्कृत (और सही, मुझे लगता है) मेटा-विश्लेषण या एमएल (डेर्सिमोनियन-लेयर्ड, वेंजेल-रुखिन, आदि) लागू कर रहा है

बूटस्ट्रैप अनुमान के बारे में क्या?


1
सिमुलेशन (10,000 सामान्य रूप से वितरित मुख्य प्रभावों और त्रुटियों के साथ परीक्षण) इंगित करता है [21, 58] इस अर्थ के लिए एक दो-तरफा 95% सीआई है।
whuber

व्हुबेर: मैं यह जानने के लिए उत्सुक हूं कि आपने उन सिमुलेशन को कैसे किया। मूल डेटा से बूटस्ट्रैपिंग? या वास्तव में सिमुलेशन? यदि उत्तरार्द्ध, क्या मूल्य का मतलब है और एसडी क्या आपने डेटा का अनुकरण करने के लिए उपयोग किया है ??
हार्वे मोटुलस्की
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.