सांख्यिकीय परीक्षण जो मापन अनिश्चितता को शामिल करते हैं


11

मान लीजिए कि मुझे बड़े पैमाने पर माप के दो समूह दिए गए हैं (मिलीग्राम में), जिन्हें y1 और y2 के रूप में संदर्भित किया जाता है। मैं यह निर्धारित करने के लिए एक परीक्षण करना चाहता हूं कि क्या दो नमूने अलग-अलग साधनों के साथ आबादी से खींचे गए हैं। उदाहरण के लिए कुछ इस तरह (आर में):

y1 <- c(10.5,2.9,2.0,4.4,2.8,5.9,4.2,2.7,4.7,6.6)
y2 <- c(3.8,4.3,2.8,5.0,9.3,6.0,7.6,3.8,6.8,7.9)
t.test(y1,y2)

मुझे 0.3234 का पी-मान मिलता है, और 0.05 के महत्व स्तर पर शून्य परिकल्पना को अस्वीकार नहीं करते हैं कि दो समूह एक ही अर्थ के साथ आबादी से खींचे जाते हैं। अब मुझे प्रत्येक माप के लिए अनिश्चितताएं दी गई हैं:

u1 <- c(2.3,1.7,1.7,1.7,2.0,2.2,2.1,1.7,2.3,2.2)
u2 <- c(2.4,1.8,1.6,2.3,2.5,1.8,1.9,1.5,2.3,2.3)

जहां u1 [1] माप y1 [1] (और इसी तरह) में संयुक्त मानक अनिश्चितता है। मैं इन अनिश्चितताओं को सांख्यिकीय परीक्षण में कैसे शामिल करूं?


ये युग्मित माप हैं या नहीं? (मुझे लगता है कि नहीं।) अनिश्चितताओं का इस्तेमाल किया जा सकता है, जो आपके अनुमानों को बेहतर बना सकता है, लेकिन अनिश्चितताओं में भिन्नता बहुत कम है, इसलिए अनिश्चितताओं में भी ज्यादा फायदा नहीं होगा।
Glen_b -Reinstate मोनिका

ये वास्तविक अप्रकाशित डेटा का एक सबसेट हैं। उदाहरण के लिए मुख्य रूप से प्रश्न को स्पष्ट करना था। मैं वास्तव में जिस चीज की तलाश कर रहा हूं, वह एक परिकल्पना परीक्षण (जैसे परीक्षण) में माप अनिश्चितता को सर्वोत्तम रूप से शामिल करने के लिए सामान्य मार्गदर्शन है। मुझे ऐसा लगता है कि यदि हम माप अनिश्चितताओं का उपयोग नहीं करते हैं, तो हम बहुत सारी मूल्यवान जानकारी बर्बाद कर रहे हैं, लेकिन मैं साहित्य में इस विषय पर स्पष्ट मार्गदर्शन नहीं पा सका हूं।
टॉम

उनका पूरा उपयोग करने के लिए आपको उन्हें टिप्पणियों के लिए एक संभाव्य मॉडल में शामिल करने की आवश्यकता है; माप अनिश्चितता वास्तव में क्या दर्शाती है? (आप इसे हाथ नहीं लगा सकते, इसलिए सावधान रहें।)
Glen_b -Reinstate Monica

जवाबों:


1

ऐसा लगता है कि आप एक भारित विश्लेषण करना चाहते हैं। एसएएस प्रलेखन के "अवधारणाओं" खंड में "भारित सांख्यिकी उदाहरण" देखें ।


तो हम केवल भारित साधनों और भारित मानक विचलन के साथ टी-टेस्ट करते हैं, जहां u1 और u1 वजन हैं?
टॉम

हाँ। आप मान रहे होंगे कि i_th अवलोकन का प्रसरण Var / w_i है, जहाँ i_th अवलोकन के लिए भार और Var_ 0 है।
रिक

1

इसका अनुकरण क्यों नहीं? अर्थात्, प्रत्येक अवलोकन के लिए शोर के अहसास के रूप में अपनी अनिश्चितता में जोड़ें। फिर परिकल्पना परीक्षण दोहराएं। ऐसा लगभग 1000 बार करें और देखें कि कितनी बार नल अस्वीकार कर दिया गया था। आपको शोर के लिए एक वितरण लेने की आवश्यकता होगी। सामान्य एक विकल्प की तरह लगता है, लेकिन यह नकारात्मक टिप्पणियों का उत्पादन कर सकता है, जो यथार्थवादी नहीं है।


1

आप इसे एक प्रतिगमन समस्या में बदल सकते हैं और अनिश्चितताओं को वज़न के रूप में उपयोग कर सकते हैं। यह है, एक प्रतिगमन में माप से समूह (1 या 2?) की भविष्यवाणी करें।

परंतु

अनिश्चितताएं लगभग स्थिर होती हैं, इसलिए यह संभावना लगती है कि इनके इस्तेमाल से भी कुछ नहीं बदलेगा।

आपके पास 10.5 पर एक हल्का बाहरी हिस्सा है, जो साधनों के बीच के अंतर को कम करके मामलों को जटिल कर रहा है। लेकिन अगर आप अनिश्चितताओं पर विश्वास कर सकते हैं, तो यह मूल्य किसी भी अन्य की तुलना में अधिक संदिग्ध नहीं है।

टी-टेस्ट को पता नहीं है कि आपकी वैकल्पिक परिकल्पना यह है कि दो नमूने अलग-अलग आबादी से खींचे जाते हैं। सभी इसके बारे में जानते हैं कि कुछ मान्यताओं के तहत इसकी तुलना की जा रही है। रैंक-आधारित परीक्षण एक विकल्प है, लेकिन यदि आप इन आंकड़ों में माप के रूप में रुचि रखते हैं, तो वे आपके लक्ष्यों के लिए बेहतर नहीं लगते हैं।


मुद्दा लेना। मैंने इसे साधनों के रूप में व्यक्त करने के लिए प्रश्न को बदल दिया।
टॉम

0

साधारण से कम वर्गों (जैसे, lm (y ~ x)) में आप x मान दिए जाने वाले y मानों के आसपास परिवर्तनशीलता (अनिश्चितता) के लिए अनुमति दे रहे हैं। यदि आप प्रतिगमन (lm (x ~)) के चारों ओर फ्लिप करते हैं, तो आप x के आसपास की त्रुटियों को कम करते हैं। दोनों ही मामलों में, त्रुटियों को काफी समरूप माना जाता है।

यदि आप अपने प्रतिक्रिया चर के प्रत्येक अवलोकन के चारों ओर विचरण की मात्रा जानते हैं, और यह विचरण x द्वारा आदेशित होने पर स्थिर नहीं है, तो आप कम से कम वर्ग का उपयोग करना चाहेंगे। आप 1 / (प्रसरण) के कारकों द्वारा y मानों का वजन कर सकते हैं।

उस स्थिति में जहां आप चिंतित हैं कि दोनों x और y में अनिश्चितता है, और यह कि दोनों के बीच अनिश्चितता समान नहीं है, तो आप अपने अक्षों में से एक में सीधा अवशिष्ट (पता अनिश्चितता) को कम से कम नहीं करना चाहते हैं। आदर्श रूप से, आप अनिश्चितता को कम करेंगे जो कि फिटेड ट्रेंड लाइन के लंबवत है। ऐसा करने के लिए, आप पीसीए रिग्रेशन (जिसे ऑर्थोगोनल रिग्रेशन या कुल कम से कम वर्ग के रूप में भी जाना जाता है) का उपयोग कर सकते हैं। पीसीए रिग्रेशन के लिए आर पैकेज हैं , और इस वेब साइट पर पहले भी इस विषय पर पोस्ट किए जा चुके हैं , जिनकी चर्चा अन्यत्र भी की गई है। इसके अलावा, मुझे लगता है (यानी, मैं गलत हो सकता हूं ...) आप अभी भी इस प्रतिगमन का एक भारित संस्करण कर सकते हैं, जिससे आपके ज्ञान का उपयोग किया जा सकता है।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.