माप त्रुटि के आधार पर पुजारियों का चयन करना


9

यदि आपके पास किसी उपकरण की माप त्रुटि है, तो आप उपयुक्त गणना कैसे करेंगे? यह पैराग्राफ Cressie की पुस्तक "Spatio-Temporal Data के लिए सांख्यिकी" है:

यह अक्सर ऐसा होता है कि माप-त्रुटि भिन्नता के संबंध में कुछ पूर्व जानकारी उपलब्ध होती है, जिससे एक सूचनात्मक पैरामीटर मॉडल को निर्दिष्ट किया जा सकता है। उदाहरण के लिए, यदि हम सशर्त रूप से स्वतंत्र माप त्रुटियों को मान रहे हैं जो कि iid हैं Gau(0,σϵ2), तो हम पहले के लिए एक जानकारीपूर्ण निर्दिष्ट करना चाहिए σϵ2। कहते हैं कि हम परिवेशी तापमान में रुचि रखते थे, और हमने देखा कि उपकरण निर्माता के विनिर्देशों ने "त्रुटि" का संकेत दिया । यह मानते हुए कि यह "त्रुटि" 2 मानक विचलन (एक धारणा की जाँच की जानी चाहिए!) से मेल खाती है, हम तब (sigma _ {\ epsilon} ^ {2} निर्दिष्ट कर सकते हैं जिसका पूर्व मतलब (0.1 / 2) ^ 2 = 0.0025 है±0.1°Cσϵ2(0.1/2)2=0.0025। साधन निर्माता के विनिर्देशन के कारण, हम एक ऐसा वितरण मानेंगे जिसमें 0.0025 पर एक स्पष्ट रूप से परिभाषित और काफी संकीर्ण चोटी थी (जैसे, उलटा गामा)। वास्तव में, हम केवल 0.0025 पर ठीक कर सकते हैं; हालाँकि, डेटा-मॉडल त्रुटि में अनिश्चितता के अन्य घटक भी हो सकते हैं (धारा 7.1)। प्रक्रिया-मॉडल त्रुटि के साथ संभावित पहचान समस्याओं से बचने के लिए, यह बहुत महत्वपूर्ण है कि मॉडलर्स अनिश्चितता को कम करते हैं, जितना कि विज्ञान अनुमति देता है, जिसमें प्रतिकृति डेटा के लिए डिज़ाइन किए गए अध्ययन भी शामिल हैं।

क्या किसी को पता है कि पहले वर्णित के मूल्यों को प्राप्त करने के लिए सामान्य प्रक्रिया क्या है (हालांकि पैराग्राफ केवल पूर्व अर्थ प्राप्त करने के लिए संदर्भित करता है)?

जवाबों:


6

दो मानक विधियाँ हैं

  1. "साधन निर्माता के विनिर्देशों" से परामर्श करें, जैसा कि उद्धरण में संकेत दिया गया है। यह आम तौर पर एक क्रूड-बैक-बैक का उपयोग किया जाता है जब कोई अन्य जानकारी उपलब्ध नहीं होती है, क्योंकि (ए) "वास्तव में" सटीकता और "सटीक" से साधन निर्माता का क्या मतलब होता है, अक्सर अनिश्चित होता है और (बी) कैसे इंस्ट्रूमेंट नया होने पर प्रतिक्रिया देता है एक परीक्षण प्रयोगशाला के क्षेत्र में उपयोग किए जाने से बेहतर प्रदर्शन की संभावना थी।

  2. प्रतिकृति नमूने ले लीजिए। पर्यावरणीय नमूने में लगभग आधा दर्जन स्तर होते हैं, जिन पर नमूनों को नियमित रूप से दोहराया जाता है (और बहुत अधिक जिस पर उन्हें दोहराया जा सकता है), प्रत्येक स्तर के लिए एक भिन्नता के स्रोत के लिए नियंत्रित किया जाता था। ऐसे स्रोतों में शामिल हो सकते हैं:

    • नमूना लेने वाले व्यक्ति की पहचान।
    • प्रारंभिक प्रक्रियाएं, जैसे कि कुओं को बांधना, एक नमूना प्राप्त करने से पहले लिया जाता है।
    • शारीरिक नमूना प्रक्रिया में परिवर्तनशीलता।
    • नमूना मात्रा के भीतर विषमता।
    • एक प्रयोगशाला में नमूना को संरक्षित और शिपिंग करते समय होने वाले परिवर्तन।
    • प्रारंभिक प्रयोगशाला प्रक्रियाओं में विविधताएं, जैसे कि एक भौतिक नमूने को समरूप बनाना या विश्लेषण के लिए पचाना।
    • प्रयोगशाला विश्लेषक (ओं) की पहचान।
    • प्रयोगशालाओं के बीच अंतर।
    • भौतिक रूप से अलग-अलग उपकरणों के बीच अंतर, जैसे कि दो गैस क्रोमैटोग्राफ।
    • समय के साथ उपकरण अंशांकन में बहाव।
    • दिनचर्या में फेरबदल। (यह प्राकृतिक और व्यवस्थित हो सकता है लेकिन नमूना समय मनमाने होने पर यादृच्छिक दिखाई दे सकता है।)

परिवर्तनशीलता के घटकों का एक पूर्ण मात्रात्मक मूल्यांकन केवल उपयुक्त प्रयोगात्मक डिजाइन के अनुसार इनमें से प्रत्येक कारक को व्यवस्थित रूप से भिन्न करके प्राप्त किया जा सकता है।

आमतौर पर केवल सूत्रों का मानना ​​है कि सबसे अधिक परिवर्तनशीलता का अध्ययन किया जाता है। उदाहरण के लिए, कई अध्ययन व्यवस्थित रूप से नमूनों के एक निश्चित भाग को प्राप्त करने के बाद विभाजित करेंगे और उन्हें दो अलग-अलग प्रयोगशालाओं में भेज देंगे। उन विभाजन के परिणामों के बीच अंतर का एक अध्ययन माप परिवर्तनशीलता में उनके योगदान को निर्धारित कर सकता है। यदि इस तरह के विभाजन को पर्याप्त रूप से प्राप्त किया जाता है, तो माप परिवर्तनशीलता का पूर्ण वितरण एक पदानुक्रमित बायेसियन अनुपात-लौकिक मॉडल में पूर्व के रूप में अनुमानित किया जा सकता है। क्योंकि कई मॉडल गॉसियन डिस्ट्रीब्यूशन (प्रत्येक गणना के लिए) मानते हैं, पूर्व में एक गॉसियन प्राप्त करना अंत में विभाजन के बीच के अंतर और विचलन का अनुमान लगाने के लिए नीचे आता है। अधिक जटिल अध्ययनों में, जिसका उद्देश्य विचरण के एक से अधिक घटकों की पहचान करना है,

इन मुद्दों के बारे में सोचने के लाभों में से एक यह है कि वे आपको त्रुटि के इन घटकों में से कुछ को कम करने या यहां तक ​​कि उन्हें समाप्त करने के तरीकों की पहचान करने में मदद करते हैं (जिससे कि उन्हें मात्रा निर्धारित किए बिना), जिससे Cressie और Wikle के आदर्श के करीब पहुंचना "अनिश्चितता को कम करना" है। जितना विज्ञान इजाजत देता है। "

एक विस्तारित काम करने वाले उदाहरण के लिए (मिट्टी के नमूने में), देखें

वान ई, ब्लम, और स्टार्क्स, मिट्टी के नमूने में त्रुटियों के आकलन के लिए एक तर्क। यूएस ईपीए, मई 1990: ईपीए / 600 / 4-90 / 013।


2
रॉबर्ट, यहाँ मुद्दा यह है कि कभी-कभी कोई अनुमान के लिए मानक विचलन की रिपोर्ट करेगा; दूसरी बार वे इसे दो बार रिपोर्ट करेंगे (विभाजन को दो से घटाकर) या दो तरफा विश्वास अंतराल; और कभी-कभी कुछ और भी; इसलिए पुजारियों में सटीकता और सटीकता के बयानों को परिवर्तित करने के लिए कोई निश्चित नियम नहीं है: आपको फ़ुटनोट्स और अन्य तकनीकी विवरणों से परामर्श करना चाहिए ताकि यह पता लगाया जा सके कि संख्याएं क्या दर्शाती हैं। एक अनुमान की मानक त्रुटि, उपयोग किए गए नमूने के आकार का एक कार्य होने के नाते, इस उद्देश्य के लिए अप्रासंगिक है।
whuber

1
समझ गया। मुझे अपने दूसरे मामले पर ध्यान केंद्रित करने दें। यदि मैं एक प्रयोग को कई बार दोहराता हूं और माप और हूं, तो मैं इस जानकारी का उपयोग पूर्व वितरण के लिए माध्य और विचरण को सूचित करने के लिए कैसे कर सकता हूं? आपने कई विभाजन के लिए जैसा सुझाव दिया है , है ना? इसलिए, मेरे पास एक माप त्रुटि और एक नमूना मानक विचलन । क्या यह पूर्व में शामिल करने के लिए पर्याप्त है ? m1m2m1m2mϵσεएन(ε,σε2)
रॉबर्ट स्मिथ

1
आप विभाजन के साथ सटीकता का आकलन नहीं कर सकते हैं: इसके लिए, आपको ज्ञात मूल्यों के नमूनों को मापने की आवश्यकता है। (प्रयोगशाला स्पाइक्स और नुकीला डुप्लिकेट इसके लिए उपयोग किए जाते हैं।) इसका मतलब निर्धारित किया जाएगा। आमतौर पर इसे माप प्रक्रिया को कैलिब्रेट करते समय संभाला जाता है, इसलिए इसका मतलब शून्य हो जाता है। विचरण का अनुमान सामान्य एनोवा फार्मूले के साथ किया जाता है। आप माप प्रणाली के संगत घटक पर एक पूर्व निर्दिष्ट करने के लिए इसका उपयोग कर सकते हैं।
whuber

2
ऐसा नहीं है: मैंने जो संदर्भ दिया है वह यूएस ईपीए मार्गदर्शन है जो लगभग एक चौथाई शताब्दी के लिए रहा है और हाल ही में बहुत सारे मार्गदर्शन इसके विचारों पर आधारित हैं। मैंने एक बार एक संघीय अदालत में इस दृष्टिकोण का इस्तेमाल एक दूषित प्लम को परिसीमित करने के लिए समोच्च रेखाओं (भू-स्थानिक भविष्यवक्ता पर आधारित) पर माप त्रुटि के प्रभाव का मूल्यांकन करने के लिए किया था: माप त्रुटि बेर को बांधने के लिए उपयोग की गई एकाग्रता से बड़ी थी! (दूसरे शब्दों में, पंख चित्रण में अनिश्चितता अनिवार्य रूप से अनंत था।)
whuber

1
बहुत अच्छे। वैसे, मेरा कहने का मतलब था कि आमतौर पर बहुत ध्यान रखे बिना ही पुजारी सेट हो जाते हैं। मैंने इसे बायेसियन मॉडलिंग और मशीन लर्निंग में अधिक प्रमुखता से देखा है क्योंकि शायद एक अनुमान अक्सर सभ्य परिणाम देने के लिए पर्याप्त होता है।
रॉबर्ट स्मिथ
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.