वाल्टमीटर कहानी पर अक्सर क्या होता है?


15

वाल्टमीटर कहानी और इसकी विविधताओं पर अक्सर क्या होता है? इसके पीछे विचार यह है कि एक सांख्यिकीय विश्लेषण जो काल्पनिक घटनाओं की अपील करता है, उसे संशोधित करना होगा यदि बाद में पता चला कि उन काल्पनिक घटनाओं को ग्रहण नहीं किया जा सकता था।

विकिपीडिया पर कहानी का संस्करण नीचे दिया गया है।

एक इंजीनियर इलेक्ट्रॉन ट्यूबों का एक यादृच्छिक नमूना खींचता है और उनके वोल्टेज को मापता है। माप 75 से 99 वोल्ट तक होता है। एक सांख्यिकीविद् नमूना माध्य और वास्तविक माध्य के लिए एक विश्वास अंतराल की गणना करता है। बाद में सांख्यिकीविद् को पता चलता है कि वोल्टमीटर केवल 100 तक ही पढ़ता है, इसलिए जनसंख्या 'सेंसर' हो जाती है। यह एक नए विश्लेषण की आवश्यकता है, अगर सांख्यिकीविद् रूढ़िवादी है। हालांकि, इंजीनियर का कहना है कि उसके पास 1000 मीटर की दूरी पर एक और मीटर रीडिंग है, जिसका इस्तेमाल वह किसी भी वोल्टेज 100 से अधिक होने पर करता था। यह सांख्यिकीविद् के लिए एक राहत की बात है, क्योंकि इसका मतलब है कि आबादी प्रभावी रूप से बिना सेंसर किए हुई थी। लेकिन, अगले दिन इंजीनियर ने सांख्यिकीविद को सूचित किया कि माप के समय यह दूसरा मीटर काम नहीं कर रहा था। सांख्यिकीविद् यह पता लगाते हैं कि इंजीनियर मीटर को ठीक करने तक माप को आयोजित नहीं करेगा, और उसे सूचित करेगा कि नए माप की आवश्यकता है। इंजीनियर चकित है। "आगे आप मेरे आस्टसीलस्कप के बारे में पूछेंगे"।

यह कहानी स्पष्ट रूप से मूर्खतापूर्ण है, लेकिन यह मेरे लिए स्पष्ट नहीं है कि जिस पद्धति के साथ यह मजाक उड़ाया जा रहा है, उसमें क्या स्वतंत्रता है। मुझे यकीन है कि इस मामले में एक व्यस्त लागू सांख्यिकीविद् इस पर चिंता नहीं करेंगे, लेकिन एक कट्टर अकादमिक शिक्षक के बारे में क्या?

एक हठधर्मी लगातार दृष्टिकोण का उपयोग करते हुए, क्या हमें प्रयोग दोहराने की आवश्यकता होगी? क्या हम पहले से उपलब्ध आंकड़ों से कोई निष्कर्ष निकाल सकते हैं?

कहानी द्वारा किए गए अधिक सामान्य बिंदु को भी संबोधित करने के लिए, यदि हम पहले से मौजूद डेटा का उपयोग करना चाहते हैं, तो क्या काल्पनिक ढांचे में फिट होने के लिए काल्पनिक परिणामों के लिए आवश्यक संशोधन किया जा सकता है?


4
लगातार दृष्टिकोण भी कंडीशनिंग के लिए अनुमति देता है, इसलिए मैं अनिश्चित हूं कि बोली में पाया गया तर्क पूरी तरह से पर्याप्त है।
शीआन

@ शीआन भले ही हम नमूने की सेंसरिंग को शामिल कर लें या दूसरे वाल्टमीटर की संभावना को हमारी गणनाओं में तोड़ा जाए, लेकिन समस्या यह है कि इसके प्रयोग के बाद हम प्रयोग का डिज़ाइन बदल रहे हैं । मुझे नहीं पता कि क्या लगातार तरीकों से सामंजस्य स्थापित किया जा सकता है।
प्रिक्सोलिटिक

6
हो सकता है कि यह प्रविष्टि कंडिशनलिटी सिद्धांत पर जाँच करें । एक व्यक्तिवादी नहीं होने के बावजूद, मैं इस कहानी का बहुत बड़ा प्रशंसक नहीं हूं क्योंकि यह उन लोगों की सीमा को परिभाषित किए बिना सभी संभव काल्पनिक घटनाओं पर प्रभाव डालने के लिए लगता है। यह बल्कि कैरिकेचर है।
शीआन

5
यह वास्तव में विचारशील चर्चा और जवाब के योग्य है। लेकिन कृपया ध्यान दें कि "यदि सांख्यिकीविद रूढ़िवादी है" और अतिरिक्त कार्य के लिए अक्षम या लालची नहीं है, तो वह बताएगी कि चूंकि मूल टिप्पणियों में से कोई भी सेंसर नहीं किया गया था, उसकी मूल पसंद की प्रक्रिया (संभवतः स्वीकार्य है) स्वीकार्य है और इसलिए इसका कोई आधार नहीं है। बदल दें। सैद्धांतिक आधार जो "फ़्रीक्वेंटिस्ट" सांख्यिकी - निर्णय सिद्धांत को रेखांकित करता है - इसका "संभावना सिद्धांत" के लिए कोई उपयोग नहीं है।
whuber

1
मुझे पता है कि मैं क्या करूंगा, बशर्ते पर्याप्त डेटा हो। मैं एक हिस्टोग्राम बनाऊंगा। मैं हिस्टोग्राम को देखूंगा। यदि उस बिंदु पर एकतरफा छंटनी किए गए हिस्टोग्राम को बनाने के लिए 99 पर एक स्पष्ट बाध्य था, तो मुझे संदेह होगा कि इसे काट दिया गया था। मैं उन आंकड़ों को भी देखूंगा, जिन्हें ज्ञात नहीं किया गया है और उनकी वक्र आकृतियों का निरीक्षण किया गया है, और यह देखने के लिए कि क्या मुझे फिट होने के लिए एक संभावना मॉडल मिल सकता है, जैसे, एक गामा वितरण, या क्या नहीं। मैं तब छंटनी किए गए डेटा (धारणा द्वारा) पर वापस जाऊंगा और देखूंगा कि क्या यह बाकी भी गामा वितरित (या जो कुछ भी) है। फिर मुझे समझाने की ज़रूरत है, "गामा क्यों?" यदि हां, तो मैं कर रहा हूं।
कार्ल

जवाबों:


5

में frequentist निष्कर्ष , हम यह निर्धारित करने कि कितने समय में कुछ हुआ है | अगर एक चाहते दिया स्टोकेस्टिक प्रक्रिया बार-बार अनुभव किया गया। यह पी-वैल्यू, विश्वास अंतराल और इस तरह के सिद्धांत के लिए शुरुआती बिंदु है। हालांकि, कई लागू परियोजनाओं में, "दी गई" प्रक्रिया वास्तव में नहीं दी गई है, और सांख्यिकीविद् को कम से कम कुछ काम निर्दिष्ट करना है और इसे मॉडलिंग करना है। यह आश्चर्यजनक रूप से अस्पष्ट समस्या हो सकती है, जैसा कि इस मामले में है।

डेटा जनरेशन प्रोसेस को मॉडलिंग करना

दी गई जानकारी के आधार पर, हमारा सबसे अच्छा उम्मीदवार निम्नलिखित प्रतीत होता है:

  1. यदि 100V मीटर 100V पढ़ता है, तो यह परिचालन के दौरान इंजीनियर 1000V मीटर के साथ फिर से मापता है। अन्यथा, वह बस 100V को चिह्नित करता है और आगे बढ़ता है।

लेकिन यह हमारे इंजीनियर के लिए थोड़ा अनुचित नहीं है? यह मानते हुए कि वह एक इंजीनियर है और केवल एक तकनीशियन नहीं है, वह शायद यह समझता है कि पहले मीटर 100V को पढ़ने पर उसे फिर से मापने की आवश्यकता क्यों है; यह इसलिए है क्योंकि मीटर अपनी सीमा की ऊपरी सीमा पर संतृप्त है , इसलिए अब विश्वसनीय नहीं है। तो शायद इंजीनियर वास्तव में क्या करेगा

  1. यदि 100 वी मीटर 100 पढ़ता है, तो इंजीनियर परिचालन के 1000 मीटर के साथ फिर से मापता है। अन्यथा, वह बस 100V को चिह्नित करता है, संतृप्त माप को इंगित करने के लिए एक प्लस चिह्न जोड़ता है, और आगे बढ़ता है।

ये दोनों प्रक्रियाएं हमारे पास मौजूद डेटा के अनुरूप हैं, लेकिन वे अलग-अलग प्रक्रियाएं हैं, और वे विभिन्न आत्मविश्वास अंतराल पैदा करते हैं। प्रक्रिया 2 वह है जिसे हम सांख्यिकीविद् के रूप में पसंद करेंगे। यदि वोल्टेज अक्सर 100 वी से ऊपर होते हैं, तो प्रक्रिया 1 में एक संभावित भयावह विफलता मोड होता है जिसमें माप कभी-कभी गंभीर रूप से कम करके आंका जाता है, क्योंकि डेटा को हमारे जानने के बिना सेंसर किया जाता है। आत्मविश्वास अंतराल तदनुसार चौड़ा होगा। हम इसे यह कहकर कम कर सकते हैं कि इंजीनियर हमें यह बताए कि जब उसका 1000V मीटर काम नहीं कर रहा है, लेकिन यह वास्तव में यह सुनिश्चित करने का एक और तरीका है कि हमारा डेटा प्रक्रिया 2 के अनुरूप हो।

यदि घोड़े ने पहले ही खलिहान छोड़ दिया है और हम यह निर्धारित नहीं कर सकते हैं कि माप कब हैं और सेंसर नहीं हैं, तो हम उस समय डेटा से अनुमान लगाने की कोशिश कर सकते हैं जब 1000V मीटर काम नहीं कर रहा है। प्रक्रिया में एक इंजेक्शन नियम शुरू करके, हम प्रभावी रूप से 1 और 2 दोनों से 1.5 अलग एक नई प्रक्रिया बनाते हैं। हमारा निष्कर्ष नियम कभी-कभी काम करेगा और कभी-कभी नहीं, इसलिए प्रक्रिया 1.5 की तुलना में प्रक्रिया 1.5 से आत्मविश्वास अंतराल आकार में होगा और 2।

सिद्धांत रूप में, एक ही आँकड़ा के बारे में कुछ भी गलत या संदिग्ध नहीं है, जिसमें तीन अलग-अलग विश्वासयोग्य प्रतिनिधि स्टोचस्टिक प्रक्रियाओं से जुड़े तीन अलग-अलग आत्मविश्वास अंतराल हैं। व्यवहार में, आंकड़ों के कुछ उपभोक्ता तीन अलग-अलग आत्मविश्वास अंतराल चाहते हैं। वे एक चाहते हैं, वह जो वास्तव में हुआ होता है पर आधारित है , प्रयोग कई बार दोहराया गया था। इसलिए आमतौर पर, लागू सांख्यिकीविद परियोजना के दौरान अपने द्वारा अर्जित डोमेन ज्ञान पर विचार करता है, एक शिक्षित अनुमान बनाता है, और उस प्रक्रिया से जुड़े आत्मविश्वास अंतराल को प्रस्तुत करता है जो उसने अनुमान लगाया है। या वह प्रक्रिया को औपचारिक बनाने के लिए ग्राहक के साथ काम करती है, इसलिए आगे बढ़ने का अनुमान लगाने की कोई आवश्यकता नहीं है।

नई जानकारी के लिए कैसे प्रतिक्रिया दें

कहानी में सांख्यिकीविद् के आग्रह के बावजूद, अक्सर अनुमान लगाने की आवश्यकता नहीं है कि हम माप दोहराते हैं जब हम नई जानकारी प्राप्त करने का सुझाव देते हैं कि जनरेटिंग स्टोकेस्टिक प्रक्रिया काफी नहीं है जो हमने मूल रूप से कल्पना की थी। हालांकि, यदि प्रक्रिया दोहराई जा रही है, तो हमें यह सुनिश्चित करने की आवश्यकता है कि सभी पुनरावृत्ति विश्वास अंतराल द्वारा निर्धारित मॉडल प्रक्रिया के अनुरूप हैं। हम इस प्रक्रिया को बदलकर या इसके मॉडल को बदलकर कर सकते हैं।

यदि हम प्रक्रिया को बदलते हैं, तो हमें पिछले डेटा को त्यागने की आवश्यकता हो सकती है जो उस प्रक्रिया के साथ असंगत रूप से एकत्र किया गया था। लेकिन यह एक मुद्दा नहीं है, क्योंकि सभी प्रक्रिया भिन्नताएं जिन पर हम विचार कर रहे हैं, वे केवल भिन्न हैं जब कुछ डेटा 100V से ऊपर है, और यह इस मामले में कभी नहीं हुआ।

हम जो कुछ भी करते हैं, मॉडल और वास्तविकता को संरेखण में लाना चाहिए। इसके बाद ही सैद्धांतिक रूप से गारंटीकृत लगातार त्रुटि दर होगी जो ग्राहक को वास्तव में प्रक्रिया के दोहराया प्रदर्शन पर मिलती है।

बायेसियन वैकल्पिक

दूसरी ओर, अगर हम सभी की वास्तव में परवाह करते हैं, तो इसके लिए सही अर्थ की संभावित सीमा है इस नमूने के , तो हमें पूरी तरह से अलग-थलग कर देना चाहिए और उस सवाल का जवाब बेचने वाले लोगों की तलाश करनी चाहिए - बायेसियन। यदि हम इस मार्ग पर जाते हैं, तो जवाबी कार्रवाई के लिए सभी बाधाएं अप्रासंगिक हो जाती हैं; यह सब मायने रखता है पूर्व और संभावना है। इस सरलीकरण के बदले में, हम "प्रयोग" के दोहराया प्रदर्शन के तहत एक त्रुटि दर की गारंटी की कोई उम्मीद खो देते हैं।

उपद्रव क्यों?

इस कहानी का निर्माण इस बात के लिए किया गया था कि बिना किसी कारण के मूर्खतापूर्ण चीजों पर अक्सर फासिस्ट बने रहे। ईमानदारी से, जो इन मूर्खतापूर्ण जवाबी कार्रवाई की परवाह करता है? जवाब, निश्चित रूप से, यह है कि हर किसी को परवाह करनी चाहिए। वस्तुतः महत्वपूर्ण वैज्ञानिक क्षेत्र वर्तमान में एक गंभीर प्रतिकृति संकट से पीड़ित हैं , जो बताता है कि झूठी खोजों की आवृत्ति वैज्ञानिक साहित्य में अपेक्षा से बहुत अधिक है। इस संकट के ड्राइवरों में से एक, हालांकि किसी भी तरह से एकमात्र नहीं , पी-हैकिंग का उदय है , जो तब होता है जब शोधकर्ता किसी मॉडल के कई रूपों के साथ खेलते हैं, विभिन्न चर को नियंत्रित करते हैं, जब तक कि उन्हें महत्व नहीं मिलता।

पी-हैकिंग को लोकप्रिय वैज्ञानिक मीडिया और ब्लॉग जगत में बड़े पैमाने पर देखा गया है, लेकिन कुछ लोग वास्तव में समझते हैं कि पी-हैकिंग के बारे में क्या गलत है और क्यों। लोकप्रिय सांख्यिकीय राय के विपरीत, मॉडलिंग प्रक्रिया से पहले, दौरान और बाद में आपके डेटा को देखने में कुछ भी गलत नहीं है। क्या गलत है यह खोजपूर्ण विश्लेषणों की रिपोर्ट करने में विफल है और उन्होंने अध्ययन के पाठ्यक्रम को कैसे प्रभावित किया। केवल पूर्ण प्रक्रिया को देखकर ही हम संभवतः यह भी निर्धारित कर सकते हैं कि स्टोकेस्टिक मॉडल उस प्रक्रिया का प्रतिनिधि है और उस मॉडल के लिए कौन सा लगातार विश्लेषण उपयुक्त है, यदि कोई हो।

यह दावा करना कि एक निश्चित लगातार विश्लेषण उपयुक्त है एक बहुत ही गंभीर दावा है। यह दावा करने से तात्पर्य है कि आप अपने द्वारा चुनी गई स्टोकेस्टिक प्रक्रिया के अनुशासन के लिए खुद को बाध्य कर रहे हैं, जो विभिन्न स्थितियों में आपके द्वारा किए गए कार्यों के बारे में पूरी तरह से प्रतिक्रिया करता है। आपको वास्तव में उस प्रणाली के अनुरूप होना चाहिए जो आप पर लागू करने के लिए लगातार गारंटी के लिए है। बहुत कम शोधकर्ता, विशेष रूप से उन क्षेत्रों में जो खुले अंत की खोज पर जोर देते हैं, प्रणाली के अनुरूप होते हैं, और वे अपने विचलन की गहराई से रिपोर्ट नहीं करते हैं; यही कारण है कि अब हमारे हाथ पर प्रतिकृति संकट है। (कुछ सम्मानित शोधकर्ताओं ने तर्क दिया है कि यह अपेक्षा अवास्तविक है, ऐसी स्थिति जिससे मैं सहानुभूति रखता हूं, लेकिन यह इस पद के दायरे से परे है।)

यह अनुचित प्रतीत हो सकता है कि हम प्रकाशित पत्रों की आलोचना कर रहे हैं कि वे इस बारे में एक दावे के आधार पर कि उन्होंने क्या किया होगा डेटा अलग था। लेकिन यह (कुछ हद तक विरोधाभासी) प्रकृतिवादी तर्क की प्रकृति है: यदि आप पी-मूल्य की अवधारणा को स्वीकार करते हैं, तो आपको मॉडलिंग की वैधता का सम्मान करना होगा जो वैकल्पिक डेटा के तहत किया गया होगा। (जेलमैन और लोकेन, 2013)

ऐसे अध्ययनों में, जो अपेक्षाकृत सरल और / या मानकीकृत हैं, जैसे नैदानिक ​​परीक्षण, हम कई या अनुक्रमिक तुलना जैसी चीजों के लिए समायोजित कर सकते हैं और सैद्धांतिक त्रुटि दर को बनाए रख सकते हैं; अधिक जटिल और खोजपूर्ण अध्ययनों में, एक लगातार मॉडल अनुचित हो सकता है क्योंकि शोधकर्ता सभी निर्णयों के बारे में पूरी तरह से सचेत नहीं हो सकता है , अकेले रिकॉर्डिंग करें और उन्हें स्पष्ट रूप से प्रस्तुत करें। ऐसे मामलों में, शोधकर्ता को (1) ईमानदार होना चाहिए और जो किया गया था उसके बारे में आगे बढ़ना चाहिए; (2) मजबूत पीट के साथ या तो पी-मान प्रस्तुत करें, या बिल्कुल नहीं; (3) साक्ष्य की अन्य पंक्तियों को प्रस्तुत करने पर विचार करें, जैसे कि परिकल्पना की पूर्व संभाव्यता या अनुवर्ती प्रतिकृति अध्ययन।


यह एक अच्छे उत्तर की तरह लगता है लेकिन मुझे कल इसे मानसिक रूप से पचाने की आवश्यकता होगी।
प्रिक्सोलिटिक

समस्या के वर्णन के अनुसार, ऐसा लगता है जैसे कि एक इंजीनियर दावा कर रहा है कि वह हमेशा आपका विकल्प # 2 कर रहा था
अक्षर

शायद, लेकिन उन्होंने ऐसा स्पष्ट रूप से नहीं कहा। बड़ी त्रुटियां तब की जा सकती हैं जब लोग अनुमान लगाते हैं कि अन्य लोग स्पष्ट रूप से चर्चा करने के बजाय क्या सोच रहे हैं।
पॉल

लागू सांख्यिकी पाठ्यक्रमों में, मापदंडों का अनुमान लगाने के लिए इसका क्या अर्थ है, इसकी औपचारिकता पर बहुत कम जोर दिया जाता है। मान लीजिए कि हम एक सिक्का उछालना चाहते हैं, और सिर की आवृत्ति रिकॉर्ड करते हैं। अंदर जाकर, हम स्पष्ट रूप से मान लेते हैं कि वास्तविक वितरण बर्नौली के साथ p = q = 0.5 है। 1,000 झांकियों के बाद, हम अपने आप से पूछते हैं कि वास्तविकता को सिद्धांत / धारणा से तुलना करके 'यह कितना उचित सिक्का है।' लेकिन बहुत विज्ञान में, लोग मानते हैं कि चीजें सामान्य रूप से वितरित की जाती हैं, फिर टी-टेस्ट का उपयोग करें। लेकिन वे व्यर्थ हैं यदि रिटर्न सामान्य रूप से वितरित नहीं हैं।
eSurfsnake

1

एक तार्किक गिरावट दिखती है। 1000 वोल्ट मीटर काम कर रहा था या नहीं, इंजीनियर कहते हैं, "यदि कोई रीडिंग 100 से अधिक होती, तो मैं दूसरे मीटर का उपयोग करता।" लेकिन उन्हें कैसे पता चलेगा कि 1000 वोल्ट मीटर का उपयोग किए बिना वोल्टेज> 100 था?

मुझे नहीं लगता कि यह पहेली एक उपयोगी दार्शनिक सवाल बनाने के लिए पर्याप्त रूप से तैयार है। व्यावहारिक रूप से, मैं इस जवाब से सहमत हूं कि सही चीज हिस्टोग्राम बनाना और यह देखना है कि क्या यह छोटा दिखता है।

लेकिन, किसी भी मामले में, प्रश्न में कुछ भी नहीं है कि मुद्दों से संबंधित है, जैसे: (1) रीडिंग के ज्ञात (या संदिग्ध) वितरण क्या है, और क्यों? क्या विश्वास करने का कोई कारण है कि वे सामान्य रूप से वितरित हैं? (२) यदि उस प्रश्न का उत्तर नहीं दिया जाता है, तो किसी भी विश्वास अंतराल का कभी अनुमान कैसे लगाया गया था?

इसे चरम पर ले जाने के लिए, कुछ 'वोल्टेज' को मापा जा रहा है। मान लीजिए कि बिजली की आपूर्ति 100 वोल्ट से अधिक नहीं कर सकती है। यह सच था, संभवतः 100 वोल्ट से अधिक कोई माप नहीं हो सकता है, इसलिए मीटर अप्रासंगिक है।

पुजारियों, अड़चनों इत्यादि के संदर्भ में एक पूरा गुच्छा अधिक है - जो अनुमान में शामिल है और प्रश्न कवर की तरह है। यह 'मोंटी हॉल' विरोधाभास के विपरीत है, जो कुरकुरा और साफ है।


1
कहानी की बात संभावना की आलोचनात्मक व्याख्याओं की है जो इन व्याख्याओं को एक बेतुके चरम तक बढ़ाकर काल्पनिक घटनाओं पर निर्भर करती है। आप जिन मुद्दों का उल्लेख करते हैं वे बिंदु के बगल में हैं। माना जाता है कि इंजीनियर को जरूरत पड़ने पर वोल्टमीटर बदलने के लिए जाना जाता है (उदाहरण के लिए "100" की रीडिंग देखता है) और सांख्यिकीविद् के पास अन्यथा उसके द्वारा उपयोग किए जाने वाले दृष्टिकोण का उपयोग करने के कारण हैं (जैसे वह सिर्फ इसलिए पहले से ही जानता है कि सामान्य वितरण एक अच्छा है इन रीडिंग के लिए मॉडल)।
प्रिक्सोलिटिक
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.