में frequentist निष्कर्ष , हम यह निर्धारित करने कि कितने समय में कुछ हुआ है | अगर एक चाहते दिया स्टोकेस्टिक प्रक्रिया बार-बार अनुभव किया गया। यह पी-वैल्यू, विश्वास अंतराल और इस तरह के सिद्धांत के लिए शुरुआती बिंदु है। हालांकि, कई लागू परियोजनाओं में, "दी गई" प्रक्रिया वास्तव में नहीं दी गई है, और सांख्यिकीविद् को कम से कम कुछ काम निर्दिष्ट करना है और इसे मॉडलिंग करना है। यह आश्चर्यजनक रूप से अस्पष्ट समस्या हो सकती है, जैसा कि इस मामले में है।
डेटा जनरेशन प्रोसेस को मॉडलिंग करना
दी गई जानकारी के आधार पर, हमारा सबसे अच्छा उम्मीदवार निम्नलिखित प्रतीत होता है:
- यदि 100V मीटर 100V पढ़ता है, तो यह परिचालन के दौरान इंजीनियर 1000V मीटर के साथ फिर से मापता है। अन्यथा, वह बस 100V को चिह्नित करता है और आगे बढ़ता है।
लेकिन यह हमारे इंजीनियर के लिए थोड़ा अनुचित नहीं है? यह मानते हुए कि वह एक इंजीनियर है और केवल एक तकनीशियन नहीं है, वह शायद यह समझता है कि पहले मीटर 100V को पढ़ने पर उसे फिर से मापने की आवश्यकता क्यों है; यह इसलिए है क्योंकि मीटर अपनी सीमा की ऊपरी सीमा पर संतृप्त है , इसलिए अब विश्वसनीय नहीं है। तो शायद इंजीनियर वास्तव में क्या करेगा
- यदि 100 वी मीटर 100 पढ़ता है, तो इंजीनियर परिचालन के 1000 मीटर के साथ फिर से मापता है। अन्यथा, वह बस 100V को चिह्नित करता है, संतृप्त माप को इंगित करने के लिए एक प्लस चिह्न जोड़ता है, और आगे बढ़ता है।
ये दोनों प्रक्रियाएं हमारे पास मौजूद डेटा के अनुरूप हैं, लेकिन वे अलग-अलग प्रक्रियाएं हैं, और वे विभिन्न आत्मविश्वास अंतराल पैदा करते हैं। प्रक्रिया 2 वह है जिसे हम सांख्यिकीविद् के रूप में पसंद करेंगे। यदि वोल्टेज अक्सर 100 वी से ऊपर होते हैं, तो प्रक्रिया 1 में एक संभावित भयावह विफलता मोड होता है जिसमें माप कभी-कभी गंभीर रूप से कम करके आंका जाता है, क्योंकि डेटा को हमारे जानने के बिना सेंसर किया जाता है। आत्मविश्वास अंतराल तदनुसार चौड़ा होगा। हम इसे यह कहकर कम कर सकते हैं कि इंजीनियर हमें यह बताए कि जब उसका 1000V मीटर काम नहीं कर रहा है, लेकिन यह वास्तव में यह सुनिश्चित करने का एक और तरीका है कि हमारा डेटा प्रक्रिया 2 के अनुरूप हो।
यदि घोड़े ने पहले ही खलिहान छोड़ दिया है और हम यह निर्धारित नहीं कर सकते हैं कि माप कब हैं और सेंसर नहीं हैं, तो हम उस समय डेटा से अनुमान लगाने की कोशिश कर सकते हैं जब 1000V मीटर काम नहीं कर रहा है। प्रक्रिया में एक इंजेक्शन नियम शुरू करके, हम प्रभावी रूप से 1 और 2 दोनों से 1.5 अलग एक नई प्रक्रिया बनाते हैं। हमारा निष्कर्ष नियम कभी-कभी काम करेगा और कभी-कभी नहीं, इसलिए प्रक्रिया 1.5 की तुलना में प्रक्रिया 1.5 से आत्मविश्वास अंतराल आकार में होगा और 2।
सिद्धांत रूप में, एक ही आँकड़ा के बारे में कुछ भी गलत या संदिग्ध नहीं है, जिसमें तीन अलग-अलग विश्वासयोग्य प्रतिनिधि स्टोचस्टिक प्रक्रियाओं से जुड़े तीन अलग-अलग आत्मविश्वास अंतराल हैं। व्यवहार में, आंकड़ों के कुछ उपभोक्ता तीन अलग-अलग आत्मविश्वास अंतराल चाहते हैं। वे एक चाहते हैं, वह जो वास्तव में हुआ होता है पर आधारित है , प्रयोग कई बार दोहराया गया था। इसलिए आमतौर पर, लागू सांख्यिकीविद परियोजना के दौरान अपने द्वारा अर्जित डोमेन ज्ञान पर विचार करता है, एक शिक्षित अनुमान बनाता है, और उस प्रक्रिया से जुड़े आत्मविश्वास अंतराल को प्रस्तुत करता है जो उसने अनुमान लगाया है। या वह प्रक्रिया को औपचारिक बनाने के लिए ग्राहक के साथ काम करती है, इसलिए आगे बढ़ने का अनुमान लगाने की कोई आवश्यकता नहीं है।
नई जानकारी के लिए कैसे प्रतिक्रिया दें
कहानी में सांख्यिकीविद् के आग्रह के बावजूद, अक्सर अनुमान लगाने की आवश्यकता नहीं है कि हम माप दोहराते हैं जब हम नई जानकारी प्राप्त करने का सुझाव देते हैं कि जनरेटिंग स्टोकेस्टिक प्रक्रिया काफी नहीं है जो हमने मूल रूप से कल्पना की थी। हालांकि, यदि प्रक्रिया दोहराई जा रही है, तो हमें यह सुनिश्चित करने की आवश्यकता है कि सभी पुनरावृत्ति विश्वास अंतराल द्वारा निर्धारित मॉडल प्रक्रिया के अनुरूप हैं। हम इस प्रक्रिया को बदलकर या इसके मॉडल को बदलकर कर सकते हैं।
यदि हम प्रक्रिया को बदलते हैं, तो हमें पिछले डेटा को त्यागने की आवश्यकता हो सकती है जो उस प्रक्रिया के साथ असंगत रूप से एकत्र किया गया था। लेकिन यह एक मुद्दा नहीं है, क्योंकि सभी प्रक्रिया भिन्नताएं जिन पर हम विचार कर रहे हैं, वे केवल भिन्न हैं जब कुछ डेटा 100V से ऊपर है, और यह इस मामले में कभी नहीं हुआ।
हम जो कुछ भी करते हैं, मॉडल और वास्तविकता को संरेखण में लाना चाहिए। इसके बाद ही सैद्धांतिक रूप से गारंटीकृत लगातार त्रुटि दर होगी जो ग्राहक को वास्तव में प्रक्रिया के दोहराया प्रदर्शन पर मिलती है।
बायेसियन वैकल्पिक
दूसरी ओर, अगर हम सभी की वास्तव में परवाह करते हैं, तो इसके लिए सही अर्थ की संभावित सीमा है इस नमूने के , तो हमें पूरी तरह से अलग-थलग कर देना चाहिए और उस सवाल का जवाब बेचने वाले लोगों की तलाश करनी चाहिए - बायेसियन। यदि हम इस मार्ग पर जाते हैं, तो जवाबी कार्रवाई के लिए सभी बाधाएं अप्रासंगिक हो जाती हैं; यह सब मायने रखता है पूर्व और संभावना है। इस सरलीकरण के बदले में, हम "प्रयोग" के दोहराया प्रदर्शन के तहत एक त्रुटि दर की गारंटी की कोई उम्मीद खो देते हैं।
उपद्रव क्यों?
इस कहानी का निर्माण इस बात के लिए किया गया था कि बिना किसी कारण के मूर्खतापूर्ण चीजों पर अक्सर फासिस्ट बने रहे। ईमानदारी से, जो इन मूर्खतापूर्ण जवाबी कार्रवाई की परवाह करता है? जवाब, निश्चित रूप से, यह है कि हर किसी को परवाह करनी चाहिए। वस्तुतः महत्वपूर्ण वैज्ञानिक क्षेत्र वर्तमान में एक गंभीर प्रतिकृति संकट से पीड़ित हैं , जो बताता है कि झूठी खोजों की आवृत्ति वैज्ञानिक साहित्य में अपेक्षा से बहुत अधिक है। इस संकट के ड्राइवरों में से एक, हालांकि किसी भी तरह से एकमात्र नहीं , पी-हैकिंग का उदय है , जो तब होता है जब शोधकर्ता किसी मॉडल के कई रूपों के साथ खेलते हैं, विभिन्न चर को नियंत्रित करते हैं, जब तक कि उन्हें महत्व नहीं मिलता।
पी-हैकिंग को लोकप्रिय वैज्ञानिक मीडिया और ब्लॉग जगत में बड़े पैमाने पर देखा गया है, लेकिन कुछ लोग वास्तव में समझते हैं कि पी-हैकिंग के बारे में क्या गलत है और क्यों। लोकप्रिय सांख्यिकीय राय के विपरीत, मॉडलिंग प्रक्रिया से पहले, दौरान और बाद में आपके डेटा को देखने में कुछ भी गलत नहीं है। क्या गलत है यह खोजपूर्ण विश्लेषणों की रिपोर्ट करने में विफल है और उन्होंने अध्ययन के पाठ्यक्रम को कैसे प्रभावित किया। केवल पूर्ण प्रक्रिया को देखकर ही हम संभवतः यह भी निर्धारित कर सकते हैं कि स्टोकेस्टिक मॉडल उस प्रक्रिया का प्रतिनिधि है और उस मॉडल के लिए कौन सा लगातार विश्लेषण उपयुक्त है, यदि कोई हो।
यह दावा करना कि एक निश्चित लगातार विश्लेषण उपयुक्त है एक बहुत ही गंभीर दावा है। यह दावा करने से तात्पर्य है कि आप अपने द्वारा चुनी गई स्टोकेस्टिक प्रक्रिया के अनुशासन के लिए खुद को बाध्य कर रहे हैं, जो विभिन्न स्थितियों में आपके द्वारा किए गए कार्यों के बारे में पूरी तरह से प्रतिक्रिया करता है। आपको वास्तव में उस प्रणाली के अनुरूप होना चाहिए जो आप पर लागू करने के लिए लगातार गारंटी के लिए है। बहुत कम शोधकर्ता, विशेष रूप से उन क्षेत्रों में जो खुले अंत की खोज पर जोर देते हैं, प्रणाली के अनुरूप होते हैं, और वे अपने विचलन की गहराई से रिपोर्ट नहीं करते हैं; यही कारण है कि अब हमारे हाथ पर प्रतिकृति संकट है। (कुछ सम्मानित शोधकर्ताओं ने तर्क दिया है कि यह अपेक्षा अवास्तविक है, ऐसी स्थिति जिससे मैं सहानुभूति रखता हूं, लेकिन यह इस पद के दायरे से परे है।)
यह अनुचित प्रतीत हो सकता है कि हम प्रकाशित पत्रों की आलोचना कर रहे हैं कि वे इस बारे में एक दावे के आधार पर कि उन्होंने क्या किया होगा डेटा अलग था। लेकिन यह (कुछ हद तक विरोधाभासी) प्रकृतिवादी तर्क की प्रकृति है: यदि आप पी-मूल्य की अवधारणा को स्वीकार करते हैं, तो आपको मॉडलिंग की वैधता का सम्मान करना होगा जो वैकल्पिक डेटा के तहत किया गया होगा। (जेलमैन और लोकेन, 2013)
ऐसे अध्ययनों में, जो अपेक्षाकृत सरल और / या मानकीकृत हैं, जैसे नैदानिक परीक्षण, हम कई या अनुक्रमिक तुलना जैसी चीजों के लिए समायोजित कर सकते हैं और सैद्धांतिक त्रुटि दर को बनाए रख सकते हैं; अधिक जटिल और खोजपूर्ण अध्ययनों में, एक लगातार मॉडल अनुचित हो सकता है क्योंकि शोधकर्ता सभी निर्णयों के बारे में पूरी तरह से सचेत नहीं हो सकता है , अकेले रिकॉर्डिंग करें और उन्हें स्पष्ट रूप से प्रस्तुत करें। ऐसे मामलों में, शोधकर्ता को (1) ईमानदार होना चाहिए और जो किया गया था उसके बारे में आगे बढ़ना चाहिए; (2) मजबूत पीट के साथ या तो पी-मान प्रस्तुत करें, या बिल्कुल नहीं; (3) साक्ष्य की अन्य पंक्तियों को प्रस्तुत करने पर विचार करें, जैसे कि परिकल्पना की पूर्व संभाव्यता या अनुवर्ती प्रतिकृति अध्ययन।