दो स्वतंत्र अनुपातों के एक शक्ति विश्लेषण में कोई कैसे एक रोक नियम विकसित कर सकता है?


18

मैं एक सॉफ्टवेयर डेवलपर हूं जो ए / बी टेस्टिंग सिस्टम पर काम कर रहा हूं। मेरे पास एक ठोस आँकड़े पृष्ठभूमि नहीं है, लेकिन पिछले कुछ महीनों में ज्ञान उठा रहा है।

एक विशिष्ट परीक्षण परिदृश्य में एक वेबसाइट पर दो URL की तुलना करना शामिल है। एक आगंतुक का दौरा LANDING_URLऔर उसके बाद बेतरतीब ढंग से या तो को भेजा जाता है URL_CONTROLया URL_EXPERIMENTAL। एक आगंतुक एक नमूना का गठन करता है, और एक जीत की स्थिति तब प्राप्त होती है जब आगंतुक उस साइट पर कुछ वांछित कार्रवाई करता है। यह रूपांतरण का गठन करता है और रूपांतरण दर रूपांतरण दर (आमतौर पर प्रतिशत के रूप में व्यक्त) है। किसी दिए गए URL के लिए एक विशिष्ट रूपांतरण दर 0.01% से 0.08% के दायरे में कुछ है। हम यह निर्धारित करने के लिए परीक्षण चलाते हैं कि पुराने URL के मुकाबले नए URL की तुलना कैसे की जाए। तो URL_EXPERIMENTALबेहतर प्रदर्शन करना दिखाया गया है URL_CONTROL, हम की जगह URL_CONTROLके साथURL_EXPERIMENTAL

हमने सरल परिकल्पना परीक्षण तकनीकों का उपयोग करके एक प्रणाली विकसित की है। मैंने एक और क्रॉसविलेक्टेड प्रश्न के उत्तर का उपयोग यहां किया इस प्रणाली को विकसित करने।

एक परीक्षण निम्नानुसार सेट किया गया है:

  • रूपांतरण दर अनुमान CRE_CONTROLसेURL_CONTROL ऐतिहासिक डेटा का उपयोग कर गणना की जाती है।
  • वांछित लक्ष्य रूपांतरण दर CRE_EXPERIMENTALकीURL_EXPERIMENTAL सेट है।
  • आमतौर पर 0.95 का महत्व स्तर होता है।
  • 0.8 की शक्ति का आमतौर पर उपयोग किया जाता है।

एक साथ, इन सभी मूल्यों का उपयोग वांछित नमूना आकार की गणना करने के लिए किया जाता है। मैं आर फ़ंक्शन का उपयोग कर रहा हूंpower.prop.test इस नमूने का आकार प्राप्त करने के लिए ।

सभी नमूनों को एकत्र किए जाने तक एक परीक्षण चलेगा। इस बिंदु पर, के लिए आत्मविश्वास अंतराल CR_CONTROLऔर CR_EXPERIMENTALगणना की जाती है। यदि वे ओवरलैप नहीं करते हैं, तो एक विजेता को 0.95 के महत्व स्तर और 0.8 की शक्ति के साथ घोषित किया जा सकता है।

हमारे परीक्षणों के उपयोगकर्ताओं को दो प्रमुख चिंताएं हैं, हालांकि:

1. यदि, परीक्षण के दौरान किसी बिंदु पर, एक स्पष्ट विजेता दिखाने के लिए पर्याप्त नमूने एकत्र किए जाते हैं, तो क्या परीक्षण को रोका नहीं जा सकता है?

2. यदि परीक्षण के अंत में कोई विजेता घोषित नहीं किया जाता है, तो क्या हम यह देखने के लिए परीक्षण चला सकते हैं कि क्या हम विजेता को खोजने के लिए पर्याप्त नमूने एकत्र कर सकते हैं?

यह ध्यान दिया जाना चाहिए कि वहाँ कई वाणिज्यिक उपकरण मौजूद हैं जो अपने उपयोगकर्ताओं को ठीक वही करने की अनुमति देते हैं जो हमारे अपने उपयोगकर्ता चाहते हैं। मैंने पढ़ा है कि उपर्युक्त के साथ बहुत सी गलतियाँ हैं, लेकिन मैं एक नियम को रोकने के विचार में आया हूं और अपने स्वयं के सिस्टम में इस तरह के नियम का उपयोग करने की संभावना तलाशना चाहता हूं।

यहाँ दो दृष्टिकोण हैं जिन पर हम विचार करना चाहेंगे:

1. उपयोग करना power.prop.test , वर्तमान मापा रूपांतरण दरों की तुलना नमूनों की वर्तमान संख्या से करें और देखें कि विजेता घोषित करने के लिए पर्याप्त नमूने एकत्र किए गए हैं या नहीं।

उदाहरण: हमारे सिस्टम में निम्नलिखित व्यवहार मौजूद है या नहीं यह देखने के लिए एक परीक्षण स्थापित किया गया है:

  • CRE_CONTROL: 0.1
  • CRE_EXPERIMENTAL: 0.1 * 1.3
  • इन मापदंडों के साथ, नमूना आकार N1774 है।

हालांकि, परीक्षण के रूप में और 325 नमूनों तक पहुँचता है, CRM_CONTROL(नियंत्रण के लिए मापा रूपांतरण दर) 0.08 है और CRM_EXPERIMENTAL0.15 है। power.prop.testइन रूपांतरण दरों पर चलाया जाता है और N325 पाया जाता है। वास्तव CRM_EXPERIMENTALमें विजेता घोषित करने के लिए आवश्यक नमूनों की संख्या ! इस बिंदु पर यह हमारी आशा है कि परीक्षण समाप्त हो सकता है। इसी तरह, यदि परीक्षण 1774 नमूनों तक पहुंचता है, लेकिन कोई विजेता नहीं पाया जाता है, लेकिन फिर यह 2122 नमूनों तक पहुंच जाता है, जो कि CRM_CONTROL0.1 और यह दिखाने के लिए पर्याप्त हैCRM_EXPERIMENTAL 0.128 है, एक परिणाम है जहां एक विजेता घोषित किया जा सकता है।

एक में संबंधित सवाल उन सलाह दी है कि इस तरह के एक परीक्षण की वजह से जल्दी उत्साहजनक कम नमूने होने बंद हो जाता है और यह भी की चपेट में किया जा रहा करने के लिए कम विश्वसनीय है आकलन पूर्वाग्रह और टाइप I और टाइप II त्रुटियों की एक बढ़ी संख्या के । क्या इस रोक नियम को काम करने का कोई तरीका है? यह हमारा पसंदीदा तरीका है क्योंकि इसका मतलब है हमारे लिए कम प्रोग्रामिंग समय। शायद यह रोक नियम कुछ प्रकार के संख्यात्मक स्कोर या स्कोर की पेशकश करके काम कर सकता है जो परीक्षण की विश्वसनीयता को मापता है इसे जल्दी रोका जाना चाहिए?

2. अनुक्रमिक विश्लेषण या SPRT का उपयोग करना ।

परीक्षण के इन तरीकों को उस स्थिति के लिए बिल्कुल तैयार किया गया है जो हम स्वयं में पाते हैं: हमारे उपयोगकर्ता कैसे परीक्षण शुरू कर सकते हैं और इसे इस तरह से समाप्त कर सकते हैं कि वे परीक्षण में अतिरिक्त समय बर्बाद नहीं करते हैं? या तो एक परीक्षण बहुत लंबा चल रहा है, या विभिन्न मापदंडों के साथ एक परीक्षण शुरू करने के लिए।

उपरोक्त दो विधियों में से, मैं एसपीआरटी का पक्ष लेता हूं क्योंकि गणित मेरे लिए पकड़ना थोड़ा आसान है और क्योंकि ऐसा लगता है कि यह प्रोग्राम करना आसान हो सकता है। हालाँकि, मुझे समझ नहीं आ रहा है कि इस संदर्भ में संभावना फ़ंक्शन का उपयोग कैसे करें । यदि कोई संभावना-अनुपात की गणना करने के लिए एक उदाहरण का निर्माण कर सकता है, तो संभावना-अनुपात का संचयी योग, और उदाहरण के माध्यम से एक स्थिति को दिखाता है जब कोई निगरानी जारी रखेगा, जब कोई अशक्त परिकल्पना और वैकल्पिक परिकल्पना को स्वीकार करेगा। अगर एसपीआरटी जाने का सही तरीका है तो हमें यह निर्धारित करने में मदद करेगा।


2
मैं आपके वूडू का सहारा नहीं लेने की सराहना करता हूं। जब आप एक उपकरण का उपयोग कर रहे होते हैं और आपको यह ठीक से समझ में नहीं आता कि यह क्या कर रहा है या यह कैसे काम करता है, तो आप उपकरण के परिणामों की व्याख्या करने के लिए योग्य नहीं हैं। जब कोई विश्लेषण व्यवसाय निर्णय लेता है, और आप परिणाम में समय और पैसा लगा रहे हैं, तो यह स्वामित्व दिखाता है यदि आप डेटा के स्रोत को समझने में समय लेते हैं। यह उस तरह की मेहनत है जो आपको "झुंड में" होने के बजाय अधिक अवसर देती है।
EngrStudent -

जवाबों:


7

यह एक दिलचस्प समस्या है और संबंधित तकनीकों में बहुत सारे अनुप्रयोग हैं। उन्हें अक्सर "अंतरिम निगरानी" रणनीतियों या "अनुक्रमिक प्रयोगात्मक डिजाइन" (विकिपीडिया लेख, जिसे आप से जोड़ा गया है, दुर्भाग्य से थोड़ा विरल है) कहा जाता है, लेकिन इस बारे में जाने के कई तरीके हैं। मुझे लगता है कि @ user27564 को यह कहने में गलती हो गई है कि ये विश्लेषण आवश्यक रूप से बेयसियन होना चाहिए - निश्चित रूप से अंतरिम निगरानी के लिए भी लगातार दृष्टिकोण हैं।

AsBsABP(A)=P(B)=0.558x such that 1F(x;100;0.5)<αF

इसी तरह के तर्क से आपको अन्य परीक्षणों के लिए "अनिवार्यता अंक" मिल सकते हैं:

  1. कुल नमूना आकार * तय हो गया है, और
  2. प्रत्येक अवलोकन नमूने के लिए एक बंधी हुई राशि का योगदान देता है।

यह शायद आपके लिए लागू करना आसान होगा - रुकने के मानदंड की गणना ऑफ़लाइन करें और फिर इसे अपनी साइट के कोड में प्लग करें - लेकिन आप अक्सर बेहतर कर सकते हैं यदि आप प्रयोग को समाप्त करने के लिए तैयार हैं न कि केवल तभी जब परिणाम अपरिहार्य हो। , लेकिन जब यह भी बदलने की संभावना नहीं है।

इसे स्टोकेस्टिक कर्टेलमेंट कहा जाता है । उदाहरण के लिए, मान लीजिए, ऊपर के उदाहरण में, कि हमने 57 देखा हैबी

कई अन्य दृष्टिकोण भी हैं। समूह अनुक्रमिक विधियों को उन स्थितियों के लिए डिज़ाइन किया गया है जहां आप एक निश्चित संख्या में विषयों और विषयों को परिवर्तनीय दरों पर प्राप्त करने में सक्षम नहीं हो सकते हैं। आपकी साइट के ट्रैफ़िक के आधार पर, आप इस पर गौर करना चाहते हैं या नहीं कर सकते हैं।

सीआरएएन के आसपास उचित संख्या में आर पैकेज तैर रहे हैं, यदि आप अपने विश्लेषण के लिए इसका उपयोग कर रहे हैं। शुरू करने के लिए एक अच्छी जगह वास्तव में क्लिनिकल ट्रायल्स टास्क व्यू हो सकती है , क्योंकि इस क्षेत्र से बहुत सारे काम निकले थे।


[*] बस कुछ अनुकूल सलाह: डेटा बिंदुओं की बहुत बड़ी संख्या से गणना के महत्व को देखते समय सावधान रहें। आप अधिक से अधिक डेटा एकत्र रूप में, आप होगा अंत में एक महत्वपूर्ण परिणाम मिल जाए, लेकिन प्रभाव तुच्छता से छोटे हो सकता है। उदाहरण के लिए, यदि आपने पूरे ग्रह से पूछा कि क्या वे A या B को पसंद करते हैं, तो यह बहुत कम संभावना है कि आप एक सटीक 50:50 का विभाजन देखेंगे, लेकिन यदि विभाजन 50.001: 49.999 है, तो शायद यह आपके उत्पाद को वापस लेने के लायक नहीं है। प्रभाव के आकार (यानी, रूपांतरण दरों में अंतर) की भी जाँच करते रहें!


1
अपने उपयोगकर्ताओं की चिंताओं को स्पष्ट रूप से संबोधित करने के लिए: हां, आप निश्चित रूप से विश्लेषण को जल्दी समाप्त कर सकते हैं। यह नैदानिक ​​परीक्षणों के लिए हर समय होता है - दवा या तो इतनी सफल सफलता है कि उनके पास इसकी प्रभावकारिता के लिए पर्याप्त डेटा है और इसे नियंत्रण समूह में फंसे लोगों को देना चाहते हैं (या, अधिक संभावना है, दवा बहुत बड़ी है बस्ट / चीजों को बदतर बनाना)। हालाँकि, प्रयोग का विस्तार अधिक विवादास्पद है - कई "दिखता है" के लिए सही करने के तरीके हैं, लेकिन आप पहले से अधिकतम एन को ठीक करना बेहतर होगा - आप हमेशा जल्दी रोक सकते हैं!
मैट क्रुज

2
इसके लिए धन्यवाद, मैं पूरी तरह से रोक के साथ सहमत हूं अगर प्रयोग अपरिहार्य है, तो यह वास्तव में समझ में आता है! उस 'रोक के साथ अगर इसकी वास्तव में संभावना नहीं है' तो मुझे संदेह होगा कि एक वास्तविक लगातार सहमत होगा। यह कुछ भी कम नहीं है तो कह रही है: अरे, 95%? मैं कहूँगा 93% भी अच्छा है! मेरा मतलब है कि 90% आत्मविश्वास से संतुष्ट होना भी अच्छा होगा, लेकिन डेटा को देखने से पहले एक निरंतरवादी के रूप में!
सेबस्टियनन्यूबाउर

1
मैं एक कट्टरपंथी-निरंतरवादी नहीं हूं, न ही मैं टीवी पर एक खेलता हूं, लेकिन मुझे लगता है कि आप अभी भी एक प्रारंभिक रोक नियम की एक उचित निरंतरवादी व्याख्या कर सकते हैं - अगर मैंने इस प्रयोग को 100 बार चलाया, तो मुझे कितनी बार मिलेगा? अलग जवाब अगर मैं अब बंद कर दिया तो बनाम अगर मैं पूरा करने के लिए भाग गया? मैंने जो समीक्षा की है, वह बताती है कि यह उन अच्छे मामलों में से एक है, जहाँ एक ही समय में बेयसियन और फ़्रीक्वेंटर्स को संतुष्ट करना संभव है ...
मैट क्रूस

लेकिन क्या यह सच नहीं है कि यह तरीका आसानी से समय पर प्रयोग को समाप्त करने के jkndrkn के लक्ष्यों को काउंटर चला सकता है? ऐसे मामलों की एक उचित संख्या नहीं है जहां अगर आप वास्तव में (समायोजित) पी के तहत पाने की कोशिश कर रहे हैंαयदि आप डेटा संग्रह के बाद नियोजित n पर परीक्षण का आयोजन किया है, तो आप से अधिक डेटा एकत्र करने के लिए समाप्त हो जाएगा?
23

1
@ रसेलस पियर: मुझे लगता है कि यह निर्भर करता है। जाहिर है, वक्रता नहीं होगी, लेकिन कुछ अन्य तरीके हैं। उदाहरण के लिए, ओ'ब्रे और फ्लेमिंग परीक्षण, अधिक डेटा का उपयोग कर सकते हैं, लेकिन पहले भी अस्वीकार कर सकते हैं, और पोकॉक के परीक्षण को और भी अधिक। यह स्पष्ट रूप से बारीकियों पर निर्भर करता है: ऊपर दी गई पुस्तक में कुछ उचित मूल्यों (प्रभाव आकार: 0.25, अल्फा = 0.05, शक्ति = 0.9, 5 दिखता है) के साथ एक उदाहरण है। निश्चित एन संस्करण को अस्वीकार करने के लिए 170 विषयों की आवश्यकता है; OBF संस्करण को अधिकतम 180 की आवश्यकता होती है, और Pocock को अधिकतम 205 की आवश्यकता होती है, लेकिन विषयों की अपेक्षित संख्या क्रमशः 130 और 117 है।
मैट क्रूस

1

आप जल्दी रोक सकते हैं, लेकिन यदि आप करते हैं, तो आपके पी-मूल्यों की आसानी से व्याख्या नहीं की जाती है। यदि आप अपने पी-मूल्य की व्याख्या के बारे में परवाह नहीं करते हैं, तो जिस तरह से आपके पहले दो सवालों के जवाब 'नहीं' हैं (बहुत ज्यादा) कोई फर्क नहीं पड़ता। आपका मुवक्किल व्यावहारिक लगता है, इसलिए पी-वैल्यू की सही व्याख्या संभवत: आपके लिए ध्यान रखने योग्य बात नहीं है।

मैं दूसरे दृष्टिकोण से बात नहीं कर सकता जिसे आप प्रस्तावित करते हैं।

हालांकि, पहला दृष्टिकोण ठोस जमीन पर नहीं है। द्विपद वितरण के सामान्य सन्निकटन उन अनुपातों के लिए मान्य नहीं होते हैं, जो निम्न (जो कि पॉवर पॉवर.प्रॉप.टेस्ट का उपयोग करता है, कोहेन द्वारा अपनी पॉवर बुक में प्रयोग की गई विधि भी है)। इसके अलावा, जहां तक ​​मैं जानता हूं, दो-नमूना अनुपात परीक्षणों के लिए कोई बंद प्रपत्र शक्ति विश्लेषण समाधान नहीं है (सीएफ। कोई सामान्य सन्निकटन का उपयोग किए बिना दो-समूह द्विपद शक्ति विश्लेषण कैसे कर सकता है? )। हालांकि अनुपात के विश्वास अंतराल (cf. पैकेज बिनोम) के अनुमान लगाने के बेहतर तरीके हैं)। आप आंशिक समाधान के रूप में गैर-ओवरलैपिंग विश्वास अंतराल का उपयोग कर सकते हैं ... लेकिन यह पी-मूल्य का अनुमान लगाने के समान नहीं है और इस प्रकार सीधे बिजली का मार्ग प्रदान नहीं करता है। मुझे उम्मीद है कि किसी के पास एक अच्छा बंद फॉर्म समाधान होगा जो वे हम में से बाकी लोगों के साथ साझा करेंगे। यदि मैं एक पर ठोकर खाता हूं, तो मैं उपरोक्त संदर्भित प्रश्न को अपडेट करूंगा। सौभाग्य।

संपादित करें: जबकि मैं इसके बारे में सोच रहा हूं, मुझे एक पल के लिए यहां पूरी तरह से व्यावहारिक होने दें। आपके ग्राहक चाहते हैं कि यह प्रयोग तब समाप्त हो जब वे निश्चित हों कि प्रायोगिक साइट नियंत्रण स्थल से बेहतर काम कर रही है। आपके द्वारा एक अच्छा नमूना प्राप्त करने के बाद, यदि आप निर्णय लेने के लिए तैयार नहीं हैं, तो बस अपने यादृच्छिक असाइनमेंट के अनुपात को जो भी 'जीत' हो, समायोजित करना शुरू करें। यदि यह सिर्फ एक कोड़ा था, तो इस दिशा में प्रतिगमन घट जाएगा, आप कम निश्चित हो जाएंगे और अनुपात को कम कर देंगे। जब आप उचित रूप से निश्चित हों, तो इसे कॉल करें और विजेता घोषित करें। इष्टतम दृष्टिकोण शायद बायेसियन अपडेट को शामिल करेगा, लेकिन मैं आपको निर्देशित करने के लिए मेरे सिर के ऊपर से उस विषय के बारे में पर्याप्त नहीं जानता। हालाँकि, मैं आपको आश्वस्त कर सकता हूं कि जब यह कई बार सहज ज्ञान युक्त लग सकता है, तो गणित ही वह सब कठिन नहीं है।


0

आपके पास विशिष्ट प्रश्न सांख्यिकीय परीक्षणों में उभरते हैं। वहाँ आँकड़े के दो 'जायके' हैं, लगातार और संगीन। आपके दोनों सवालों का लगातार जवाब इसका आसान है:

  • नहीं
  • नहीं, आप जल्दी नहीं रोक सकते
  • नहीं, आप अभी और नहीं माप सकते

एक बार जब आप अपने सेटअप को परिभाषित करते हैं, तो आपको डेटा (अंधा विश्लेषण) को देखने की भी अनुमति नहीं है। बार-बार के दृष्टिकोण से, कोई रास्ता नहीं है, कोई धोखा नहीं, कोई चाल नहीं! (EDIT: बेशक, ऐसा करने के प्रयास हैं, और यदि वे सही तरीके से उपयोग किए जाते हैं, तो वे भी काम करेंगे, लेकिन उनमें से अधिकांश को पक्षपात का परिचय देने के लिए जाना जाता है।)

लेकिन वहाँ देखने का बिंदु है, जो काफी अलग है। Bayesian दृष्टिकोण आवृत्तियों के विपरीत एक अतिरिक्त इनपुट, एक प्राथमिकता- प्रायिकता वितरण की आवश्यकता है। इसे हम पूर्व ज्ञान या पूर्वाग्रह भी कह सकते हैं। इसके होने के बाद, हम अपने ज्ञान को अद्यतन करने के लिए डेटा / माप का उपयोग कर सकते हैं। बिंदु यह है कि हम डेटा का उपयोग कर सकते हैं और इससे भी अधिक, हम माप के प्रत्येक मध्यवर्ती बिंदु पर डेटा का उपयोग कर सकते हैं। प्रत्येक अद्यतन में, अंतिम पोस्टीरियर हमारा नया पूर्व है और हम इसे अपने अप-टू-डेट ज्ञान के लिए एक नए माप के साथ अपडेट कर सकते हैं। कोई जल्दी रोक समस्या नहीं है!

मुझे आपके जैसी समस्याओं के बारे में चर्चा करने वाली एक बात मिली और मैंने ऊपर वर्णित किया: http://biostat.mc.vanderbilt.edu/wiki/pub/Main/JoAnnAlvarez/BayesianAdvivePres.pdf

लेकिन इसके बगल में, क्या आपको वाकई यकीन है कि आपको इसकी आवश्यकता है? ऐसा लगता है कि आपके पास अनुरोध को लिंक करने के लिए कुछ सिस्टम चल रहा है। इसके लिए आपको यह प्रमाणित करने की आवश्यकता नहीं है कि एक परिकल्पना परीक्षण के साथ आपके निर्णय एक सांख्यिकीय अर्थ में सही हैं। क्या आपने कभी कोक खरीदा है, क्योंकि आप 95% की संभावना के साथ उस पेप्सी को 'अभी' बाहर कर सकते हैं? यह एक को लेने के लिए पर्याप्त है जो सिर्फ बेहतर है, एक परिकल्पना को छोड़कर नहीं। यह एक तुच्छ एल्गोरिथ्म होगा: दर ए की अनिश्चितता की गणना करें, बी की अनिश्चितता की गणना करें। दोनों दरों के अंतर को लें और इसे अंतर की अनिश्चितता से विभाजित करें। परिणाम कुछ ऐसा है जैसे सिग्मा में अंतर का महत्व। फिर बस उन सभी लिंक को लें जहां दो या तीन से अधिक सिग्मा अंतर है। दोष यह है,


1
मुझे लगता है कि आपके पहले चार पैराग्राफ एक लाल हेरिंग के एक बिट हैं - अंतरिम निगरानी के लिए लगातार दृष्टिकोण हैं। यह सच है कि (बायेसियन) बाद में अद्यतन करने के लिए खुद को अच्छी तरह से उधार देता है, लेकिन आप इस समस्या को कई अलग-अलग तरीकों से फ्रेम कर सकते हैं। स्लाइड के लिए सूचक के लिए धन्यवाद!
मैट क्रुज

+1 वैसे भी - बायेसियन दृष्टिकोण शायद स्पष्ट रूप से किसी भी निरंतरता की तुलना में यहां अध्यक्षता में है।
रसैलपिएरेस

2
एह, यह वहाँ है ... मेम ... बायेसियन तरीकों से किसी भी जटिलताओं के बिना डेटा पर एक झांकना है। हालाँकि, समग्र प्रकार I त्रुटि दर वास्तव में नियंत्रित नहीं है (यह क्यों होगा?) और यह बहुत अधिक लगने के बाद मनमाने ढंग से बड़ी हो सकती है। " आप इसे एक उपयुक्त पूर्व के साथ बदल सकते हैं, या आप तर्क दे सकते हैं कि टाइप I त्रुटि को नियंत्रित करना लंगड़ा है, लेकिन ऐसा नहीं है कि सभी बायेसियन तकनीक एक रामबाण हैं।
मैट क्रूस

0

शायद कुछ तरीकों का इस्तेमाल किया जा सकता है जैसे

  • पोकॉक
  • ओ'ब्रायन और फ्लेमिंग
  • पीटो

यह परिणामों के आधार पर P कटऑफ को समायोजित करेगा और डेटा एकत्र करने और संसाधनों और समय को कम करने में मदद करेगा।

शायद अन्य कार्यों को यहां जोड़ा जा सकता है।


क्या आप अपने बुलेट पॉइंट्स के लिए लिंक या अधिक जानकारी प्रदान कर सकते हैं?
एंटोनी

मेरे पास वह सटीक लेख नहीं है क्योंकि मैंने एक समीक्षा लेख का उपयोग किया है जो इनका हवाला दे रहा है, मेरा मतलब है कि दृष्टिकोण अलग हैं, लेकिन मैं आपको सलाह दे सकता हूं कि आप चिकित्सा क्षेत्र में प्रश्न का प्रबंधन करें: नैदानिक ​​परीक्षणों में अनुकूली नमूना आकार संशोधन: छोटे से शुरू करें अधिक की मांग करें? क्रिस्टोफर जेनिसन * † और ब्रूस डब्ल्यू। टर्नबुल
हैप्पीमैन
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.