जब प्रारंभिक अवस्था में नैदानिक ​​परीक्षण समाप्त हो जाता है तो पूर्वाग्रह क्यों प्रभावित होता है?


24

एक अंतरिम विश्लेषण एक या अधिक समय बिंदुओं पर डेटा का विश्लेषण है, जो कि अध्ययन के आधिकारिक करीबी अंक से पहले है, उदाहरण के लिए, संभवतः अध्ययन को जल्दी समाप्त करना।

Piantadosi के अनुसार, एस। ( क्लिनिकल परीक्षण - एक तरीका ): " एक उपचार प्रभाव का अनुमान तब पक्षपाती होगा जब एक प्रारंभिक अवस्था में परीक्षण समाप्त हो जाता है। पहले का निर्णय, जितना बड़ा पूर्वाग्रह। "

क्या आप मुझे यह दावा समझा सकते हैं। मैं आसानी से समझ सकता हूं कि सटीकता प्रभावित होने वाली है, लेकिन पूर्वाग्रह के बारे में दावा मेरे लिए स्पष्ट नहीं है ...


मुझे लगता है यह "बाहर मांस" बायेसियन और frequentist कार्यप्रणाली के बीच मतभेद के लिए एक सही सवाल यह है कि
probabilityislogic

जवाबों:


13

सबसे पहले, आपको संदर्भ को नोट करना होगा: यह केवल तब लागू होता है जब परीक्षण को प्रभावकारिता / निरर्थकता को दर्शाने वाली अंतरिम निगरानी के कारण जल्दी रोक दिया गया था, न कि कुछ यादृच्छिक बाहरी कारणों से। उस स्थिति में प्रभाव आकार का अनुमान पूरी तरह से सांख्यिकीय अर्थ में पक्षपाती होगा। यदि आप प्रभावकारिता के लिए रुक गए हैं, तो अनुमानित प्रभाव बहुत अधिक होगा (यह सकारात्मक है), यदि आप व्यर्थता के लिए रुक गए हैं, तो यह बहुत कम होगा।

Piantodosi एक सहज व्याख्या भी देता है (मेरे संस्करण में Sec 10.5.4)। मान लीजिए कि दो साधनों में वास्तविक अंतर 1 इकाई है। जब आप बहुत सारे परीक्षण चलाते हैं, और अपने अंतरिम विश्लेषण समय पर उन्हें देखते हैं, तो उनमें से कुछ ने 1 से ऊपर प्रभाव आकार देखा होगा, कुछ एक के नीचे, और अधिकांश 1 के आसपास - वितरण व्यापक होगा, लेकिन सममित होगा। इस बिंदु पर अनुमानित प्रभाव का आकार बहुत सटीक नहीं होगा, लेकिन निष्पक्ष होगा। हालांकि आप केवल एक प्रभाव आकार को रोकते हैं और रिपोर्ट करते हैं यदि अंतर महत्वपूर्ण है (कई परीक्षण के लिए समायोजित), तो यह अनुमान उच्च पक्ष पर है। अन्य सभी मामलों में आप चलते रहते हैं और एक अनुमान की रिपोर्ट नहीं करते हैं। इसका मतलब है कि जल्दी बंद होने पर सशर्तप्रभाव आकार का वितरण सममित नहीं है, और इसका अनुमानित मूल्य अनुमान के वास्तविक मूल्य से ऊपर है।

यह तथ्य कि यह प्रभाव अधिक गंभीर है, परीक्षण को रोकने के लिए बड़ी बाधा से आता है, इस प्रकार वितरण का एक बड़ा हिस्सा कंडीशनिंग के दौरान फेंक दिया जाता है।


1
पहले तो मैंने भी यही सोचा था, लेकिन जब मैं इसे साबित करने के लिए बैठ गया, तो मैं नहीं कर सका: मैं केवल यह दिखा सकता था कि परिणामी अनुमान वास्तव में असंतुलित है। (नई अंतर्ज्ञान: एक सशर्त रोक से सकारात्मक पूर्वाग्रह प्रयोग को पूरा करने से एक नकारात्मक पूर्वाग्रह को संतुलित करता है ।) तो: क्या आप अधिक कठोर प्रदर्शन प्रस्तुत कर सकते हैं?
whuber

@whuber मैं इसे लिखने अप करने की कोशिश करेंगे, लेकिन मुद्दा यह है कि Piantodosi के बयान केवल क्या होता है जब आप के बारे में है करना बंद जल्दी। इसे संतुलित करने के लिए पूरा नहीं किया गया है।
ऐको

2
@whuber हां, यही मूल कथन भी दावा करता है। आपका कहना है कि अध्ययन पूरा करने पर एक विपरीत पूर्वाग्रह स्थिति भी मान्य होगी। संपूर्ण संदेश यह होना चाहिए कि एक बार जब आप अंतरिम निगरानी करना शुरू करते हैं, तो प्रभाव आकार का अनुमान लगाने की आपकी क्षमता के लिए अजीब चीजें होने लगती हैं।
ऐको

3
@ ऐनिको पूर्वाग्रह के लिए समायोजित किया जाना चाहिए जब प्रारंभिक समाप्ति होती है। इसलिए हम एक मानक अनुमानक के अनुभवहीन उपयोग पर चर्चा कर रहे हैं, जो कि निर्धारित आकार के यादृच्छिक नमूनों के लिए, सशर्त रूप से समाप्त प्रयोगों में है, जहां ऐसे अनुमानकों के पास अपने वांछित गुण नहीं हैं। (+1, वैसे।)
whuber

2
@whuber ज़रूर, आप इस पूर्वाग्रह के लिए समायोजित कर सकते हैं, लेकिन पहले आपको यह पहचानना होगा कि यह मौजूद है। और फिर आपको अन्वेषक को बेचना होगा कि भले ही स्पष्ट रूप से 10 में से 5 रोगियों ने प्रतिक्रिया दी हो, पूर्वाग्रह को रोकने के बाद प्रतिक्रिया की अनुमानित दर 40% (संख्या से बनी) है।
ऐको

3

यहाँ इस बात का चित्रण है कि पूर्वाग्रह कैसे निष्कर्ष में उत्पन्न हो सकते हैं, और यह पूरी कहानी क्यों नहीं हो सकती है। मान लीजिए कि आपके पास एक दवा का अनुक्रमिक परीक्षण है जो सकारात्मक (+1) प्रभाव पड़ता है लेकिन नकारात्मक प्रभाव (-1) हो सकता है। एक के बाद एक पांच गिनी सूअरों का परीक्षण किया जाता है। किसी एकल मामले में एक सकारात्मक परिणाम की अज्ञात संभावना वास्तव में और एक नकारात्मक परिणाम13414

इसलिए पाँच परीक्षणों के बाद विभिन्न परिणामों की संभावनाएँ हैं

 Outcome     Probability
+5-0 = +5    243/1024
+4-1 = +3    405/1024
+3-2 = +1    270/1024
+2-3 = -1     90/1024
+1-4 = -3     15/1024
+0-5 = -5      1/1024

तो कुल मिलाकर सकारात्मक परिणाम की संभावना 918/1024 = 0.896 है, और औसत परिणाम +2.5 है। 5 परीक्षणों से विभाजित, यह प्रति परीक्षण +0.5 परिणाम का औसत है।

यह निष्पक्ष आंकड़ा है, क्योंकि यह भी +1×34-1×14

मान लीजिए कि गिनी सूअरों की रक्षा करने के लिए, अध्ययन को समाप्त कर दिया जाएगा यदि किसी भी स्तर पर संचयी परिणाम नकारात्मक है। तब संभावनाएं बन जाती हैं

 Outcome     Probability
+5-0 = +5    243/1024
+4-1 = +3    324/1024
+3-2 = +1    135/1024
+2-3 = -1     18/1024
+1-2 = -1     48/1024
+0-1 = -1    256/1024

तो कुल मिलाकर सकारात्मक परिणाम की संभावना 702/1024 = 0.6855 है, और औसत परिणाम +1.953 है। यदि हमने पिछली गणना में प्रति परीक्षण के परिणाम का औसत मूल्य देखा, अर्थात + 5 का उपयोग किया ,+3+55 ,+1+35 ,-1+15 ,-1-15 और-1-13 तो हमें +0.184 मिलेगा।-11

ये वे संवेदनाएँ हैं जिनमें दूसरी योजना के आरंभ में रुककर पूर्वाग्रह होता है, और पूर्वाग्रह पूर्वानुमानित दिशा में होता है। लेकिन यह पूरी कहानी नहीं है।

व्हुबेर और प्रोबेबिलिसोलॉजिक को लगता है कि जल्दी रोकना निष्पक्ष परिणामों का उत्पादन करना चाहिए? हमें पता है कि दूसरी योजना में परीक्षणों का अपेक्षित परिणाम +1.953 है। परीक्षणों की अपेक्षित संख्या 3.906 निकली। इसलिए एक-दूसरे को विभाजित करके हम +0.5 प्राप्त करते हैं, ठीक उसी तरह जैसे पहले और जिसे निष्पक्ष बताया गया था।


आप "पूर्व-डेटा" दुनिया का परिप्रेक्ष्य ले रहे हैं। आप जो कहते हैं वह सच है, कि रोक नियम मायने रखता है लेकिन इससे पहले कि आप डेटा पर विचार करें । ऐसा इसलिए है क्योंकि रोक नियम डेटा के बारे में जानकारी प्रदान करता है, लेकिन सही संभावनाओं के बारे में नहीं। एक बार डेटा में है, तो रोक नियम अब मायने नहीं रखता। ध्यान दें कि वास्तविक संभावनाएं वास्तविक प्रयोग में अज्ञात हैं। तो आपको उन परिस्थितियों पर भी विचार करने की आवश्यकता है जब संभावनाएं हैं, औरपी(-)=3P(+)=14 , साथ ही किसी भी अन्य संभावित संयोजन। P()=34
संभाव्यताविषयक

इसलिए मैं यह कहते हुए के रूप में अपने उदाहरण लेते कि । यह निश्चित रूप से सच है! मेरा उत्तर भी D पर स्थितियां हैं । ऐसा इसलिए है, क्योंकि यदि आप मुझे रोक नियम बताते हैं, लेकिन यह नहीं कि आपने वास्तव में रोक दिया है, तो मैं इसे डेटा सेट से समझ सकता हूं जो वास्तव में है। वास्तव में, मैं यह पता लगा सकता हूं कि क्या कोई रोक नियम वास्तव में बंद हो गया होगा, एक बार मुझे डेटा पता है। पी(एच|एस,मैं)पी(एच|मैं)डी
probabilityislogic

1

खैर, इस पर मेरी जानकारी Harveian भाषण से 2008 में आता है http://bookshop.rcplondon.ac.uk/details.aspx?e=262 अनिवार्य रूप से, मेरी याद करने का सबसे अच्छा परिणाम 1 के रूप में पक्षपातपूर्ण हो जाएगा करने के लिए) जल्दी रोक आमतौर पर इसका मतलब है कि या तो उपचार एक आशा से अधिक या कम प्रभावी था, और यदि यह सकारात्मक है, तो आप मौके पर पूंजीकरण कर सकते हैं। मेरा मानना ​​है कि पी मूल्यों की गणना नियोजित नमूना आकार के आधार पर की जाती है (लेकिन मैं इस पर गलत हो सकता है), और यह भी कि अगर आप लगातार अपने परिणामों की जांच कर रहे हैं कि क्या कोई प्रभाव दिखाया गया है, तो आपको कई तुलनाओं के लिए सही करने की आवश्यकता है बीमा करने के लिए कि आप केवल एक मौका प्रभाव नहीं पा रहे हैं। उदाहरण के लिए, यदि आप .05 से नीचे के मानों के लिए 20 बार जांच करते हैं, तो सांख्यिकीय रूप से, आप एक महत्वपूर्ण परिणाम प्राप्त करने के लिए लगभग निश्चित हैं।


भाग 1 सबसे पहले, आपके उत्तर के लिए धन्यवाद। वास्तव में, लगातार परीक्षण के लिए अक्सर सही तरीके होते हैं। इसलिए, पक्षपाती उपचार प्रभाव अनुमान की समस्या वहाँ से नहीं आ सकती है। एक अंतरिम विश्लेषण में, परीक्षण वर्तमान जानकारी पर आधारित है, वर्तमान नमूना आकार का उपयोग करते हुए, समग्र नियोजित नमूना आकार का नहीं। तो समस्या वहां से भी नहीं आती है।
ओकराम

PART2 मैं मानता हूं कि जल्दी रुकने का मतलब यह हो सकता है कि उपचार "एक से अधिक प्रभावी है"। उस अर्थ में, अनुमान उपचार प्रभाव अपेक्षा से बड़ा होगा। लेकिन, मेरे अनुसार, यह इसे पक्षपाती नहीं बनाता है ... इसके बजाय, मेरे अनुसार, कुछ अर्थों में, "हमारी आशा पक्षपाती थी"।
ओकराम

1

मैं उस दावे से असहमत होऊंगा, जब तक कि "पूर्वाग्रह" द्वारा पाइंटाडोसि का अर्थ उस सटीकता का हिस्सा नहीं है जिसे आमतौर पर पूर्वाग्रह कहा जाता है। यह अनुमान "पक्षपाती" नहीं होगा क्योंकि आपने प्रति से रुकना चुना था: यह "पक्षपाती" होगा क्योंकि आपके पास कम डेटा है। तथाकथित "संभावना सिद्धांत" में कहा गया है कि निष्कर्ष केवल उस डेटा पर निर्भर होना चाहिए जो अवलोकन किया गया था, और उस डेटा पर नहीं जिसे देखा जा सकता था, लेकिन नहीं था। एलपी कहते हैं

P(एच|डी,एस,मैं)=पी(एच|डी,मैं)

एचडीएसमैंडीमैंएस=जी(डी,मैं)=एस=जी(डी,मैं)डीमैंडी,एस,मैं=डी,जी(डी,मैं),मैं=डी,मैंडीमैं यह मायने रखता है।


@probabilityislogic: धन्यवाद! यदि मैं इसे अच्छी तरह से समझता हूं, तो "पूर्वाग्रह" को एक सांख्यिकीय अर्थ में नहीं लिया जाना चाहिए। मुझे लगता है कि यह समझ में आता है क्योंकि पिएंटडोसि एक अनुमान के "पूर्वाग्रह" के बारे में बोलता है और एक अनुमानक के नहीं ...
ocram

(μ-μ^)2=vआर(μ^)+बीमैंरों(μ^)μμ^"अनुमानक" है। यदि दूसरा शब्द (पूर्वाग्रह) नमूना आकार पर निर्भर करता है, तो आप उम्मीद करेंगे कि जल्दी बंद होने से पूर्वाग्रह बढ़ जाएगा, क्योंकि यह नमूना आकार में कमी आई है, यदि प्रयोग जारी रहा। लेकिन आप जो कहते हैं, उससे लगता है कि "बायस" की व्याख्या पिएंटडोसिटी के दृष्टिकोण से "त्रुटि" के रूप में की जानी चाहिए।
probabilityislogic

1
यह तर्क पूर्वाग्रह के बारे में कुछ नहीं कहता है, समस्या की केवल परिकल्पना परीक्षण पहलू है, जो कोई सवाल नहीं करता है।
ऐको

@Prob में मुझे @Aniko से सहमत होना है: यह स्पष्ट है कि जब अशक्त सही है, तो प्रारंभिक समाप्ति की सकारात्मक संभावना है, जिस स्थिति में प्रभाव का अनुमान नॉनज़रो होगा। इस प्रकार अनुमानित प्रभाव की उम्मीद, प्रारंभिक समाप्ति पर सशर्त , सकारात्मक है, जबकि बिना शर्त उम्मीद शून्य है। (ध्यान दें कि ओपी संबोधित कर रहा है अनुमान , नहीं परिकल्पना परीक्षण।)
whuber

एचμ(,+)एसडीमैंएसएसएसडीमैंμ
probabilityislogic

0

वहाँ होगा पूर्वाग्रह हो ( "सांख्यिकीय भावना" में) अगर पढ़ाई की समाप्ति यादृच्छिक नहीं है।

निष्कर्ष के लिए चलाए गए प्रयोगों के एक सेट में, "प्रारंभिक परिणाम" (ए) के कुछ प्रयोग जो अंततः "कोई प्रभाव नहीं" पाते हैं, कुछ प्रभाव दिखाएंगे (मौका के परिणामस्वरूप) और (बी) कुछ प्रयोग जो अंततः ढूंढते हैं प्रभाव "कोई प्रभाव नहीं" दिखाएगा (संभवतः शक्ति की कमी के परिणामस्वरूप)। जिस दुनिया में आप परीक्षण समाप्त करते हैं, यदि आप (a) अधिक बार (b) रोकते हैं, तो आप प्रभाव खोजने के पक्ष में पूर्वाग्रह के साथ अध्ययन समाप्त कर देंगे। (समान तर्क प्रभाव आकारों के लिए लागू होता है ; अध्ययनों को समाप्त करना जो "अपेक्षा से अधिक बड़ा" दिखाते हैं, जो "उम्मीद के मुताबिक या कम" दिखाते हैं, उन लोगों की तुलना में अधिक प्रभावी होता है "बड़े प्रभाव" के निष्कर्षों की गिनती बढ़ जाएगी।

यदि वास्तव में चिकित्सा परीक्षणों को समाप्त कर दिया जाता है, जब शुरुआती परिणाम सकारात्मक प्रभाव दिखाते हैं - प्लेसबो या अन्य में विषयों को उपचार उपलब्ध कराने के लिए - लेकिन नहीं जब शुरुआती परिणाम अनिर्णायक होते हैं, तो इस तरह के परीक्षण में अधिक टाइप 1 त्रुटि होगी वहाँ होगा अगर सभी प्रयोगों को समाप्त करने के लिए चलाए गए थे। लेकिन इसका मतलब यह नहीं है कि अभ्यास गलत है; नैतिक रूप से बोलने में टाइप 1 त्रुटि की लागत, उपचार से इनकार करने की तुलना में कम हो सकती है क्योंकि उपचार के लिए जल्दी से होगा जो वास्तव में पूर्ण परीक्षण के अंत में काम करने के लिए दिखाया जाएगा।


कृपया Aniko के जवाब के लिए मेरी टिप्पणी देखें, क्योंकि मैं आपसे एक ही सवाल पूछूंगा: क्या आप अधिक कठोर प्रदर्शन प्रदान कर सकते हैं?
whuber

मैं Aniko के लिए स्थगित - वह एक बेहतर काम करता है की तुलना में मैं कर सकता था। लेकिन अगर आप इस बात से सहमत हैं कि "डेस्क ड्रावर इफेक्ट" का परिणाम पूर्वाग्रह में है, तो यहां तर्क समान है। परिकल्पना के डेटा सपोर्टिव के पक्ष में पूर्वाग्रह है - पूर्व मामले में बी / सी में नहीं-सहायक डेटा की सूचना नहीं है, बाद के बी / सी में कुछ समर्थित डेटा का कुछ अंश आवश्यक रूप से एकत्र नहीं किया जा रहा है: परीक्षण समाप्त करना जब परिणाम अच्छे दिखते हैं, तो "खराब परिणाम" वितरण के उस भाग को बाहर निकाल दिया जाता है, जो परीक्षणों से आबाद होता है जो उनके बुरे परिणामों को देर से उत्पन्न करेगा । शायद इस पूर्वाग्रह को समायोजित किया जा सकता है - लेकिन समायोजन की आवश्यकता में पूर्वाग्रह है।
dmk38

@ मैं केवल आप दोनों को @Probability के साथ बहस करने की कोशिश कर रहा हूं, जिसके साथ आप असहमत हैं; असहमत;;
whuber

1
पी(डी|एच,एस,मैं)

1
@probability यह देखने का एक तरीका है। एक और परिकल्पना को पूरी तरह से चकमा देना है और वास्तव में पूछे जा रहे प्रश्न को संबोधित करना है; बुद्धि के लिए, उपचार प्रभाव का आकार क्या है ? एक बार जब निर्णय लेने का समर्थन करने के लिए पर्याप्त सटीकता के साथ अनुमान लगाया जाता है, तो इस दृष्टिकोण से समाप्ति हो सकती है। उदाहरण के लिए, हम उच्च विश्वास रखना चाहते हैं कि उपचार को निर्धारित करने से स्वास्थ्य में लाभ उपचार की लागत (और दुष्प्रभाव) से अधिक होने की संभावना है।
whuber
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.