मेडिकल दर्शकों के लिए विश्वसनीय अंतराल को संक्षेप में कैसे बताया जाए


21

स्टेन और फ्रंटएंड पैकेज के साथ rstanarmया brmsमैं बायेसियन तरीके से डेटा का आसानी से विश्लेषण कर सकता हूं जैसा कि मैंने पहले मिश्रित मॉडल के साथ किया था lme। जबकि मेरे पास मेरी डेस्क पर क्रूसके-गेलमैन-वेगेनमेकर्स-इत्यादि द्वारा अधिकांश पुस्तक और लेख हैं, ये मुझे मेडिकल दर्शकों के लिए परिणामों को संक्षेप में नहीं बताते हैं, बाइसियन के क्रोध के स्काईला और मेडिकल समीक्षकों के चिरबिडीस के बीच फटे "हम महत्व चाहते हैं, सामान को फैलाना नहीं")।

एक उदाहरण: गैस्ट्रिक आवृत्ति (1 / मिनट) को तीन समूहों में मापा जाता है; स्वस्थ नियंत्रण संदर्भ हैं। प्रत्येक प्रतिभागी के लिए कई माप हैं, इसलिए मैं अक्सर मिश्रित मॉडल का उपयोग करता हूं lme:

summary(lme(freq_min~ group, random = ~1|study_id, data = mo))

थोड़ा संपादित परिणाम:

Fixed effects: freq_min ~ group 
                   Value Std.Error DF t-value p-value
(Intercept)        2.712    0.0804 70    33.7  0.0000
groupno_symptoms   0.353    0.1180 27     3.0  0.0058
groupwith_symptoms 0.195    0.1174 27     1.7  0.1086

सादगी के लिए, मैं 95% CI के रूप में 2 * std त्रुटि का उपयोग करूंगा।

लगातार संदर्भ में, मैंने इसे संक्षेप में बताया है:

  • नियंत्रण समूह में अनुमानित आवृत्ति 2.7 / मिनट थी (शायद यहां सीआई जोड़ें, लेकिन मैं इसे कभी-कभी पूर्ण और अंतर सीआई द्वारा बनाई गई भ्रम की वजह से बचता हूं)।
  • No_symptoms समूह में, आवृत्ति 0.4 / मिनट, CI (0.11 से 0.59) / मिनट, पी = 0.006 नियंत्रण से अधिक थी।
  • With_symptoms समूह में, आवृत्ति 0.2 / मिनट, CI (-0.04 से 0.4) / मिनट, पी = 0.11 नियंत्रण से अधिक थी।

यह चिकित्सा प्रकाशन के लिए अधिकतम स्वीकार्य जटिलता के बारे में है, समीक्षक शायद मुझे दूसरे मामले में "महत्वपूर्ण नहीं" जोड़ने के लिए कहेंगे।

यहाँ stan_lmerऔर डिफ़ॉल्ट पुजारियों के साथ भी ऐसा ही है ।

freq_stan = stan_lmer(freq_min~ group + (1|study_id), data = mo)


           contrast lower_CredI frequency upper_CredI
        (Intercept)     2.58322     2.714       2.846
   groupno_symptoms     0.15579     0.346       0.535
 groupwith_symptoms    -0.00382     0.188       0.384

जहां क्रेडि 90% विश्वसनीय अंतराल हैं (देखें रिस्टारम विगनेट क्यों 90% डिफ़ॉल्ट के रूप में उपयोग किया जाता है)।

प्रशन:

  • उपरोक्त सारांश को बायेसियन दुनिया में कैसे अनुवाद करें?
  • पूर्व-चर्चा किस हद तक आवश्यक है? मुझे पूरा यकीन है कि जब मैं पुजारियों का उल्लेख करता हूं तो कागज सामान्य "व्यक्तिपरक धारणा" के साथ वापस आ जाएगा; या कम से कम "कोई तकनीकी चर्चा नहीं, कृपया" के साथ। लेकिन सभी Bayesian अधिकारियों का अनुरोध है कि व्याख्या केवल पुजारियों के संदर्भ में मान्य है।
  • मैं Bayesian अवधारणाओं को धोखा दिए बिना, सूत्रीकरण में कुछ "महत्व" कैसे प्रदान कर सकता हूं? कुछ "विश्वसनीय रूप से अलग" (ऊऊह ...) या लगभग विश्वसनीय रूप से अलग (बुआ ..., लगता है जैसे "महत्व के शिखर पर")।

जोना गैरी और बेन गुडरिक (2016)। Rstanarm: Bayesian एप्लाइड प्रतिगमन स्टैन के माध्यम से मॉडलिंग। आर पैकेज संस्करण 2.9.0-3। https://CRAN.R-project.org/package=rstanarm

स्टेन डेवलपमेंट टीम (2015)। स्टेन: ए सी ++ लाइब्रेरी फॉर प्रोबेबिलिटी एंड सैंपलिंग, संस्करण २.०.०। URL http://mc-stan.org/

पॉल-क्रिस्चियन बुकेनर (2016)। brms: Bayesian Regression मॉडल स्टेन का उपयोग करते हुए। पैकेज संस्करण 0.8.0। https://CRAN.R-project.org/package=brms

पिनहेइरो जे, बेट्स डी, देबोरॉय एस, सरकार डी और आर कोर टीम (2016)। ल्युमेम: रैखिक और नॉनलाइनर मिश्रित प्रभाव मॉडल । आर पैकेज संस्करण 3.1-124, http://CRAN.R-project.org/package=nlme>।


1
मुझे मेडिकल पत्रिकाओं के समीक्षकों / संपादकों के साथ कोई अनुभव नहीं है, लेकिन शायद आप कह सकते हैं कि शून्य संभावना है कि अवरोधन नकारात्मक है, शून्य संभावना है कि "कोई लक्षण नहीं" डमी चर पर गुणांक नकारात्मक है, और लगभग 5% संभावना है "लक्षणों के साथ" डमी चर पर गुणांक नकारात्मक है। आप लगभग 5% अधिक करके ठीक कर सकते हैं mean(as.matrix(freq_stan)[,"groupwith_symptoms"] < 0)
बेन गुडरिक

हम उस के बारे में सोचा, और 5% ठीक लग रहा था; शोधकर्ता इसे "महत्व" के लिए अनुवाद करेंगे, लेकिन जैसा कि वे आम तौर पर महत्व को गलत समझते हैं, वे दोहरे नकार से सही होंगे। दूसरी ओर, "शून्य संभावना", एक हत्यारा है: क्या आप इसे स्वीकार करेंगे? शायद <1 / Reff (पी <0.001) एक सन्निकटन होगा? लेकिन फिर: जब मैं पी <xxx लिखता हूं, तो मैं महत्व की दुनिया में हूं।
डाइटनर मेंन

ऊपर n_eff को ठीक करें।
डाइटनर मेंन

1
मैं व्यक्तिगत रूप से एक पूंछ संभावना को "n_eff मौका में 1 से कम" होने के रूप में संदर्भित नहीं करूंगा क्योंकि n_eff उस परिशुद्धता से संबंधित है जिसके साथ अर्थ अनुमानित है। शायद आप गुणांक के लिए 1 नकारात्मक ड्रा प्राप्त करने के लिए अपनी जंजीरों को लंबे समय तक चला सकते हैं group_nosymptomsऔर फिर कहें कि इसके नकारात्मक होने की संभावना है 1 / draws। लेकिन अवरोधन के लिए, श्रृंखला कभी भी इन आंकड़ों के लिए नकारात्मक क्षेत्र में भटकने वाली नहीं है, इसलिए मुझे लगता है कि आप कह सकते हैं कि संभावना की तुलना में कम है 1 / draws
बेन गुडरिक

मुझे एक डोमेन विशेषज्ञ के लिए पी-वैल्यू को शामिल करने के बारे में कुछ अच्छी सलाह मिली है, लेकिन सांख्यिकीय विशेषज्ञ समीक्षक यहां नहीं है: आंकड़े . stackexchange.com/questions/148649/… । हमने p <0. का उपयोग किया जब एक रूढ़िवादी ऊपरी हिस्से के रूप में सभी मापदंडों के न्यूनतम (n_eff) का इस्तेमाल किया गया
stijn

जवाबों:


16

त्वरित विचार:

1) मुख्य मुद्दा यह है कि आप अपने दर्शकों के लिए जवाब देने की कोशिश कर रहे सवाल को क्या लागू करते हैं, क्योंकि यह निर्धारित करता है कि आप अपने सांख्यिकीय विश्लेषण से क्या जानकारी चाहते हैं। इस मामले में, यह मुझे प्रतीत होता है कि आप समूहों के बीच मतभेदों की भयावहता का अनुमान लगाना चाहते हैं (या शायद समूहों के अनुपात का परिमाण यदि वह माप आपके दर्शकों के लिए अधिक परिचित है)। अंतर का परिमाण सीधे आपके द्वारा प्रश्न में प्रस्तुत किए गए विश्लेषणों द्वारा प्रदान नहीं किया जाता है। लेकिन बायसियन विश्लेषण से आप जो चाहते हैं उसे प्राप्त करने के लिए सीधे आगे हैं: आप मतभेदों (या अनुपात) के पीछे वितरण को चाहते हैं। फिर, अंतर (या अनुपात) के पीछे वितरण से, आप इस तरह से एक प्रत्यक्ष संभावना बयान कर सकते हैं:

"95% सबसे विश्वसनीय अंतर [निम्न 95% एचडीआई सीमा] और [उच्च 95% एचडीआई सीमा] के बीच आते हैं" (यहां मैं 95% उच्चतम घनत्व अंतराल [एचडीआई] का उपयोग विश्वसनीय अंतराल के रूप में कर रहा हूं, और क्योंकि वे हैं) उच्चतम घनत्व पैरामीटर मानों की परिभाषा उन्हें 'सबसे विश्वसनीय' के रूप में दी गई है)

एक मेडिकल-जर्नल दर्शकों को सहज रूप से और सही ढंग से उस कथन को समझ सकता है, क्योंकि यह वही है जो आम तौर पर दर्शकों को लगता है कि एक निरंतर आत्मविश्वास अंतराल का अर्थ है (भले ही वह लगातार विश्वास अंतराल का अर्थ न हो)।

स्टेन या JAGS से आपको मतभेद (या अनुपात) कैसे मिलते हैं? पूर्ण की गई एमसीएमसी श्रृंखला के बाद के प्रसंस्करण द्वारा विलय। श्रृंखला के प्रत्येक चरण में, प्रासंगिक अंतर (या अनुपात) की गणना करें, फिर अंतर (या अनुपात) के पिछले वितरण की जांच करें। उदाहरण के लिए DBDA2E https://sites.google.com/site/doingbayesiandataanalysis/ में MCMC के लिए सामान्यतः चित्र 7.9 (पृष्ठ 177) में दिए गए हैं, JAGS के लिए चित्र 8.6 (पृष्ठ 211) में, और स्टेन के लिए धारा 16.3 (p) में दिए गए हैं। । 468) इत्यादि!

2) यदि आप शून्य के अंतर को खारिज कर दिया है या नहीं, इस बारे में बयान देने के लिए परंपरा से मजबूर हैं, तो आपके पास दो बायेसियन विकल्प हैं।

2A) एक विकल्प शून्य के पास अंतराल के संबंध में संभावना बयान करने के लिए है, और एचडीआई से उनका संबंध है। इसके लिए, आप शून्य के आसपास व्यावहारिक तुल्यता (ROPE) के एक क्षेत्र की स्थापना करते हैं, जो कि आपके लागू डोमेन के लिए केवल एक निर्णय सीमा है - --- कितना बड़ा अंतर तुच्छ रूप से छोटा है? इस तरह की सीमाओं की स्थापना नियमित रूप से नैदानिक ​​गैर-हीनता परीक्षण में की जाती है, उदाहरण के लिए। यदि आपके पास अपने क्षेत्र में एक 'प्रभाव आकार' माप है, तो 'छोटे' प्रभाव आकार के लिए कन्वेंशन हो सकते हैं, और ROPE सीमाएं, छोटे प्रभाव का आधा, कह सकती हैं। तो आप इस तरह के रूप में प्रत्यक्ष संभावना बयान कर सकते हैं:

"अंतर का केवल 1.2% वितरण व्यावहारिक रूप से शून्य के बराबर है"

तथा

"95% सबसे विश्वसनीय अंतर सभी व्यावहारिक रूप से शून्य के बराबर नहीं हैं (यानी, 95% एचडीआई और आरओपीई ओवरलैप नहीं हैं) और इसलिए हम शून्य को अस्वीकार करते हैं।" (पूर्ववर्ती वितरण से संभाव्यता कथन के बीच अंतर पर ध्यान दें, और उस कथन के आधार पर बाद का निर्णय)

आप व्यावहारिक उद्देश्यों के लिए शून्य का अंतर भी स्वीकार कर सकते हैं, यदि 95% सबसे विश्वसनीय मूल्य सभी व्यावहारिक रूप से बराबर शून्य शून्य हैं।

2 बी) एक दूसरे बायेसियन विकल्प बायेसियन नल परिकल्पना परीक्षण है। (ध्यान दें कि ऊपर दी गई विधि नहीं थी"परिकल्पना परीक्षण" कहा जाता है!) बायेसियन नल की परिकल्पना परीक्षण एक पूर्व वितरण की एक बायेसियन मॉडल की तुलना करता है जो मानता है कि अंतर केवल एक वैकल्पिक पूर्व वितरण के खिलाफ शून्य हो सकता है जो मानता है कि अंतर संभावनाओं के कुछ फैलाने की सीमा हो सकती है। इस तरह के एक मॉडल तुलना (आमतौर पर) का परिणाम वैकल्पिक वितरण की विशेष पसंद पर बहुत दृढ़ता से निर्भर करता है, और इसलिए वैकल्पिक विकल्प की पसंद के लिए सावधानीपूर्वक औचित्य बनाया जाना चाहिए। अशक्त और वैकल्पिक दोनों के लिए कम से कम हल्के से सूचित पुजारियों का उपयोग करना सबसे अच्छा है ताकि मॉडल की तुलना वास्तव में सार्थक हो। ध्यान दें कि मॉडल तुलना समूहों के बीच अंतर के अनुमान से अलग जानकारी प्रदान करती है क्योंकि मॉडल तुलना एक अलग प्रश्न को संबोधित कर रही है। इस प्रकार, यहां तक ​​कि एक मॉडल की तुलना के साथ,

स्टेन / जेएजीएस / एमसीएमसी आउटपुट से बायेसियन नल परिकल्पना परीक्षण करने के तरीके हो सकते हैं, लेकिन मुझे इस मामले में पता नहीं है। उदाहरण के लिए, एक बे-फैक्टर के लिए सैवेज-डिकी सन्निकटन की कोशिश कर सकता है, लेकिन यह मतभेदों पर पूर्व घनत्व को जानने पर निर्भर करेगा, जिसके लिए पूर्व से कुछ गणितीय विश्लेषण या कुछ अतिरिक्त MCMC सन्निकटन की आवश्यकता होगी।

शून्य मानों के बारे में निर्णय लेने के दो तरीकों पर चर्चा की गई है। DBDA2E https://sites.google.com/site/doingbayesiandataanalysis/ के 12 । लेकिन मैं वास्तव में यह चर्चा नहीं करना चाहता हूं कि अशक्त मूल्यों का आकलन करने के "उचित" तरीके के बारे में एक बहस द्वारा ट्रैक किया जाए; वे बस अलग हैं और वे अलग-अलग जानकारी प्रदान करते हैं। मेरे उत्तर का मुख्य बिंदु बिंदु 1 है, ऊपर: समूहों के बीच अंतर के वितरण को देखें।


3
हमारी साइट पर आपका स्वागत है! यह बहुत अच्छा है कि आप हमारे समुदाय का हिस्सा बनें!
टिम

आप इस एक के साथ अपने खाते मर्ज करना चाहते हैं, तो stats.stackexchange.com/users/16592 (प्रकट होता है तुम्हारा भी है कि), आप के माध्यम से स्वचालित रूप से यह कर सकते हैं stats.stackexchange.com/contact
अमीबा का कहना है कि मोनिका

आप ब्रम्स का उपयोग करके यहां वर्णित परिकल्पना परीक्षण कर सकते हैं। देखें: github.com/paul-buerkner/brms
bjw

3

SO शिष्टाचार के बाद, यह @John K. Kruschke के लिए एक टिप्पणी के रूप में लिखा जाना चाहिए था, लेकिन अब टिप्पणियाँ संरचना के लिए मुश्किल हैं। माफ़ करना।

  • @ जॉन के। क्रॉश्के लिखते हैं: पूरी हुई एमसीएमसी श्रृंखला के बाद के प्रसंस्करण से ...

lower_CredIऔर upper_CredIमूल पोस्ट में गणना की गई थी जैसा कि आपने पूर्ण एमसीएमसी श्रृंखलाओं से उल्लेख किया है और lmeआउटपुट के साथ बेहतर तुलना के लिए केवल थोड़ा सुधारित किया गया है । जब आप एचडीआई का पक्ष लेते हैं, तो ये सरल मात्राएँ होती हैं; इस उदाहरण में सममितीय पीछे के साथ यह एक बड़ा अंतर नहीं करता है।

  • ROPE और प्रभाव का आकार

मैंने देखा है कि आचार समितियों के आवेदन प्रभाव आकार के बारे में धारणा बताते हुए सांख्यिकीय शक्ति की गणना की गई थी। यहां तक ​​कि उस मामले के लिए जहां "नैदानिक ​​रूप से प्रासंगिक प्रभाव" को परिभाषित करने के आसपास कोई रास्ता नहीं है, चिकित्सा शोधकर्ताओं को अवधारणा को समझाना मुश्किल है। यह गैर-हीन परीक्षणों के लिए थोड़ा आसान है, लेकिन ये अक्सर एक अध्ययन के अधीन नहीं होते हैं।

इसलिए मुझे पूरा यकीन है कि ROPES शुरू करना स्वीकार्य नहीं होगा - एक और धारणा, लोग एक से अधिक संख्या को ध्यान में नहीं रख सकते। बेयर्स कारक काम कर सकते हैं, क्योंकि पी-मानों की तरह घर ले जाने के लिए केवल एक ही संख्या है।

  • महंतों

मुझे आश्चर्य है कि स्टेन टीम के @John K. Kruschke और न ही @Ben Goodrich ने पुजारियों का उल्लेख किया है; परिणाम प्रस्तुत करते समय विषय पर अधिकांश कागजात पूर्व संवेदनशीलता की विस्तृत चर्चा के लिए पूछते हैं।

यह अच्छा होगा यदि आपकी पुस्तक के अगले संस्करण में - स्टेन के साथ उम्मीद है - आप चयनित उदाहरणों के लिए "100 शब्दों के साथ" (एक गैर-सांख्यिकीय पेपर में इसे कैसे प्रकाशित करें) बक्से जोड़ सकते हैं। जब मैं आपके अध्याय 23.1 को शब्द द्वारा ले जाऊंगा, एक विशिष्ट मेडिकल शोध पत्र 100 पृष्ठों और लंबे आंकड़ों के द्वारा होगा ...


* मुख्य बिंदु मतभेदों के पीछे वितरण (समूहों के बीच, समूहों के संयोजन के बीच) को देखना था। MCMC श्रृंखला के बाद के प्रसंस्करण की जरूरत है।
जॉन के। क्रुश्के

* ROPE: आप "पूरी तरह से आश्वस्त हैं कि ROPE स्वीकार्य नहीं होगा" और "चिकित्सा शोधकर्ताओं को अवधारणा को समझाना मुश्किल है"। मैं यह नहीं देखता कि कैसे बेयर्स कारक समझाने में आसान होंगे या स्वीकार किए जाएंगे, क्योंकि बेयस फैक्टर निर्णय के लिए कुछ विशेष बीएफ सीमा का अधिक विस्तृत विवरण और औचित्य लेता है !! मुझे लगता है कि आपने मान लिया है कि आपके दर्शक स्थायी रूप से एक निरंतरवादी ढांचे में ossified हैं; यदि ऐसा है तो बस लगातार आँकड़े का उपयोग करें या अपने काम को एक अधिक प्रबुद्ध पत्रिका में जमा करें।
जॉन के। क्रुश्के

* आप Ch 23.1 की सिफारिशों के बारे में गंभीर रूप से अतिरंजित हैं, जो वास्तव में पाठ की एक छोटी मात्रा में संक्षिप्त रूप से संबोधित किया जा सकता है, विशेष रूप से सरल मॉडल जैसे कि आप यहां उपयोग करते हैं। अगली टिप्पणी में जारी ...
जॉन के। क्रुश्के

1
(i) बायेसियन के उपयोग को प्रेरित करता है - यह आपको काफी जानकारीपूर्ण उत्तरोत्तर वितरण प्रदान करता है। (ii) मॉडल और उसके मापदंडों की व्याख्या करें, जो इस मामले में आसान है। (iii) इस मामले में पूर्व - फिर से तुच्छ का औचित्य साबित करने के लिए सिर्फ यह कहें कि आपने विसरित पुजारियों का उपयोग किया है जिनका अनिवार्य रूप से पश्च पर कोई प्रभाव नहीं है। (लेकिन अगर आप बेयस कारकों का उपयोग नहीं करते हैं, जिसके लिए पूर्व महत्वपूर्ण है।) (iv) एमसीएमसी श्रृंखला की चिकनाई की रिपोर्ट करें - कहने के लिए कि ईएसएस सभी मापदंडों और अंतरों के लिए लगभग 10,000 था। अगली टिप्पणी में जारी ...
जॉन के। क्रुश्के

1
(v) पश्च की व्याख्या करें: प्रत्येक अंतर के लिए बस पश्च की केंद्रीय प्रवृत्ति (जैसे मोड) और उसके ९ ५% HDI को बताएं। यह एक ट्वीट जितना छोटा नहीं है, लेकिन यह केवल एक युगल पैराग्राफ है।
जॉन के। क्रुश्के
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.