पृष्ठभूमि और अनुभवजन्य उदाहरण
मेरे दो अध्ययन हैं; मैंने एक प्रयोग (अध्ययन 1) चलाया और फिर उसे दोहराया (अध्ययन 2)। अध्ययन 1 में, मुझे दो चर के बीच एक अंतःक्रिया मिली; अध्ययन 2 में, यह बातचीत एक ही दिशा में थी लेकिन महत्वपूर्ण नहीं थी। यहाँ अध्ययन 1 के मॉडल का सारांश दिया गया है:
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 5.75882 0.26368 21.840 < 2e-16 ***
condSuppression -1.69598 0.34549 -4.909 1.94e-06 ***
prej -0.01981 0.08474 -0.234 0.81542
condSuppression:prej 0.36342 0.11513 3.157 0.00185 **
और अध्ययन 2 का मॉडल:
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 5.24493 0.24459 21.444 <2e-16 ***
prej 0.13817 0.07984 1.731 0.0851 .
condSuppression -0.59510 0.34168 -1.742 0.0831 .
prej:condSuppression 0.13588 0.11889 1.143 0.2545
यह कहने के बजाय, "मुझे लगता है कि मेरे पास कुछ भी नहीं है, क्योंकि मैं 'को दोहराने में विफल रहा," "मैंने जो किया वह दो डेटा सेटों को मिलाया, डेटा अध्ययन के लिए एक डमी चर बनाया, और फिर इंटरैक्शन चलाया। फिर से अध्ययन डमी चर के लिए नियंत्रित करने के बाद। इसके लिए नियंत्रित करने के बाद भी यह बातचीत महत्वपूर्ण थी, और मैंने पाया कि हालत और नापसंद / पूर्वाग्रह के बीच यह दो-तरफ़ा बातचीत अध्ययन डमी चर के साथ तीन-तरफ़ा बातचीत द्वारा योग्य नहीं थी।
पेश है बायेसियन एनालिसिस
मुझे किसी ने सुझाव दिया कि यह बेयसियन विश्लेषण का उपयोग करने का एक शानदार अवसर है: अध्ययन 2 में, मुझे अध्ययन 1 से जानकारी है जिसे मैं पूर्व सूचना के रूप में उपयोग कर सकता हूं! इस तरह, स्टडी 2 स्टेप 1 से बायसियन अपडेट कर रहा है, स्टडी 1 में साधारण कम से कम परिणाम हैं। इसलिए, मैं वापस जाता हूं और स्टडी 2 मॉडल का फिर से विश्लेषण करता हूं, अब गुणांक पर जानकारीपूर्ण पादरियों का उपयोग करते हुए: सभी गुणांक एक था सामान्य जहां अध्ययन 1 में अनुमान था और मानक विचलन अध्ययन 1 में मानक त्रुटि थी।
यह परिणाम का सारांश है:
Estimates:
mean sd 2.5% 25% 50% 75% 97.5%
(Intercept) 5.63 0.17 5.30 5.52 5.63 5.74 5.96
condSuppression -1.20 0.20 -1.60 -1.34 -1.21 -1.07 -0.80
prej 0.02 0.05 -0.08 -0.01 0.02 0.05 0.11
condSuppression:prej 0.34 0.06 0.21 0.30 0.34 0.38 0.46
sigma 1.14 0.06 1.03 1.10 1.13 1.17 1.26
mean_PPD 5.49 0.11 5.27 5.41 5.49 5.56 5.72
log-posterior -316.40 1.63 -320.25 -317.25 -316.03 -315.23 -314.29
ऐसा लगता है कि अब हमारे पास अध्ययन 2 विश्लेषण से बातचीत के लिए बहुत ठोस सबूत हैं। जब मैंने बस एक दूसरे के ऊपर डेटा को स्टैक किया और डमी-चर के रूप में अध्ययन संख्या के साथ मॉडल को चलाया तो मैं इससे सहमत हूं।
जवाबी कार्रवाई: क्या होगा अगर मैं भाग 2 अध्ययन पहले?
मुझे यह सोचकर मिला: क्या होगा यदि मैंने पहले अध्ययन 2 को चलाया था और फिर अध्ययन 1 से अपने विश्वासों को अद्यतन करने के लिए अध्ययन 1 के डेटा का उपयोग किया? मैंने ऊपर जैसा ही काम किया था, लेकिन मैंने अध्ययन 1 के डेटा के मेरे विश्लेषण के लिए अध्ययन 2 से पहले के साधन, मानक कम से कम गुणांक अनुमान और मानक विचलन का उपयोग करते हुए अध्ययन 1 डेटा का फिर से विश्लेषण किया। सारांश परिणाम थे:
Estimates:
mean sd 2.5% 25% 50% 75% 97.5%
(Intercept) 5.35 0.17 5.01 5.23 5.35 5.46 5.69
condSuppression -1.09 0.20 -1.47 -1.22 -1.09 -0.96 -0.69
prej 0.11 0.05 0.01 0.08 0.11 0.14 0.21
condSuppression:prej 0.17 0.06 0.05 0.13 0.17 0.21 0.28
sigma 1.10 0.06 0.99 1.06 1.09 1.13 1.21
mean_PPD 5.33 0.11 5.11 5.25 5.33 5.40 5.54
log-posterior -303.89 1.61 -307.96 -304.67 -303.53 -302.74 -301.83
फिर से, हम एक बातचीत के लिए सबूत देखते हैं, हालांकि यह जरूरी नहीं कि मामला हो। ध्यान दें कि दोनों Bayesian विश्लेषण के लिए बिंदु अनुमान एक दूसरे के लिए 95% विश्वसनीय अंतराल में भी नहीं हैं; बायेसियन विश्लेषण से दो विश्वसनीय अंतरालों में ओवरलैप करने की तुलना में अधिक गैर-ओवरलैप होते हैं।
समय पूर्वता के लिए Bayesian औचित्य क्या है?
मेरा प्रश्न इस प्रकार है: बायोसियन के पास कालानुक्रम का सम्मान करने के लिए क्या औचित्य है कि डेटा कैसे एकत्र किए गए और उनका विश्लेषण किया गया? मुझे अध्ययन 1 से परिणाम मिलते हैं और उन्हें अध्ययन 2 में सूचनात्मक पुजारी के रूप में उपयोग करते हैं ताकि मैं अपने विश्वासों को "अपडेट" करने के लिए अध्ययन 2 का उपयोग करूं। लेकिन अगर हम यह मानते हैं कि मुझे मिलने वाले परिणाम बेतरतीब ढंग से एक सच्चे जनसंख्या प्रभाव के साथ वितरण से लिए गए हैं ... तो फिर मैं अध्ययन 1 के लिए परिणामों का विशेषाधिकार क्यों देता हूं? अध्ययन 1 के लिए पुजारी के रूप में अध्ययन 2 के परिणाम लेने के बजाय अध्ययन 2 के लिए अध्ययन 1 परिणाम के लिए पुजारियों के रूप में उपयोग करने का औचित्य क्या है? क्या जिस क्रम में मैंने विश्लेषण एकत्र किया और गणना की वह वास्तव में मायने रखता है? ऐसा नहीं लगता कि यह मेरे लिए होना चाहिए - इसके लिए बायेसियन औचित्य क्या है? मुझे यह क्यों विश्वास करना चाहिए कि बिंदु अनुमान .34 के करीब है। 17 की तुलना में यह केवल इसलिए है क्योंकि मैंने पहले अध्ययन 1 चलाया था?
कोडियोलॉजिस्ट के जवाब का जवाब
कोडियोलॉजिस्ट ने टिप्पणी की:
बायेसियन सम्मेलन से आपके द्वारा किए गए एक महत्वपूर्ण प्रस्थान के लिए इन बिंदुओं में से दूसरा। आपने पहले मॉडल को सेट नहीं किया और फिर दोनों मॉडल को बायेसियन फैशन में फिट किया। आप एक मॉडल को गैर-बेसेसियन फैशन में फिट करते हैं और फिर दूसरे मॉडल के लिए पुजारियों के लिए इसका इस्तेमाल करते हैं। यदि आपने पारंपरिक दृष्टिकोण का उपयोग किया है, तो आप उस आदेश पर निर्भरता नहीं देखेंगे जो आपने यहां देखा था।
इसे संबोधित करने के लिए, मैं अध्ययन 1 और अध्ययन 2 के लिए मॉडल फिट करता हूं, जहां सभी प्रतिगमन गुणांकों में । चर प्रयोगात्मक हालत, कोडित 0 या 1 के लिए एक डमी चर था; चर, साथ ही परिणाम, दोनों 7 सूत्री 1 से 7 को लेकर तराजू पर नापा गया इस प्रकार, मुझे लगता है कि यह पूर्व के एक उचित विकल्प है। बस डेटा कैसे स्केल किया जाता है, यह बहुत पहले से पता चलता है कि गुणांक को देखने वाले की तुलना में बहुत बड़ा होगा।cond
prej
उन अनुमानों का औसत अनुमान और मानक विचलन लगभग ओएलएस प्रतिगमन के समान है। अध्ययन 1:
Estimates:
mean sd 2.5% 25% 50% 75% 97.5%
(Intercept) 5.756 0.270 5.236 5.573 5.751 5.940 6.289
condSuppression -1.694 0.357 -2.403 -1.925 -1.688 -1.452 -0.986
prej -0.019 0.087 -0.191 -0.079 -0.017 0.040 0.150
condSuppression:prej 0.363 0.119 0.132 0.282 0.360 0.442 0.601
sigma 1.091 0.057 0.987 1.054 1.088 1.126 1.213
mean_PPD 5.332 0.108 5.121 5.259 5.332 5.406 5.542
log-posterior -304.764 1.589 -308.532 -305.551 -304.463 -303.595 -302.625
और अध्ययन 2:
Estimates:
mean sd 2.5% 25% 50% 75% 97.5%
(Intercept) 5.249 0.243 4.783 5.082 5.246 5.417 5.715
condSuppression -0.599 0.342 -1.272 -0.823 -0.599 -0.374 0.098
prej 0.137 0.079 -0.021 0.084 0.138 0.192 0.287
condSuppression:prej 0.135 0.120 -0.099 0.055 0.136 0.214 0.366
sigma 1.132 0.056 1.034 1.092 1.128 1.169 1.253
mean_PPD 5.470 0.114 5.248 5.392 5.471 5.548 5.687
log-posterior -316.699 1.583 -320.626 -317.454 -316.342 -315.561 -314.651
चूंकि ये साधन और मानक विचलन ओएलएस के अनुमान के अनुसार कम या ज्यादा समान हैं, इसलिए ऊपर दिए गए आदेश प्रभाव अभी भी होते हैं। यदि मैं अध्ययन 2 का विश्लेषण करते समय अध्ययन 1 से पूर्ववर्ती सारांश आँकड़ों में प्लग-इन करता हूं, तो मैं अध्ययन 2 का विश्लेषण करते समय पहले की तुलना में अलग-अलग अंतिम अवलोकन करता हूं और फिर अध्ययन 1 का विश्लेषण करने के लिए पुजारियों के रूप में उन पीछे के सारांश आँकड़ों का उपयोग करता हूं।
यहां तक कि जब मैं बार-बार होने वाले अनुमानों के बजाय प्रतिगमन गुणकों के रूप में प्रतिगमन गुणांक के लिए बायेसियन साधन और मानक विचलन का उपयोग करता हूं, तब भी मैं उसी आदेश प्रभाव का पालन करूंगा। इसलिए सवाल यह है कि पहले आए अध्ययन को विशेषाधिकार देने के लिए बायेसियन औचित्य क्या है?
rstanarm
या स्टेन के रूप में पूरे संयुक्त पोस्टीरियर को शामिल करने का कोई तरीका है ? ऐसा लगता है कि इससे पहले कि सवाल यहाँ पूछा गया है: सांख्यिकी.stackexchange.com/questions/241690/…
prej
भी उसी तरह होना चाहिए, जब तक कि मैं आपकी प्रक्रिया को गलत नहीं समझ रहा हूं।