अन्य विश्लेषणों की तुलना में पहले किए गए विशेषाधिकार विश्लेषण के लिए बायेसियन औचित्य क्या है?


26

पृष्ठभूमि और अनुभवजन्य उदाहरण

मेरे दो अध्ययन हैं; मैंने एक प्रयोग (अध्ययन 1) चलाया और फिर उसे दोहराया (अध्ययन 2)। अध्ययन 1 में, मुझे दो चर के बीच एक अंतःक्रिया मिली; अध्ययन 2 में, यह बातचीत एक ही दिशा में थी लेकिन महत्वपूर्ण नहीं थी। यहाँ अध्ययन 1 के मॉडल का सारांश दिया गया है:

Coefficients:
                        Estimate Std. Error t value Pr(>|t|)    
(Intercept)              5.75882    0.26368  21.840  < 2e-16 ***
condSuppression         -1.69598    0.34549  -4.909 1.94e-06 ***
prej                    -0.01981    0.08474  -0.234  0.81542    
condSuppression:prej     0.36342    0.11513   3.157  0.00185 ** 

और अध्ययन 2 का मॉडल:

Coefficients:
                     Estimate Std. Error t value Pr(>|t|)    
(Intercept)           5.24493    0.24459  21.444   <2e-16 ***
prej                  0.13817    0.07984   1.731   0.0851 .  
condSuppression      -0.59510    0.34168  -1.742   0.0831 .  
prej:condSuppression  0.13588    0.11889   1.143   0.2545  

यह कहने के बजाय, "मुझे लगता है कि मेरे पास कुछ भी नहीं है, क्योंकि मैं 'को दोहराने में विफल रहा," "मैंने जो किया वह दो डेटा सेटों को मिलाया, डेटा अध्ययन के लिए एक डमी चर बनाया, और फिर इंटरैक्शन चलाया। फिर से अध्ययन डमी चर के लिए नियंत्रित करने के बाद। इसके लिए नियंत्रित करने के बाद भी यह बातचीत महत्वपूर्ण थी, और मैंने पाया कि हालत और नापसंद / पूर्वाग्रह के बीच यह दो-तरफ़ा बातचीत अध्ययन डमी चर के साथ तीन-तरफ़ा बातचीत द्वारा योग्य नहीं थी।

पेश है बायेसियन एनालिसिस

मुझे किसी ने सुझाव दिया कि यह बेयसियन विश्लेषण का उपयोग करने का एक शानदार अवसर है: अध्ययन 2 में, मुझे अध्ययन 1 से जानकारी है जिसे मैं पूर्व सूचना के रूप में उपयोग कर सकता हूं! इस तरह, स्टडी 2 स्टेप 1 से बायसियन अपडेट कर रहा है, स्टडी 1 में साधारण कम से कम परिणाम हैं। इसलिए, मैं वापस जाता हूं और स्टडी 2 मॉडल का फिर से विश्लेषण करता हूं, अब गुणांक पर जानकारीपूर्ण पादरियों का उपयोग करते हुए: सभी गुणांक एक था सामान्य जहां अध्ययन 1 में अनुमान था और मानक विचलन अध्ययन 1 में मानक त्रुटि थी।

यह परिणाम का सारांश है:

Estimates:
                       mean    sd      2.5%    25%     50%     75%     97.5%
(Intercept)             5.63    0.17    5.30    5.52    5.63    5.74    5.96
condSuppression        -1.20    0.20   -1.60   -1.34   -1.21   -1.07   -0.80
prej                    0.02    0.05   -0.08   -0.01    0.02    0.05    0.11
condSuppression:prej    0.34    0.06    0.21    0.30    0.34    0.38    0.46
sigma                   1.14    0.06    1.03    1.10    1.13    1.17    1.26
mean_PPD                5.49    0.11    5.27    5.41    5.49    5.56    5.72
log-posterior        -316.40    1.63 -320.25 -317.25 -316.03 -315.23 -314.29

ऐसा लगता है कि अब हमारे पास अध्ययन 2 विश्लेषण से बातचीत के लिए बहुत ठोस सबूत हैं। जब मैंने बस एक दूसरे के ऊपर डेटा को स्टैक किया और डमी-चर के रूप में अध्ययन संख्या के साथ मॉडल को चलाया तो मैं इससे सहमत हूं।

जवाबी कार्रवाई: क्या होगा अगर मैं भाग 2 अध्ययन पहले?

मुझे यह सोचकर मिला: क्या होगा यदि मैंने पहले अध्ययन 2 को चलाया था और फिर अध्ययन 1 से अपने विश्वासों को अद्यतन करने के लिए अध्ययन 1 के डेटा का उपयोग किया? मैंने ऊपर जैसा ही काम किया था, लेकिन मैंने अध्ययन 1 के डेटा के मेरे विश्लेषण के लिए अध्ययन 2 से पहले के साधन, मानक कम से कम गुणांक अनुमान और मानक विचलन का उपयोग करते हुए अध्ययन 1 डेटा का फिर से विश्लेषण किया। सारांश परिणाम थे:

Estimates:
                          mean    sd      2.5%    25%     50%     75%     97.5%
(Intercept)                5.35    0.17    5.01    5.23    5.35    5.46    5.69
condSuppression           -1.09    0.20   -1.47   -1.22   -1.09   -0.96   -0.69
prej                       0.11    0.05    0.01    0.08    0.11    0.14    0.21
condSuppression:prej       0.17    0.06    0.05    0.13    0.17    0.21    0.28
sigma                      1.10    0.06    0.99    1.06    1.09    1.13    1.21
mean_PPD                   5.33    0.11    5.11    5.25    5.33    5.40    5.54
log-posterior           -303.89    1.61 -307.96 -304.67 -303.53 -302.74 -301.83

फिर से, हम एक बातचीत के लिए सबूत देखते हैं, हालांकि यह जरूरी नहीं कि मामला हो। ध्यान दें कि दोनों Bayesian विश्लेषण के लिए बिंदु अनुमान एक दूसरे के लिए 95% विश्वसनीय अंतराल में भी नहीं हैं; बायेसियन विश्लेषण से दो विश्वसनीय अंतरालों में ओवरलैप करने की तुलना में अधिक गैर-ओवरलैप होते हैं।

समय पूर्वता के लिए Bayesian औचित्य क्या है?

मेरा प्रश्न इस प्रकार है: बायोसियन के पास कालानुक्रम का सम्मान करने के लिए क्या औचित्य है कि डेटा कैसे एकत्र किए गए और उनका विश्लेषण किया गया? मुझे अध्ययन 1 से परिणाम मिलते हैं और उन्हें अध्ययन 2 में सूचनात्मक पुजारी के रूप में उपयोग करते हैं ताकि मैं अपने विश्वासों को "अपडेट" करने के लिए अध्ययन 2 का उपयोग करूं। लेकिन अगर हम यह मानते हैं कि मुझे मिलने वाले परिणाम बेतरतीब ढंग से एक सच्चे जनसंख्या प्रभाव के साथ वितरण से लिए गए हैं ... तो फिर मैं अध्ययन 1 के लिए परिणामों का विशेषाधिकार क्यों देता हूं? अध्ययन 1 के लिए पुजारी के रूप में अध्ययन 2 के परिणाम लेने के बजाय अध्ययन 2 के लिए अध्ययन 1 परिणाम के लिए पुजारियों के रूप में उपयोग करने का औचित्य क्या है? क्या जिस क्रम में मैंने विश्लेषण एकत्र किया और गणना की वह वास्तव में मायने रखता है? ऐसा नहीं लगता कि यह मेरे लिए होना चाहिए - इसके लिए बायेसियन औचित्य क्या है? मुझे यह क्यों विश्वास करना चाहिए कि बिंदु अनुमान .34 के करीब है। 17 की तुलना में यह केवल इसलिए है क्योंकि मैंने पहले अध्ययन 1 चलाया था?


कोडियोलॉजिस्ट के जवाब का जवाब

कोडियोलॉजिस्ट ने टिप्पणी की:

बायेसियन सम्मेलन से आपके द्वारा किए गए एक महत्वपूर्ण प्रस्थान के लिए इन बिंदुओं में से दूसरा। आपने पहले मॉडल को सेट नहीं किया और फिर दोनों मॉडल को बायेसियन फैशन में फिट किया। आप एक मॉडल को गैर-बेसेसियन फैशन में फिट करते हैं और फिर दूसरे मॉडल के लिए पुजारियों के लिए इसका इस्तेमाल करते हैं। यदि आपने पारंपरिक दृष्टिकोण का उपयोग किया है, तो आप उस आदेश पर निर्भरता नहीं देखेंगे जो आपने यहां देखा था।

इसे संबोधित करने के लिए, मैं अध्ययन 1 और अध्ययन 2 के लिए मॉडल फिट करता हूं, जहां सभी प्रतिगमन गुणांकों में । चर प्रयोगात्मक हालत, कोडित 0 या 1 के लिए एक डमी चर था; चर, साथ ही परिणाम, दोनों 7 सूत्री 1 से 7 को लेकर तराजू पर नापा गया इस प्रकार, मुझे लगता है कि यह पूर्व के एक उचित विकल्प है। बस डेटा कैसे स्केल किया जाता है, यह बहुत पहले से पता चलता है कि गुणांक को देखने वाले की तुलना में बहुत बड़ा होगा।N(0,5)condprej

उन अनुमानों का औसत अनुमान और मानक विचलन लगभग ओएलएस प्रतिगमन के समान है। अध्ययन 1:

Estimates:
                       mean     sd       2.5%     25%      50%      75%      97.5% 
(Intercept)             5.756    0.270    5.236    5.573    5.751    5.940    6.289
condSuppression        -1.694    0.357   -2.403   -1.925   -1.688   -1.452   -0.986
prej                   -0.019    0.087   -0.191   -0.079   -0.017    0.040    0.150
condSuppression:prej    0.363    0.119    0.132    0.282    0.360    0.442    0.601
sigma                   1.091    0.057    0.987    1.054    1.088    1.126    1.213
mean_PPD                5.332    0.108    5.121    5.259    5.332    5.406    5.542
log-posterior        -304.764    1.589 -308.532 -305.551 -304.463 -303.595 -302.625

और अध्ययन 2:

Estimates:
                       mean     sd       2.5%     25%      50%      75%      97.5% 
(Intercept)             5.249    0.243    4.783    5.082    5.246    5.417    5.715
condSuppression        -0.599    0.342   -1.272   -0.823   -0.599   -0.374    0.098
prej                    0.137    0.079   -0.021    0.084    0.138    0.192    0.287
condSuppression:prej    0.135    0.120   -0.099    0.055    0.136    0.214    0.366
sigma                   1.132    0.056    1.034    1.092    1.128    1.169    1.253
mean_PPD                5.470    0.114    5.248    5.392    5.471    5.548    5.687
log-posterior        -316.699    1.583 -320.626 -317.454 -316.342 -315.561 -314.651

चूंकि ये साधन और मानक विचलन ओएलएस के अनुमान के अनुसार कम या ज्यादा समान हैं, इसलिए ऊपर दिए गए आदेश प्रभाव अभी भी होते हैं। यदि मैं अध्ययन 2 का विश्लेषण करते समय अध्ययन 1 से पूर्ववर्ती सारांश आँकड़ों में प्लग-इन करता हूं, तो मैं अध्ययन 2 का विश्लेषण करते समय पहले की तुलना में अलग-अलग अंतिम अवलोकन करता हूं और फिर अध्ययन 1 का विश्लेषण करने के लिए पुजारियों के रूप में उन पीछे के सारांश आँकड़ों का उपयोग करता हूं।

यहां तक ​​कि जब मैं बार-बार होने वाले अनुमानों के बजाय प्रतिगमन गुणकों के रूप में प्रतिगमन गुणांक के लिए बायेसियन साधन और मानक विचलन का उपयोग करता हूं, तब भी मैं उसी आदेश प्रभाव का पालन करूंगा। इसलिए सवाल यह है कि पहले आए अध्ययन को विशेषाधिकार देने के लिए बायेसियन औचित्य क्या है?


2
"मैं अब भी उसी स्थिति में रहूंगा। इसलिए यह सवाल बना हुआ है कि जो अध्ययन पहले किया गया है, उसके विशेषाधिकार के लिए बायेसियन औचित्य क्या है?" - हुह? किस अर्थ में आप अभी भी अध्ययन 1 का विशेषाधिकार प्राप्त कर रहे हैं? आप यहां वर्णित या विपरीत क्रम में दो मॉडल फिट कर सकते हैं और उदाहरण के लिए आपके अंतिम गुणांक का सही जनसंख्या गुणांक prejभी उसी तरह होना चाहिए, जब तक कि मैं आपकी प्रक्रिया को गलत नहीं समझ रहा हूं।
कोडियोलॉजिस्ट

@Kodiologist मैंने प्रक्रिया के बारे में अधिक सहित स्पष्टता के लिए संपादित किया।
मार्क व्हाइट

1
सहसंयोजक मैट्रिक्स और त्रुटि के बारे में क्या? आपको अपने नए पूर्व के रूप में पूरे संयुक्त पश्च का उपयोग करने के लिए मिला है।
Scortchi - को पुनः स्थापित मोनिका

@ स्कोर्टची बिंगो - यह सही उत्तर है, मुझे लगता है, और यह वही था जो अनटुबा के उत्तर ने मुझे विश्वास दिलाया। मैंने जो किया वह अद्यतन करने का एक बहुत ही कच्चा संस्करण था: मैंने सारांश के आँकड़े लिए, न कि पूरे जोड़ के बाद के। इसका मतलब है कि प्रश्न: क्या पूर्व rstanarmया स्टेन के रूप में पूरे संयुक्त पोस्टीरियर को शामिल करने का कोई तरीका है ? ऐसा लगता है कि इससे पहले कि सवाल यहाँ पूछा गया है: सांख्यिकी.stackexchange.com/questions/241690/…
मार्क व्हाइट

1
यदि आप गुणांकों के लिए गॉसियन पुजारी (और स्वतंत्रता?) के साथ शुरू कर रहे हैं और विचरण के लिए एक उलटा-गामा है, तो आपको पहले एक सामान्य उलटा-गामा मिला है और यह संयुग्म है। अद्यतन समीकरण देखें।
Scortchi - को पुनः स्थापित मोनिका

जवाबों:


22

बेयस की प्रमेय कहती है कि rescaling के बाद posteriorबराबर है prior * likelihood(इसलिए संभावना 1 के बराबर है )। प्रत्येक अवलोकन में एक likelihoodअद्यतन करने priorऔर एक नया बनाने के लिए इस्तेमाल किया जा सकता है posterior:

posterior_1 = prior * likelihood_1
posterior_2 = posterior_1 * likelihood_2
...
posterior_n = posterior_{n-1} * likelihood_n

इसलिए कि

posterior_n = prior * likelihood_1 * ... * likelihood_n

गुणन की समानता का तात्पर्य है कि अद्यतन किसी भी क्रम में किए जा सकते हैं । इसलिए यदि आप एक एकल से शुरू करते हैं, तो आप किसी भी क्रम में अध्ययन 1 और अध्ययन 2 से टिप्पणियों को मिला सकते हैं, बेयस के फार्मूले को लागू कर सकते हैं और उसी अंतिम पर पहुंच सकते हैं posterior


1
एकदम सही समझ में आता है। तो यह होने के कारण विसंगति के संभावित कारण की ओर इशारा करता है: जिस तरह से मैंने अपने विश्लेषण किए (अगले अध्ययन के लिए पूर्व तर्कों में पीछे के सारांश आँकड़े) काम नहीं कर रहे हैं? वह यह है: मुझे पोस्टीरियर की संपूर्णता पर विचार करने की जरूरत है, न कि केवल सारांश के आँकड़ों को बाद के विश्लेषणों के पुजारियों में। सही बात?
मार्क व्हाइट

4
@ मार्खाइट सही। आपके पहले विश्लेषण से पिछले वितरण दूसरे के लिए आपके पुजारी होने चाहिए।
कोडियालॉजिस्ट

4
@Kodiologist और पीछे के बारे में सारांश आँकड़े! = पीछे
मार्क व्हाइट

@ मार्खाइट राइट।
कोडियोलॉजिस्ट

22

पहले मुझे यह बताना चाहिए:

  1. p
  2. आप उस नमूने से सीधे अपने निष्कर्षों का अनुवाद करके अध्ययन 1 के परिणामों में बहुत विश्वास कर रहे हैं, इसलिए सीधे पुजारियों में। याद रखें, एक पूर्व केवल पिछले निष्कर्षों का प्रतिबिंब नहीं है। इसे पहले के निष्कर्षों से पहले अपने विश्वासों सहित, अपने पूर्ववर्ती विश्वासों की संपूर्णता को एनकोड करने की आवश्यकता है। यदि आप मानते हैं कि अध्ययन 1 में नमूना त्रुटि के साथ-साथ अन्य प्रकार की कम ट्रैक्टिबल अनिश्चितता शामिल है, जैसे कि मॉडल अनिश्चितता, तो आपको पहले से अधिक रूढ़िवादी का उपयोग करना चाहिए।

बायेसियन सम्मेलन से आपके द्वारा किए गए एक महत्वपूर्ण प्रस्थान के लिए इन बिंदुओं में से दूसरा। आपने पहले मॉडल को सेट नहीं किया और फिर दोनों मॉडल को बायेसियन फैशन में फिट किया। आप एक मॉडल को गैर-बेसेसियन फैशन में फिट करते हैं और फिर दूसरे मॉडल के लिए पुजारियों के लिए इसका इस्तेमाल करते हैं। यदि आपने पारंपरिक दृष्टिकोण का उपयोग किया है, तो आप उस आदेश पर निर्भरता नहीं देखेंगे जो आपने यहां देखा था।


1. मैंने एक अलग मॉडल के साथ नकारात्मक परिणाम का पालन कैसे किया? "नकारात्मक परिणाम" से आपका क्या तात्पर्य है? जहां तक ​​स्टडी-वाइड टाइप I एरर रेट की बात है, तो ये दो अलग-अलग स्टडीज हैं, जो एक-दूसरे के अलावा कई हफ्तों तक चलती हैं। किसी भी तरह से, मैं खोजपूर्ण डेटा विश्लेषण करने में विश्वास करता हूं, इसलिए मुझे नहीं लगता कि अभ्यास में पी-मान "सही" हैं या हमें उनसे "पूरी तरह से सही होने" की उम्मीद करनी चाहिए। " अगर लोग केवल उन्हीं परीक्षणों के बारे में सोचते थे जो पहले से सोचा करते थे, तो हम बहुत से महान निष्कर्षों को याद करेंगे जो दुर्घटना से हुए थे - और हम टन डेटा बर्बाद कर रहे थे।
मार्क व्हाइट

2
p

1
2. हाँ, लेकिन आप अध्ययन 2 के लिए अलग-अलग पुजारियों के साथ समाप्त होंगे, जो कि इस विचार में इतनी विश्वसनीयता डालने के साथ समाप्त नहीं हुआ कि अध्ययन 1 सटीक था।
कोडियालॉजिस्ट

1
1. समस्या यह नहीं है कि आपने अधिक डेटा एकत्र किया और इसका विश्लेषण किया, बल्कि यह कि आपने दोनों अध्ययनों के डेटा को एक नए मॉडल के साथ एकीकृत किया है (क्योंकि एक नए भविष्यवक्ता के साथ) आपने पहली बार दूसरे डेटासेट का विश्लेषण करते हुए नकारात्मक परिणाम प्राप्त किए हैं। मैंने कभी यह मानने का कारण नहीं देखा है कि महत्व-परीक्षण वास्तव में उपयोगी है, लेकिन जो लोग मानते हैं उनमें से अधिकांश को लगता है कि महत्व-परीक्षण के बारे में सभी प्रमेय हैं जो इसकी उपयोगिता का समर्थन करते हैं, और सभी प्रमेयों की तरह प्रमेयों की आवश्यकता होती है अपने निष्कर्ष प्राप्त करने के लिए कुछ परिसर।
कोडियालॉजिस्ट

1
@Kodiologist - अगर आपको नहीं लगता कि महत्व परीक्षण कभी उपयोगी है, तो आप किस आधार पर (उदाहरण के लिए) उस शोधकर्ता पर संदेह करते हैं, जो यह निष्कर्ष निकालता है कि ज्यादातर लोगों की नीली आँखें होने की संभावना है, क्योंकि सभी ने अपने दो के नमूने में किया था?
ओबी 2.0

4

मैंने सोचा कि मैं एक अलग, लेकिन शैलीगत समस्या के साथ ग्राफ़ की एक श्रृंखला बना सकता हूं, आपको यह दिखाने के लिए कि फ़्रीक्वेंटिस्ट से बायेसियन विधियों तक जाने के लिए खतरनाक क्यों हो सकता है और सारांश आँकड़ों का उपयोग करके समस्याएं क्यों पैदा कर सकता है।

अपने उदाहरण का उपयोग करने के बजाय, जो बहुआयामी है, मैं इसे दो अध्ययनों के साथ एक आयाम में कटौती करने जा रहा हूं, जिसका आकार तीन अवलोकन और तीन अवलोकन हैं।

1π11+(xθ)2.

मैं इसका उपयोग कर रहा हूं क्योंकि केंद्रीय सीमा प्रमेय लागू नहीं होता है, इसमें पर्याप्त आंकड़ों का अभाव होता है, चरम अवलोकन सामान्य होते हैं, चेचीशेव की असमानता पकड़ में नहीं आती है और सामान्य रूप से व्यावहारिक समाधानों की एक पूरी मेजबानी अलग हो जाती है। मैं इसका उपयोग कर रहा हूं क्योंकि यह बहुत अधिक उदाहरणों के लिए बनाता है बिना समस्या के बहुत काम करता है।

{5,1,4}{1.5,1,.5}±669σ±3σ

दो अलग-अलग अध्ययनों के पीछे घनत्व है बायेसियन सिपाही पोस्टेरीर्स

जैसा कि स्पष्ट रूप से स्पष्ट है, नमूना से सारांश आँकड़े लेना अविश्वसनीय रूप से भ्रामक हो सकता है। यदि आप अच्छे, अनमॉडल, अच्छी तरह से परिभाषित और नामित घनत्वों को देखने के लिए उपयोग किए जाते हैं, तो यह जल्दी से बायेसियन टूल के साथ दरवाजे से बाहर जा सकता है। इसके जैसा कोई नामांकित वितरण नहीं है, लेकिन आप इसे निश्चित रूप से सारांशित आंकड़ों के साथ वर्णन कर सकते हैं कि आपने इसे देखा नहीं था। एक सारांश सांख्यिकीय का उपयोग करना एक समस्या हो सकती है यदि आप तब उपयोग करने जा रहे हैं ताकि एक नया पूर्व निर्माण किया जा सके।

दोनों नमूनों के लिए फ़्रीक्वेंटिस्ट विश्वास वितरण समान हैं। क्योंकि स्केल ज्ञात है, केवल अज्ञात पैरामीटर माध्यिका है। तीन के एक नमूना आकार के लिए, माध्य एमयूयूई है। जबकि कॉची वितरण का कोई मतलब या भिन्नता नहीं है, मध्यिका का नमूना वितरण करता है। यह अधिकतम संभावना अनुमानक की तुलना में कम कुशल है, लेकिन यह मुझे गणना करने के लिए कोई प्रयास नहीं करता है। बड़े नमूना आकारों के लिए रोथेनबर्ग की विधि एमवीयूई है और मध्यम नमूना आकार के समाधान भी हैं।

फ़्रीक्वेंटिस्ट वितरण के लिए, आपको मिलता है बार-बार विश्वास का वितरण।

Pr(x|θ)Pr(θ|x)

फ़्रीक्वेंटिस्ट वितरण नमूना आकार तीन ड्रॉ का एक अनंत दोहराव मानता है और नमूना मध्यस्थों के वितरण के लिए सीमित वितरण दिखाता है। बायेसियन वितरण को दिया जाता है, इसलिए यह केवल देखे गए नमूने पर निर्भर करता है और इस नमूने के अच्छे या बुरे गुणों की उपेक्षा करता है। दरअसल, बेयसियन तरीकों के लिए नमूना असामान्य है और इसलिए इसके बारे में एक मजबूत निष्कर्ष बनाने के लिए किसी को भी विराम दिया जा सकता है। यही कारण है कि पीछे इतना व्यापक है, नमूना असामान्य है। फ़्रीक्वेंटिस्ट विधि असामान्य नमूनों के लिए नियंत्रित कर रही है, जबकि बायेसियन नहीं है। यह विकृत मामला बनाता है जहां स्केल पैरामीटर की अतिरिक्त निश्चितता फ़्रिक्वेंटिस्ट समाधान को बताती है, लेकिन बेयसियन को चौड़ा करती है।x

संयुक्त पोस्टीरियर दोनों पोस्टीरियर का गुणन है और गुणन की संबद्धता से, यह कोई फर्क नहीं पड़ता कि आप किस क्रम का उपयोग करते हैं। नेत्रहीन, संयुक्त पोस्टीरियर है जॉइंट और सेपरेट पोस्टेरीयर्स

यह स्पष्ट है कि आपने डाकियों पर कुछ सरलीकृत वितरण लगाया था और उनके सारांश आंकड़ों का उपयोग किया था, तो आपको संभवतः एक अलग उत्तर मिलेगा। वास्तव में, यह एक बहुत ही अलग जवाब हो सकता था। यदि एक अध्ययन के लिए 70% विश्वसनीय क्षेत्र का उपयोग किया जाता है, तो इसका परिणाम एक कटे हुए विश्वसनीय क्षेत्र के रूप में होता है। डिस्कनेक्ट किए गए अंतराल का अस्तित्व बायेसियन विधियों में कभी-कभी होता है। उच्चतम घनत्व अंतराल का ग्राफिक और अध्ययन के लिए सबसे कम घनत्व वाला अंतराल हैएचडीआर बनाम एलडीआर

आप देखेंगे कि एचडीआर एक क्षेत्र के एक ज़ुल्फ़ से टूट गया है जो विश्वसनीय सेट के बाहर है।

जबकि इनमें से कई समस्याएं आमतौर पर प्रतिगमन के साथ बड़े सेटों में गायब हो जाती हैं, तो मैं आपको एक प्राकृतिक अंतर का उदाहरण देता हूं कि कैसे बायेसियन और फ़्रीक्विंटिस्ट तरीके रिग्रेशन में लापता चर को अलग तरीके से संभाल लेंगे।

एक लापता चर, मौसम के साथ एक अच्छी तरह से निर्मित प्रतिगमन पर विचार करें। आइए हम मान लें कि ग्राहक बारिश के दिनों और धूप के दिनों में अलग व्यवहार करते हैं। यदि वह अंतर पर्याप्त है तो आसानी से दो बायेसियन पोस्टीरियर मोड हो सकते हैं। एक मोड सनी व्यवहार को दर्शाता है, दूसरा बारिश का। आप नहीं जानते कि आपके पास दो मोड क्यों हैं। यह एक सांख्यिकीय रन हो सकता है या यह एक लापता डेटा बिंदु हो सकता है, लेकिन या तो आपका नमूना असामान्य है या आपके मॉडल में एक लोप किया गया चर है।

फ़्रीक्वेंटिस्ट समाधान दोनों राज्यों को औसत करेगा और प्रतिगमन लाइन को ऐसे क्षेत्र में डाल सकता है जहां वास्तव में कोई ग्राहक व्यवहार नहीं होता है, लेकिन जो दो प्रकार के व्यवहार का औसत निकालते हैं। यह भी अधोमुखी पक्षपाती होगा। अवशेषों के विश्लेषण में मुद्दों को पकड़ा जा सकता है, खासकर अगर सच्चे संस्करण में एक बड़ा अंतर है, लेकिन यह नहीं हो सकता है। यह अवशिष्ट के उन अजीब चित्रों में से एक हो सकता है जो समय-समय पर क्रॉस-मान्य पर दिखाई देंगे।

तथ्य यह है कि आप एक ही डेटा से दो अलग-अलग पोस्टरी हैं इसका मतलब है कि आपने दोनों को सीधे एक साथ गुणा नहीं किया है। या तो आपने एक फ्रीक्वेंटिस्ट समाधान से एक पोस्टीरियर बनाया जो बायेसियन पोस्टीरियर के साथ एक-से-एक मैप नहीं करता था, या आपने सारांश आँकड़ों से एक पूर्व बनाया था और संभावना फ़ंक्शन पूरी तरह से सममित नहीं था, जो कि आम है।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.