स्टेन बनाम गेलमैन-रूबिन परिभाषा


16

मैं स्टेन प्रलेखन से गुजर रहा था जिसे यहाँ से डाउनलोड किया जा सकता है । मुझे गेलमैन-रुबिन डायग्नोस्टिक के उनके कार्यान्वयन में विशेष रूप से दिलचस्पी थी। मूल पेपर गेलमैन एंड रुबिन (1992) संभावित स्केल रिडक्शन फैक्टर (PSRF) को निम्नानुसार परिभाषित करता है:

चलो हो वें मार्कोव श्रृंखला नमूना है, और वहाँ समग्र रहने दो स्वतंत्र नमूना जंजीरों। Let \ bar {X} _ {i \ cdot} का अर्थ i वें श्रृंखला से है, और \ bar {X} _ {\ _ cdot \ cdot} का अर्थ समग्र होना चाहिए। परिभाषित करें, W = \ dfrac {1} {M} \ sum_ {m = 1} ^ {M} {s ^ 2_m}, जहां s ^ 2_m = \ dfrac {1} {N-1} \ sum_ {t = 1 } ^ {N} (\ bar {X} _ {mt} - \ bar {X} _ {m \ cdot}) 2 \ _:। और B B = \ dfrac {N} {M-1} \ sum_ {m = 1} ^ {M} (\ bar {X} _ {m \ _ cdot} - \ bar {X} _ {\ _ cdot \ cdot] परिभाषित करें }) ^ 2 \ _। मैं एम ˉ एक्स मैं मैं ˉ एक्स डब्ल्यू = 1Xi,1,,Xi,NiMX¯iiX¯रों 2 मीटर =1

W=1Mm=1Msm2,
बी बी = एन
sm2=1N1t=1N(X¯mtX¯m)2.
B
B=NM1m=1M(X¯mX¯)2.

परिभाषित करें

V^=(N1N)W+(M+1MN)B.
PSRF का अनुमान R^ जहां
R^=V^Wdf+3df+1,
जहाँ df=2V^/Var(V^)

पृष्ठ 349 पर स्टेन प्रलेखन df के साथ इस शब्द को अनदेखा करता है dfऔर (M+1)/M गुणक शब्द को भी हटा देता है । यह उनका सूत्र है,

विचरण आकलनकर्ता

var^+(θ|y)=N1NW+1NB.
अंत में, संभावित स्केल रिडक्शन स्टैटिस्टिस्टिक को " हैट {R} = \ sqrt {\ frac {\ widehat {\ text {var}} ^ {+} (\ theta \; | \ _, y)} {W}} द्वारा परिभाषित किया गया है।
R^=var^+(θ|y)W.

जो मैं देख सकता था, वे सूत्र के इस परिवर्तन के लिए एक संदर्भ प्रदान नहीं करते हैं, और न ही वे इस पर चर्चा करते हैं। आमतौर पर बहुत बड़ा नहीं होता है, और अक्सर रूप में कम हो सकता है , इसलिए को अनदेखा नहीं किया जाना चाहिए, भले ही शब्द 1 के साथ अनुमानित किया जा सकता है।M2(M+1)/Mdf

तो यह सूत्र कहाँ से आता है?


संपादित करें: मुझे इस प्रश्न का आंशिक उत्तर मिला है कि " यह सूत्र कहाँ से आता है? ", जिसमें गेलमैन, कार्लिन, स्टर्न और रुबिन (दूसरा संस्करण) बायेसियन डेटा एनालिसिस पुस्तक का एक ही सूत्र है। हालांकि, पुस्तक यह नहीं बताती है कि उन शर्तों को अनदेखा करना कैसे / क्यों उचित है?


अभी तक इस पर कोई प्रकाशित पेपर नहीं आया है, और सूत्र शायद अगले कुछ महीनों में वैसे भी बदल जाएगा।
बेन गुडरिक

@BenGoodrich टिप्पणी के लिए धन्यवाद। क्या आप इस सूत्र का उपयोग करने की प्रेरणा पर कुछ और कह सकते हैं? और वास्तव में सूत्र क्यों बदलेगा?
ग्रीनपार्क

1
वर्तमान विभाजन आर-हैट फार्मूला है जिस तरह से यह ज्यादातर उस मामले पर लागू होता है जहां केवल एक श्रृंखला होती है। आने वाले परिवर्तन ज्यादातर इस तथ्य से निपटने के लिए हैं कि अंतर्निहित सीमांत वितरण सामान्य नहीं हो सकता है या इसका मतलब और / या विचरण हो सकता है।
बेन गुडरिक

1
@BenGoodrich हाँ, मुझे लगता है कि क्यों STAN विभाजन Rhat करता है। लेकिन उस मामले में भी , और इसलिए स्थिरांक जो कि आग्नेय नहीं है। M=2(M+1)/M=3/2
ग्रीनपार्क

जवाबों:


4

मैंने गेलमैन एंड रुबिन (1992) के लिए दिए गए विशिष्ट लिंक का अनुसरण किया और इसमें बाद के संस्करणों में, के साथ बदल दिया में ब्रूक्स और Gelman (1998) और साथ BDA2 में (Gelman एट अल, 2003) और BDA3 (Gelman एट अल, 2013)।

σ^=n1nW+1nB
σ^σ^+var^+

BDA2 और BDA3 (अभी जांच नहीं कर सकते हैं BDA1) ने संकेत के साथ एक अभ्यास किया है ताकि यह दिखाया जा सके कि वांछित मात्रा का निष्पक्ष अनुमान है।var^+

जेलमैन एंड ब्रूक्स (1998) में समीकरण 1.1 जिसे " रूप में पुन: व्यवस्थित किया जा सकता है हम देख सकते हैं कि बड़े होने पर निर्णय लेने के लिए दूसरे और तीसरे शब्द का प्रभाव नगण्य है। ब्रूक्स एंड गेलमैन (1998) में धारा 3.1 से पहले पैराग्राफ में चर्चा भी देखें।

R^=m+1mσ^+Wn1mn,
R^=σ^+W+σ^+Wmn1mn.
n

गेलमैन एंड रुबिन (1992) का भी df / df-2 के रूप में df के साथ कार्यकाल था। ब्रूक्स एंड गेलमैन (1998) में एक अनुभाग है, जिसमें बताया गया है कि यह df corretion गलत क्यों है और परिभाषित (df + 3) / (df + 1)। ब्रूक्स एंड जेलमैन (1998) में धारा 3.1 से पहले का पैराग्राफ बताता है कि (d + 3) / (d + 1) को क्यों छोड़ा जा सकता है।

ऐसा लगता है कि समीकरणों के लिए आपका स्रोत कुछ पोस्ट ब्रूक्स एंड जेलमैन (1998) था जैसा कि आपने (डी + 3) / (डी + 1) वहां और जेलमैन और रुबिन (1992) ने डीएफ / डीएफ (-2) किया था। अन्यथा गेलमैन और रुबिन (1992) और ब्रूक्स एंड गेलमैन (1998) में समतुल्य समीकरण हैं (थोड़ा अलग अंकन और कुछ शब्दों को अलग तरीके से व्यवस्थित किया गया है)। BDA2 (गेलमैन, एट अल।, 2003) के पास अब कोई शब्द नहीं हैं । बीडीए 3 (गेलमैन एट अल।, 2003) और स्टेन ने स्प्लिट चेन वर्जन पेश किया।σ^+Wmn1mn

विभिन्न संस्करणों का उपयोग करते हुए कागजात और अनुभवों की मेरी व्याख्या यह है कि जिन शब्दों को अंततः गिरा दिया गया है, उन्हें अनदेखा किया जा सकता है जब बड़ा है, तब भी जब नहीं है। मैं वर्षों पहले एंड्रयू जेलमैन के साथ इस पर चर्चा करना भी याद करता हूं, लेकिन यदि आप इतिहास के बारे में निश्चित होना चाहते हैं, तो आपको उनसे पूछना चाहिए।R^nm

आमतौर पर एम बहुत बड़ा नहीं है, और अक्सर 2 के रूप में कम हो सकता है

मैं वास्तव में आशा करता हूं कि यह अक्सर ऐसा नहीं होता है। ऐसे मामलों में जहां आप विभाजन- अभिसरण निदान का उपयोग करना चाहते हैं, आपको कम से कम 4 श्रृंखलाओं के विभाजन का उपयोग करना चाहिए और इस प्रकार = 8 = 8 होना चाहिए। आप कम श्रृंखलाओं का उपयोग कर सकते हैं, यदि आप पहले से ही जानते हैं कि आपके विशिष्ट मामलों में अभिसरण और मिश्रण तेज है।R^

अतिरिक्त संदर्भ:

  • ब्रूक्स और गेलमैन (1998)। कम्प्यूटेशनल और ग्राफिकल स्टैटिस्टिक्स जर्नल, 7 (4) 434-455।

σ^2R^(σ^2+B/mn)/Wdfterm(m+1)/m
ग्रीनपार्क

मैं उलझन में हूं। आपके द्वारा दिए गए लिंक के माध्यम से लेख और स्टेट साइंस वेब पेजों के लेख में केवल पृष्ठ 457-472 हैं। मैंने अभी चेक नहीं किया था, लेकिन सालों पहले और पिछले साल जब मैंने कोडा की जांच की थी, तो इसमें वर्तमान अनुशंसित संस्करण नहीं था।
अकी वेहतरारी

ध्यान दें कि मैंने अपना उत्तर संपादित किया। गेलमैन एंड ब्रूक्स (1998) ने कहा है कि (m + 1) / m शब्द अधिक स्पष्ट रूप से है, और ऐसा लगता है कि आपने अंतिम शब्द को याद किया है जो निर्णय लेने के लिए (m + 1) / m शब्द के प्रभाव को रद्द करता है। खंड 3.1 से पहले उस पैराग्राफ को देखें।
अकी वेहतरारी

इसके बारे में क्षमा करें, वह एक टाइपो था। यह पृष्ठ 465 है, और जेलमैन और रुबिन की ब्रुक और जेलमैन (जो आप ऊपर बता रहे हैं) के समान सटीक परिभाषा है। ब्रूक्स और गेलमैन में समीकरण 1.1 बिल्कुल वही है जो मैंने नीचे लिखा था (जब आप कुछ शर्तों को पुनर्व्यवस्थित करते हैं)।
ग्रीनपार्क

"हम देख सकते हैं कि दूसरे और तीसरे कार्यकाल का प्रभाव निर्णय लेने के लिए नगण्य है जब n बड़ा होता है", इसलिए आप जो कह रहे हैं वह यह है कि BDA में अभिव्यक्ति और इसलिए STAN बड़े n के लिए इन शब्दों को अनिवार्य रूप से अनदेखा करने से आता है?
ग्रीनपार्क
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.