पूर्ववर्ती पूर्वानुमान जांच क्या हैं और क्या उन्हें उपयोगी बनाती हैं?


33

मैं समझता हूं कि पोस्टीरियर प्रेडिक्टिव डिस्ट्रीब्यूशन क्या है और मैं पोस्टीरियर प्रेडिक्टिव चेक के बारे में पढ़ रहा हूं , हालांकि यह मेरे लिए स्पष्ट नहीं है कि यह अभी तक क्या है।

  1. वास्तव में पश्चगामी पूर्वानुमान क्या है?
  2. क्यों कुछ लेखकों का कहना है कि पोस्टीरियर प्रेडिक्टिव चेक चलाना "डेटा का दो बार उपयोग करना" है और इसका दुरुपयोग नहीं होना चाहिए? (या यह भी कि यह बायेसियन नहीं है)? (जैसे यह देखें या यह )
  3. यह जाँच किसके लिए बिल्कुल उपयोगी है? क्या वास्तव में इसका उपयोग मॉडल चयन के लिए किया जा सकता है? (जैसे यह दोनों फिटनेस और मॉडल जटिलता का कारक है?)

जवाबों:


36

पोस्टीरियर प्रेडिक्टिव चेक सरल शब्दों में, "फिट किए गए मॉडल के तहत प्रतिकृति डेटा का अनुकरण करना और फिर इनका अवलोकन डेटा से तुलना करना है" ( गेलमैन और हिल, 2007, पृष्ठ 158 )। तो, आप "वास्तविक और सिम्युलेटेड डेटा के बीच व्यवस्थित विसंगतियों की तलाश" के लिए पूर्ववर्ती भविष्यवाणियों का उपयोग करते हैं ( गेलमैन एट अल। 2004, पी। 169 )।

"दो बार डेटा का उपयोग करने" के बारे में तर्क यह है कि आप मॉडल का अनुमान लगाने के लिए अपने डेटा का उपयोग करते हैं और फिर, यह जांचने के लिए कि क्या मॉडल डेटा फिट बैठता है, जबकि आम तौर पर यह एक बुरा विचार है और बाहरी डेटा पर अपने मॉडल को मान्य करना बेहतर होगा। , इसका उपयोग अनुमान के लिए नहीं किया गया था।

यदि आपकी मॉडल आपको वास्तविकता के बारे में "मान्य" भविष्यवाणियां देती है, तो यह अनुमान लगाने में सहायक होती है कि वे प्रेक्षित डेटा को फिट करती हैं या नहीं। यह मॉडल निर्माण और जाँच का एक सहायक चरण है। यदि आपका मॉडल "ठीक" है या यदि यह "बेहतर" है, तो अन्य मॉडल पर यह निश्चित जवाब नहीं देता है, हालांकि, यह जांचने में आपकी मदद कर सकता है कि क्या आपका मॉडल समझ में आता है।

यह अच्छी तरह से वर्णन किया गया है LaplacesDemon शब्दचित्र बायेसियन निष्कर्ष :

भविष्य कहनेवाला वितरण की तुलना करना yप्रतिनिधि देखे गए डेटा के लिए yको आम तौर पर "पोस्टीरियर प्रिडिक्टिव चेक" कहा जाता है। इस प्रकार की जांच में मॉडल के अनुमानित मापदंडों से जुड़ी अनिश्चितता शामिल होती है, अक्सर आंकड़ों के विपरीत।

पोस्टीरियर प्रेडिक्टिव चेक (भविष्य कहनेवाला वितरण के माध्यम से) में डेटा का दोहरा उपयोग शामिल है, जो संभावना सिद्धांत का उल्लंघन करता है। हालांकि, पश्चवर्ती भविष्यवाणियों की जाँच के पक्ष में तर्क दिए गए हैं, बशर्ते कि उपयोग मॉडल की पर्याप्तता का अध्ययन करने के लिए विसंगति के उपायों तक सीमित है, मॉडल तुलना और अनुमान के लिए नहीं (मेंग 1994)।

तुलना करने के लिए जेलमैन सबसे बुनियादी स्तर पर सिफारिश करता है yप्रतिनिधि सेवा मेरे yकिसी भी व्यवस्थित अंतर की तलाश में, जो मॉडल की संभावित विफलताओं का संकेत दे सकता है (जेलमैन एट अल। 2004, पी। 159)। अक्सर ग्राफिकल प्लॉटों की तुलना करने की सिफारिश की जाती है, जैसे कि वितरण y तथा yप्रतिनिधि


3
आपके विषय में कि PPC बेयसियन नहीं हो सकता है, ध्यान दें कि Gelman बहुत चर्चा करता है कि वास्तव में एक Bayesian / बायेसियन डेटा विश्लेषण Gelman और Shalizi क्या है
N Brouwer

2
गेलमैन और शालिज़ी चर्चा करते हैं कि बायेसियन डेटा विश्लेषण उनके दृष्टिकोण के अनुसार क्या है । वहाँ से बाहर देखने के कई अलग-अलग बिंदु हैं, सभी अच्छी तरह से प्रेरित हैं - जेफरीज़ से सैवेज तक, डे फिनेट्टी से लेकर गैफ़मैन, स्कॉट और क्रूस एंड हेल्परिन , डेम्प्सटर -शफ़र जैसे विचारों को और भी अलग-अलग उल्लेख करने के लिए नहीं ।
pglpm
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.