मैंने पारंपरिक अक्सरवादी सांख्यिकीय डोमेन में पूर्वानुमान मॉडल को मान्य करने के लिए तरीकों और सॉफ्टवेयर के विकास के लिए बहुत समय समर्पित किया है । व्यवहार और शिक्षण में अधिक बायेसियन विचारों को रखने में मुझे गले लगाने के लिए कुछ महत्वपूर्ण अंतर दिखाई देते हैं। सबसे पहले, बेयसियन प्रेडिक्टिव मॉडलिंग विश्लेषक को पूर्व वितरण के बारे में कठिन सोचने के लिए कहता है जो उम्मीदवार सुविधाओं के लिए अनुकूलित किया जा सकता है, और ये पुजारी मॉडल को उनकी ओर खींचेंगे (यानी, विभिन्न पूर्वानुमान सुविधाओं के साथ अलग-अलग मात्रा में दंड के साथ संकोचन / दंड / नियमितीकरण प्राप्त करेंगे) )। दूसरा, "वास्तविक" बायेसियन तरीका एक मॉडल में परिणाम नहीं करता है, लेकिन एक भविष्यवाणी के लिए एक पूरे पोस्टीरियर वितरण होता है।
उन Bayesian सुविधाओं को ध्यान में रखते हुए, ओवरफिटिंग का क्या मतलब है? क्या हमें इसका आकलन करना चाहिए? यदि हां, तो कैसे? जब क्षेत्र के उपयोग के लिए एक बायेसियन मॉडल विश्वसनीय है तो हमें कैसे पता चलेगा? या यह कि एक बिंदू के बाद से एक बिंदु सभी सावधानी देने वाली अनिश्चितताओं के साथ ले जाएगा जब हम उस मॉडल का उपयोग करते हैं जिसे हमने भविष्यवाणी के लिए विकसित किया था?
अगर हम बायेसियन मॉडल को एक ही संख्या में डिस्टिल्ड करने के लिए मजबूर करते हैं तो सोच कैसे बदलेगी, जैसे, पीछे मतलब / मोड / ध्यान जोखिम?
मैं कुछ संबंधित सोच को देखने के लिए यहाँ । एक समानांतर चर्चा यहाँ मिल सकती है ।
फॉलो-अप प्रश्न :: यदि हम पूरी तरह से बायेसियन हैं और डेटा देखने से पहले याजकों के बारे में सोचने में कुछ समय बिताते हैं, और हम एक मॉडल फिट करते हैं जहाँ डेटा की संभावना उचित रूप से निर्दिष्ट की गई थी, तो क्या हम ओवरफिटिंग के संबंध में अपने मॉडल से संतुष्ट होने के लिए मजबूर हैं। ? या क्या हमें ऐसा करने की आवश्यकता है जो हम लगातार दुनिया में करते हैं जहां एक यादृच्छिक रूप से चुने गए विषय की औसत पर अच्छी तरह से भविष्यवाणी की जा सकती है, लेकिन अगर हम एक ऐसे विषय का चयन करते हैं जिसकी बहुत कम भविष्यवाणी है या जिसमें बहुत अधिक अनुमानित मूल्य है, तो प्रतिगमन होगा मतलब के लिए?