गैलीट श्मुइली के "टू एक्सप्लेन ऑर प्रेडिक्ट " (2010) को पढ़कर मैं एक स्पष्ट विरोधाभास से हैरान हूँ। तीन परिसर हैं,
- AIC- बनाम BIC- आधारित मॉडल की पसंद (पृष्ठ 300 का अंत - p। 301 की शुरुआत): सीधे शब्दों में कहें तो AIC को भविष्यवाणी के लिए बनाए गए मॉडल का चयन करने के लिए उपयोग किया जाना चाहिए जबकि BIC का उपयोग स्पष्टीकरण के लिए एक मॉडल का चयन करने के लिए किया जाना चाहिए । इसके अतिरिक्त (उपरोक्त पेपर में नहीं), हम जानते हैं कि कुछ शर्तों के तहत BIC उम्मीदवार मॉडल के सेट के बीच सही मॉडल का चयन करता है ; सच्चा मॉडल वह है जो हम व्याख्यात्मक मॉडलिंग (पी। 293 के अंत) में चाहते हैं।
- सरल अंकगणित: एआईसी बनाम बीआईसी में विभिन्न जटिलता दंड के कारण आकार 8 या बड़े (संतोषजनक के नमूनों के लिए AIC BIC से बड़े मॉडल का चयन करेगा ।
- "सही" मॉडल (यानी सही regressors और सही कार्यात्मक रूप लेकिन अपूर्ण अनुमान गुणांक के साथ मॉडल) भविष्यवाणी के लिए सबसे अच्छा मॉडल नहीं हो सकता है (पी 307।): एक लापता भविष्यवक्ता के साथ एक प्रतिगमन मॉडल एक बेहतर पूर्वानुमान मॉडल हो सकता है - गुमशुदा भविष्यवक्ता के कारण पूर्वाग्रह का परिचय अनुमान की कमी के कारण विचरण में कमी से कम हो सकता है।
अंक 1. और 2. सुझाव देते हैं कि बड़े मॉडल भविष्यवाणी से अधिक बेहतर मॉडल के लिए बेहतर हो सकते हैं। इस बीच, बिंदु 3. एक विपरीत उदाहरण देता है जहां एक बड़ा मॉडल की तुलना में अधिक प्रशस्त मॉडल भविष्यवाणी के लिए बेहतर है। मुझे यह गुदगुदी लगती है।
प्रशन:
- अंक {1 के बीच स्पष्ट विरोधाभास कैसे हो सकता है। और 2.} और 3. समझाया / हल किया जा सकता है?
- बिंदु 3 के प्रकाश में, क्या आप इस बात के लिए एक सहज स्पष्टीकरण दे सकते हैं कि AIC द्वारा चुना गया एक बड़ा मॉडल वास्तव में BIC द्वारा चुने गए अधिक प्रशंसनीय मॉडल की तुलना में भविष्यवाणी के लिए बेहतर क्यों है?