क्या BIC एक सच्चे मॉडल को खोजने की कोशिश करता है?


17

यह प्रश्न एक विषय I और कई अन्य के संबंध में संभावित भ्रम को दूर करने का एक अनुवर्ती या प्रयास है, जो AIC और BIC के बीच के अंतर के बारे में थोड़ा कठिन है। इस विषय (पर @Dave Kellen द्वारा एक बहुत अच्छा जवाब में /stats//a/767/30589 ) हम पढ़ते हैं:

आपके प्रश्न का अर्थ है कि AIC और BIC एक ही प्रश्न का उत्तर देने का प्रयास करते हैं, जो कि सत्य नहीं है। एआईसी उस मॉडल का चयन करने की कोशिश करता है जो एक अज्ञात, उच्च आयामी वास्तविकता का सबसे पर्याप्त रूप से वर्णन करता है। इसका मतलब यह है कि वास्तविकता कभी भी उम्मीदवार मॉडल के सेट में नहीं होती है जिसे माना जा रहा है। इसके विपरीत, बीआईसी उम्मीदवारों के सेट के बीच TRUE मॉडल खोजने की कोशिश करता है। मुझे यह धारणा काफी अजीब लगती है कि जिस मॉडल को शोधकर्ताओं ने रास्ते में बनाया था, उसमें से किसी एक में वास्तविकता का तुरंत अनुमान लगाया जाता है। यह बीआईसी के लिए एक वास्तविक मुद्दा है।

नीचे एक टिप्पणी में, @ gui11aume द्वारा, हमने पढ़ा:

(-1) महान विवरण, लेकिन मैं एक चुनौती देना चाहूंगा। @ केवलेन क्या आप इस बात का संदर्भ दे सकते हैं कि BIC के लिए TRUE मॉडल का विचार कहां है? मैं इस पर पड़ताल करना चाहूंगा, क्योंकि इस पुस्तक में लेखक इस बात का पुख्ता प्रमाण देते हैं कि ऐसा नहीं है। - 2711 मई को 21:47 पर gu'11aume

ऐसा लगता है कि यह दावा स्वराज (1978) से किया गया है, हालांकि यह दावा जरूरी नहीं था: एक ही लेखक (@ @ gui11aume लिंक) द्वारा, हम उनके लेख "मल्टीमॉडल इनवेंशन: अंडरस्टैंडिंग एआईसी एंड बीआईसी इन मॉडल सेलेक्शन" ( बर्नहैम और एंडरसन, 2004):

क्या BIC की व्युत्पत्ति एक सच्चे मॉडल के अस्तित्व को मानती है, या, अधिक संकीर्ण रूप से, BIC का उपयोग करते समय सही मॉडल को मॉडल सेट में माना जाता है? (श्वार्ज की व्युत्पत्ति ने इन शर्तों को निर्दिष्ट किया है।) ... उत्तर ... नहीं। यही है, बीआईसी (एक निश्चित बायेसियन अभिन्न के लिए एक अनुमान के आधार के रूप में) यह मानकर बिना व्युत्पन्न किया जा सकता है कि व्युत्पत्ति अंतर्निहित मॉडल सच है (देखें, उदाहरण के लिए कैवानुआघ और 1999 के नीचे; बर्नहैम और एंडरसन 2002: 293-5)। निश्चित रूप से, बीआईसी को लागू करने में, मॉडल सेट में पूर्ण वास्तविकता का प्रतिनिधित्व करने वाला (नोकेन्टिव) सच्चा मॉडल नहीं होना चाहिए। इसके अलावा, बीआईसी-चयनित मॉडल को एक टार्गेट मॉडल (एक आईआईडी नमूने के आदर्शीकरण के तहत) की संभावना में अभिसरण तार्किक रूप से इसका मतलब यह नहीं है कि लक्ष्य मॉडल सही डेटा-जनरेट वितरण होना चाहिए)।

इसलिए, मुझे लगता है कि यह इस विषय पर चर्चा या कुछ स्पष्टीकरण (यदि अधिक की आवश्यकता है) के लायक है। अभी, हमारे पास AIC और BIC के बीच के अंतर के बारे में बहुत ही उच्च मतदान वाले उत्तर के तहत @ gui11aume (धन्यवाद!) से एक टिप्पणी है।


1
प्रश्न को बेहतर तरीके से केंद्रित करने के लिए, एआईसी को शायद शीर्षक से हटा दिया जा सकता है, अगर मैं सही ढंग से समझता हूं, तो यह सवाल इस बारे में है कि क्या सही मॉडल को बीआईसी का उपयोग करते समय उम्मीदवार सेट में होना चाहिए।
जुहो कोक्कल

@ जुहूकोक्कल: मैं सहमत हूं।
इरोसिनिन

4
मेरे लिए नीचे की रेखा यह है कि अधिकांश व्यावहारिक अनुप्रयोगों में बीआईसी अंडरफिटिंग में परिणाम देता है और एआईसी अधिक सटीक रूप से नए डेटा पर मॉडल के हाथ में नहीं होने के संभावित प्रदर्शन का आकलन करता है। लेकिन, यदि आप AIC या BIC का उपयोग करते हैं, यदि आप बीच में से चयन कर रहे हैं, तो कहें, 3 प्रतिस्पर्धी मॉडल / फीचर सेट, जिसके परिणामस्वरूप मॉडल ओवरफिट कर सकता है। एआईसी और बीआईसी सबसे अच्छा काम करते हैं जब संभावित मॉडल की संख्या कम होती है या मॉडल कम संख्या में मापदंडों (जैसे, दंड) से जुड़े होते हैं।
फ्रैंक हरेल

धन्यवाद @Erosennin संदर्भ को खोदने के लिए। मैं अब समझता हूं कि TRUE मॉडल को शामिल करने का विचार कहां से आता है।
gui11aume

@FrankHarrell: क्या आप बता सकते हैं कि "व्यावहारिक अनुप्रयोगों" से आपका क्या मतलब है? अगर मैं बर्नहैम और एंडरसन को सही ढंग से समझता हूं, तो ऐसा लगता है कि डेटा के कम होने पर बीआईसी को परिणाम देना पड़ेगा। जब हमारे पास बहुत अधिक डेटा होता है, तो BIC वास्तव में AIC से अधिक जटिल किसी अर्ध-सच्चे मॉडल की खोज / चयन करेगा। एआईसी और बीआईसी के अलग-अलग "लक्ष्य मॉडल" हैं। आप जो कह रहे हैं, उसका विस्तार मुझे अच्छा लगेगा, यदि केवल मुझे किसी लेख / पुस्तक की ओर इंगित करना है।
इरोसिनिन

जवाबों:


11

श्वार्ज़ द्वारा सूचना मानदंड (1978) को इस विशेषता के साथ डिज़ाइन किया गया था कि यह asymptotically मॉडल को उच्चतर पश्च बाधाओं के साथ चुनता है, अर्थात उच्च संभावना वाले मॉडल को समान पुजारियों के तहत डेटा दिया जाता है। तो मोटे तौर पर जहां "asymptotically समतुल्य" और को है, मॉडल दिया गया पीछे डेटा । मैं यह नहीं देखता कि यह परिणाम मॉडल 1 के सत्य होने पर कैसे निर्भर करेगा (क्या बायेसियन फ्रेमवर्क में भी एक सही मॉडल है)।

पी(1|y)पी(2|y)>1~एसमैंसी(1)<एसमैंसी(2)
~पी(जे|y)जेy

मुझे लगता है कि भ्रम के लिए जिम्मेदार है कि SIC के पास अन्य अच्छी विशेषता है, जो कुछ शर्तों के तहत, यह asymptotically "true" मॉडल का चयन करेगा यदि बाद वाला मॉडल ब्रह्मांड के भीतर है। AIC और SIC दोनों मापदंड के विशेष मामले हैं जहां पैरामीटर अनुमानों की लॉग संभावना है , मापदंडों की संख्या है और नमूना आकार है। जब मॉडल ब्रह्मांड में रेखीय, गाऊसी मॉडल होते हैं, तो यह दिखाया जा सकता है कि हमें आवश्यकता है:

मैंसी()=-2टीएल(θ^;y)+जी(टी)
एल(θ^;y)θ^टी
जी(टी)0जैसा
IC के लिए ऐसे मॉडल का चयन न करना जो सत्य मॉडल से छोटे हो, प्रायिकता एक और IC के लिए एक मॉडल का चयन न करने के लिए करें जो कि एक संभावना वाले सच्चे मॉडल से बड़ा है। हमारे पास वह तो SIC दोनों शर्तों को पूरा करता है जबकि AIC पहली पूरी करता है, लेकिन दूसरी शर्त नहीं। इन सुविधाओं की एक बहुत ही सुलभ प्रदर्शनी और व्यावहारिक प्रभाव की चर्चा के लिए, इस पुस्तक के अध्याय 6 को देखें ।
टीजी(टी)जैसा
जीमैंसी(टी)=2टी,जीएसमैंसी(टी)=lnटीटी

इलियट, जी। और ए। टिमरमन (2016, अप्रैल)। आर्थिक पूर्वानुमान। प्रिंसटन यूनिवर्सिटी प्रेस।

श्वार्ज़, गिदोन। "एक मॉडल के आयामों का अनुमान।" आंकड़ों की व्याख्या 6.2 (1978): 461-464।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.