AIC और श्वार्ज की कसौटी को समझना


13

मैं एक लॉजिस्टिक मॉडल चला रहा हूं। वास्तविक मॉडल डेटासेट के 100 से अधिक चर हैं, लेकिन मैं एक परीक्षण डेटा सेट चुन रहा हूं जिसमें लगभग 25 चर हैं। इससे पहले मैंने एक डेटासेट भी बनाया था जिसमें 8-9 वैरिएबल थे। मुझे बताया जा रहा है कि मॉडल की तुलना करने के लिए एआईसी और एससी मूल्यों का उपयोग किया जा सकता है। मैंने देखा कि मॉडल में चर मान कम होने पर भी SC के मान अधिक थे (उदा। 0053)। मेरे अंतर्ज्ञान के लिए एक मॉडल जिसमें चर महत्व का स्तर होता है, कम SC और AIC मूल्यों में परिणत होना चाहिए। लेकिन ऐसा नहीं हो रहा है। क्या कोई इसे स्पष्ट कर सकता है। संक्षेप में मैं निम्नलिखित प्रश्न पूछना चाहता हूं:

  1. चर की संख्या का SC AIC से कोई लेना-देना नहीं है?
  2. क्या मुझे p मान या कम SC AIC मान पर ध्यान केंद्रित करना चाहिए?
  3. SC AIC मानों को कम करने के विशिष्ट तरीके क्या हैं?

जवाबों:


15

आपके प्रश्न का सटीक तरीके से उत्तर देना काफी कठिन है, लेकिन मुझे लगता है कि आप दो मानदंडों (सूचना मानदंड और पी-मूल्य) की तुलना कर रहे हैं जो समान जानकारी नहीं देते हैं। सभी सूचना मानदंड (एआईसी, या श्वार्ज़ मानदंड) के लिए, वे जितने छोटे होते हैं, वे आपके मॉडल के लिए बेहतर होते हैं (सांख्यिकीय दृष्टिकोण से) क्योंकि वे फिट की कमी और मॉडल में मापदंडों की संख्या के बीच एक व्यापार-बंद को दर्शाते हैं। ; उदाहरण के लिए, एकैके मानदंड पढ़ता है , जहांकश्मीर पी2log()+2kkमापदंडों की संख्या है। हालांकि, एआईसी के विपरीत, एससी सुसंगत है: नमूना आकार बढ़ने पर गलत तरीके से एक बड़ा मॉडल चुनने की संभावना 0 में परिवर्तित हो जाती है। उनका उपयोग मॉडलों की तुलना करने के लिए किया जाता है, लेकिन आप महत्वपूर्ण भविष्यवक्ताओं के साथ एक मॉडल का अवलोकन कर सकते हैं जो खराब फिट (बड़े अवशिष्ट विचलन) प्रदान करते हैं। यदि आप कम एआईसी के साथ एक अलग मॉडल प्राप्त कर सकते हैं, तो यह एक खराब मॉडल का विचारोत्तेजक है। और, यदि आपका नमूना आकार बड़ा है, तो -values ​​अभी भी कम हो सकते हैं जो मॉडल फिट के बारे में अधिक जानकारी नहीं देता है। कम से कम, देखो कि एआईसी केवल एक अवरोधन के साथ मॉडल की तुलना करते समय और कोवरिएट्स वाले मॉडल की तुलना में एक महत्वपूर्ण कमी दिखाता है। हालांकि, यदि आपकी रुचि भविष्यवाणियों के सर्वश्रेष्ठ सबसेट को खोजने में निहित है, तो आपको निश्चित रूप से परिवर्तनशील चयन के तरीकों को देखना होगा।p

मैं दंडित प्रतिगमन को देखने का सुझाव दूंगा , जो ओवरफिटिंग मुद्दों से बचने के लिए चर चयन करने की अनुमति देता है। फ्रैंक हरेल के रिग्रेशन मॉडलिंग रणनीतियों (पी। 207 एफएफ।), या मून्स एट अल। में, दत्तक ग्रहण की अधिकतम संभावना का अनुमान लगाया गया है , जो कि दत्तक ग्रहण के लिए नैदानिक ​​और रोगनिरोधी भविष्यवाणी मॉडल को सीधे समायोजित करने के लिए है: एक नैदानिक ​​उदाहरण , जे क्लिन एपिड (2004) 57। 12)।

यह भी देखें डिजाइन ( lrm) और stepPlr ( step.plr) आर संकुल, या दंडित पैकेज। आप इस एसई पर चर चयन पर संबंधित प्रश्न ब्राउज़ कर सकते हैं ।


हाय chl, थैंक्स द रिप्लाई..मैं मानता हूं कि मुझे आपके जवाब से कुछ जानकारी मिली थी..मुझे अपनी समझ डालिए और फिर आप मुझे कमेंट कर सकते हैं। (1) मुझे एक संकेत मिलता है कि पी मान नीचे जा सकते हैं यदि आपका नमूना आकार बड़ा है ... - क्या ऐसा है ?? मेरी समझ में p मान केवल दिखा सकता है कि उर अशक्त परिकल्पना को खारिज किया गया है या नहीं। (२) मैं अब समझता हूं कि मुझे AIC मूल्यों में अंतर केवल और सहसंयोजकों के साथ देखने की जरूरत है। मुझे लगता है जब हम कहते हैं कि हम कम AIC चाहते हैं तो हम उसी डेटासेट के लिए चाहते हैं। मुझे मेरी टिप्पणी में चरित्र चरित्र छोड़ दिया जा रहा है, इसलिए कृपया जवाब देने के बाद एक बार फिर टिप्पणी करेंगे,
आयुष बियानी २६'१० को

1
@ आयुष (1) परीक्षण के आँकड़े (जैसे वाल्ड) नमूना आकार पर निर्भर करते हैं (बढ़ते नमूना आकार के साथ मानक त्रुटि कम हो जाती है, और आपको बड़े नमूने के साथ कम पी-मान प्राप्त होने की संभावना होती है)। (2) हां, हालांकि एआईसी का उपयोग गैर-नेस्टेड मॉडल की तुलना करने के लिए किया जा सकता है, यहां मैं इसे बढ़ते जटिलता के विभिन्न मॉडलों की तुलना करने के तरीके के रूप में सोच रहा था।
CHL

धन्यवाद फिर से..मैं अब पी मूल्य का सार मिलता है। कुछ 5 मीटर पीछे मैंने एक मॉडल चलाया जो मुझे सभी वैरिएबल के लिए .05 से नीचे p मान दे रहा है लेकिन 28238.407 के AIC केवल इंटरसेप्ट के साथ और 21507.933 कोविरेट के साथ। मेरे पास एक मामला भी है जिसमें AIC 16035.xy है जो केवल इंटरसेप्ट के साथ है और 4234.xy के साथ है। दो मामलों की तुलना में आपकी राय क्या है? कृपया ध्यान दें कि दूसरे मॉडल के २५ संस्करण अलग-अलग थे, जबकि पहले के २० थे। इसलिए दूसरे के पास अधिक चर (२० की तुलना में २५) कम एआईसी था। हालांकि सभी के लिए पी वैल्यू .05 मान हैं। कृपया सुझाव दें..इसके बाद पूछें..धन्यवाद।
आयुष बियानी

@ आयूष यह जानना मुश्किल है कि मॉडल की गुणवत्ता के बारे में यह जानना मुश्किल है कि चर कैसे चुने गए। केवल एक अवरोधन और कुछ सहसंयोजकों सहित एक मॉडल के बीच AIC की खाई आपको उन भविष्यवक्ताओं की "व्याख्यात्मक शक्ति" के बारे में एक संकेत देती है (आपके द्वारा दिखाए गए 2 के मामले में अवशिष्ट भटकाव काफी हद तक कम होता दिख रहा है, और AIC इसके लिए दंडित करता है। # पैरामीटर जैसा कि मैंने अपनी प्रतिक्रिया में कहा था)। यह इन भविष्यवक्ताओं की प्रासंगिकता के बारे में पूर्ण उत्तर नहीं है। मेरा सुझाव है कि आप अपने विशिष्ट अध्ययन के लिए GLM में परिवर्तनीय चयन के बारे में अधिक विशिष्ट प्रश्न (IMO) पूछें
chl

8

SC और AIC को एक साथ ग्रुप करना गलत है । वे बहुत अलग चीजें हैं, भले ही लोग उनका भारी दुरुपयोग करते हैं। एआईसी सार्थक है जब आप चीजों की भविष्यवाणी कर रहे हैं, तो इस परिदृश्य में एससी का उपयोग करने से (हर समय नहीं) गलत परिणाम हो सकते हैं। इसी तरह, अगर आप पार्सिमोनी (ओपेकम रेजर) एससी के सिद्धांत के साथ मॉडल चयन करने में रुचि रखते हैं तो बेहतर है। मैं सैद्धांतिक विवरणों में नहीं जाना चाहता, लेकिन संक्षेप में: SC - पार्सिमोनियस मॉडल के लिए अच्छा है जब आप अपने डेटा को समझाने के लिए सरलतम संभव मॉडल के बराबर कुछ चाहते हैं, एआईसी - जब आप भविष्यवाणी करना चाहते हैं। AIC यह नहीं मानता है कि आपका असली मॉडल उस मॉडल स्थान पर है जहाँ SC करता है।

दूसरे, पी-मान और सूचना मानदंड का एक साथ उपयोग करना भी chl द्वारा समझाया गया भ्रामक हो सकता है ।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.