मॉडल चयन में एआईसी और पी-वैल्यू की समानता


9

इस सवाल के जवाब के लिए एक टिप्पणी में , यह कहा गया था कि मॉडल चयन में एआईसी का उपयोग करना 0.154 के पी-मूल्य का उपयोग करने के बराबर था।

मैंने इसे R में आज़माया, जहाँ मैंने एक "बैकवर्ड" सब्मिट सिलेक्शन अल्गोरिद्म का इस्तेमाल किया, जिसमें एक फुल स्पेसिफिकेशन से वेरिएबल को बाहर किया गया। सबसे पहले, क्रमिक रूप से चर को उच्चतम पी-मूल्य के साथ बाहर फेंकना और रोकना जब सभी पी-मान 0.154 से नीचे हैं और दूसरी बात, चर को गिराने से जिसके परिणामस्वरूप सबसे कम एआईसी हो जाता है जब तक कोई सुधार नहीं किया जा सकता है।

यह पता चला कि वे लगभग उसी परिणाम देते हैं जब मैं थ्रेशोल्ड के रूप में 0.154 के पी-मूल्य का उपयोग करता हूं।

क्या यह वास्तव में सच है? यदि हां, तो क्या किसी को पता है कि वह एक स्रोत का संदर्भ क्यों दे सकता है या उसे समझाता है?

PS मैं टिप्पणी करने वाले व्यक्ति से पूछ नहीं सकता या टिप्पणी नहीं लिख सकता, क्योंकि अभी साइन अप किया गया है। मुझे पता है कि यह मॉडल चयन और अनुमान आदि के लिए सबसे उपयुक्त दृष्टिकोण नहीं है।


(1) लॉजिस्टिक रिग्रेशन एनालिसिस के साथ प्रोग्नोमेटिक मॉडलिंग: छोटे डेटा सेट में चयन और आकलन के तरीकों की तुलना। चिकित्सा में आंकड़े, 19, 1059-1079 (2) df1 वाले वेरिएबल्स के लिए सही हैं, जो कि aic परिभाषा पर आधारित हैं। लेकिन कम भी हो सकती है, तो चर की स्वतंत्रता अधिक की अपनी डिग्री
चार्ल्स

जवाबों:


13

सांख्यिकीय परीक्षण या एआईसी का उपयोग करके किया गया परिवर्तनीय चयन अत्यधिक समस्याग्रस्त है। यदि उपयोग कर रहे हैंχ2 परीक्षण, एआईसी के कटऑफ का उपयोग करता है χ2= 2.0 जो मेल खाती है α=0.157। एआईसी जब अलग-अलग वैरिएबल पर उपयोग किया जाता है तो कुछ भी नया नहीं होता है; यह सिर्फ एक अधिक उचित उपयोग करता हैα0.05 की तुलना में। एक अधिक उचित (कम अनुमान-परेशान)α 0.5 है।


+1 मैंने अपने (अब हटाए गए) उत्तर को बनाने में इतना लंबा समय बिताया, मैंने यह भी नहीं देखा कि इस बीच कोई पोस्ट किया था। मैंने इसके बजाय सिर्फ एक वोट दिया होगा।
Glen_b -Reinstate मोनिका
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.