आर में चरणबद्ध प्रतिगमन - महत्वपूर्ण पी-मूल्य


12

step()आर में स्टेप वाइज रिग्रेशन के लिए फ़ंक्शन द्वारा उपयोग किए जाने वाले महत्वपूर्ण पी-मान क्या है ? मुझे लगता है कि यह 0.15 है, लेकिन क्या मेरी धारणा सही है? मैं महत्वपूर्ण पी-वैल्यू कैसे बदल सकता हूं?


7
R का 'स्टेप' फंक्शन AIC आधारित है।
माइकल एम

7
सबसे अच्छा है कि स्टेप वाइज मॉडल सेलेक्शन रूटीन का इस्तेमाल बिल्कुल न करें। यह समझने के लिए कि क्यों, यह आपको मेरा जवाब पढ़ने में मदद कर सकता है: स्वचालित मॉडल चयन के लिए एल्गोरिदम
गूँग - मोनिका

3
इसके अलावा @ माइकलयर की टिप्पणी: कहने के Descriptionलिए मदद पृष्ठ का हिस्सा ?step, अपनी संपूर्णता में: एआईसी द्वारा एक सूत्र-आधारित मॉडल का चयन करें।
Stephan Kolassa

जवाबों:


27

जैसा कि मैंने आपके अन्य प्रश्न पर अपनी टिप्पणी में बताया है, stepपी-मूल्यों के बजाय एआईसी का उपयोग करता है।

हालांकि, एक के लिए एक एक समय में चर, AIC करता अनुरूप 0.15 की एक पी-मूल्य का उपयोग करने के (या अधिक सटीक होना करने के लिए, .1573):

दो मॉडलों की तुलना करने पर विचार करें, जो एक एकल चर द्वारा भिन्न होते हैं। मॉडल (छोटे मॉडल) और (बड़ा मॉडल) को कॉल करें , और अपने AIC के क्रमशः और ।एम 1 एआईसी 0 एआईसी 1M0M1AIC0AIC1

AIC मानदंड का उपयोग करते हुए, आप बड़े मॉडल का उपयोग करेंगे यदि । यदि । - 2 लॉग एल 0 - ( - 2 लॉग एल 1 ) > 2AIC1<AIC02logL0(2logL1)>2

लेकिन यह एक संभावना अनुपात परीक्षण में केवल आंकड़ा है। विल्क्स के प्रमेय से, हम शून्य को अस्वीकार कर देंगे, यदि आँकड़ा ऊपरी मात्रा "a । इसलिए यदि हम छोटे मॉडल और बड़े के बीच चयन करने के लिए एक परिकल्पना परीक्षण का उपयोग करते हैं, तो हम बड़े मॉडल का चयन करते हैं जब ।χ 2 1 - 2 लॉग एल 0 - ( - 2 लॉग एल 1 ) > सी अल्फाαχ122logL0(2logL1)>Cα

अब एक के 84.27 प्रतिशत पर है । इसलिए, यदि हम बड़े मॉडल का चयन करते हैं, जब इसका आकार AIC होता है, तो यह या पी-मान के साथ अतिरिक्त शब्द के परीक्षण के लिए अशक्त परिकल्पना को खारिज करने से मेल खाता है।χ 2 1 1 - ०.८४३ = 0.157 15.7 %2χ1210.843=0.15715.7%


तो आप इसे कैसे संशोधित करते हैं?

आसान। kपैरामीटर stepको 2 से कुछ और में बदलें । आप इसके बजाय 10% चाहते हैं? इसे 2.7 करें:

qchisq(0.10,1,lower.tail=FALSE)
[1] 2.705543

आप 2.5% चाहते हैं? सेट करें k=5:

qchisq(0.025,1,lower.tail=FALSE)
[1] 5.023886

और इसी तरह।


हालाँकि, हालांकि यह आपके प्रश्न को हल करता है, मैं आपको सलाह देता हूं कि आप अपने अन्य प्रश्न पर फ्रैंक हरेल के उत्तर पर पूरा ध्यान दें, और यहां स्टेपवाइज रिग्रेशन से संबंधित अन्य प्रश्नों पर एक महान कई सांख्यिकीविदों की प्रतिक्रियाओं की खोज करें, जो सलाह बहुत हद तक सही है सामान्य रूप से स्टेप वाइज प्रक्रियाओं से बचने के लिए लगातार।


अच्छी व्याख्या। क्या आप जानते हैं कि यह सामान्य प्रतिगमन टी-परीक्षणों के पी-मूल्यों के लिए लगभग सही होगा या नहीं?
बेन ओगोरेक

सॉरी बेन, मुझे 100% यकीन नहीं है कि "यह" क्या दर्शाता है। क्या आप कह रहे हैं "क्या मैं उपरोक्त दृष्टिकोण का उपयोग कर सकता हूं जहां आपने दिखाया था कि 5% परीक्षण करने के लिए 10% और 2.5% पर परीक्षण कैसे करें?" यदि इसका उत्तर "स्पष्ट रूप से, हाँ" है ... लेकिन अंतिम वाक्य - जो बताता है कि भले ही आप दिखते हैं कि आप कुछ नाममात्र स्तर पर परीक्षण कर रहे हैं, वास्तविक प्रकार मैं त्रुटि दर उनके नाममात्र मूल्यों की तरह कुछ भी नहीं हैं । दूसरे शब्दों में, आप उपयोग करने के लिए एक मान की गणना कर सकते हैं, और यह स्टेपवाइज सेट करने के लिए बराबर होना चाहिए ... लेकिन वास्तविक महत्व का स्तर अभी भी 5% नहीं होगा। यह केवल एक ही है ... (ctd)α=0.05
ग्लेन_ब-मोनिट

(ctd) ... स्टेप वाइज गंभीर समस्याओं का एक समूह। अन्य में पक्षपाती अनुमान और मानक त्रुटियां शामिल हैं जो बहुत छोटे हैं।
Glen_b -Reinstate मोनिका

1
पल-पल समस्याओं को स्टेप वाइज मॉडल के चयन के साथ रखना, मुझे छोटे AIC => .1573 पी-वैल्यू नियम को सामान्य बनाने में दिलचस्पी है। आपके द्वारा वर्णित संभावना अनुपात पी-मूल्य ठीक है, लेकिन आर-एलएम, अनुमान / std.err जैसी दिनचर्या में टी-वितरण की तुलना की जा रही है। यह एक अलग परीक्षा है, और मैं सोच रहा था कि आपका .1573 परिणाम लगभग पकड़ में आ सकता है।
बेन ओगोरेक

2
बेन: हाँ, .1573 एसिम्प्टोटिक (सामान्य पर आधारित है; यह केवल लगभग सही होगा)। मुझे लगता है कि आप लिए स्टेप एआईसी के संगत पी-मूल्य की गणना कर सकते हैं , क्योंकि यह आपकी समस्या में स्वतंत्रता की डिग्री पर निर्भर करेगा (जैसे मुझे लगता है कि यह 200 df के लिए 0.1579 है); एक परिणाम के रूप में आप वांछित वापस करने में सक्षम होना चाहिए । @ निक कि सबसे दिलचस्प है। पहली नज़र में मुझे नहीं लगता कि गणना के बीच कोई सीधा संबंध है - वे समान मात्रा की गणना कर रहे हैं, लेकिन विभिन्न कारणों से। केtk
Glen_b -Reinstate Monica

4

जैसा कि ऊपर कहा गया है, stepR में फ़ंक्शन AIC मानदंड पर आधारित है। लेकिन मुझे लगता है कि पी-वैल्यू से आपका मतलब अल्फा में प्रवेश करना है और अल्फा को छोड़ना है। stepwiseपॉल रुबिन द्वारा लिखित और यहां उपलब्ध फ़ंक्शन का उपयोग करने के लिए आप क्या कर सकते हैं । जैसा कि आप देख सकते हैं कि आपके पास Alpha.to.enter और alpha.to.leave के तर्क हैं, जिन्हें आप बदल सकते हैं। ध्यान दें कि यह फ़ंक्शन मॉडल का चयन करने के लिए एफ-परीक्षण या समकक्ष टी-परीक्षण का उपयोग करता है। इसके अलावा, यह न केवल चरणबद्ध प्रतिगमन को संभाल सकता है, बल्कि आगे के चयन और पिछड़े उन्मूलन के साथ-साथ यदि आप ठीक से तर्कों को परिभाषित करते हैं।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.