"स्टेप वाइज रिग्रेशन" कैसे काम करता है?


11

मैंने प्रोबेट मॉडल को फिट करने के लिए निम्नलिखित आर कोड का उपयोग किया:

p1 <- glm(natijeh ~ ., family=binomial(probit), data=data1)
stepwise(p1, direction='backward/forward', criterion='BIC')

मुझे पता है कि क्या करता है चाहते हैं stepwiseऔर backward/forwardवास्तव में क्या करना है और कैसे चर का चयन?


7
फ्रैंक Harrell (द्वारा कुछ टिप्पणियां stats.stackexchange.com/users/4253/frank-harrell क्यों चरणबद्ध प्रतिगमन बुरा है पर): stata.com/support/faqs/statistics/stepwise-regression-problems

4
बाबाक के लिंक के अलावा, साइट से इस पोस्ट को भी देखें ।
COOLSerdash

3
: फिर भी चरणबद्ध (और पिछड़े और आगे के रूप में अच्छी तरह से) के साथ समस्याओं के बारे में एक और पोस्ट एक कागज मैं दाऊद केसल के साथ लिखा है चरणबद्ध रोक
पीटर Flom

@PeterFlom, इस पत्र को संदर्भित करने के लिए, मुझे उचित उद्धरण को समझने में कुछ समस्याएं हो रही हैं। क्या आप इसे यहाँ सूचीबद्ध कर सकते हैं? धन्यवाद।
doug.numbers

2
@ doug.numbers यह विभिन्न स्थानों पर प्रस्तुत किया गया था और सम्मेलन की कार्यवाही के हिस्से के रूप में प्रकाशित किया गया था। यदि आप Google "फ़्लॉम, कैसेल, स्टेप वाइज" प्राप्त करेंगे, तो आप इसे प्रस्तुत किए गए स्थानों पर ले जा सकते हैं और आप इसे प्रकाशित प्रकाशनों के उद्धरणों को प्रारूपित कर सकते हैं।
पीटर Flom

जवाबों:


10

स्टेप वाइज सिलेक्शन का सिद्धांत

  1. आप अपनी इच्छानुसार सभी चर के साथ एक मॉडल फिट करते हैं। यह आपका वर्तमान सर्वश्रेष्ठ मॉडल है।
  2. आप BIC (या किसी भी) के अनुसार एक चर को हटाते हैं (या एक को जोड़ते हैं, जो कि वर्तमान सर्वोत्तम मॉडल में उपयोग नहीं किए गए चर के बीच है), और प्रत्येक के लिए, आप नए मॉडल को फिट करते हैं, और आप उनकी तुलना करते हैं अन्य कसौटी, जैसे एआईसी )। आपको एक और "वर्तमान सर्वश्रेष्ठ मॉडल" मिलता है।

आप दोहराते हैं 2. जब तक बीआईसी की कोई कमी नहीं होती है। आपके पास केवल BIC का एक स्थानीय न्यूनतम है, जिसका अर्थ है कि आपको चर के सबसेट के सभी संभावित विकल्पों में से सर्वश्रेष्ठ मॉडल नहीं मिल सकता है। लेकिन वैसे भी, आमतौर पर उनमें से बहुत सारे हैं, इसलिए यह बहुत अधिक काम के बिना, थोड़ा सा अनुकूलन करने का एक तरीका है।

विकिपीडिया पर स्टेप वाइज रिग्रेशन और मॉडल का चयन भी देखें ।


5

स्टेप वाइज रिग्रेशन मूल रूप से एक निर्दिष्ट मानदंड (कसौटी के ऊपर आपके उदाहरण में बीआईसी पर आधारित होगा) के आधार पर एक बार कोविरेट्स को जोड़कर / गिराकर प्रतिगमन मॉडल को फिट करता है।

आगे निर्दिष्ट करके आप बता रहे हैं Rकि आप सबसे सरल मॉडल (यानी, एक कोवरिएट) के साथ शुरू करना चाहते हैं और फिर एक ही समय में एक कोवरिएट को जोड़ते हैं केवल उन लोगों को रखते हुए जो मॉडल बीआईसी में सुधार करते हैं।

पिछड़े को निर्दिष्ट करके आप बता रहे हैं Rकि आप पूर्ण मॉडल (यानी, सभी कोवरिएट्स के साथ मॉडल) के साथ शुरू करना चाहते हैं और फिर कोवरिएट्स, एक अटा समय को छोड़ देते हैं, जिसके परिणामस्वरूप बीआईसी में सुधार होता है।

स्टेप वाइज रिग्रेशन एक बहुत ही खतरनाक सांख्यिकीय प्रक्रिया हो सकती है क्योंकि यह एक इष्टतम मॉडल चयन प्रक्रिया नहीं है। यह विधि बहुत खराब मॉडल के चयन का कारण बन सकती है क्योंकि यह आपको कई तुलनाओं जैसी समस्याओं से बचाता नहीं है।


धन्यवाद। और 'पिछड़े / आगे' के बारे में क्या?
महमूद

पिछड़े / आगे के बारे में आपका क्या मतलब है?

R में stpewise () के तरीकों में से एक 'बैकवर्ड / फॉरवर्ड' है! क्या यह दोनों का मेल है?
महमूद

2
ओह सॉरी, अब मैं समझ गया हूं कि आप क्या पूछ रहे हैं। हां, यदि आप दोनों को निर्दिष्ट करते हैं तो यह आगे और पीछे दोनों पर लागू होता है और सबसे अच्छी कसौटी वाले को चुनता है।
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.