R, NA को एक lm () गुणांक के रूप में क्यों लौटाएगा?


32

मैं एक lm()मॉडल को एक डेटा सेट में फिट कर रहा हूं जिसमें वित्तीय तिमाही (Q1, Q2, Q3) के लिए संकेतक शामिल हैं, जो Q4 को डिफ़ॉल्ट बनाते हैं)। का उपयोग करते हुए lm(Y~., data = data) मुझे NAQ3 के लिए गुणांक के रूप में मिलता है , और एक चेतावनी है कि एक चर को विलक्षणताओं के कारण बाहर रखा गया था।

क्या मुझे Q4 कॉलम जोड़ने की आवश्यकता है?

जवाबों:


39

Q3=a×Q1+b×Q2+ca,b,cQ4


1
मैं सहमत हूं ... लगता है कि डमी वैरिएबल परिभाषाओं के साथ एक समस्या है।
डोमिनिक कॉमटिस

14
(+1)। NA अधिक सामान्यतः का अर्थ है कि गुणांक अनुमान योग्य नहीं है। जैसा कि आपने उल्लेख किया है, यह सटीक मिलीभगत के कारण हो सकता है। लेकिन, यह प्रासंगिक मापदंडों (जैसे अगर) का अनुमान लगाने के लिए पर्याप्त टिप्पणियों के न होने के कारण भी हो सकता हैपी>n)। यदि आप भविष्यवाणियाँ श्रेणीबद्ध हैं और आप सहभागिता की शर्तें जोड़ रहे हैं, तो एक NA का अर्थ यह भी हो सकता है कि कारकों के स्तरों के संयोजन के साथ कोई अवलोकन नहीं है।
मैक्रों

2
पी>nकेवल कॉलिनियरिटी का एक विशेष मामला है - यदि भविष्यवाणियों की तुलना में कम अवलोकन हैं, तो कॉलिनियरिटी एक दी गई है। आप बातचीत की शर्तों के बारे में सही हैं, हालाँकि मुझे पूरा यकीन है कि यहाँ क्या नहीं हो रहा है।
मार्टिन ओ'लेरी

चर रैखिक रूप से संबंधित नहीं हैं, क्यू 3 के रूप में = 1 iff Q1 = Q2 = 0। इसके अलावा, stepAIC () का उपयोग करके और उन तीनों चर को शामिल करने के लिए मॉडल को मजबूर करने से कोई समस्या नहीं होती है। इसके अलावा, मेरे पास मोटे तौर पर 3x से चर के लिए टिप्पणियों की संख्या है। मेरा सबसे अच्छा अनुमान है कि वहाँ Q3 और कुछ अन्य चर के बीच कॉलिनियरिटी है, जो मुझे लगता है कि एक stepAIC द्वारा शामिल नहीं है।
फ्रैजियो
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.