एक रेखीय प्रतिगमन पूर्वसूचक को जोड़ने से आर वर्ग कम हो जाता है


10

मेरे डेटासेट ( ) में एक आश्रित चर (DV), पाँच स्वतंत्र "आधार रेखा" चर (P1, P2, P3, P4, P5) और एक स्वतंत्र चर (Q) है।N10,000

मैंने निम्नलिखित दो मॉडल के लिए ओएलएस रैखिक रजिस्टर चलाए हैं:

DV ~ 1 + P1 + P2 + P3 + P4 + P5
                                  -> R-squared = 0.125

DV ~ 1 + P1 + P2 + P3 + P4 + P5 + Q
                                  -> R-squared = 0.124

यानी, भविष्यवक्ता Q को जोड़ने से रैखिक मॉडल में बताए गए विचरण की मात्रा में कमी आई है। जहां तक ​​मैं समझता हूं, ऐसा नहीं होना चाहिए

स्पष्ट होने के लिए, ये आर-स्क्वेर्ड मान हैं और आर-स्क्वेर्ड मान समायोजित नहीं हैं।

मैंने Jasp और Python के आँकड़ेस्मोडेल का उपयोग करते हुए R-squared मानों को सत्यापित किया है ।

क्या इस घटना को देखने का कोई कारण है? शायद ओएलएस विधि से संबंधित कुछ?


1
संख्यात्मक मुद्दे? संख्या एक दूसरे के काफी करीब हैं ...

@ user2137591 यह वही है जो मैं सोच रहा हूं, लेकिन मुझे नहीं पता कि इसे कैसे सत्यापित किया जाए। R-squared मानों में पूर्ण अंतर 0.000513569 है, जो छोटा है, लेकिन वह छोटा नहीं है
कै

1
मुझे आशा है कि आप रेखीय बीजगणित जानते हैं: if ऊपर का डिज़ाइन मैट्रिक्स है, तो क्या आप कृपया गणना कर सकते हैं , जहाँ मैट्रिक्स का प्रस्ताव है और मैट्रिक्स निर्धारक है? Xdetएक्सटीएक्सटीdet
शहनाई

8
गुम मानों को स्वत: गिरा दिया जाता है?
जेनेरिक_युसर

1
0.000513569 एक बहुत छोटी संख्या है: यह 0.41 प्रतिशत परिवर्तन है। यह संभवतः एक संख्यात्मक मुद्दा है। क्लैरिनेटिस्ट क्या कहना चाह रहा है कि हो सकता है कि आपके डिज़ाइन मैट्रिक्स की खराब स्थिति संख्या हो और जब यह अंकीय रूप से अस्थिर हो ...

जवाबों:


25

क्या ऐसा हो सकता है कि आपके पास गायब मूल्य हैं Qजो ऑटो-ड्रॉप हो रहे हैं? यह नमूना पर निहितार्थ होगा, जिससे दो प्रतिगमन तुलनीय नहीं होंगे।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.