मेरा एक प्रश्न है कि मुझे लगता है कि बहुत सारे उपयोगकर्ताओं के लिए काफी बुनियादी होगा।
(I) रेखीय प्रतिगमन मॉडल का उपयोग करते हुए Im कई व्याख्यात्मक चर के संबंध की जांच करता है और मेरी प्रतिक्रिया चर और (ii) व्याख्यात्मक चर का उपयोग करके मेरे प्रतिक्रिया चर की भविष्यवाणी करता है।
एक विशेष व्याख्यात्मक चर एक्स मेरे प्रतिक्रिया चर पर हस्ताक्षर करने के लिए प्रभावी ढंग से प्रकट होता है। इस प्रतिक्रियाशील चर X के जोड़े गए मूल्य का परीक्षण करने के लिए मैंने अपने प्रतिक्रिया चर के आउट-ऑफ-सैंपल भविष्यवाणियों के उद्देश्य से दो मॉडलों का उपयोग किया: मॉडल (ए) जिसमें सभी व्याख्यात्मक चर और मॉडल (बी) का उपयोग किया गया था जिसमें सभी चर का उपयोग किया गया था वेरिएबल X को छोड़कर। दोनों मॉडलों के लिए मैं केवल आउट-ऑफ-सैंपल प्रदर्शन की रिपोर्ट करता हूं। ऐसा प्रतीत होता है कि दोनों मॉडल लगभग समान रूप से अच्छे प्रदर्शन करते हैं। दूसरे शब्दों में, व्याख्यात्मक चर एक्स को जोड़ने से आउट-ऑफ-नमूना भविष्यवाणियों में सुधार नहीं होता है। ध्यान दें कि मैंने मॉडल (ए), यानी सभी व्याख्यात्मक चर वाले मॉडल का उपयोग किया है, यह पता लगाने के लिए कि व्याख्यात्मक चर एक्स आपकी प्रतिक्रिया चर को काफी प्रभावित करता है।
मेरा सवाल अब यह है: इस खोज की व्याख्या कैसे करें? सीधा निष्कर्ष यह है कि, भले ही चर एक्स हीन मॉडल का उपयोग करके मेरी प्रतिक्रिया चर को काफी प्रभावित करता है, यह आउट-ऑफ-सैंपल भविष्यवाणियों में सुधार नहीं करता है। हालाँकि, मुझे इस खोज को समझाने में परेशानी हो रही है। यह कैसे संभव हो सकता है और इस खोज के लिए कुछ स्पष्टीकरण क्या हैं?
अग्रिम में धन्यवाद!
अतिरिक्त जानकारी: 'काफी प्रभाव' के साथ मेरा मतलब है कि पैरामीटर अनुमान के उच्चतम 95% पोस्टीरियर घनत्व अंतराल में शामिल नहीं है (एक बाइसियन दृष्टिकोण का उपयोग करके im)। लगातार शब्दों में, यह मोटे तौर पर 0.05 से कम पी-मूल्य होने से मेल खाती है। मैं अपने सभी मॉडल मापदंडों के लिए केवल विसरित (अनइनफॉर्मेटिव) पुजारियों का उपयोग कर रहा हूं। मेरे डेटा में एक अनुदैर्ध्य संरचना है और इसमें लगभग 7000 अवलोकन शामिल हैं। आउट-ऑफ-द-नमूना भविष्यवाणियों के लिए मैंने अपने मॉडल को फिट करने के लिए 90% डेटा का उपयोग किया और 10% डेटा का उपयोग कई प्रतिकृति का उपयोग करके मॉडल का मूल्यांकन करने के लिए किया। यही है, मैंने कई बार ट्रेन-टेस्ट स्प्लिट का प्रदर्शन किया और अंततः औसत प्रदर्शन मैट्रिक्स की रिपोर्ट की।