मुझे एक प्रतिगमन मॉडल दिखाई दे रहा है जो वर्ष-दर-वर्ष स्टॉक इंडेक्स रिटर्न पर पिछड़ रहा है (12 महीने) उसी स्टॉक इंडेक्स का वर्ष-दर-वर्ष रिटर्न, क्रेडिट स्प्रेड (मासिक जोखिम रहित बॉन्ड और कॉर्पोरेट बॉन्ड के बीच अंतर) पैदावार), YoY मुद्रास्फीति की दर और औद्योगिक उत्पादन के YoY सूचकांक।
यह इस प्रकार दिखता है (हालाँकि आप इस मामले में भारत के लिए विशिष्ट डेटा को सब्सक्राइब करेंगे):
SP500YOY(T) = a + b1*SP500YOY(T-12) + b2*CREDITSPREAD(T) +
b4*INDUSTRIALPRODUCTION(T+2) + b3*INFLATION(T+2) + b4*INFLATIONASYMM(T+2)
SP500YOY SP500 इंडेक्स के लिए साल-दर-साल रिटर्न है। इसकी गणना करने के लिए, SP500 मानों की मासिक औसत गणना की जाती है और फिर प्रत्येक महीने के लिए साल-दर-साल रिटर्न में बदल दिया जाता है (यानी Jan'10-Jan'11, Feb'10- Feb'11, Mar'10-Mar'11,।)। व्याख्यात्मक चर पक्ष पर, SP500YOY का 12-महीने का अंतराल मूल्य T और INFLATION और INDUSTRIALPRODUCTION दो अवधि AHEAD के समय CREDITSPREAD के साथ प्रयोग किया जाता है। INFLATIONASYMM एक डमी है कि मुद्रास्फीति 5.0% की सीमा मूल्य से अधिक है या नहीं। कोष्ठक में सूचकांक प्रत्येक चर के लिए समय सूचकांक दिखाता है।
यह मानक ओएलएस रैखिक प्रतिगमन द्वारा अनुमानित है। SP500 के YOY रिटर्न के 1,2 और 3-महीने के पूर्वानुमान के लिए इस मॉडल का उपयोग करने के लिए, किसी को मुद्रास्फीति के लिए 3,4 और 5-महीने के आगे के पूर्वानुमान और औद्योगिक उत्पादन के सूचकांक को उत्पन्न करना होगा। इन पूर्वानुमानों को व्यक्तिगत रूप से प्रत्येक में ARIMA मॉडल को फिट करने के बाद किया जाता है। 1,2 और 3 महीने के लिए क्रेडिटस्प्रेड पूर्वानुमान केवल मानसिक अनुमानों के रूप में फेंके गए हैं।
मैं यह जानना चाहूंगा कि क्या यह ओएलएस रैखिक प्रतिगमन सही / गलत, कुशल / अक्षम या आमतौर पर मान्य सांख्यिकीय अभ्यास है।
पहली समस्या जो मुझे दिख रही है, वह है ओवरलैपिंग डेटा का उपयोग करना। यानी स्टॉक इंडेक्स के दैनिक मूल्यों को हर महीने औसत किया जाता है, और फिर वार्षिक रिटर्न की गणना की जाती है जो मासिक रूप से लुढ़का होता है। यह त्रुटि शब्द को स्वतः संबद्ध कर देना चाहिए। मुझे लगता है कि निम्नलिखित में से किसी एक की तर्ज पर कुछ 'सुधार' का उपयोग करना होगा:
- व्हाइट की विषमलैंगिकता सुसंगत सहसंयोजक अनुमानक
- Newey और West heteroscedasticity और autocorrelation सुसंगत (HAC) अनुमानक
- हेंसन एंड होड्रिक की हेटेरोसाडेसिटी-सुसंगत संस्करण
क्या इस तरह के अतिव्यापी डेटा के लिए मानक ओएलएस रेखीय प्रतिगमन (किसी भी सुधार के बिना) को लागू करने के लिए वास्तव में समझ में आता है, और इसी तरह, एसपी 500 -वाय पूर्वानुमान के लिए मूल ओएलएस रैखिक प्रतिगमन में उपयोग करने के लिए व्याख्यात्मक चर के लिए 3-पीरियड से पहले एआरआईएमए पूर्वानुमान का उपयोग करें? मैंने पहले ऐसा रूप नहीं देखा है, और इसलिए अतिव्यापी टिप्पणियों के उपयोग के लिए सही करने के अपवाद के बिना, वास्तव में इसका न्याय नहीं कर सकता।