मेरे VAR मॉडल स्थिर डेटा की तुलना में गैर-डेटा डेटा के साथ बेहतर काम क्यों कर रहे हैं?


9

मैं फाइनेंशियल टाइम सीरीज़ के डेटा को मॉडल करने के लिए अजगर के स्टैटमोडेल्स VAR लाइब्रेरी का उपयोग कर रहा हूं और कुछ परिणामों ने मुझे हैरान कर दिया है। मुझे पता है कि VAR मॉडल समय श्रृंखला डेटा को स्थिर मानते हैं। मैं अनजाने में दो अलग-अलग प्रतिभूतियों के लिए लॉग कीमतों की एक गैर-स्थिर श्रृंखला फिट करता हूं और आश्चर्यजनक रूप से फिट किए गए मान और इन-सैंपल पूर्वानुमान अपेक्षाकृत निरर्थक, स्थिर अवशेषों के साथ बहुत सटीक थे। R2 इन-सैंपल फोरकास्ट 99% था और पूर्वानुमान अवशिष्ट श्रृंखला का मानक विचलन पूर्वानुमान मानों का लगभग 10% था।

हालांकि, जब मैं लॉग की कीमतों में अंतर करता हूं और उस समय श्रृंखला को VAR मॉडल में फिट करता हूं, तो फिटेड और फोरकास्ट मान निशान से दूर होते हैं, मतलब के चारों ओर एक तंग सीमा में उछलते हैं। नतीजतन, अवशिष्ट फिट किए गए मानों की तुलना में लॉग रिटर्न का पूर्वानुमान लगाते हुए एक बेहतर काम करते हैं, साथ ही पूर्वानुमानित अवशेषों का मानक विचलन 15X फिटेड डेटा श्रृंखला की तुलना में बड़ा है।R2 पूर्वानुमान श्रृंखला के लिए मूल्य।

क्या मैं VAR मॉडल पर फिट किए गए बनाम अवशेषों का गलत अर्थ लगा रहा हूं या कुछ और त्रुटि कर रहा हूं? एक गैर-स्थिर समय श्रृंखला एक ही अंतर्निहित डेटा के आधार पर स्थिर एक से अधिक सटीक भविष्यवाणियों का परिणाम क्यों देगी? मैंने उसी अजगर लाइब्रेरी से ARMA मॉडल के साथ एक अच्छा सा काम किया है और इस मॉडलिंग सिंगल सीरीज़ डेटा जैसा कुछ भी नहीं देखा है।


5
दो तथ्य: (1) जब आप किसी अन्य यादृच्छिक वॉक पर एक रैंडम वॉक को पुनः प्राप्त करते हैं और गलत तरीके से स्थिरता का अनुमान लगाते हैं, तो आपको लगभग हमेशा ही सांख्यिकीय रूप से महत्वपूर्ण परिणाम मिलते हैं, भले ही वे स्वतंत्र प्रक्रियाएं हों! । (२) यदि दो चरों का संयोग होता है , तो आप एक दूसरे को पुनः प्राप्त कर सकते हैं और आपका अनुमानक सामान्य प्रतिगमन की तुलना में अधिक तेजी से जुटेगा, जिसके परिणामस्वरूप सुपर-संगति कहा जाता है।
मैथ्यू गन

आपका बहुत बहुत धन्यवाद। तथ्य # 1 निश्चित रूप से गैर-स्थिर श्रृंखला के लिए परिणाम बताता है। स्थिर श्रृंखला के परिणाम निश्चित रूप से कार्य करते हैं जैसे कि वे दिखा रहे हैं कि आपको सुपर-संगति क्या कहा जाता है, सिवाय इसके कि दो श्रृंखलाओं का संयोग नहीं है, जहां तक ​​मैं बता सकता हूं। मैंने दो मूल्य श्रृंखलाओं पर एक रेखीय प्रतिगमन चलाया और अवशिष्ट स्थिर से दूर थे। तो मुझे यह मान लेना होगा कि VAR मॉडल इतनी खराब भविष्यवाणी कर रहा है क्योंकि दो वापसी श्रृंखला दृढ़ता से ऑटो से संबंधित नहीं हैं। ग्रेंजर टेस्ट इसकी पुष्टि करता है।
jpeginternet

@MatthewGunn, आपकी टिप्पणी एक उत्तर के रूप में बेहतर फिट हो सकती है।
रिचर्ड हार्डी

जवाबों:


9

दो तथ्य:

  1. जब आप किसी अन्य यादृच्छिक वॉक पर एक रैंडम वॉक को पुनः प्राप्त करते हैं और गलत तरीके से स्थिरता ग्रहण करते हैं, तो आपका सॉफ्टवेयर आम तौर पर सांख्यिकीय रूप से महत्वपूर्ण परिणामों को पीछे छोड़ देगा, भले ही वे स्वतंत्र प्रक्रियाएं हों! उदाहरण के लिए, इन व्याख्यान नोटों को देखें। (शानदार घूमने के लिए Google और कई लिंक सामने आएंगे।) क्या गलत हो रहा है? सामान्य ओएलएस अनुमान और मानक-त्रुटियां उन मान्यताओं पर आधारित हैं जो यादृच्छिक चलने के मामले में सच नहीं हैं।

    आम तौर पर ओएलएस मान्यताओं को लागू करना और एक दूसरे पर दो स्वतंत्र यादृच्छिक चलना लागू करना, आमतौर पर विशाल के साथ प्रतिगमन को जन्म देगा R2, अत्यधिक महत्वपूर्ण गुणांक, और यह सब पूरी तरह से फर्जी है! जब एक यादृच्छिक चलना होता है और आप स्तरों में एक प्रतिगमन चलाते हैं, तो OLS के लिए सामान्य मान्यताओं का उल्लंघन किया जाता है, आपका अनुमान रूपांतरित नहीं होता हैtसामान्य केंद्रीय सीमा प्रमेय लागू नहीं होता है, और आपके प्रतिगमन से संबंधित टी-आँकड़े और पी-मान सभी गलत हैं

  2. यदि दो चर का संयोग किया जाता है , तो आप एक को दूसरे पर पुनः प्राप्त कर सकते हैं और आपका अनुमानक सामान्य प्रतिगमन की तुलना में तेजी से जुटेगा, जिसका परिणाम सुपर-संगति के रूप में जाना जाता है। उदाहरण के लिए। चेकआउट जॉन कोचरन की टाइम सीरीज़ ऑनलाइन बुक करें और "सुपरकंसन्टिव" की खोज करें।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.