मैं व्यवसाय और अर्थशास्त्र से स्नातक हूं जो वर्तमान में डेटा इंजीनियरिंग में मास्टर डिग्री के लिए अध्ययन कर रहा है। रैखिक प्रतिगमन (LR) और फिर समय श्रृंखला विश्लेषण (TS) का अध्ययन करते समय, एक प्रश्न मेरे दिमाग में कौंध गया। एक से अधिक रैखिक प्रतिगमन का उपयोग करने के बजाय (ACF और PACF का उपयोग करके निर्धारित अंतराल के आदेश) को जोड़ने के बजाय, एक पूरी नई विधि, यानी, टाइम सीरीज़ (ARIMA) क्यों बनाएं? तो शिक्षक ने सुझाव दिया कि मैं इस मुद्दे के बारे में थोड़ा निबंध लिखता हूं। मैं खाली हाथ मदद की तलाश में नहीं आता, इसलिए मैंने इस विषय पर अपना शोध किया।
मुझे पहले से ही पता था कि एलआर का उपयोग करते समय, यदि गॉस-मार्कोव मान्यताओं का उल्लंघन किया जाता है, तो ओएलएस प्रतिगमन गलत है, और यह तब होता है जब समय सीरीज़ डेटा (ऑटोकैरेलेशन, आदि) का उपयोग किया जाता है। (इस पर एक और सवाल, एक जीएम धारणा यह है कि स्वतंत्र चर को सामान्य रूप से वितरित किया जाना चाहिए? या स्वतंत्र लोगों के लिए केवल निर्भर चर सशर्त?)
मुझे यह भी पता है कि वितरित लैग रिग्रेशन का उपयोग करते समय, जो कि मुझे लगता है कि मैं यहां प्रस्ताव कर रहा हूं, और मापदंडों का अनुमान लगाने के लिए ओएलएस का उपयोग कर रहा हूं, चर (स्पष्ट रूप से) के बीच मल्टीकोलिनरिटी उत्पन्न हो सकती है, इसलिए अनुमान गलत होगा।
एक में टीएस और एलआर के बारे में इसी तरह की पोस्ट यहाँ, @IrishStat ने कहा:
... एक प्रतिगमन मॉडल एक स्थानांतरण फ़ंक्शन मॉडल का एक विशेष मामला है जिसे डायनेमिक प्रतिगमन मॉडल या XARMAX मॉडल के रूप में भी जाना जाता है। मुख्य बिंदु यह है कि टाइम सीरीज़ में मॉडल की पहचान यानी उचित अंतर, एक्स के उपयुक्त लैग्स, उपयुक्त एआरआईएमए संरचना, अनिर्दिष्ट निर्धारक संरचना जैसे पल्सेस, लेवल शिफ्ट्स, लोकल टाइम ट्रेंड्स, सीज़नल पल्सेस, और निगमन की उपयुक्त पहचान मापदंडों या त्रुटि भिन्नता में परिवर्तन पर विचार किया जाना चाहिए।
(मैं बॉक्स जेनकींस बनाम एलआर के बारे में ऑटोबॉक्स में उनका पेपर भी पढ़ता हूं।) लेकिन यह अभी भी मेरे सवाल को हल नहीं करता है (या कम से कम यह मेरे लिए आरएल और टीएस के विभिन्न यांत्रिकी को स्पष्ट नहीं करता है)।
यह स्पष्ट है कि पिछड़े हुए चर के साथ भी ओएलएस की समस्याएँ उत्पन्न होती हैं और यह न तो कुशल है और न ही सही, लेकिन अधिकतम संभावना का उपयोग करते समय, क्या ये समस्याएं बनी रहती हैं? मैंने पढ़ा है कि ARIMA अधिकतम संभावना के माध्यम से अनुमानित है, इसलिए यदि OLS के बजाय ML के साथ lags का अनुमान है, तो क्या यह "सही" गुणांक उत्पन्न करता है (मान लें कि हम लैग्ड त्रुटि शर्तों के साथ-साथ एमए के आदेश भी शामिल हैं) क्यू)।
संक्षेप में, समस्या OLS है? क्या समस्या को हल करने में एमएल लागू है?