टाइम्स श्रृंखला विश्लेषण बनाम मशीन सीखने?


10

बस एक सामान्य सवाल है। यदि आपके पास समय श्रृंखला डेटा है, तो मशीन / सांख्यिकीय सीखने की तकनीक (KNN, प्रतिगमन) से अधिक समय श्रृंखला तकनीकों (उर्फ, ARCH, GARCH, आदि) का उपयोग करना बेहतर है। यदि कोई ऐसा ही सवाल है जो क्रॉस्लेटिड पर मौजूद है, तो कृपया मुझे इसकी ओर इंगित करें - देखा और एक नहीं मिला।


जवाबों:


9

विशिष्ट मशीन शिक्षण विधियाँ मानती हैं कि आपका डेटा स्वतंत्र और समान रूप से वितरित है, जो समय श्रृंखला डेटा के लिए सही नहीं है। इसलिए वे सटीकता के संदर्भ में, समय श्रृंखला तकनीकों की तुलना में नुकसान में हैं। इसके उदाहरणों के लिए, पिछले प्रश्नों को देखें मशीन लर्निंग और रैंडम फॉरेस्ट के लिए टाइम सीरीज़ का ऑर्डर ओवरफिटिंग है


आपके प्रतिक्रिया के लिए धन्येवाद। अपनी बात को आगे बढ़ाने के लिए, ऐसा लगता है कि मशीन लर्निंग डेटा में संबंधों को खोजने पर अधिक चिंतित है, जबकि समय श्रृंखला विश्लेषण डेटा के कारणों की सही पहचान करने के साथ अधिक चिंतित है - अर्थात स्टोकैस्टिक कारक इसे कैसे प्रभावित कर रहे हैं। क्या आप इस बात से सहमत हैं?
नागी

4
नहीं, मैं उस सारांश से सहमत नहीं हूँ।
टॉम मिंका

4

फ्रांसिस डाइबोल्ड ने हाल ही में अपने ब्लॉग पर "एमएल और मेट्रिक्स VI: ए के बीच महत्वपूर्ण अंतर एमएल और टीएस इकोनोमेट्रिक्स" पोस्ट किया है। मैं इसका छोटा संस्करण प्रदान कर रहा हूं, इसलिए सारा श्रेय उसी को जाता है। (बोल्ड में जोर मेरा है।)

[S] टैटिशियल मशीन लर्निंग (ML) और टाइम सीरीज़ अर्थमिति (TS) में बहुत कुछ सामान्य है। लेकिन एक दिलचस्प अंतर यह भी है: सशर्त-गैर-साधनहीनता के लचीले nonparametric मॉडलिंग पर ML का जोर TS में एक बड़ी भूमिका नहीं निभाता है। <...>

[टी] यहां सबसे आर्थिक समय श्रृंखला के सहसंयोजक-स्थिर (डी-ट्रेंडेड, डी-सीजनलाइज्ड) गतिकी में महत्वपूर्ण सशर्त-मतलब गैर-मौजूदगी का बहुत कम सबूत है। <...> वास्तव में मैं केवल एक प्रकार की सशर्त-मतलब गैर-विहीनता के बारे में सोच सकता हूं जो आर्थिक समय श्रृंखला के लिए बार-बार महत्वपूर्ण के रूप में उभरा है: हैमिल्टन-शैली मार्कोव-स्विचिंग गतिकी।

[बेशक कमरे में एक गैर-रैखिक हाथी है: एंगल-शैली गार्च-प्रकार की गतिशीलता। वे वित्तीय अर्थमिति में बहुत महत्वपूर्ण हैं, और कभी-कभी स्थूल-अर्थमिति में भी हैं, लेकिन वे सशर्त रूपांतरों के बारे में हैं, न कि सशर्त साधनों के बारे में।]

तो मूल रूप से टीएस में केवल दो महत्वपूर्ण गैर-रेखीय मॉडल हैं, और उनमें से केवल एक सशर्त-माध्य गतिशीलता से बोलता है। और महत्वपूर्ण रूप से, वे दोनों बहुत कसकर पैरामीट्रिक हैं, जो आर्थिक और वित्तीय डेटा की विशेष विशेषताओं के निकट हैं।

इस प्रकार निष्कर्ष यह है:

एमएल अत्यधिक-लचीले गैर-पैरामीट्रिक फैशन में गैर-रैखिक सशर्त-माध्य कार्यों को अनुमानित करने पर जोर देता है। यह टीएस में दोगुना अनावश्यक है: चिंता करने के लिए बस सशर्त-मतलब गैर-रैखिकता नहीं है, और जब कभी-कभार होता है, तो यह आम तौर पर एक अति-विशिष्ट प्रकृति का होता है जो अत्यधिक-विशेष (कसकर-पैरामीट्रिक) फैशन में अनुमानित होता है ।

मैं यहां पूरी मूल पोस्ट पढ़ने की सलाह देता हूं ।


+1। मैं इस जवाब से बहुत सहमत हूं। विशिष्ट एमएल तरीकों को गैर-पैरामीट्रिक मॉडलिंग की विशेषता है और बहुत आराम की धारणाएं हैं जबकि एआरएमए मॉडल "कसकर पैरामीट्रिक" हैं।
डिगियो

2

जैसा कि @Tom Minka ने बताया कि अधिकांश ML तकनीकें iid इनपुट मानती हैं। हालांकि कुछ समाधान हैं:

  1. सिस्टम 'मेमोरी' के भीतर सभी पिछली समय श्रृंखला के नमूनों को एक फीचर वेक्टर के रूप में उपयोग कर सकते हैं, अर्थात: x = [x (t-1), x (t-2), x (tM)]। हालाँकि, इसमें 2 समस्याएँ हैं: 1) आपके बिनिंग के आधार पर, आपके पास एक बहुत बड़ी सुविधा वेक्टर हो सकती है 2- कुछ तरीकों को स्वतंत्र होने के लिए फ़ीचर वेक्टर के भीतर सुविधाओं की आवश्यकता होती है, जो यहाँ नहीं है।

  2. कई एमएल तकनीक मौजूद हैं, जो विशेष रूप से ऐसे टाइम-सीरीज़ डेटा के लिए डिज़ाइन की गई हैं, उदाहरण के लिए हिडन मार्कोव मॉडल, जो जब्ती का पता लगाने, भाषण प्रसंस्करण, आदि के लिए बहुत सफलतापूर्वक उपयोग किया गया है ...

  3. अंत में, मैंने जो एक दृष्टिकोण लिया है वह एक गतिशील प्रतिगमन समस्या (जिसमें समय का तत्व है) को एक स्थिर में बदलने के लिए 'सुविधा निष्कर्षण' तकनीकों का उपयोग करना है। उदाहरण के लिए, प्रिंसिपल डायनेमिक्स मोड (PDM) दृष्टिकोण इनपुट अतीत फीचर वेक्टर ([x (t-1), x (t-2), ... x (tM)]) को एक स्थिर ([v) पर दिखाता है। 1), v (2), .. v (L)] सिस्टम-विशिष्ट लीनियर फ़िल्टरबैंक (PDM) के साथ अतीत को समझाकर, Marmarelis, 2004 की किताब या Marmarelis, Vasilis Z देखें। "नॉनलाइनर फिजियोलॉजिकल सिस्टम के लिए मॉडल पद्धति । " बायोमेडिकल इंजीनियरिंग के इतिहास 25.2 (1997): 239-251 ...

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.