ऑटोक्लेररेशन और न्यूरल नेटवर्क के लिए मैटलैब का उपयोग करते समय समय श्रृंखला डेटा में अंतराल / NaN से कैसे निपटें?


9

मेरे पास मापों की एक समय श्रृंखला है (ऊँचाई-एक आयामी श्रृंखला)। अवलोकन अवधि में, माप प्रक्रिया कुछ समय बिंदुओं के लिए नीचे चली गई। इसलिए परिणामी डेटा NaNs के साथ एक वेक्टर है जहां डेटा में अंतराल थे। MATLAB का उपयोग करते हुए, यह मुझे एक समस्या पैदा कर रहा है जब ऑटोकैरेलेशन ( autocorr) और तंत्रिका नेटवर्क ( nnstart) को लागू करने के लिए गणना की जाती है ।

इन अंतरालों / NaN से कैसे निपटा जाना चाहिए? क्या मुझे बस उन्हें वेक्टर से हटा देना चाहिए? या एक प्रक्षेपित मूल्य के साथ उनके प्रवेश की जगह? (यदि ऐसा है तो MATLAB में कैसे)

जवाबों:


4

मैं डेटा को बिल्कुल नहीं छूऊंगा। NaNs के साथ स्वतःसंक्रमण के लिए इसका उपयोग करें:

http://www.mathworks.com/matlabcentral/fileexchange/43840-autocorrelation-and-partial-autocorrelation-with-nans/content/nanautocorr.m

"डेटा को स्पर्श न करें" का अर्थ किसी भी डेटा या टाइम-स्टेप को हटाने या 0 या माध्य से प्रतिस्थापित करने के लिए नहीं है, यह विशिष्ट-समय-अंतराल रैखिक निर्भरता के बारे में जानकारी से समझौता करेगा। मैं अंतराल में मूल्यों का अनुकरण करने से भी बचूंगा, यदि आप "एसएएमपीएलई" ऑटोकॉरेलेशन में रुचि रखते हैं, वैसे भी सबसे अच्छी सिमुलेशन तकनीक ऑटोकॉर्लेशन के बारे में और अधिक जानकारी नहीं जोड़ेगी, जो स्वयं डेटा पर आधारित है। मैंने NaNs से निपटने के लिए आंशिक रूप से matlab (ऊपर लिंक) आटोक्लेररेशन और आंशिक ऑटोक्रॉलेशन फ़ंक्शन को पुन: कनेक्ट किया: NaNs सहित किसी भी डेटा जोड़े को गणना से बाहर रखा गया है। यह प्रत्येक अंतराल के लिए किया जाता है। इसने मेरे लिए काम किया। किसी भी सुझाव को अच्छी तरह से स्वीकार किया जाता है।


आपका स्वागत है @Fabio: क्या आप कृपया "डेटा को नहीं छूने" के साथ और अधिक स्पष्टीकरण दे सकते हैं? क्या आपका मतलब किसी चीज को नहीं हटाना है? यह आपके द्वारा लिंक की गई सामग्री को पेश करने और यह समझाने में भी मदद करेगा कि यह ओपी की मदद क्यों करता है।
मोमो

नमस्कार मोमो, टिप्पणी के लिए धन्यवाद। "डेटा को स्पर्श न करें" का अर्थ किसी भी डेटा या टाइम-स्टेप को हटाने या 0 या माध्य के साथ बदलने के लिए नहीं है, यह विशिष्ट-समय-अंतराल रैखिक निर्भरता के बारे में जानकारी से समझौता करेगा। मैंने NaNs से निपटने के लिए आंशिक रूप से matlab (ऊपर लिंक) आटोक्लेररेशन और आंशिक ऑटोक्रॉलेशन फ़ंक्शन को पुन: कनेक्ट किया: NaNs सहित किसी भी डेटा जोड़े को गणना से बाहर रखा गया है। यह प्रत्येक अंतराल के लिए किया जाता है। इसने मेरे लिए काम किया। किसी भी सुझाव को अच्छी तरह से स्वीकार किया जाता है।
फाबियो

3

कुछ एल्गोरिदम हैं जो लापता मानों के लिए प्रतिरक्षा हैं, इसलिए पसंदीदा समाधान उनके लिए देखना है (उदाहरण के लिए आर के acfऑटोकॉरेलर के लिए)।

सामान्य तौर पर, जाने का तरीका या तो लापता टिप्पणियों के साथ डेटा को छोड़ना है (बहुत दर्दनाक हो सकता है) या बस अपने मूल्यों को लागू करने के लिए - पड़ोसियों का मतलब चिकनी श्रृंखला और छोटे अंतराल के लिए पर्याप्त हो सकता है, लेकिन वे निश्चित रूप से हैं अन्य अधिक शक्तिशाली तरीकों का बहुतायत, बंटवारे, यादृच्छिक / सबसे लगातार मूल्यों का उपयोग करना, मॉडलों से प्रतिरूपण आदि।


2
लापता मूल्य के साथ acf की गणना सामान्य तरीके से की जाती है, लेकिन लापता मानों को 'sums' में छोड़ दिया जाता है (अर्थात, दिए गए अंतराल के लिए acf फॉर्मूला एक राशि द्वारा विभाजित राशि की तरह दिखता है, उन प्रत्येक sums में लापता मान हो सकता है) छोड़ देना)। यह मूल डेटा से लापता मानों को हटाने के समान नहीं है। मतलूब के साथ समस्या यह है कि वह NaN को छोड़ता नहीं है, और गणना में NaN में सब कुछ बदल जाता है।
जीरो

1

उपयोगी एआरआईएमए संरचना और किसी भी स्थानीय समय के रुझान और / या स्तर की बदलाव का फायदा उठाने वाले लापता घाटों को लागू करने के लिए हस्तक्षेप जांच का उपयोग करें।


1

यहां 2 समस्याएं हैं। पहले matlab में आपके ऑटोक्रेलेशन उत्तर के लिए एक सार्थक संख्यात्मक ढांचा प्रदान कर रहा है। ऐसा होने के लिए, आपको अपने डेटा वैक्टरों के समय-श्रृंखला-भाग को फैलाने और / या पैच करने की आवश्यकता है ... समस्या का यह 'डेटा अखंडता' घटक सबसे मौलिक है।

दूसरे, आपको यह तय करने की आवश्यकता है कि आपके वेक्टर के 'मूल्य' घटक को कैसे संभालना है ... यह विशेष रूप से विशेष रूप से लागू करने के लिए काफी हद तक निर्भर करता है कि क्या सबसे अच्छा है, (जैसे, छोटे, लापता समय-टिकट और संबंधित NaN या नल इसे पड़ोसियों से सुरक्षित रूप से प्रक्षेपित किया जा सकता है ... बड़े अंतराल में, शून्य के लिए मूल्य निर्धारित करना शायद अधिक सुरक्षित है ... या ऊपर की सिफारिश के रूप में लागू होता है - जाहिर है इसके लिए सार्थक होने के लिए, अंतराल फिर से तुलनात्मक रूप से छोटा होना चाहिए।) ।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.