पूर्वानुमान द्वारा सामना किए जा रहे महत्वपूर्ण मुद्दों में से एक यह है कि क्या दी गई श्रृंखला का पूर्वानुमान लगाया जा सकता है या नहीं?
मैं पीटर कैट द्वारा " एंट्रोपी फॉर ए ए प्रियोरी इंडिकेटर ऑफ फोरकास्टीबिलिटी " नामक एक लेख पर अड़ गया, जो किसी दिए गए समय श्रृंखला के निर्धारण के लिए एक सापेक्ष माप के रूप में अनुमानित एंट्रोपी (एपन) का उपयोग करता है।
लेख कहता है,
"छोटे एपन मान अधिक संभावना को इंगित करते हैं कि डेटा का एक सेट समान डेटा (नियमितता) द्वारा पीछा किया जाएगा। इसके विपरीत, एपन का एक बड़ा मूल्य समान डेटा के दोहराए जाने (अनियमितता) के कम अवसर को इंगित करता है। इसलिए, बड़ा विकार अधिक विकार को दर्शाता है। , यादृच्छिकता और सिस्टम जटिलता। "
और ApEn की गणना के लिए गणितीय सूत्रों का पालन किया जाता है। यह एक दिलचस्प दृष्टिकोण है क्योंकि यह एक संख्यात्मक मूल्य प्रदान करता है जिसका उपयोग सापेक्ष अर्थों में पूर्वानुमान का आकलन करने के लिए किया जा सकता है। मुझे नहीं पता कि अनुमानित एंट्रोपी का क्या मतलब है, मैं इसके बारे में अधिक पढ़ रहा हूं।
इसमें एक पैकेज है, जिसे प्रैक्मा कहा जाता है R
, जिससे आप ApEn की गणना कर सकते हैं। एक उदाहरण के उद्देश्य से, मैंने 3 अलग-अलग समय श्रृंखलाओं का उपयोग किया और एपन संख्याओं की गणना की।
- श्रृंखला 1: प्रसिद्ध AirPassenger समय श्रृंखला - अत्यधिक निर्धारक है और हमें आसानी से पूर्वानुमान करने में सक्षम होना चाहिए।
- श्रृंखला 2: सनस्पॉट टाइम सीरीज - बहुत अच्छी तरह से परिभाषित है लेकिन श्रृंखला 1 की तुलना में कम पूर्वानुमान योग्य होना चाहिए।
- श्रृंखला 3: रैंडम संख्या इस श्रृंखला का पूर्वानुमान लगाने का कोई तरीका नहीं है।
इसलिए यदि हम ApEn की गणना करते हैं, तो श्रंखला 1, श्रृंखला 2 से कम होनी चाहिए, श्रृंखला 3 बहुत कम होनी चाहिए।
नीचे आर स्निपेट है जो तीनों श्रृंखलाओं के लिए एपन की गणना करता है।
library("pracma")
> series1 <- approx_entropy(AirPassengers)
> series1
[1] 0.5157758
> series2 <- approx_entropy(sunspot.year)
> series2
[1] 0.762243
> series3 <- approx_entropy(rnorm(1:30))
> series3
[1] 0.1529609
यह वह नहीं है जिसकी मुझे उम्मीद थी। यादृच्छिक श्रृंखला में अच्छी तरह से परिभाषित AirPassenger श्रृंखला की तुलना में कम संख्या है। यहां तक कि अगर मैं यादृच्छिक संख्या को 100 तक बढ़ाता हूं, तो मुझे अभी भी निम्नलिखित मिलता है जो अच्छी तरह से परिभाषित श्रृंखला 2 / Sunspot.yeall श्रृंखला से कम है।
> series3 <- approx_entropy(rnorm(1:100))
> series3
[1] 0.747275
नीचे मेरे सवाल हैं:
- ApEn (
m
औरr
) की गणना करने में 2 पैरामीटर हैं ? उन्हें कैसे निर्धारित किया जाए।R
ऊपर दिए गए कोड में Iused चूक । - मैं जो गलत कर रहा हूं, वह गलत तरीके से दिखा रहा है कि ApEn यादृच्छिक संख्या बनाम एक अच्छी तरह से परिभाषित श्रृंखला जैसे कि sunspot.yearly बनाम के लिए कम है।
- क्या मुझे सीरीज़ को डिसेंसेलाइज़ / डिसेंड करना चाहिए और फिर ApEn का अनुमान लगाना चाहिए। लेखक ने हालांकि ApEn को सीधे श्रृंखला में लागू किया है।
- क्या यह निर्धारित करने का कोई अन्य तरीका है कि क्या श्रृंखला पूर्वानुमान योग्य है?