एक्सपोनेंशियल स्मूथिंग एक क्लासिक तकनीक है जिसका उपयोग गैर-कोशिकीय समय श्रृंखला पूर्वानुमान में किया जाता है। जब तक आप इसे केवल सीधे-सीधे पूर्वानुमान में उपयोग करते हैं और किसी अन्य डेटा माइनिंग या सांख्यिकीय एल्गोरिथ्म के इनपुट के रूप में इन-सैंपल स्मूथेड फिट का उपयोग नहीं करते , ब्रिग्स की समालोचना लागू नहीं होती है। (तदनुसार, मैं इसे "प्रस्तुति के लिए सुचारू डेटा का उत्पादन करने के लिए" के बारे में संदेह कर रहा हूं, जैसा कि विकिपीडिया कहता है - यह सुचारू रूप से परिवर्तनशील परिवर्तन को छिपाकर भ्रामक हो सकता है।)
यहां एक्सपोनेंशियल स्मूथिंग के लिए एक टेक्स्टबुक परिचय दिया गया है।
और यहां एक (10-वर्षीय, लेकिन अभी भी प्रासंगिक) समीक्षा लेख है।
EDIT: ब्रिग्स की समालोचना की वैधता के बारे में कुछ संदेह प्रतीत होता है , संभवतः इसकी पैकेजिंग से कुछ हद तक प्रभावित है । मैं इस बात से पूरी तरह सहमत हूं कि ब्रिग्स का लहजा अक्खड़ हो सकता है। हालांकि, मैं यह बताना चाहता हूं कि मुझे क्यों लगता है कि उसके पास एक बिंदु है।
नीचे, मैं समय श्रृंखलाओं के 10,000 जोड़े, 100 टिप्पणियों में से प्रत्येक का अनुकरण कर रहा हूं। सभी श्रृंखलाएं सफेद शोर वाली हैं, जिनका कोई संबंध नहीं है। तो एक मानक सहसंबंध परीक्षण चलाने के लिए p मान प्राप्त करना चाहिए जो समान रूप से [0,1] पर वितरित किए जाते हैं। जैसा कि यह होता है (नीचे बाईं तरफ हिस्टोग्राम)।
हालांकि, लगता है हम पहले प्रत्येक श्रृंखला चिकनी और करने के लिए सह-संबंध परीक्षण लागू समतल डेटा। कुछ आश्चर्यजनक प्रतीत होता है: चूंकि हमने डेटा से बहुत अधिक परिवर्तनशीलता को हटा दिया है, इसलिए हमें ऐसे पी मान मिलते हैं जो बहुत छोटे हैं । हमारा सहसंबंध परीक्षण भारी पक्षपातपूर्ण है। इसलिए हम मूल श्रृंखला के बीच किसी भी जुड़ाव के बारे में निश्चित होंगे, जो कि ब्रिग्स कह रहा है।
यह सवाल वास्तव में लटका हुआ है कि क्या हम पूर्वानुमान के लिए स्मूथ डेटा का उपयोग करते हैं, जिस स्थिति में स्मूथिंग वैध है, या क्या हम इसे कुछ विश्लेषणात्मक एल्गोरिथ्म में एक इनपुट के रूप में शामिल करते हैं , जिस स्थिति में परिवर्तनशीलता को दूर करने से हमारे डेटा में उच्च निश्चितता को चेतावनी दी जाएगी। इनपुट डेटा में यह अनौपचारिक निश्चितता अंतिम परिणामों के माध्यम से होती है और इसके लिए जिम्मेदार होने की जरूरत है, अन्यथा सभी अनुमान भी निश्चित होंगे। (और अगर हम पूर्वानुमान के लिए "फुलाए गए निश्चितता" पर आधारित मॉडल का उपयोग करते हैं, तो निश्चित रूप से हमें बहुत छोटे पूर्वानुमान अंतराल भी मिलेंगे।)
n.series <- 1e4
n.time <- 1e2
p.corr <- p.corr.smoothed <- rep(NA,n.series)
set.seed(1)
for ( ii in 1:n.series ) {
A <- rnorm(n.time)
B <- rnorm(n.time)
p.corr[ii] <- cor.test(A,B)$p.value
p.corr.smoothed[ii] <- cor.test(lowess(A)$y,lowess(B)$y)$p.value
}
par(mfrow=c(1,2))
hist(p.corr,col="grey",xlab="",main="p values\nunsmoothed data")
hist(p.corr.smoothed,col="grey",xlab="",main="p values\nsmoothed data")