गैर-आवधिक समय श्रृंखला में प्रवृत्ति का विश्लेषण कैसे करें


12

मान लीजिए कि मेरे पास गैर-आवधिक समय श्रृंखला है। जाहिर है रुझान कम हो रहा है और मैं इसे कुछ परीक्षण ( पी-वैल्यू के साथ ) साबित करना चाहूंगा । मैं मूल्यों के बीच मजबूत अस्थायी (धारावाहिक) ऑटो-सहसंबंध के कारण क्लासिक रैखिक प्रतिगमन का उपयोग करने में असमर्थ हूं।

library(forecast)
my.ts <- ts(c(10,11,11.5,10,10.1,9,11,10,8,9,9,
               6,5,5,4,3,3,2,1,2,4,4,2,1,1,0.5,1),
            start = 1, end = 27,frequency = 1)
plot(my.ts, col = "black", type = "p",
     pch = 20, cex = 1.2, ylim = c(0,13))
# line of moving averages 
lines(ma(my.ts,3),col="red", lty = 2, lwd = 2)

यहाँ छवि विवरण दर्ज करें

मेरे विकल्प क्या हैं?


4
मुझे लगता है कि यह तथ्य है कि श्रृंखला गैर-आवधिक है ( frequency=1) यहां थोड़ा प्रासंगिक है। एक अधिक प्रासंगिक मुद्दा यह हो सकता है कि क्या आप अपने मॉडल के लिए एक कार्यात्मक रूप निर्दिष्ट करने के लिए तैयार हैं।
रिचर्ड हार्डी

1
डेटा के बारे में कुछ और जानकारी शायद मॉडलिंग के लिए उपयोगी होगी।
bdeonovic

डेटा जलाशयों में हर साल गिने जाने वाले कुछ प्रजातियों के व्यक्तियों (हजारों में) की गिनती है।
लादिस्लाव नाओ

1
@LadislavNado आपकी श्रृंखला है जो उदाहरण में दी गई छोटी है? मैं पूछता हूं क्योंकि यदि ऐसा है, तो यह उन तरीकों की संख्या को कम करता है जिन्हें नमूना आकार के कारण नियोजित किया जा सकता है।
टिम

1
घटते पहलू की स्पष्टता काफी हद तक निर्भर है, जो कि, मुझे ध्यान में रखना चाहिए
लॉरेंट डुवल

जवाबों:


7

जैसा कि आपने कहा, आपके उदाहरण डेटा में रुझान स्पष्ट है। यदि आप इस तथ्य को केवल परिकल्पना परीक्षण, रेखीय प्रतिगमन (स्पष्ट पैरामीट्रिक पसंद) का उपयोग करने के अलावा, आप गैर-पैरामीट्रिक मान-केंडल परीक्षण का उपयोग कर सकते हैं। परीक्षण करने के लिए प्रयोग किया जाता है

मूल्यांकन करें कि क्या समय के साथ ब्याज के चर का एक अखंड या नीचे की ओर रुझान है। एक मोनोटोनिक ऊपर की ओर (नीचे की ओर) प्रवृत्ति का मतलब है कि चर लगातार (घटता) समय के माध्यम से बढ़ता है, लेकिन प्रवृत्ति रैखिक हो सकती है या नहीं। ( http://vsp.pnnl.gov/help/Vsample/Design_Trend_Mann_Kendall.htm )

इसके अलावा, गिल्बर्ट (1987) द्वारा परीक्षण के अनुसार

लापता मूल्यों की अनुमति के बाद से विशेष रूप से उपयोगी है और डेटा को किसी विशेष वितरण के अनुरूप नहीं होना चाहिए

परीक्षण आँकड़ा सभी जोड़े जोड़े के बीच नकारात्मक और सकारात्मक अंतर के बीच का अंतर है , अर्थात n ( n - 1 ) / 2xjxin(n1)/2

S=i=1n1j=i+1nsgn(xjxi)

जहाँ एक संकेत कार्य है का उपयोग आँकड़ों की गणना करने के लिए किया जा सकता है, जो सहसंबंध के समान होता है, क्योंकि यह से , जहाँ संकेत नकारात्मक या सकारात्मक प्रवृत्ति का संकेत देता है, और का मान प्रवृत्ति के ढलान के समानुपाती होता है।एस τ - 1 + 1 τsgn()S τ1+1τ

τ=Sn(n1)/2

अंत में, आप -values ​​की गणना कर सकते हैं । आकार के नमूनों के लिए आप विभिन्न मूल्यों और अलग-अलग नमूना आकारों (देखें गिल्बर्ट, 1987 देखें) के लिए प्री-कॉम्पटेड -values की तालिकाओं का उपयोग कर सकते हैं । बड़े नमूनों के साथ, पहले आपको विचरण की गणना करने की आवश्यकता हैpn10pSS

var(S)=118[n(n1)(2n+5)p=1gtp(tp1)(2tp+5)]

और फिर परीक्षण आँकड़ा की गणना करेंZMK

ZMK={S1var(S)if S>00if S=0S+1var(S)if S<0

का मूल्य मानक सामान्य मूल्यों की तुलना में है ZMK

  • ZMKZ1α ऊपर की ओर प्रवृत्ति के लिए,
  • ZMKZ1αनीचे की प्रवृत्ति के लिए ,
  • |ZMK|Z1α/2ऊपर या नीचे की ओर प्रवृत्ति के लिए ।

में इस सूत्र तो आप इस परीक्षा को लागू आर कोड पा सकते हैं।

के बाद से आंकड़ा बजाय के लिए सामान्य सन्निकटन का उपयोग कर के तो टिप्पणियों के सभी संभव जोड़े की तुलना में है, -value आप क्रमचय परीक्षण है कि इस मामले के लिए स्पष्ट है उपयोग कर सकते हैं। सबसे पहले, आप अपने डेटा से स्टेटिस्टिक की गणना करते हैं और फिर आप बेतरतीब ढंग से अपने डेटा को कई बार फेरबदल करते हैं और प्रत्येक नमूने के लिए गणना करते हैं। केवल मामलों का अनुपात है जब ऊपर की प्रवृत्ति के लिए या की प्रवृत्ति के लिए ।पी एस पी एस डेटाएस क्रमचय एस डेटाएस क्रमचयSpSpSdataSpermutationSdataSpermutation


गिल्बर्ट, आरओ (1987)। पर्यावरण प्रदूषण निगरानी के लिए सांख्यिकीय तरीके। विली, एनवाई।

,Nöz, बी।, और बायज़िट, एम। (2003)। प्रवृत्ति का पता लगाने के लिए सांख्यिकीय परीक्षणों की शक्ति। इंजीनियरिंग और पर्यावरण विज्ञान के तुर्की जर्नल, 27 (4), 247-251।


1

आपके पास जो समस्या है "मैं मूल्यों के बीच मजबूत लौकिक (धारावाहिक) ऑटो-सहसंबंध के कारण क्लासिक रैखिक प्रतिगमन का उपयोग करने में असमर्थ हूं।" वास्तव में एक अवसर है। मैंने आपके 27 मान लिए और AUTOBOX सॉफ्टवेयर का एक टुकड़ा (जिसका मैंने विकास करने में मदद की है) का उपयोग किया है जो स्वचालित रूप से एक संभावित मॉडल निर्धारित कर सकता है। यहाँ वास्तविक / फिट और पूर्वानुमान ग्राफ है यहाँ छवि विवरण दर्ज करें। अवशिष्ट के ACF यहाँ अवशिष्ट भूखंड के साथ है यहाँ छवि विवरण दर्ज करें। मॉडल यहाँ यहाँ छवि विवरण दर्ज करेंऔर यहाँ यहाँ छवि विवरण दर्ज करेंऔर यहाँ हैयहाँ छवि विवरण दर्ज करें। दो गुणांकों ने अनुमानित रूप से डेटा का वर्णन "ट्रेंड" उर्फ ​​"बहाव" के साथ-साथ अवधि -५ ९ ६ के अंतराल के साथ किया है। ध्यान दें कि यह एक प्रकार की प्रवृत्ति है जहां आपके मॉडल ने 1,2, ... 27 की गिनती के लिए एक भविष्यवाण चर के रूप में उपयोग किया था। यदि आपके डेटा ने उस तरह की प्रवृत्ति का सुझाव दिया है, तो सॉफ्टवेयर ने इसे अधिक लागू पाया होगा। मैं कोशिश करूंगा और मेरी एक पुरानी पोस्ट ढूंढूंगा जिसने इन दो प्रकार के रुझानों को पूरी तरह से विस्तृत / विपरीत किया। यहाँ एक स्टोकेस्टिक ट्रेंड मॉडल की पहचान करना और प्रारंभिक प्रवृत्ति या आउटलेर का पता लगाना

यहाँ छवि विवरण दर्ज करें


2
ऑटोबॉक्स पूर्वानुमान हर दिलचस्प बिंदु को याद करता है 1996, 1999, 2000, 2009 जहां हाल की प्रवृत्ति टूट गई है। यह लगभग एक वर्ष के चरण परिवर्तन की तरह है। इस संबंध में यह कुछ भी स्पष्ट नहीं करता है।
अक्कल १६'१६ को

डेटा के लिए एक उच्च डिग्री बहुपद फिटिंग के लिए आपकी पिछली सिफारिश (गाल में जीभ) वही करेगी जो आपने पूछा था। लेकिन हम फिटिंग के बारे में नहीं हैं हम मॉडलिंग के बारे में हैं। अवशिष्ट भूखंड किसी बाहरी / अज्ञात कारक के कारण त्रुटि प्रक्रिया का पर्याप्त वर्णन करता है। सभी मॉडल गलत हैं लेकिन कुछ उपयोगी हैं। मेरा मानना ​​है कि यह एक उपयोगी मॉडल है लेकिन अगर आपको लगता है कि आप बेहतर कर सकते हैं तो कृपया अपने परिणाम पोस्ट करें ताकि हम सभी सीख सकें। ARIMA मॉडल से कोई स्पष्टीकरण नहीं है क्योंकि अतीत केवल छोड़े गए चर के लिए एक प्रॉक्सी है।
आयरिशस्टैट

2
इस मामले में ऐसा लगता है कि आंकड़ों के साथ ऐसा करने के लिए बहुत कुछ नहीं है। यह एन दिलचस्प आँकड़े सवाल बिल्कुल नहीं है। एक स्पष्ट प्रवृत्ति है, और ओपी को घटना के भौतिकी का अध्ययन करना चाहिए। मुझे लगता है कि ये मॉडल जैसे ऑटोबॉक्स से फिट बैठता है, ओपी को गलत दिशा में ले जा रहा है। वे पहले से ही स्पष्ट होने से परे मूल्य का कुछ भी खुलासा नहीं कर रहे हैं।
अक्कल

सवाल यह है कि क्या विश्लेषणात्मक मानव आंख की जगह ले सकता है या नहीं ... विश्लेषण से पता चलता है कि आंख किस चीज का समर्थन करती है, यही कारण है कि हम संभवतः तुरंत दिखाई देने वाले से अधिक करने के लिए आंकड़ों का अभ्यास करते हैं। AUTOBOX समाधान ओपी को सही दिशा में यानी नीचे की ओर ले जाता है। आपकी टिप्पणी मेरे विचार में बिलकुल भी उपयोगी नहीं है क्योंकि मैंने पहले (विनम्रता से) कृपया एक सांख्यिकी आधारित व्यवहार्य विकल्प प्रदान करने के लिए कहा। मेरी राय में यह एक बहुत ही दिलचस्प सांख्यिकीय सवाल है और इसके जवाब की आवश्यकता है। कृपया एक प्रदान करें यदि आप कर सकते हैं।
आयरिशस्टैट

1

जिस डिग्री का आप डेटा मोनोटोनिक है, उसे निर्धारित करने के लिए आप स्पीयरमैन के रैंक सहसंबंध गुणांक का उपयोग कर सकते हैं । यह मोनोटोनिक बढ़ते डेटा के लिए सकारात्मक मान लौटाता है और मोनोटोनिक घटते डेटा (-1 और +1 के बीच) के लिए नकारात्मक मान। ऊपर दिए गए लिंक के बाद, एक अनुभाग है जो महत्व परीक्षण का परीक्षण कर रहा है, हालांकि मुझे यकीन है कि सह-संबंध गुणांक (जैसे कि मटलब [RHO,PVAL] = corr(...):; आर में; cor.test(x,...)) की गणना करते समय अधिकांश सॉफ्टवेयर पैकेज आपके लिए एक पी-वैल्यू होगा ।


0

आप ओएलएस का उपयोग कर सकते हैं क्योंकि कोई सीरियल ऑटोकैरेलेशन नहीं है (कम से कम आपके द्वारा आपूर्ति किए गए नमूने में); 1.966 (.2) के डर्बिन-वाटसन टेस्ट स्टेटिस्टिक पर ध्यान दें।

तो, X1 के लिए महत्वपूर्ण नकारात्मक गुणांक का अनुमान आप सभी को कुछ कहना चाहिए

[कुछ विशेष प्रजातियों] की देखी गई गणना प्रति वर्ष लगभग 1,000 घट रही है।

या

[कुछ विशेष प्रजातियों] की देखी गई गणना प्रति वर्ष 628 और 1,408 के बीच (95% आत्मविश्वास में) घट रही है।

यह मानता है कि प्रजातियों की गिनती के लिए कार्यप्रणाली में अच्छा कवरेज है और आपके नमूने में वर्षों से लगातार है।

यहाँ छवि विवरण दर्ज करें

यह इस पायथन कोड के साथ तैयार किया गया था (क्षमा करें, आर काम नहीं है):

import numpy as np
import statsmodels.api as sm

y = [10,12,10,11,8,9,6,4,2,4]
x = np.arange(len(y))
x = sm.add_constant(x)

mod = sm.OLS(y, x)
result = mod.fit()
print(result.summary())

0

डेटा के स्रोत को जानना बहुत मददगार होगा, और यह भी जानकारी कि क्या मूल्य my.tsनकारात्मक हो सकते हैं या नहीं।

हालांकि, भूखंड पर एक त्वरित नज़र रखने के बजाय, एक निरंतर रैखिक प्रवृत्ति को देखने के बजाय, मैं सुझाव देता हूं कि समय श्रृंखला स्थिर नहीं है, इसलिए एकीकृत है । एक उदाहरण के रूप में, स्टॉक की कीमतें भी एकीकृत हैं, लेकिन स्टॉक रिटर्न अब और नहीं (वे 0 के निकट उतार-चढ़ाव करते हैं)।

इस परिकल्पना को ऑगमेंटेड डिकी फुलर टेस्ट का उपयोग करके भी जांचा जा सकता है:

require(tseries)
adf.test(my.ts)

Augmented Dickey-Fuller Test
Dickey-Fuller = -2.9557, Lag order = 2, p-value = 0.7727
alternative hypothesis: stationary

यह देखते हुए कि पी-मान 0.05 से कम नहीं है, इस बात का कोई सबूत नहीं है कि प्रक्रिया स्थिर है।

डेटा स्थिर करने के लिए, आपको इसे अलग करना होगा:

diff.ts <- diff(my.ts)
plot(diff.ts)

यहाँ छवि विवरण दर्ज करें

अब डेटा अब कोई रुझान नहीं दिखाता है , और केवल एक चीज जो आप पाएंगे, वह ऑर्डर 2 (उपयोग acf(diff.ts)) का एक ऑटोरेस्पिरेटिव शब्द है ।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.