आर में एक समय श्रृंखला की चिकनाई कैसे मापें?


25

आर में एक समय श्रृंखला की चिकनाई को मापने का एक अच्छा तरीका है? उदाहरण के लिए,

-1, -0.8, -0.6, -0.4, -0.2, 0, 0.2, 0.4, 0.6, 0.8, 1.0

की तुलना में बहुत चिकनी है

-1, 0.8, -0.6, 0.4, -0.2, 0, 0.2, -0.4, 0.6, -0.8, 1.0

हालांकि उनका एक ही मतलब और मानक विचलन है। यह शांत होगा यदि मुझे एक समय श्रृंखला में एक चिकनी स्कोर देने के लिए कोई फ़ंक्शन है।


4
स्टोकेस्टिक प्रक्रियाओं के सिद्धांत में चिकनापन एक अच्छी तरह से परिभाषित अर्थ है। ("एक वैरोग्राम एक सांख्यिकीय-आधारित, मात्रात्मक है, एक सतह की खुरदरापन का विवरण": Goldensoftware.com/variogramTutorial.pdf , पृष्ठ 16।) चिकनाई वेरोग्राम के एक्सट्रपलेशन से शून्य दूरी तक संबंधित है। (क्रमिक मतभेदों के एसडी और लैग-वन ऑटोकरेलेशन इस के त्वरित और गंदे संस्करण हैं)। आवश्यक जानकारी टेलर सीरीज़ के गुणांक में निहित है। ०. in पर, एक गैर-शून्य स्थिरांक वास्तव में मोटा है; 0 पर एक उच्च-क्रम शून्य एक बहुत चिकनी श्रृंखला को इंगित करता है।
whuber

मैंने एक्सपट्र्स के बारे में सुना है।
टेलर

कितना मज़ेदार है, मैं खुद भी यही बात सोच रहा हूँ। पोस्ट करने का शुक्रिया!
क्रिस बीली

@whuber: यह एक जवाब है, टिप्पणी नहीं।
n

@ naught101 मैं विनम्रतापूर्वक अलग-अलग भीख माँगता हूँ: मेरी टिप्पणी एक संबंधित स्थिति है और यह केवल उस स्थानिक डेटा को मॉडल करने के लिए उपयोग की जाने वाली सैद्धांतिक प्रक्रिया को संदर्भित करती है, न कि यह कि वास्तव में कैसे सहजता का अनुमान लगाया जाएगा । उस अनुमान के लिए एक कला है जिसके साथ मैं कई आयामों में परिचित हूं, लेकिन एक में नहीं, जो विशेष है (समय के तीर की दिशा के कारण), इसलिए मैं यह दावा करने में संकोच करता हूं कि बहुआयामी प्रक्रियाओं को समय श्रृंखला में लागू करना बिल्कुल भी नहीं है पारंपरिक या एक अच्छा दृष्टिकोण।
whuber

जवाबों:


22

मतभेदों का मानक विचलन आपको एक सहज चिकनाई का अनुमान देगा:

x <- c(-1, -0.8, -0.6, -0.4, -0.2, 0, 0.2, 0.4, 0.6, 0.8, 1.0)
y <- c(-1, 0.8, -0.6, 0.4, -0.2, 0, 0.2, -0.4, 0.6, -0.8, 1.0)
sd(diff(x))
sd(diff(y))

अपडेट: जैसा कि सियान बताते हैं, यह आपको पैमाना-निर्भर माप देता है। एक समान पैमाने पर स्वतंत्र माप मानक विचलन के बजाय भिन्नता के गुणांक का उपयोग करेगा:

sd(diff(x))/abs(mean(diff(x)))
sd(diff(y))/abs(mean(diff(y)))

दोनों मामलों में, छोटे मूल्य चिकनी श्रृंखला के अनुरूप हैं।


1
यह स्कोर स्केल-इनवेरिएंट नहीं है, जो अनुप्रयोग के आधार पर समझ में नहीं आता है या नहीं हो सकता है। (और मेरे अपने सुझाव है तो एक ही चिंता का विषय है इसे करने के लिए लागू होता है, स्केल-अपरिवर्तनीय।) इसके अलावा, यह की ओर इशारा करते हुए लायक है कि ऊपर स्कोर के लिए, छोटे मूल्यों चिकनी समय श्रृंखला संकेत मिलता है।
सियान

1
धन्यवाद @ क्यान। मैंने अब एक पैमाना-स्वतंत्र संस्करण भी जोड़ा है।
रोब हंडमैन

2
क्या आप वास्तव diffमें हर में शामिल करने का इरादा रखते हैं ? मानों को बीजगणितीय रूप से कम कर दिया जाएगा, (x[n]-x[1])/(n-1)जो कि (क्रूड) उपाय है प्रवृत्ति और ought, कई मामलों में, शून्य के बेहद करीब होना, जिसके परिणामस्वरूप एक अस्थिर और बहुत ही सार्थक सांख्यिकीय नहीं है। मुझे लगता है कि हैरान कर रहा हूँ, लेकिन शायद मैं कुछ स्पष्ट अनदेखी कर रहा हूँ ...
whuber

1
मैं diffस्टेशनरी की धारणा से बचता था। यदि इसे हर के साथ परिभाषित किया जाता है abs(mean(x))तो स्केलिंग केवल तभी काम करेगी जब xस्थिर हो। डिफरेंसेस लेने का मतलब है कि यह अंतर स्थिर प्रक्रियाओं के लिए भी काम करेगा। बेशक, अंतर xस्थिर नहीं हो सकते हैं और फिर अभी भी समस्याएं हैं। स्केलिंग टाइम सीरीज़ इस वजह से मुश्किल है। लेकिन मैं स्थिरता के बारे में आपकी बात लेता हूं। मुझे लगता है कि कुछ भी बेहतर करने के लिए कुछ और अधिक परिष्कृत कुछ की आवश्यकता होगी --- उदाहरण के लिए एक nonparametric चिकनी का उपयोग करना।
रोब हंडमैन

1
मैंने सोचा होगा कि एक निरंतर प्रवृत्ति पूरी तरह से चिकनी होनी चाहिए, इसलिए इसका उत्तर 0. होना चाहिए
रोब हंडमैन

13

लैग-वन ऑटोकॉर्लेशन एक स्कोर के रूप में काम करेगा और इसकी एक बहुत सीधी सांख्यिकीय व्याख्या भी होगी।

cor(x[-length(x)],x[-1])

स्कोर व्याख्या:

  • 1 के पास स्कोर एक सुचारू रूप से बदलती श्रृंखला है
  • 0 के पास स्कोर का मतलब है कि डेटा बिंदु और निम्न के बीच कोई समग्र रैखिक संबंध नहीं है (जो है, प्लॉट (x [-Length] (x)], x [-1]) किसी भी स्पष्ट रैखिकता के साथ एक स्कैप्लेट नहीं देगा)
  • -1 के पास स्कोर का सुझाव है कि श्रृंखला एक विशेष तरीके से दांतेदार है: यदि एक बिंदु माध्य से ऊपर है, तो अगला उसी राशि के बारे में मतलब से नीचे होने की संभावना है, और इसके विपरीत।

0

आप बस टाइमस्टेप नंबर के खिलाफ सहसंबंध की जांच कर सकते हैं। यह समय पर एक साधारण रैखिक प्रतिगमन के R² लेने के बराबर होगा। ध्यान दें, हालांकि, वे दो बहुत अलग-अलग समय हैं, इसलिए मुझे नहीं पता कि तुलना के रूप में कितनी अच्छी तरह काम करता है।


4
यह समय के साथ रैखिकता का माप होगा, लेकिन चिकनापन का नहीं।
रोब हंडमैन
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.