एक समय श्रृंखला को स्थिर क्यों होना पड़ता है?


92

मैं समझता हूं कि एक स्थिर समय श्रृंखला वह है जिसका माध्य और विचरण समय के साथ निरंतर होता है। क्या कोई यह बता सकता है कि इससे पहले कि हम अलग-अलग ARIMA या ARM मॉडल चला सकें, हमें यह सुनिश्चित करना होगा कि हमारा डेटा सेट स्थिर क्यों है? क्या यह सामान्य प्रतिगमन मॉडल पर भी लागू होता है जहां ऑटोक्रेलेशन और / या समय एक कारक नहीं है?


2
एआरएम मॉडल क्या हैं? क्या आपका मतलब ARMA है?
mpiktas

9
स्थिरता के लिए निरंतर माध्य और भिन्नता की आवश्यकता होती है। कमजोर स्थिरता के लिए आवश्यक है कि सहसंयोजक कार्य सीv(एक्सटी,एक्सटी+) doe पर निर्भर न हो टी
mpiktas

11
आप एक एआर को चलाने के लिए stationarity की आवश्यकता नहीं है एमए मॉडल, के बाद से अगर मैं ( ) आदेश है > 0 , यह स्पष्ट रूप से nonstationary है। स्टेशनैरिटी ARMA की एक धारणा है, हालाँकि। II()>0
Glen_b

1
आदेश टिप्पणी के लिए +1, हालांकि सख्ती से, यह केवल तभी है जब का आदेश { 0 , 1 , 2 , / में हो } । मनमाने आदेशों के लिए, ARFIMAमैं{0,1,2,}
conjugateprior

@Glen_b क्या ARIMA मॉडल को किसी भी गैर स्थिर श्रृंखला में लागू किया जा सकता है? या कुछ विशिष्ट गैर स्थिर मामले हैं जिनमें ARIMA कैन को लागू किया जा सकता है?
निज़ार

जवाबों:


75

स्टेशनैरिटी एक प्रकार की निर्भरता संरचना है।

मान लीजिए कि हमें एक डेटा है । सबसे बुनियादी धारणा यह है कि X i स्वतंत्र है, अर्थात हमारे पास एक नमूना है। स्वतंत्रता एक अच्छी संपत्ति है, इसका उपयोग करने के बाद से हम बहुत सारे उपयोगी परिणाम प्राप्त कर सकते हैं। समस्या यह है कि कभी-कभी (या अक्सर, दृश्य के आधार पर) यह संपत्ति धारण नहीं करती है।एक्स1,,एक्सnएक्समैं

अब स्वतंत्रता एक अनूठी संपत्ति है, दो यादृच्छिक चर केवल एक तरह से स्वतंत्र हो सकते हैं, लेकिन वे विभिन्न तरीकों से निर्भर हो सकते हैं। तो निर्भरता संरचना पर निर्भरता के मॉडलिंग का एक तरीका है। यह पता चलता है कि बहुत सारे अच्छे परिणाम जो स्वतंत्र यादृच्छिक चर (बड़ी संख्या के कानून, कुछ का नाम रखने के लिए केंद्रीय सीमा प्रमेय) के लिए स्थिर यादृच्छिक चर (हमें सख्ती से अनुक्रम कहना चाहिए) के लिए पकड़ रखते हैं। और निश्चित रूप से यह पता चला है कि बहुत सारे डेटा को स्थिर माना जा सकता है, इसलिए गैर-स्वतंत्र डेटा मॉडलिंग में स्टेशनरी की अवधारणा बहुत महत्वपूर्ण है।

जब हमने निर्धारित किया है कि हमारे पास स्थिरता है, स्वाभाविक रूप से हम इसे मॉडल करना चाहते हैं। यह वह जगह है जहां ARMA मॉडल आते हैं। यह पता चलता है कि Wold अपघटन प्रमेय के लिए किसी भी स्थिर डेटा को स्थिर ARMA मॉडल के साथ अनुमानित किया जा सकता है । यही कारण है कि ARMA मॉडल बहुत लोकप्रिय हैं और यही कारण है कि हमें यह सुनिश्चित करने की आवश्यकता है कि इन मॉडलों का उपयोग करने के लिए श्रृंखला स्थिर है।

अब फिर से वही कहानी है जो स्वतंत्रता और निर्भरता के साथ है। स्टेशनरी को विशिष्ट रूप से परिभाषित किया गया है, अर्थात डेटा या तो स्थिर है या नहीं, इसलिए डेटा के स्थिर होने का केवल एक ही तरीका है, लेकिन इसके लिए बहुत सारे तरीके गैर-स्थिर हैं। फिर से यह पता चलता है कि कुछ परिवर्तन के बाद बहुत सारा डेटा स्थिर हो जाता है। ARIMA मॉडल गैर-स्थिरता के लिए एक मॉडल है। यह मानता है कि अलग-अलग होने के बाद डेटा स्थिर हो जाता है।

प्रतिगमन संदर्भ में स्थिरता महत्वपूर्ण है क्योंकि वही परिणाम जो स्वतंत्र डेटा के लिए लागू होते हैं यदि डेटा स्थिर है।


4
मैं आपको अपनी प्रतिक्रिया का यह हिस्सा लगाने के लिए सुझाव दूंगा ("यह वह जगह है जहां एआरएमए मॉडल आते हैं। यह पता चलता है कि किसी भी स्थिर डेटा को स्थिर एआरएमए मॉडल के साथ अनुमानित किया जा सकता है, जो कि वॉल्ड अपघटन प्रमेय के लिए धन्यवाद है। इसलिए एआरएम मॉडल बहुत हैं।" लोकप्रिय है और इसलिए हमें यह सुनिश्चित करने की आवश्यकता है कि श्रृंखला इन मॉडलों का उपयोग करने के लिए स्थिर है। ") बोल्ड में क्योंकि यह मुख्य रूप से प्रश्न का उत्तर देता है।
पॉइट मौदित

34

जब हम एक समय श्रृंखला पर सांख्यिकीय विश्लेषण करते हैं, तो आम तौर पर हमें कौन सी मात्रा में रुचि होती है? हम जानना चाहते हैं

  • इसका अपेक्षित मूल्य,
  • इसका विचरण, और
  • मूल्यों के बीच संबंध अलग का एक सेट के लिए अवधि रों मूल्यों।ss

हम इन चीजों की गणना कैसे करते हैं? कई समयावधि के दौरान एक माध्य का उपयोग करना।

कई समयावधि के दौरान माध्य केवल सूचनात्मक होता है यदि अपेक्षित मूल्य उन समयावधि में समान हो। यदि ये जनसंख्या पैरामीटर अलग-अलग हो सकते हैं, तो हम वास्तव में समय भर में औसत लेकर क्या अनुमान लगा रहे हैं?

(कमजोर) स्थिरता के लिए आवश्यक है कि ये जनसंख्या मात्रा समय के साथ समान होनी चाहिए, जिससे नमूना औसत उनका अनुमान लगाने का एक उचित तरीका है।

इसके अलावा, स्थिर प्रक्रियाएं स्पुरियस रिग्रेशन की समस्या से बचती हैं ।


12

सांख्यिकीय सीखने में एक अंतर्निहित विचार यह है कि आप एक प्रयोग को दोहराकर सीख सकते हैं। उदाहरण के लिए, हम इस बात की संभावना जानने के लिए एक अंगूठा फड़फड़ाते रह सकते हैं कि उसके सिर पर एक अंगूठा भूमि है।

समय-श्रृंखला के संदर्भ में, हम स्टोकेस्टिक प्रक्रिया के बार-बार चलने के बजाय एक स्टोकेस्टिक प्रक्रिया के एकल रन का निरीक्षण करते हैं। हम कई, स्वतंत्र प्रयोगों के बजाय 1 लंबे प्रयोग का निरीक्षण करते हैं।

हमें स्टेशनरिटी और एर्गोडिसिटी की आवश्यकता है ताकि एक स्टोकेस्टिक प्रक्रिया के लंबे समय का अवलोकन करना स्टोकेस्टिक प्रक्रिया के कई स्वतंत्र रनों का निरीक्षण करने के समान हो।

कुछ (अभेद्य) परिभाषाएँ

चलो Ω एक नमूना जगह हो। एक स्टोकेस्टिक प्रक्रिया {Yt} दोनों समय की एक समारोह है t{1,2,3,} और परिणाम ωΩ

  • किसी भी समय के लिए t , Yt (यानी से एक समारोह के एक यादृच्छिक चर रहा है Ω इस तरह के वास्तविक संख्या के स्थान के रूप में कुछ जगह के लिए)।
  • किसी भी परिणाम के लिए ω हमारे पास X(ω) एक नियतात्मक श्रृंखला है {Y1(ω),Y2(ω),Y3(ω),}

समय श्रृंखला में एक मौलिक मुद्दा

101 के आँकड़ों में, हमें स्वतंत्र और समान रूप से वितरित चर X1 , X2 , X3 आदि की एक श्रृंखला के बारे में पढ़ाया जाता है ... हम कई, समान प्रयोगों i=1,,n निरीक्षण करते हैं, जहाँ ωiΩ यादृच्छिक रूप से होता है। चुना और यह हमें यादृच्छिक चर X बारे में जानने की अनुमति देता है । बड़ी संख्याओं के नियम से , हमारे पास 1ni=1nXiकरने के लिए लगभग निश्चित रूप से convergingE[X]

समय श्रृंखला की स्थापना में एक मौलिक अंतर यह है कि हम समय के साथ कई टिप्पणियों को देख रहे हैं t से कई से ड्रॉ बल्कि Ω

सामान्य मामले में, 1Tt=1TYtकिसी भी चीज़ में परिवर्तित नहीं हो सकता है!

इसने कई टिप्पणियों के लिए समय कई के रूप में चित्रित करता एक समान कार्य को पूरा करने नमूना अंतरिक्ष , हम की जरूरत है stationarity और ergodicity

यदि बिना शर्त का मतलब E[Y] मौजूद है और एर्गोडिक प्रमेय के लिए शर्तें संतुष्ट हैं, तो समय-श्रृंखला, नमूना 1Tt=1TYtबिना शर्त मतलब की ओर अभिसरित होगाE[Y]

उदाहरण 1: स्टेशनरी की विफलता

चलो {Yt} पतित प्रक्रिया हो Yt=t । हम देख सकते हैं कि {Yt} एक स्थिर नहीं है (संयुक्त वितरण समय-अपरिवर्तित नहीं है)।

चलो St=1ti=1tYiसमय श्रृंखला नमूना मतलब हो सकता है, और यह स्पष्ट है किStके रूप में कुछ भी करने के अभिसरण नहीं हैt:S1=1,S2=32,S3=2,,St=t+12 । का मतलबYtमौजूद नहीं है औरStके रूप में कुछ भी करने के अभिसरण नहीं हैt

उदाहरण: ergodicity की विफलता

बता दें कि X एक ही सिक्के के पलटने का परिणाम है। चलो Yt=X सभी के लिएt , वह यह है कि या तो{Yt}=(0,0,0,0,0,0,0,) या{Yt}=(1,1,1,1,1,1,1,

भले ही E[Yt]=12 , टाइम-सीरीज़ सैंपल का मतलबSt=1ti=1tYiआप में से मतलब नहीं देंगेYt


10

कुछ अन्य उत्तरों में उच्च-स्तरीय उत्तर जोड़ने के लिए जो अच्छे हैं, लेकिन अधिक विस्तृत हैं, स्थिरता महत्वपूर्ण है, क्योंकि इसकी अनुपस्थिति में, डेटा का वर्णन करने वाला मॉडल विभिन्न समय बिंदुओं पर सटीकता में भिन्न होगा। इस तरह, नमूना आंकड़ों के लिए स्थिरता की आवश्यकता होती है जैसे कि साधन, संस्करण, और सहसंबंध, ब्याज के सभी समय बिंदुओं पर डेटा का सटीक वर्णन करने के लिए।

नीचे दी गई समय श्रृंखला के भूखंडों को देखते हुए, आप (उम्मीद) यह देख सकते हैं कि किसी भी समय खंड के माध्य और विचरण पूरे स्थिर समय श्रृंखला का प्रतिनिधित्व करते हुए एक अच्छा काम करेंगे, लेकिन पूरी तरह से गैर-स्थिर समय श्रृंखला का प्रतिनिधित्व करने वाला अपेक्षाकृत खराब काम। उदाहरण के लिए, गैर-स्थिर समय श्रृंखला का मतलब से बहुत कम है और इसका विचरण इस सीमा में 200 < t < 400 से सीमा से बहुत अधिक है ।600<t<800200<t<400

यहाँ छवि विवरण दर्ज करें


8

xt=xt1+et

हालांकि, हम अक्सर स्टेशनरी की तलाश करते हैं। क्यों?

पूर्वानुमान समस्या पर विचार करें। आप पूर्वानुमान कैसे लगाते हैं? अगर कल सब कुछ अलग होता है तो पूर्वानुमान लगाना असंभव है, क्योंकि सब कुछ अलग होने वाला है। तो भविष्यवाणी के लिए महत्वपूर्ण है कुछ को खोजने के लिए है कि एक ही कल हो जाएगा, और विस्तार है कि कल के लिए। वह कुछ भी कुछ भी हो सकता है। मैं आपको कुछ उदाहरण दूंगा।

ऊपर मैं (1) मॉडल में, हम अक्सर यह मान (या आशा) जो त्रुटि वितरण ही आज और कल है: etN(0,σ2)σ2Δxtxtxt1=etΔxt

xt=αt+etE[et]=0α

पूर्वानुमान के लिए हमें श्रृंखला में निरंतर (समय अपरिवर्तनीय) घटक खोजने की आवश्यकता है, अन्यथा परिभाषा द्वारा पूर्वानुमान करना असंभव है। स्टेशनरिटी केवल एक विशेष मामला है।


5

चूँकि ARIMA अधिकांश भाग के लिए अपने आप को पुन: प्राप्त कर रहा है, इसलिए यह एक प्रकार के स्व-प्रेरित कई प्रतिगमन का उपयोग करता है जो अनावश्यक रूप से एक मजबूत प्रवृत्ति या मौसमी प्रभाव से प्रभावित होगा। यह कई प्रतिगमन तकनीक पिछली समय श्रृंखला मूल्यों पर आधारित है, विशेष रूप से नवीनतम कालखंडों के भीतर, और हमें कई अतीत के मूल्यों के बीच एक बहुत ही दिलचस्प "अंतर-संबंध" निकालने की अनुमति देता है जो भविष्य के मूल्य को समझाने के लिए काम करते हैं।


2

X(Xt+1,,Xt+k)(X1,,Xk)tk। विकी से: एक स्थिर प्रक्रिया (या सख्त (ly) स्थिर प्रक्रिया या मजबूत (ly) स्थिर प्रक्रिया) एक स्टोकेस्टिक प्रक्रिया है जिसकी संयुक्त संभावना वितरण समय या स्थान में स्थानांतरित होने पर परिवर्तित नहीं होती है। नतीजतन, माध्य और विचरण जैसे पैरामीटर, यदि वे मौजूद हैं, तो भी समय या स्थिति में परिवर्तन नहीं होता है। इसके अलावा, कार्डिनल ने सही ढंग से इंगित किया है कि ऑटोकैरेलेशन फ़ंक्शन समय के साथ अपरिवर्तित होना चाहिए (जिसका अर्थ है कि सहसंयोजक फ़ंक्शन समय के साथ स्थिर है) सभी अंतर अंतरालों के लिए ARMA मॉडल के अपरिवर्तनीय / स्थिर होने के मापदंडों में परिवर्तित होता है।

ARMA मॉडल की स्थिरता का विचार निकटता के विचार में बारीकी से बंधा हुआ है।

फॉर्म एक मॉडल पर विचार करेंy(t)=1.1y(t1)(11.1B)


1
X

द्वितीय-क्रम स्टेशनरी का उल्लेख लगता है कि आपके सबसे हाल के संपादन में खो गया है। क्या वह जानबूझकर था? (मेरी मूल टिप्पणी सख्त स्टेशनरी की तुलना में दूसरे क्रम के स्टेशनैरिटी की ओर अधिक निर्देशित थी।)
कार्डिनल

: कार्डिनल मुझे लगता है कि मुझे लगा कि आपकी टिप्पणी महत्वपूर्ण थी और यह स्पष्ट किया कि जैसा माना जा रहा था। यदि आपको लगता है कि "दूसरा ऑर्डर स्टेशनरी" का विचार स्पष्टता जोड़ता है, तो कृपया मुझे इसे अपने उत्तर में इस तरह जोड़ने में मदद करें, जो सरल अंग्रेजी में प्रकाश डालता है।
आयरिशस्टैट

-2

ARMA और ARIMA को इस धारणा के साथ बनाया गया है कि श्रृंखला स्थिर है। यदि श्रृंखला नहीं है, तो भविष्यवाणी गलत होगी।

नमूना आँकड़े - मतलब, विचरण, सह विचरण - भविष्य के व्यवहार के विवरणकों के रूप में उपयोगी होते हैं केवल यदि श्रृंखला स्थिर है। उदाहरण के लिए, यदि श्रृंखला समय के साथ लगातार बढ़ रही है, तो नमूना का मतलब और भिन्नता नमूने के आकार के साथ बढ़ेगा और वे भविष्य की अवधि में हमेशा माध्य और भिन्नता को कम आंकेंगे। गैर-स्थिर डेटा के लिए फिट किए गए प्रतिगमन मॉडल को एक्सट्रपलेट करने की कोशिश करते समय सतर्क रहना महत्वपूर्ण है।


-3

मेरे विचार में स्टोकेस्टिक प्रक्रिया वह प्रक्रिया है जो तीन सांख्यिकीय गुणों द्वारा शासित होती है, जो समय के अनुरूप होनी चाहिए। वे माध्य विचरण और ऑटो सहसंबंध समारोह हैं। पहले दो समय में प्रक्रिया के विकास के बारे में कुछ नहीं बताते हैं, इसलिए तीसरी संपत्ति जो ऑटो-सहसंबंध समारोह है, उस पर विचार किया जाना चाहिए जो यह बताता है कि निर्भरता कैसे आगे बढ़ती है (समय)।


5
यह एक स्टोकेस्टिक प्रक्रिया होने और स्थिर होने के कारण भ्रमित करता है, इसलिए यह एक मौलिक त्रुटि के साथ शुरू होता है। पहले से ही पोस्ट किए गए लोगों के लिए आपका जवाब क्या जोड़ता है?
निक कॉक्स

-3

कुछ भी हल करने के लिए हमें स्टैटिक्स का उपयोग करके गणितीय रूप से समीकरणों को मॉडल करने की आवश्यकता होती है।

  1. इस तरह के समीकरणों को हल करने के लिए इसे स्वतंत्र और स्थिर होना चाहिए (गतिमान नहीं)
  2. स्थिर डेटा में केवल हम अंतर्दृष्टि प्राप्त करने और बहुउद्देश्यीय के लिए गणितीय संचालन (मतलब, विचरण आदि) कर सकते हैं
  3. गैर-स्थिर में, डेटा प्राप्त करना कठिन है

रूपांतरण प्रक्रिया के दौरान, हमें एक प्रवृत्ति और सीज़नसिटी मिलेगी


2
आपके किसी भी जवाब का कोई मतलब नहीं है। प्रश्न का आधार गलत है। कई बार श्रृंखला को सैद्धांतिक और अवलोकन दोनों तरह से गैर-स्थिर माना जा सकता है। उदाहरण के लिए इससे निपटने के लिए कई तरीके हैं। अलग या मौसमी श्रृंखला को अलग करना या 2. साइन लहरों जैसे चक्रीय घटकों को शामिल करना।
बजे माइकल चेरिक

@MichaelChernick अंतर और मौसमी अंतर के दौरान हम गैर-स्थिर श्रृंखला को एक स्थिर में परिवर्तित कर रहे हैं। मैं अपनी बात स्वीकार करते हैं कि कई समय श्रृंखला गैर स्थिर हैं, लेकिन हल करने के लिए सही यह गणितीय हम एक स्थिर करने के लिए इसे बदलने की आवश्यकता
सरवनन saminathan
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.