सहसंबंध निर्धारित करने के लिए 2 गैर-स्थिर समय श्रृंखला की तुलना कैसे करें?


11

मेरे पास दो डेटा सीरीज़ हैं जो समय के साथ मृत्यु की औसत आयु को दर्शाती हैं। दोनों श्रृंखला समय के साथ मृत्यु की बढ़ती उम्र को प्रदर्शित करती हैं, लेकिन एक दूसरे की तुलना में बहुत कम है। मैं यह निर्धारित करना चाहता हूं कि क्या निचले नमूने की मृत्यु की आयु में वृद्धि ऊपरी नमूने की तुलना में काफी भिन्न है।

यहां तीन दशमलव स्थानों के अनुसार, वर्ष (1972 से 2009 तक समावेशी) का डेटा दिया गया है:

Cohort A    70.257  70.424  70.650  70.938  71.207  71.263  71.467  71.763  71.982  72.270  72.617  72.798  72.964  73.397  73.518  73.606  73.905  74.343  74.330  74.565  74.558  74.813  74.773  75.178  75.406  75.708  75.900  76.152  76.312  76.558  76.796  77.057  77.125  77.328  77.431  77.656  77.884  77.983
Cohort B    5.139   8.261   6.094   12.353  11.974  11.364  12.639  11.667  14.286  12.794  12.250  14.079  17.917  16.250  17.321  18.182  17.500  20.000  18.824  21.522  21.500  21.167  21.818  22.895  23.214  24.167  26.250  24.375  27.143  24.500  23.676  25.179  24.861  26.875  27.143  27.045  28.500  29.318

दोनों श्रृंखला गैर-स्थिर हैं - मैं दोनों की तुलना कैसे कर सकता हूं? मैं STATA का उपयोग कर रहा हूं। कोई भी सलाह कृतज्ञता से ली जाएगी।

डेटा प्लॉट


यदि आप अपने डेटा, मैट का लिंक प्रदान करते हैं, तो हम उन डेटा को शामिल करने के लिए आपके प्रश्न को संपादित कर सकते हैं।
whuber

मेरी दुर्दशा में आपकी रुचि के लिए बहुत धन्यवाद - जोड़ा गया डेटा के लिए लिंक। किसी भी मदद की सराहना की जाएगी
मैट

@ मैट: आपके डेटा को देखते हुए, ऐसा लग रहा है कि वे दोनों ऊपर की ओर चल रहे हैं। तो क्या आप अनिवार्य रूप से परिकल्पना में रुचि रखते हैं कि एक सहकर्मी दूसरे की तुलना में अधिक तेज़ी से बढ़ रहा है?
एंड्रयू

हां एंड्रयू - ऊपरी कोहर्ट सामान्य आबादी है, जबकि गरीब की मृत्यु के साथ कोहर्ट एक ही स्थिति से मरने वाला एक समूह है। अशक्त परिकल्पना यह है कि यदि वे निकट संबंध में किसी भी सुधार से संबंधित हैं तो संभावित रूप से सामान्य कारकों (और उक्त स्थिति की देखभाल में सुधार नहीं) के कारण होता है।
मैट हर्ले

हालांकि, मापी गई, इतनी स्पष्ट रूप से भिन्न हैं कि कोई औपचारिक परीक्षण आवश्यक नहीं है। (आपको या उससे कम मूल्य के पी-वैल्यू मिलेंगे , भले ही आप ढलान का आकलन और तुलना करते हों, चाहे आप भिन्नता का कोई भी मॉडल क्यों न हों।) जीवन प्रत्याशाओं में अंतर 0.83% प्रति की दर से घट गया है। साल। दिलचस्प बात 2001 में कोहोर्ट बी में अचानक झटका है; यह परिवर्तन - प्रगति के छह साल के तात्कालिक नुकसान के बराबर - सांख्यिकीय रूप से महत्वपूर्ण है।1010
व्हिबर

जवाबों:


14

यह एक साधारण स्थिति है; चलो इसे बनाए रखें। मुख्य बात यह है कि क्या मायने रखता है:

  • डेटा का एक उपयोगी विवरण प्राप्त करना।

  • उस विवरण से व्यक्तिगत विचलन का आकलन करना।

  • व्याख्या में मौके की संभावित भूमिका और प्रभाव का आकलन करना।

  • बौद्धिक अखंडता और पारदर्शिता बनाए रखना।

अभी भी कई विकल्प हैं और विश्लेषण के कई रूप मान्य और प्रभावी होंगे। आइए यहां एक दृष्टिकोण का वर्णन करें जो इन प्रमुख सिद्धांतों के पालन के लिए अनुशंसित किया जा सकता है।

अखंडता बनाए रखने के लिए, आइए डेटा को हिस्सों में विभाजित करें: 1972 से 1990 तक और 1991 से 2009 तक (प्रत्येक में 19 वर्ष)। हम पहले हाफ के लिए मॉडल फिट करेंगे और फिर देखेंगे कि दूसरे हाफ को प्रोजेक्ट करने में फिट कितना कारगर है। इसमें दूसरे छमाही के दौरान होने वाले महत्वपूर्ण परिवर्तनों का पता लगाने का अतिरिक्त लाभ है।

एक उपयोगी विवरण प्राप्त करने के लिए, हमें परिवर्तनों को मापने के लिए (ए) को खोजने की आवश्यकता है और (बी) उन परिवर्तनों के लिए उपयुक्त सबसे सरल संभव मॉडल को फिट करते हैं, इसका मूल्यांकन करते हैं, और साधारण मॉडल से विचलन को समायोजित करने के लिए पुनरावृत्त अधिक जटिल होते हैं।

(ए) आपके पास कई विकल्प हैं: आप कच्चे डेटा को देख सकते हैं; आप उनके वार्षिक अंतर को देख सकते हैं; आप लघुगणक के साथ भी ऐसा कर सकते हैं (सापेक्ष परिवर्तनों का आकलन करने के लिए); आप जीवन के खोए या सापेक्ष जीवन प्रत्याशा (RLE) के वर्षों का आकलन कर सकते हैं; या कई अन्य चीजें। कुछ विचार के बाद, मैंने RLE पर विचार करने का निर्णय लिया, जो कि (संदर्भ) कोहोर्ट ए। के सापेक्ष जीवन प्रत्याशा के अनुपात के रूप में परिभाषित किया गया था। समय के साथ फैशन, ताकि RLE में सबसे अधिक यादृच्छिक दिखने वाली भिन्नता कोहोर्ट बी में बदलाव के कारण होगी।

(बी) के साथ शुरू करने के लिए सबसे सरल संभव मॉडल एक रैखिक प्रवृत्ति है। देखते हैं कि यह कितना अच्छा काम करता है।

आकृति 1

इस प्लॉट में गहरे नीले बिंदु फिटिंग के लिए बनाए गए डेटा हैं; हल्के सोने के बिंदु बाद के डेटा हैं, जिनका उपयोग फिट के लिए नहीं किया जाता है। काली रेखा फिट है, जिसमें .009 / वर्ष की ढलान है। धराशायी लाइनें व्यक्तिगत भविष्य के मूल्यों के लिए भविष्यवाणी अंतराल हैं।

कुल मिलाकर, फिट अच्छा लग रहा है: अवशिष्टों की परीक्षा (नीचे देखें) समय के साथ (आकार अवधि 1972-1990 के दौरान) उनके आकार में कोई महत्वपूर्ण बदलाव नहीं दिखाती है। (कुछ संकेत हैं कि वे जीवन की शुरुआत कम होने पर बड़े होने की ओर अग्रसर थे। हम कुछ सरलता का त्याग करके इस जटिलता को संभाल सकते थे, लेकिन प्रवृत्ति का अनुमान लगाने के लिए लाभ महान होने की संभावना नहीं है।) अभी सबसे नन्हा संकेत है। क्रमिक सहसंबंध (सकारात्मक और नकारात्मक अवशिष्ट के कुछ रन द्वारा प्रदर्शित), लेकिन स्पष्ट रूप से यह महत्वहीन है। कोई आउटलेयर नहीं हैं, जो कि भविष्यवाणी बैंड से परे बिंदुओं द्वारा इंगित किया जाएगा।

एक आश्चर्य की बात यह है कि 2001 में मूल्य अचानक से कम भविष्यवाणी वाले बैंड तक गिर गए और वहीं रह गए: कुछ अचानक और बड़े हुए और लगातार बने रहे।

यहाँ अवशिष्ट हैं, जो पहले बताए गए विवरण से विचलन हैं ।

चित्र 2

क्योंकि हम अवशिष्टों की तुलना 0 से करना चाहते हैं, एक दृश्य सहायता के रूप में ऊर्ध्वाधर रेखाएं शून्य स्तर तक खींची जाती हैं। फिर से, नीले बिंदुओं को फिट के लिए उपयोग किए जाने वाले डेटा दिखाते हैं। हल्के सोने वाले लोग निम्न भविष्यवाणी सीमा, 2000 के बाद के आंकड़ों के लिए अवशिष्ट हैं।

इस आंकड़े से हम अनुमान लगा सकते हैं कि 2000-2001 के बदलाव का प्रभाव लगभग -0.07 था । यह कोहॉर्ट बी के भीतर पूर्ण जीवनकाल के 0.07 (7%) की अचानक गिरावट को दर्शाता है। उस ड्रॉप के बाद, अवशिष्ट के क्षैतिज पैटर्न से पता चलता है कि पिछले रुझान जारी रहा, लेकिन नए निचले स्तर पर। विश्लेषण के इस हिस्से को अन्वेषणात्मक माना जाना चाहिए : यह विशेष रूप से योजनाबद्ध नहीं था, लेकिन आयोजित डेटा (1991-2009) और बाकी डेटा के लिए फिट के बीच आश्चर्यजनक तुलना के कारण आया था।

एक और बात - यहां तक ​​कि सिर्फ 19 शुरुआती वर्षों के आंकड़ों का उपयोग करते हुए, ढलान की मानक त्रुटि छोटी है: यह ठीक है ।009, .009 के अनुमानित मूल्य का सिर्फ दसवां हिस्सा है। स्वतंत्रता की 17 डिग्री के साथ 10 के संबंधित टी-स्टेटिस्टिक अत्यंत महत्वपूर्ण है (पी-मूल्य से कम है107); यह है, हम विश्वास कर सकते हैं कि प्रवृत्ति मौका के कारण नहीं है। यह विश्लेषण में मौका की भूमिका के हमारे आकलन का एक हिस्सा है। अन्य भाग अवशिष्टों की परीक्षाएँ हैं।

प्रतीत होता है कि इन आंकड़ों के लिए अधिक जटिल मॉडल को फिट करने का कोई कारण नहीं है, कम से कम यह अनुमान लगाने के उद्देश्य से नहीं है कि क्या समय के साथ RLE में एक वास्तविक रुझान है: एक है। हम अपने अनुमानों को परिष्कृत करने के लिए डेटा को 2001 के पूर्व मूल्यों और 2000 के बाद के मूल्यों में विभाजित कर सकते हैंरुझानों की, लेकिन यह परिकल्पना परीक्षण करने के लिए पूरी तरह से ईमानदार नहीं होगा। पी-मान कृत्रिम रूप से कम होगा, क्योंकि विभाजन परीक्षण पहले से योजनाबद्ध नहीं थे। लेकिन खोजपूर्ण अभ्यास के रूप में, ऐसा अनुमान ठीक है। अपने डेटा से सभी जानें! बस ओवरफिटिंग के साथ खुद को धोखा नहीं देने के लिए सावधान रहें (जो कि लगभग आधा दर्जन से अधिक मापदंडों या तो या स्वचालित फिटिंग तकनीकों का उपयोग करने पर ऐसा होना निश्चित है), या डेटा स्नूपिंग: औपचारिक पुष्टि और अनौपचारिक (लेकिन मूल्यवान) डेटा की खोज।

आइए संक्षेप:

  • जीवन प्रत्याशा (आरएलई) के एक उपयुक्त माप का चयन करके, आधे डेटा को पकड़कर, एक साधारण मॉडल को फिट करके, और शेष डेटा के खिलाफ उस मॉडल का परीक्षण करके, हमने उच्च आत्मविश्वास के साथ स्थापित किया है : एक सुसंगत प्रवृत्ति थी; यह लंबे समय तक रैखिक के करीब रहा है; और 2001 में RLE में अचानक गिरावट देखी गई।

  • हमारा मॉडल हड़ताली रूप से पारंगत है : शुरुआती डेटा का सही वर्णन करने के लिए इसे केवल दो संख्याओं (एक ढलान और अवरोधन) की आवश्यकता होती है। इस विवरण से स्पष्ट लेकिन अप्रत्याशित प्रस्थान का वर्णन करने के लिए इसे तीसरे (ब्रेक की तारीख, 2001) की आवश्यकता है। इस तीन-पैरामीटर विवरण के सापेक्ष कोई आउटलेर नहीं हैं। धारावाहिक सहसंबंध (आमतौर पर समय-श्रृंखला तकनीकों का ध्यान केंद्रित) को चिह्नित करके, छोटे व्यक्तिगत विचलन (अवशिष्ट) का वर्णन करने का प्रयास करते हुए, या अधिक जटिल फिट (जैसे एक द्विघात समय घटक में जोड़कर) का वर्णन करने से मॉडल में काफी सुधार नहीं होने जा रहा है। या मॉडलिंग समय के साथ अवशिष्ट के आकार में परिवर्तन)।

  • प्रवृत्ति प्रति वर्ष 0.009 RLE है । इसका मतलब यह है कि प्रत्येक गुजरते साल के साथ, कोहोर्ट बी के भीतर जीवन प्रत्याशा 0.009 (लगभग 1%) एक पूर्ण अपेक्षित सामान्य जीवनकाल के साथ जुड़ गई है। अध्ययन के दौरान (37 वर्ष), जो कि 37 * 0.009 = 0.34 = एक तिहाई जीवन भर के सुधार का होगा। 2001 में हुए झटके ने 1972 से 2009 तक पूरे जीवनकाल में लगभग 0.28 अंक हासिल किए (भले ही उस अवधि के दौरान समग्र जीवन प्रत्याशा 10% बढ़ गई)।

  • हालांकि इस मॉडल में सुधार किया जा सकता है, लेकिन इसके लिए अधिक मापदंडों की आवश्यकता होगी और सुधार महान होने की संभावना नहीं है (क्योंकि अवशेषों के निकट-यादृच्छिक व्यवहार)। कुल मिलाकर, हमें इतने कम विश्लेषणात्मक काम के लिए डेटा के ऐसे कॉम्पैक्ट, उपयोगी, सरल विवरण पर पहुंचने के लिए संतुष्ट होना चाहिए


: पहचानने के लिए एक बार दालों को बुद्धि के पूर्वानुमान में कोई भूमिका नहीं निभानी चाहिए:
आयरिशस्टैट

2

मुझे लगता है कि मेरे जैसे गैर-श्रृंखला वाले व्यक्ति के लिए व्हीबर का जवाब सीधा और सरल है। मैं उसका आधार बनाता हूं। मेरा उत्तर आर नहीं स्टैटा में है क्योंकि मैं स्टैटा को अच्छी तरह से नहीं जानता।

मुझे आश्चर्य है कि अगर सवाल वास्तव में हमें यह देखने के लिए कह रहा है कि क्या वर्ष वृद्धि पर पूर्ण वर्ष दो सहकर्मियों (रिश्तेदार के बजाय) में समान है। मुझे लगता है कि यह महत्वपूर्ण है और इसका वर्णन इस प्रकार है। निम्नलिखित खिलौना उदाहरण पर विचार करें:

a <- 21:40
b <- 41:60
x <- 1:20
plot(y = a, x = x, ylim = c(0, 60))
points(y = b, x = x, pch = 2)

यहाँ छवि विवरण दर्ज करें

यहां हमारे पास 2 सहसंयोजक हैं, जिनमें से प्रत्येक के पास औसतन जीवित रहने पर प्रति वर्ष 1 वर्ष की वृद्धि होती है। इसलिए प्रत्येक वर्ष इस उदाहरण में दोनों समान मात्रा में वृद्धि करते हैं, लेकिन RLE निम्नलिखित देता है:

rle <-  a / b
plot(rle)

यहाँ छवि विवरण दर्ज करें

जो स्पष्ट रूप से एक ऊपर की ओर प्रवृत्ति है, और परिकल्पना का परीक्षण करने के लिए पी मान है कि लाइन 0 की ढाल 2.2e-16 है। सज्जित सीधी रेखा (आइए नजरअंदाज करें कि यह रेखा घुमावदार दिखती है) में 0.008 की ढाल है। इसलिए भले ही दोनों सहकर्मियों की एक साल में समान रूप से वृद्धि हुई है, RLE में ऊपर की ओर ढलान है।

इसलिए यदि आप RLE का उपयोग करते हैं, जब आप निरपेक्ष वृद्धि की तलाश करना चाहते हैं, तो आप अनुचित रूप से शून्य परिकल्पना को अस्वीकार करेंगे।

आपूर्ति किए गए डेटा का उपयोग करना, हमारे द्वारा प्राप्त किए जाने वाले सहकर्मियों के बीच पूर्ण अंतर की गणना करना: यहाँ छवि विवरण दर्ज करें

जिसका अर्थ है कि मध्ययुगीन अस्तित्व के बीच पूर्ण अंतर धीरे-धीरे कम हो रहा है (यानी गरीब अस्तित्व के साथ सहवास धीरे-धीरे बेहतर अस्तित्व के साथ सहवास के करीब हो रहा है)।


: एंड्रयू अपने ग्राफ के अंत में अवशिष्टों के दो समूहों पर ध्यान दें। यह आपके विश्लेषण में संभावित कमी का सुझाव देता है। दुर्भाग्य से यहां तक ​​कि कुशल गणितज्ञ जो कुशल सांख्यिकीविद् भी हैं कभी-कभी समय श्रृंखला वाले लोग नहीं होते हैं। मैंने जो सुझाव दिया वह समय श्रृंखला विश्लेषण के लिए मानक संचालन प्रक्रिया है।
आयरिशस्टैट

@ और अच्छी प्रतिक्रिया मिली। मैंने उत्थान किया, मुझे आपकी योग्यता पर विश्वास है!
एडम

1
: एडम आपके अच्छे शब्दों के लिए धन्यवाद। आप ध्यान देंगे कि मैं केवल समय श्रृंखला की समस्याओं / प्रश्नों पर ही विचार करता हूं, जहां मेरे पास कुछ विशेषज्ञता है क्योंकि मैंने पिछले 40 वर्षों से उस क्षेत्र में विशेषज्ञता हासिल की है।
आयरिशस्टैट

@IrishStat एक स्पर्श विवेकाधीन। अच्छा अनुभव है, आप मेरे जन्म से पहले से ही मेरी तरह सज़ा पा रहे हैं।
एडम

: एडम पूरा विचार अन्य लोगों की मदद करना है। मैं वास्तव में आशा करता हूं कि ऐसा ही रहा हो। मैं "दंड" शब्द से भ्रमित हूं क्योंकि मेरे पास बिल्कुल भी ऐसा नहीं है। बस मदद करने का प्रयास कर रहा हूं !
आयरिशस्टैट

1

इन दो समय श्रृंखलाओं में एक नियतात्मक प्रवृत्ति है। यह एक ऐसा संबंध है जिसे आप स्पष्ट रूप से आगे के विश्लेषण से पहले निकालना चाहते हैं। व्यक्तिगत रूप से, मैं इस प्रकार आगे बढ़ूंगा:

1) मैं एक निरंतर और एक समय के खिलाफ प्रत्येक समय श्रृंखला के लिए एक प्रतिगमन चलाऊंगा, और प्रत्येक समय श्रृंखला के लिए अवशिष्ट की गणना करूंगा।

2) दो अवशिष्ट श्रृंखलाओं को लेते हुए, ऊपर दिए गए चरण में गणना की गई, मैं एक साधारण रैखिक प्रतिगमन (स्थिर अवधि के बिना) चलाऊंगा और टी-स्टेटिस्टिक, पी-वैल्यू को देखूंगा, और इस पर निर्णय लिया जाएगा कि आगे निर्भरता है या नहीं दो श्रृंखला।

यह विश्लेषण मानता है कि आप एक रेखीय प्रतिगमन में बनाते हैं।


: user3544 समय में एक निरंतर के खिलाफ एक प्रतिगमन को चलाने का एक प्रकार है जो पूर्व-श्वेतकरण का एक रूप है; विभेदक पूर्व-श्वेतकरण का एक अन्य रूप है: दोनों प्रकल्पित हैं क्योंकि विभिन्न प्रचालनों के कई रुझान या विभिन्न रूप हो सकते हैं। ध्यान दें कि एक विभेदक ऑपरेटर ARIMA फ़िल्टर का एक विशेष मामला है जो एक श्रृंखला को सफेद शोर में परिवर्तित करता है। सामान्य तौर पर यह शोर (एक्स) बनाने के लिए एक्स को फ़िल्टर करना चाहता है और फिर उस संरचना को पहचानने या वाई और एक्स के बीच स्थानांतरण के प्रयोजनों के लिए वाई (आवश्यक रूप से सफेद शोर नहीं) बनाने के लिए वाई को फ़िल्टर लागू करें
आयरिशस्टैट

: User3544 मुझे आपके सरल सरल एकल रुझानों का उपयोग करके सराहना करनी चाहिए थी, लेकिन मुझे लगता है कि कभी-कभी किसी को भी ग्रहणशील नहीं होना चाहिए। सरल प्रवृत्ति अक्सर बेकार होती है यदि श्रृंखला में स्तर में बदलाव होते हैं या कई रुझान होते हैं। मापदंडों की कमी के बारे में परिकल्पना का परीक्षण करने के लिए मजबूत और संचालित होना चाहिए जहां एक समय में उस बिंदु के लिए खोज की जाती है जहां चाउ टेस्ट का उपयोग करके बिंदु को मनमाने ढंग से चुनने के बजाय मापदंडों में बदलाव हो सकता है। यह सर्वविदित है कि असामान्य मूल्य ऑटो-सहसंबंध के लिए नीचे पूर्वाग्रह परीक्षण करते हैं यही कारण है कि किसी को उनका पता लगाने की आवश्यकता है।
आयरिशस्टैट

आयरिशस्टैट: आपका तालियां अच्छी तरह से प्राप्त और सुनी जाती है .. :) मैं पूरी तरह से आपकी टिप्पणियों से सहमत हूं, हालांकि, दो समय श्रृंखला के भूखंडों को देखते हुए, मैंने सोचा कि "चलो इसे सरल रखें" .. :)
लालस

1
: user3544 मेरा पसंदीदा आइंस्टीन उद्धरण है "सब कुछ जितना संभव हो उतना सरल बनाएं, लेकिन सरल नहीं" या आराम करें मॉडल को यथासंभव सरल बनाएं, लेकिन सरल नहीं क्योंकि कुछ लोगों को लगता है कि सरल उद्देश्य है जबकि यह अपर्याप्त विश्लेषण का कारण हो सकता है। इस मामले में आपका सुझाव समसामयिक शिष्टाचार की पहचान करने के लिए पर्याप्त होगा और स्तर बदलाव को रोशन करते हुए दोनों सहकर्मियों के बीच अंतराल संबंध। और अधिक पढ़ें: brainyquote.com/quotes/quotes/a/...
आयरिशस्टैट

0

कुछ मामलों में कोई एक सैद्धांतिक मॉडल जानता है जिसका उपयोग आपकी परिकल्पना का परीक्षण करने के लिए किया जा सकता है। मेरी दुनिया में tis "ज्ञान" अक्सर अनुपस्थित है और किसी को सांख्यिकीय तकनीकों का सहारा लेना चाहिए जिसे खोजपूर्ण डेटा विश्लेषण के रूप में वर्गीकृत किया जा सकता है जो संक्षेप में बताता है। जब समय श्रृंखला डेटा का विश्लेषण जो गैर-स्थिर होता है, तो स्वत :संबंधी साधारण क्रॉस-सहसंबंध परीक्षण होते हैं अक्सर गलत भ्रामक के रूप में भ्रामक नासमझ आसानी से पाया जा सकता है। इसका सबसे पहला विश्लेषण यूल, GU, 1926 में पाया गया है, "हमें समय श्रृंखला के बीच कभी-कभी निरर्थक संबंध क्यों मिलते हैं? नमूने में एक अध्ययन और समय श्रृंखला की प्रकृति", जर्नल ऑफ़ द रॉयल स्टैटिस्टिकल सोसाइटी 89, 1- 64। वैकल्पिक रूप से जब एक या एक से अधिक श्रृंखला खुद को असाधारण गतिविधि से प्रभावित किया गया है (व्ह्यूबर देखें) 2001 में कोहोर्ट बी में अचानक झटका) जो महत्वपूर्ण रिश्तों को प्रभावी ढंग से छिपा सकता है। अब समय श्रृंखला के बीच एक संबंध का पता लगाने के लिए न केवल समकालीन रिश्तों बल्कि संभावित पिछड़े रिश्तों की भी जांच होती है। निरंतर, अगर या तो श्रृंखला विसंगतियों (एक बार की घटनाओं) से प्रभावित हुई है, तो हमें इन एक-बार की विकृतियों के लिए समायोजन करके अपने विश्लेषण को मजबूत करना होगा। समय श्रृंखला का साहित्य बताता है कि कैसे अधिक स्पष्ट रूप से संरचना की पहचान करने के लिए पूर्व-श्वेतकरण के माध्यम से रिश्ते की पहचान करें। अंतर-सहसंबंधी संरचना की पहचान करने से पहले अंतर-सहसंबंधी संरचना के लिए पूर्व-श्वेत समायोजन। ध्यान दें कि मुख्य शब्द संरचना की पहचान कर रहा था। यह दृष्टिकोण आसानी से निम्नलिखित "उपयोगी मॉडल" की ओर जाता है: अब समय श्रृंखला के बीच एक संबंध का पता लगाने के लिए न केवल समकालीन रिश्तों बल्कि संभावित पिछड़े रिश्तों की भी जांच होती है। निरंतर, अगर या तो श्रृंखला विसंगतियों (एक बार की घटनाओं) से प्रभावित हुई है, तो हमें इन एक-बार की विकृतियों के लिए समायोजन करके अपने विश्लेषण को मजबूत करना होगा। समय श्रृंखला का साहित्य बताता है कि कैसे अधिक स्पष्ट रूप से संरचना की पहचान करने के लिए पूर्व-श्वेतकरण के माध्यम से रिश्ते की पहचान करें। अंतर-सहसंबंधी संरचना की पहचान करने से पहले अंतर-सहसंबंधी संरचना के लिए पूर्व-श्वेत समायोजन। ध्यान दें कि मुख्य शब्द संरचना की पहचान कर रहा था। यह दृष्टिकोण आसानी से निम्नलिखित "उपयोगी मॉडल" की ओर जाता है: अब समय श्रृंखला के बीच एक संबंध का पता लगाने के लिए न केवल समकालीन रिश्तों बल्कि संभावित पिछड़े रिश्तों की भी जांच होती है। निरंतर, अगर या तो श्रृंखला विसंगतियों (एक बार की घटनाओं) से प्रभावित हुई है, तो हमें इन एक-बार की विकृतियों के लिए समायोजन करके अपने विश्लेषण को मजबूत करना होगा। समय श्रृंखला का साहित्य बताता है कि कैसे अधिक स्पष्ट रूप से संरचना की पहचान करने के लिए पूर्व-श्वेतकरण के माध्यम से रिश्ते की पहचान करें। अंतर-सहसंबंधी संरचना की पहचान करने से पहले अंतर-सहसंबंधी संरचना के लिए पूर्व-श्वेत समायोजन। ध्यान दें कि मुख्य शब्द संरचना की पहचान कर रहा था। यह दृष्टिकोण आसानी से निम्नलिखित "उपयोगी मॉडल" की ओर जाता है: यदि या तो श्रृंखला विसंगतियों (एक बार की घटनाओं) से प्रभावित हुई है, तो हमें इन एक बार की विकृतियों के लिए समायोजन करके अपने विश्लेषण को मजबूत करना होगा। समय श्रृंखला का साहित्य बताता है कि कैसे अधिक स्पष्ट रूप से संरचना की पहचान करने के लिए पूर्व-श्वेतकरण के माध्यम से रिश्ते की पहचान करें। अंतर-सहसंबंधी संरचना की पहचान करने से पहले अंतर-सहसंबंधी संरचना के लिए पूर्व-श्वेत समायोजन। ध्यान दें कि मुख्य शब्द संरचना की पहचान कर रहा था। यह दृष्टिकोण आसानी से निम्नलिखित "उपयोगी मॉडल" की ओर जाता है: यदि या तो श्रृंखला विसंगतियों (एक बार की घटनाओं) से प्रभावित हुई है, तो हमें इन एक बार की विकृतियों के लिए समायोजन करके अपने विश्लेषण को मजबूत करना होगा। समय श्रृंखला का साहित्य बताता है कि कैसे अधिक स्पष्ट रूप से संरचना की पहचान करने के लिए पूर्व-श्वेतकरण के माध्यम से रिश्ते की पहचान करें। अंतर-सहसंबंधी संरचना की पहचान करने से पहले अंतर-सहसंबंधी संरचना के लिए पूर्व-श्वेत समायोजन। ध्यान दें कि मुख्य शब्द संरचना की पहचान कर रहा था। यह दृष्टिकोण आसानी से निम्नलिखित "उपयोगी मॉडल" की ओर जाता है: ध्यान दें कि मुख्य शब्द संरचना की पहचान कर रहा था। यह दृष्टिकोण आसानी से निम्नलिखित "उपयोगी मॉडल" की ओर जाता है: ध्यान दें कि मुख्य शब्द संरचना की पहचान कर रहा था। यह दृष्टिकोण आसानी से निम्नलिखित "उपयोगी मॉडल" की ओर जाता है:

Y (T) = -194.45
+ [X1 (T)] [(+ 1.2396+ 1.6523B ** 1)] COHORTA

   +[X2(T)][(- 3.3924)]                :PULSE          3

   +[X3(T)][(- 2.4760)]                :LEVEL SHIFT   30 reflecting persistant  unusal activity

   +[X4(T)][(+ 1.1453)]                :PULSE         29

   +[X5(T)][(- 2.7249)]                :PULSE         11

   +[X6(T)][(+ 1.5248)]                :PULSE         27

   +[X7(T)][(+ 2.1361)]                :PULSE          4

   +[X8(T)][(+ 1.6395)]                :PULSE         13

   +[X9(T)][(- 1.6936)]                :PULSE         12

   +[X10(T)[(- 1.6996)]                :PULSE         19

   +[X11(T)[(- 1.2749)]                :PULSE         10

   +[X12(T)[(- 1.2790)]                :PULSE         17

  +       [A(T)]

जो १.२ ९ ३६ के समकालीन संबंध और १.६५२३ के पिछड़े प्रभाव का सुझाव देता है। ध्यान दें कि कई वर्षों से असामान्य गतिविधि की पहचान की गई थी। (1975,2001,1983,1999,1976,1985,1984,1991 और 1989)। वर्षों के लिए समायोजन हमें इन दो श्रृंखलाओं के बीच संबंधों का अधिक स्पष्ट रूप से आकलन करने की अनुमति देता है।

पूर्वानुमान लगाने के संदर्भ में

मॉडल के रूप में
एक एक्स YAXAX Y [t] = एक [1] Y [t-1] + ... + एक [p] Y [tp]
+ w [०] X [t-०] + ... + w [r] X [tr]
+ b [१] a [t-१] + ... + b [q] [a tq]
+ स्थिर

द राइट-हैंड साइड कॉन्स्टेंट IS: -194.45 है

COHORTA 0 1.239589 X (39) * 78.228616 = 96.971340

COHORTA 1 1.652332 X (38) * 77.983000 = 128.853835

I ~ L00030 0 -2.475963 X (39) * 1.000000 = -2.475963

      NET PREDICTION FOR Y(    39 )=                     28.894826 

चार गुणांक वे सभी हैं जो कोहार्टा के लिए ARIMA मॉडल से प्राप्त की गई समयावधि 39 (78.228616) पर एक पूर्वानुमान और निश्चित रूप से कोहोर्टा के लिए एक भविष्यवाणी करने के लिए आवश्यक है।


4
38 वर्षों में से नौ "असामान्य" गतिविधियों का प्रदर्शन करते हैं? (जाहिरा तौर पर) 25 मापदंडों के साथ एक मॉडल में ?! उस व्याख्या में कुछ गड़बड़ है। इन सभी दालों और स्तर की शिफ्ट के अलावा, क्या आपने कोहलर बी के चलन में अभी तक नॉनलाइनियर घटक पाया है ?
whuber

2
सही कॉलम (3, 30, 29, 11, आदि) में नंबर क्या हैं? वे डेटा के आपके विवरण का हिस्सा प्रतीत होते हैं और इसलिए पैरामीटर भी हैं। यहां तक ​​कि अगर हम उन्हें नहीं गिनते हैं, 38 मानों का वर्णन करने के लिए 14 मापदंडों का उपयोग करते हुए, खासकर जब सवाल बस "एक प्रवृत्ति है?", अत्यधिक लगता है। उस बात के लिए, वास्तव में क्या प्रवृत्ति है? जहां इन सभी अनुमानों में कोई इसे खोदता है? यदि एक चिकित्सक आपसे संपर्क करने और पूछने के लिए, "ठीक है, 1972 के बाद से कोहोर्ट बी में रोगियों के लिए क्या पूरा किया गया है," क्या आप उन्हें एक स्पष्ट वाक्य में बता सकते हैं?
व्हिबर

2
"बहुत शक्तिशाली भविष्यवाणी": मुझे गलतफहमी हो सकती है कि आपके मॉडल में क्या मात्रा है, लेकिन सामान्य तौर पर, एक विधि (समय श्रृंखला या अन्यथा) के बेहतर विवरण जो किसी के डेटा के एक चौथाई को "असामान्य" के रूप में पहचानते हैं और "समायोजन" की आवश्यकता होगी "ओवरफ़ीड" और "अनावश्यक रूप से जटिल।" कोहोर्ट बी में बिना किसी प्रवृत्ति के आपका दावा बस अविश्वसनीय है।
whuber

2
@ एडम, क्योंकि यह विश्लेषण अनिवार्य रूप से 10 "दालों" में निहित परिवर्तनशीलता के बारे में जानकारी को नजरअंदाज करता है, "पूर्वानुमान के आसपास होने वाली कोई भी भविष्यवाणी बैंड अत्यधिक अति-आशावादी (बहुत तंग) होगी। इसके अलावा, एक गहन विश्लेषण जिसमें सभी डेटा शामिल हैं (मेरे चित्रण विश्लेषण के विपरीत जिसमें केवल पहली छमाही शामिल है) एक गैर-रेखीय घटक का पता लगाएगा जो प्रवृत्ति में मामूली गिरावट के साथ संगत होगा, और वह भी यहां पता नहीं लगाया गया है। पूर्वानुमान से अधिक महत्व 2000-2001 के प्रभाव को समझ रहा है: यदि इसे दोहराया जा सकता है, तो सभी पूर्वानुमान गलत होने की संभावना है।
whuber

1
@ मैं पूरी तरह से सभी तकनीकी शब्दजाल को नहीं जानता, लेकिन आपकी व्याख्या समझदारी का एक अच्छा सौदा है। बहुत बहुत धन्यवाद।
एडम

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.