समय श्रृंखला के लिए परिकल्पना परीक्षण और महत्व


20

दो पॉपुलेशन को देखते हुए महत्व का एक सामान्य परीक्षण यदि संभव हो तो टी-टेस्ट, युग्मित टी-टेस्ट है। यह मानता है कि वितरण सामान्य है।

क्या ऐसी ही सरलीकृत धारणाएं हैं जो एक समय श्रृंखला के लिए एक महत्वपूर्ण परीक्षण का निर्माण करती हैं? विशेष रूप से हमारे पास चूहों की दो काफी छोटी आबादी है जिनका इलाज अलग तरीके से किया जा रहा है, और हम सप्ताह में एक बार वजन माप रहे हैं। दोनों रेखांकन सुचारू रूप से बढ़ते हुए कार्य प्रदर्शित करते हैं, एक ग्राफ निश्चित रूप से दूसरे के ऊपर। हम इस संदर्भ में "निश्चितता" कैसे निर्धारित करते हैं?

अशक्त परिकल्पना यह होनी चाहिए कि दो आबादी का भार "समय बीतने के समान व्यवहार" हो। एक साधारण मॉडल के संदर्भ में इसे कैसे तैयार किया जा सकता है, जो कि बहुत ही कम मापदंडों के साथ काफी सामान्य है (जैसे सामान्य वितरण सामान्य हैं)? एक बार ऐसा करने के बाद, कोई व्यक्ति पी-वैल्यू के अनुरूप महत्व या किसी चीज को कैसे माप सकता है? चूहों की जोड़ी बनाने के बारे में क्या, जितनी संभव हो उतने विशेषताओं के साथ मेल खाते हैं, प्रत्येक जोड़ी में दो आबादी में से प्रत्येक से एक प्रतिनिधि होता है?

मैं समय-श्रृंखला के बारे में कुछ प्रासंगिक अच्छी तरह से लिखित और आसानी से समझी गई पुस्तक या लेख के लिए एक सूचक का स्वागत करूंगा। मैं एक अज्ञानी के रूप में शुरू करता हूं। आपकी सहायता के लिए धन्यवाद।

डेविड एपस्टीन


आप एक व्यापक जाल डालने की इच्छा कर सकते हैं, क्योंकि यह आवश्यक रूप से एक समय श्रृंखला प्रश्न नहीं है। वास्तव में, शायद सबसे बुनियादी सवाल यहां सबसे अच्छा या कम से कम सही तरीके से एक उपचार "समापन बिंदु" निर्धारित करता है: क्या इसका मतलब है कि एक निश्चित समय के बाद जनसंख्या में वृद्धि, समय के साथ औसत विकास दर, आदि? यदि आप प्रयोग शुरू करने से पहले यह नहीं जानते थे और अचानक विकास वक्रों में लगातार अंतर को नोटिस कर रहे हैं, तो आप एक खोजपूर्ण मोड में काम कर रहे हैं , एक पुष्टिकरण नहीं और हाइपोथिसिस-परीक्षण पी-वैल्यू भ्रामक रूप से अच्छे होंगे।
whuber

परिणाम गुणात्मक रूप से अपेक्षित है, और एक तरफा परीक्षण उचित लगता है। समय श्रृंखला के बारे में मैंने जो कारण पूछा है, वह यह है कि यदि कोई केवल अंतिम वजन (जो सबसे अधिक प्रासंगिक माप है) को मापता है, तो कोई पहले की सभी सूचनाओं को समय बिंदुओं से दूर कर रहा है, और यह गलत लगता है।
डेविड एपस्टीन

आप सही हैं: आप उन डेटा को फेंकना नहीं चाहते हैं। लेकिन डेटा के मॉडल के लिए समय श्रृंखला तकनीक सामने आती है जहां आदर्श घटता से विचलन के अस्थायी सहसंबंध महत्वपूर्ण हैं, या तो अपनी रुचि के लिए या क्योंकि वे अच्छे अनुमान के साथ हस्तक्षेप कर सकते हैं। आपकी स्थिति के इन मामलों में गिरने की संभावना नहीं है। सरल, अधिक वैज्ञानिक रूप से सार्थक तरीके उपलब्ध हैं।
व्हिबर

@whuber, कुछ अर्थों में चूहों के नियंत्रण सेट "आदर्शीकृत वक्र" के समय वजन नहीं है? या कम से कम, एक सैद्धांतिक मॉडल उस डेटा के लिए फिट है?
n

1
हां, @naught, यह देखने का एक उचित तरीका है। लेकिन "वक्र" "समय श्रृंखला" के समान नहीं है। उदाहरण के लिए, रैखिक प्रतिगमन डेटा के लिए फिटिंग घटता के रूप में (और अक्सर) देखा जा सकता है, लेकिन समय श्रृंखला विश्लेषण से अलग है, जो डेटा और आदर्शित वक्र के बीच विचलन के बीच सहसंबंधों की संरचना पर जोर देता है।
whuber

जवाबों:


1

इसे करने के कई तरीके हैं यदि आप एक डायनामिक प्रक्रिया के रूप में वजन भिन्नता के बारे में सोचते हैं।

उदाहरण के लिए, इसे इंटीग्रेटर रूप में मॉडल किया जा सकता है x˙(t)=θx(t)+v(t)

जहां वजन भिन्नता है, संबंध वजन में कितनी तेजी से होता है और एक स्टोकेस्टिक गड़बड़ी है जो वजन भिन्नता को प्रभावित कर सकती है। आप एक ज्ञात लिए को रूप में मॉडल कर सकते हैं (आप इसका अनुमान भी लगा सकते हैं)।x(t)θv(t)v(t)N(0,Q)Q

यहां से, आप दो आबादी (और उनके सहसंयोजक) के लिए पैरामीटर को पहचानने की कोशिश कर सकते हैं , उदाहरण के लिए, एक भविष्यवाणी त्रुटि विधि। गाऊसी धारणा रखता है, भविष्यवाणी त्रुटि तरीकों दे देंगे कि के अनुमान भी गाऊसी (asymptotically) है और इसलिए आप एक परिकल्पना निर्धारित करने के लिए परीक्षण का निर्माण कर सकते हैं कि क्या के अनुमान सांख्यिकीय की है कि के करीब है ।θθθ1θ2

एक संदर्भ के लिए, मैं इस पुस्तक का सुझाव दे सकता हूं ।


0

मैं प्रत्येक चूहों के लिए एक ARIMA मॉडल को अलग से पहचानने और फिर समानता और सामान्यीकरण के लिए उनकी समीक्षा करने का सुझाव दूंगा। उदाहरण के लिए यदि पहले चूहों में AR (1) और दूसरे में AR (2) है, तो सबसे सामान्य (सबसे बड़ा) मॉडल AR (2) होगा। इस मॉडल को विश्व स्तर पर अर्थात संयुक्त समय श्रृंखला के लिए अनुमानित करें। समूहों में निरंतर मापदंडों की परिकल्पना का परीक्षण करने के लिए एफ मान उत्पन्न करने के लिए वर्गों के दो व्यक्तिगत त्रुटि योग के योग के साथ संयुक्त सेट के लिए वर्गों की त्रुटि राशि की तुलना करें। मेरी इच्छा है कि आप अपना डेटा पोस्ट कर सकते हैं और मैं इस परीक्षण का सटीक वर्णन करूंगा।

अतिरिक्त टिप्पणियां:

चूंकि डेटा सेट स्वत: सहसंबद्ध सामान्यता लागू नहीं होता है। यदि अवलोकन समय के साथ स्वतंत्र होते हैं, तो कुछ प्रसिद्ध गैर-समय श्रृंखला विधियों में से कुछ को लागू कर सकते हैं। समय श्रृंखला के बारे में एक आसान पुस्तक पढ़ने के बारे में आपके अनुरोध के संदर्भ में, मैं एडिसन-वेस्ले द्वारा वी पाठ का सुझाव देता हूं। सामाजिक वैज्ञानिक मैक्लेरी और हे (1980) के गैर-गणितीय दृष्टिकोण को अधिक सहज और कठोर होने का अभाव पाएंगे।


1
यह वास्तव में मूलभूत मुद्दों को संबोधित करने के लिए प्रकट नहीं होता है। (१) ऐसा मॉडल उपयुक्त क्यों है? (२) प्रत्येक माउस को मॉडल क्यों बनाया जाना चाहिए और नहीं कहना चाहिए, इसका मतलब वजन या वजन में होता है? (३) निरंतर मापदंडों का परीक्षण प्रासंगिक क्यों है? प्रश्न एक-पूंछ वाले परीक्षण के लिए भीख माँगता है। आपके द्वारा उल्लिखित अधिकांश पैरामीटर वैज्ञानिक रूप से प्रासंगिक नहीं दिखाई देते हैं, और न ही वे सीधे एक ग्राफ के दूसरे से ऊपर होने की भावना को निर्धारित करते हैं। (४) प्रयोग की शुरुआत में दो आबादी की विशेषताओं में संभावित अंतरों को आप कैसे नियंत्रित करते हैं?
whuber

: पूर्णतया प्रासंगिकता की कसौटी पर कसने के लिए, क्योंकि आपके पास ascoefficients का फ़र्स्ट ग्रुप है, जो फ़्रेडहाउस के 1 और दूसरे गुणांक का दूसरा समूह है। सवाल यह है कि "गुणांक के बीच सामूहिक रूप से महत्वपूर्ण अंतर है"। अपनी टिप्पणी के साथ जारी रखें। चूँकि एक मॉडल गुणांक एक स्थिर हो सकता है और यदि यह गुणांक के बीच का अंतर है तो योगी स्थिरांक एक दूसरे से सांख्यिकीय रूप से भिन्न होने के कारण हो सकते हैं। ध्यान दें कि अंतर्निहित ARIMA मॉडल आवश्यक रूप से स्थिर नहीं हो सकता है क्योंकि यह एक अंतर मॉडल हो सकता है।
आयरिशस्टैट

1
मुझे लगता है कि आप आंशिक रूप से सही हैं, लेकिन आपको समस्या के अपने लक्षण वर्णन को परिष्कृत करने की आवश्यकता है। ARIMA के कई गुणांक वैज्ञानिक रूप से अप्रासंगिक हो सकते हैं। उदाहरण के लिए, अगर उनमें से एक समय के साथ एक द्विघात शब्द की तरह काम करता है, तो एक अंतर विकास घटता के आकार के बारे में कुछ कह सकता है लेकिन यह बहुत कम उपयोग हो सकता है। यदि कोई प्रायोगिक समापन बिंदु को दर्शाता है और केवल उनका परीक्षण करने के लिए गुणांक चुनता है, तो कुछ अच्छा हासिल किया जा सकता है। सामान्य तौर पर, हालांकि, समय श्रृंखला मॉडल गुणांक (उदाहरण के लिए, स्वसंरचना) को यहां प्रत्यक्ष वैज्ञानिक हित के होने की संभावना नहीं है।
whuber

व्हुबर: "यदि कोई प्रायोगिक समापन बिंदुओं को प्रदर्शित करने के लिए गुणांक का चयन करता है और केवल उनका परीक्षण करता है, तो कुछ अच्छा हासिल किया जा सकता है" इससे मुझे कोई मतलब नहीं है क्योंकि यह मध्यवर्ती बिंदुओं की उपेक्षा करता है। आपकी टिप्पणी के विपरीत, समय श्रृंखला मोड और यह गुणांक के साथ महत्वपूर्ण वैज्ञानिक हित हैं क्योंकि यह रीडिंग के वितरण की विशेषता है और उन्हें एक यादृच्छिक प्रक्रिया (त्रुटि अवधि) में परिवर्तित करता है जो ऑटोकैरेक्स्ट्रक्चर संरचना से मुक्त है और फिर परीक्षणों के लिए उत्तरदायी है सामान्यता की आवश्यकता है। मेरे द्वारा प्रस्तावित परीक्षण के लिए यह धारणा आवश्यक है।
आयरिशस्टैट

1
यहां ऑटोक्रेलेशन का बहुत कम महत्व हो सकता है। ब्याज स्पष्ट रूप से प्रवृत्तियों पर केंद्रित है: अंतर्निहित विकास घटता दो आबादी के बीच अंतर कैसे करते हैं? ऑटोकैरेलेशन पैरामीटर उपद्रव पैरामीटर हैं, जिन्हें पेश किया जाना चाहिए और केवल इनोफ़ार के साथ निपटा जाना चाहिए क्योंकि वे उन विकास घटता के अनुमान को बेहतर बनाने में मदद कर सकते हैं। पहली प्राथमिकता विकास के एक वैज्ञानिक मॉडल को अपनाना है, उस मॉडल को उन मापदंडों का प्रतिनिधित्व करना है जो व्याख्यात्मक और रुचि के हैं, और उनका अनुमान लगाते हैं। समय श्रृंखला तकनीकों के स्वचालित अनुप्रयोग को पूरा करने की संभावना नहीं है।
whuber
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.