अत्यधिक अनियमित समय श्रृंखला


10

मेरे पास विभिन्न मछलियों की संख्या का डेटा है, जो लगभग 5 वर्षों की अवधि में नमूना है, लेकिन बहुत अनियमित पैटर्न में। कभी-कभी नमूनों के बीच महीनों होते हैं, कभी-कभी एक महीने में कई नमूने होते हैं। कई 0 भी मायने रखते हैं

ऐसे डेटा से कैसे निपटें?

मैं आर में आसानी से इसे ग्राफ कर सकता हूं, लेकिन ग्राफ विशेष रूप से रोशन नहीं हैं, क्योंकि वे बहुत ऊबड़ हैं।

मॉडलिंग के संदर्भ में - प्रजातियों के साथ विभिन्न चीजों के एक समारोह के रूप में मॉडलिंग की - शायद एक मिश्रित मॉडल (उर्फ मल्टीलेवल मॉडल)।

किसी भी संदर्भ या विचारों का स्वागत है

टिप्पणियों के जवाब में कुछ विवरण

लगभग 15 प्रजातियां हैं।

मैं प्रत्येक मछली में किसी भी रुझान या मौसमी का विचार प्राप्त करने की कोशिश कर रहा हूं, और देखो कि प्रजातियां एक-दूसरे से कैसे संबंधित हैं (मेरा ग्राहक मूल रूप से सहसंबंधों की एक सरल तालिका चाहता था)

लक्ष्य वर्णनात्मक और विश्लेषणात्मक है, न कि भविष्य कहनेवाला

आगे के संपादन: मुझे के। रहफ़ी वगैरह द्वारा यह पेपर मिला, जो अत्यधिक अनियमित समय श्रृंखला के लिए ACF का अनुमान लगाने के लिए गौसियन गुठली का उपयोग करने का सुझाव देता है।

http://www.nonlin-processes-geophys.net/18/389/2011/npg-18-389-2011.pdf


1
मैं आपके सवाल का जवाब देने के लिए सही आदमी नहीं हूं, लेकिन एक बहुस्तरीय मॉडल उचित लगता है। नमूने कितने बड़े हैं, इस बारे में कोई संकेत है कि कितनी प्रजातियां हैं, और शून्य गणना कैसे आती है? (आखिरी बिंदु पर, क्या नमूने यादृच्छिक नमूनों पर प्रयास करते हैं, या वे पक्षपातपूर्ण हैं, जैसे कि आपको बस एक बास-मछली पकड़ने की प्रतियोगिता से गिनती मिली जो शायद किसी भी कैटफ़िश का उत्पादन नहीं करेगी?)
वेन

1
"के साथ सौदा" का अर्थ है, बिल्कुल? अनियमित समय के साथ मुकाबला करने के बारे में कुछ विचार के लिए इस साइट पर खोज "+ अनियमित + समय"
whuber

क्या आप नमूने और लक्ष्य को स्पष्ट कर सकते हैं? उदाहरण के लिए यह कैप्चर-रिकैपचर है? क्या यह बिना रिलीज के एक विशेष अवधि के लिए एक धारा में रखा गया जाल है? क्या आप भविष्य के नमूने के आकार या उस बड़ी आबादी का अनुमान लगाने की कोशिश कर रहे हैं जिससे एक नमूना तैयार किया गया है? 1 या कई स्थानों से नमूने हैं? अनियमित समय श्रृंखला के साथ कुछ भी गलत नहीं है, लेकिन नमूने की घटनाओं और नमूनों के बीच और कुछ लक्ष्य चर (जैसे एक मॉडल प्रतिक्रिया) के बीच संबंध को समझना थोड़ा कठिन है। साथ ही, क्या प्रकृति में लक्ष्य पूर्वानुमान या वर्णनात्मक है?
इटरेटर

2
कोई इस प्रश्न को क्यों वोट देगा? बेहतर प्रश्न या उत्तर विकसित करने में मदद करने की कोशिश क्यों नहीं की गई?
०ator

2
@ इटरेटर क्योंकि अब भी, "आगे संपादन" के बाद, यहाँ कोई स्पष्ट प्रश्न नहीं है। डाउनवोट (मेरी पहली टिप्पणी पर कोई प्रतिक्रिया नहीं होने के बाद दिया गया) ओपी को आवश्यक सुधार प्रदान करने के लिए प्रोत्साहित करने के लिए रखा गया था, साथ ही साथ प्रश्न के केवल आंशिक रूप से गठित स्थिति का संकेत था। यह हर पाठक का काम नहीं है (न ही mods, उस बात के लिए) यह अनुमान लगाने के लिए कि क्या इरादा है!
whuber

जवाबों:


10

मैंने काफी समय बिताया है कि असमान-दूरी वाली समय श्रृंखला के लिए एक सामान्य ढांचा तैयार करना: http://www.eckner.com/research.html

इसके अलावा, मैंने लिखा है कि कागज असमान रूप से समय की श्रृंखला के लिए प्रवृत्ति और मौसमी अनुमान के बारे में है।

मुझे आशा है कि आपको परिणाम उपयोगी मिलेंगे!


5
धन्यवाद! वह विश्लेषण बहुत पहले हो चुका था और अब मैं ऐसा नहीं कर रहा हूं, लेकिन फिर से ऐसी ही बातें सामने आ सकती हैं; और अन्य लोग इन थ्रेड को बहुत खोजते हैं, इसलिए आपकी टिप्पणी व्यर्थ नहीं है।
पीटर Flom

जानकारी के लिए धन्यवाद (और वास्तव में वर्षों बाद इंटरनेट पर कोई इसे ढूंढ रहा है!), लेकिन लिंक मृत हो गया है।
झुका

2

मुझे नहीं पता कि क्या एक मिश्रित मॉडल बहुत उपयुक्त है (मानक पैकेजों का उपयोग करके जहां यादृच्छिक प्रभाव संरचना एक रैखिक भविष्यवक्ता है), जब तक आपको नहीं लगता कि सभी बिंदुओं पर डेटा किसी न किसी अर्थ में एक दूसरे के साथ विनिमेय होना चाहिए (जिस स्थिति में अनियमित अंतराल एक गैर-मुद्दा है) - यह वास्तव में एक उचित तरीके से लौकिक निरूपण मॉडलिंग नहीं करेगा। यह संभव है कि आप किसी प्रकार की ऑटोग्रेसिव चीज़ को करने में lmer () को चकमा दे सकते हैं लेकिन आप वास्तव में ऐसा कैसे करेंगे जो मुझे अभी बचता है (मैं सीधे नहीं सोच सकता हूं)। इसके अलावा, मुझे यकीन नहीं है कि "समूहीकरण चर" क्या होगा जो मिश्रित मॉडल परिदृश्य में स्वत :संबंध उत्पन्न करता है।

यदि टेम्पोरल ऑटोकैरेलेशन एक उपद्रव पैरामीटर है और आप इसे बहुत अधिक होने की उम्मीद नहीं करते हैंबड़े, तो आप डेटा को उन युगों में बिन कर सकते हैं जो अनिवार्य रूप से सहसंबंध के संदर्भ में एक दूसरे से असम्बद्ध हैं (उदाहरण के लिए समय श्रृंखला को उन बिंदुओं पर अलग करें जहां कोई डेटा के महीने नहीं हैं) और उन्हें स्वतंत्र प्रतिकृति के रूप में देखें। आप तब इस संशोधित डेटा सेट पर एक GEE जैसा कुछ कर सकते हैं, जहां "क्लस्टर" को परिभाषित किया गया है कि आप किस युग में हैं, और कार्य सहसंबंध मैट्रिक्स की प्रविष्टियां एक फ़ंक्शन हैं, जहां तक ​​अवलोकन किए गए थे। यदि आपका प्रतिगमन समारोह सही है, तो आपको अभी भी प्रतिगमन गुणांक के लगातार अनुमान मिलेंगे, भले ही सहसंबंध संरचना गलत हो। यह आपको उदाहरण के लिए, लॉग-लिंक (जैसा कि आमतौर पर पॉइसन रिग्रेशन में होता है) का उपयोग करके इसे गिनने की अनुमति देता है। आप प्रजातियों के बीच कुछ अंतर सहसंबंध में भी निर्माण कर सकते हैं, जहां प्रत्येक बार बिंदु को प्रजातियों के बहुभिन्नरूपी वेक्टर के रूप में देखा जाता है, समय बिंदुओं के बीच कुछ अस्थायी रूप से क्षय संघ के साथ गिना जाता है। ऐसा करने के लिए मानक GEE संकुल को रौंदने के लिए कुछ पूर्व-प्रसंस्करण की आवश्यकता होगी।

यदि टेम्पोरल ऑटोकैरेलेशन एक उपद्रव पैरामीटर नहीं है, तो मैं एक संरचित सहसंयोजक मॉडल की तरह कुछ और करने की कोशिश करूंगा, जहां आप संपूर्ण डेटासेट को एक बड़े बहुभिन्नरूपी वेक्टर के अवलोकन के रूप में देखते हैं, जैसे कि प्रजाति पर बीच है यू , वीYs,Ytu,v

cov(Ys,Yt)=fθ(s,t,u,v)

जहां , कुछ पैरामीट्रिक मानकों की एक सीमित संख्या के लिए ऊपर जाना जाता समारोह है , मानकों मतलब संरचना को नियंत्रित करने के एक नंबर के साथ। आपको इस तरह के एक मॉडल के लिए "अपना खुद का निर्माण" करने की आवश्यकता हो सकती है, लेकिन गिनती डेटा के लिए इस तरह की चीजें करने के लिए एमपीएलयूएस पैकेज होने पर मुझे आश्चर्य नहीं होगा।θfθ


धन्यवाद @macro मुझे लगता है कि एक मिश्रित मॉडल ठीक हो सकता है क्योंकि वे अक्सर डेटा के लिए उपयोग किए जाते हैं जो समय में निहित है; मुझे ऑटोक्रेलेशन के मॉडलिंग में कोई दिलचस्पी नहीं है - अर्थात, यह एक उपद्रव है। मैं मानता हूं कि समय रैखिक नहीं होगा, लेकिन मैं समय के प्रभाव को जोड़ सकता हूं (यह सुनिश्चित नहीं है कि कौन से लोग अभी भी हैं, लेकिन मैं इसका पता लगा सकता हूं)। मेरे पास MPLUS नहीं है, लेकिन मेरे पास R और SAS हैं।
पीटर Flom

1
मैं केवल यह कह रहा हूं कि एक मानक मिश्रित मॉडल इस स्थिति में उपयुक्त नहीं हो सकता है। यादृच्छिक अवरोधन बेकार है अगर आपको नहीं लगता कि सहसंबंध के संदर्भ में कई बार अंक विनिमेय हैं (यानी यह केवल आपके वास्तविक सहसंबंध संरचना के लिए 'विनिमेय सहसंबंध' दुनिया के भीतर एक सन्निकटन की पेशकश करेगा)। समय में यादृच्छिक ढलानों को शामिल करना आपको इंगित करता है कि आपको लगता है कि प्रक्षेपवक्र समय के साथ "कहीं जा रहा है" - चूंकि साजिश आपके लिए बहुत रोशन नहीं थी, यह शायद नहीं हो रहा है। मैं मानता हूँ, आप (कुछ) और अधिक उपयुक्त करने में सक्षम हो सकता है।
मैक्रों

2
+1 उन सभी प्रमुख बिंदुओं को संबोधित करने के लिए एक अच्छा, संक्षिप्त उत्तर, जिन्हें मैंने संबोधित करने के लिए सोचा था। R में संकुल के बारे में, CRAN की एक Google खोज, [पॉइसन रिग्रेशन टेम्पोरल] के लिए कई पैकेजों को बदल देती है। surveillanceपैकेज कार्यक्षमता वांछित हो सकता है। पारिस्थितिक अध्ययन में इस तरह की मॉडलिंग असामान्य नहीं है, इसलिए संभवतः सीआरएएन के पारिस्थितिक नुक्कड़ में एक अच्छा पैकेज ढूंढना सबसे अच्छा है।
आइटरेटर
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.