एक चुनौतीपूर्ण डेटा सेट के लिए कौन सा मॉडल है? (बहुत सारे घोंसले के शिकार के साथ समय श्रृंखला)


9

मेरे पास विश्लेषण करने के लिए काफी जटिल डेटा सेट है, और मैं इसके लिए एक अच्छा समाधान नहीं ढूंढ सकता।

ये रही बात:

1. कच्चा डेटा अनिवार्य रूप से कीट गीत रिकॉर्डिंग है। प्रत्येक गीत कई फट से बना है, और प्रत्येक फट उप-इकाइयों से बना है। सभी व्यक्तियों को 5 मिनट के लिए रिकॉर्ड किया गया है। विस्फोटों की संख्या और रिकॉर्डिंग में उनकी स्थिति व्यक्तियों के बीच बहुत भिन्न हो सकती है, साथ ही प्रति-उप-इकाइयों की संख्या भी फट सकती है।

2. मेरे पास प्रत्येक उप-इकाई की वाहक आवृत्ति (मौलिक आवृत्ति) है, और यही मैं विश्लेषण करना चाहता हूं।

मेरी समस्याएं:

1. एक फट के भीतर आवृत्तियों स्पष्ट रूप से स्वतंत्र नहीं हैं (हालांकि यह बहुत स्थिर है, लेकिन उप-इकाई n-1 की आवृत्ति का उप-इकाई n पर प्रभाव पड़ेगा)।

2. एक रिकॉर्डिंग के भीतर फट भी स्वतंत्र नहीं हैं।

3. वे और भी कम स्वतंत्र हैं क्योंकि समय के साथ आवृत्ति गिरती है (व्यक्ति गायन से थक जाता है इसलिए गाने की आवृत्ति कम और कम हो जाती है)। गिरना रेखीय लगता है।

4. घोंसला बनाना = मेरे पास दो स्थानों ए और बी के लिए 3 प्रतिकृति आबादी है इसलिए मेरे पास ए 1, ए 2, ए 3 और बी 1, बी 2, बी 3 है।

मैं क्या करना चाहूंगा:

1. मेरे दो स्थानों के बीच की आवृत्ति में अंतर को स्पष्ट करें (यह सांख्यिकीय रूप से परीक्षण करें)

2. दो स्थानों के बीच फ़्रीक्वेंसी ड्रॉपिंग को विशेषता दें (देखें कि उनमें से किसी एक में यह तेजी से गिरता है)

यह कैसे करना है:

खैर इसीलिए मुझे मदद की ज़रूरत है: मुझे नहीं पता ऐसा लगता है कि मेरा मामला उन समस्याओं को जोड़ता है जो आमतौर पर एक साथ नहीं देखी जाती हैं। मैंने मिश्रित मॉडल के बारे में, GAM के बारे में, ARIMA के बारे में, यादृच्छिक और निश्चित प्रभावों के बारे में पढ़ा है, लेकिन मैं वास्तव में इसे करने के सर्वोत्तम तरीके के बारे में निश्चित नहीं हूं। जब मैं इसे ग्राफ करता हूं (फ़्रीक्वेंसी ~ सब-यूनिट नंबर n ), तो दोनों स्थानों के बीच अंतर बहुत स्पष्ट है। मुझे अन्य चर को भी ध्यान में रखना होगा, जैसे तापमान (आवृत्ति अधिक बनाता है), आदि।

के बारे में मैंने सोचा:

  • व्यक्तियों को उनकी प्रतिकृति के भीतर से घोंसला बनाना और स्थान (व्यक्तिगत / प्रतिकृति / स्थान) के भीतर प्रतिकृति को घोंसला बनाना चाहिए।

  • एक यादृच्छिक 'फट' प्रभाव का उपयोग करें, इसलिए मैं प्रत्येक फट के भीतर परिवर्तनशीलता को ध्यान में रखता हूं।

  • आवृत्ति छोड़ने के उपाय को मापने के लिए एक निश्चित 'बर्स्ट पोजिशनिंग इन रिकॉर्डिंग' प्रभाव का उपयोग करें (उम्मीद है कि यह वास्तव में रैखिक है)।

क्या यह सही होगा?

क्या इस तरह के परिदृश्य के लिए मैं एक विशेष प्रकार का मॉडल इस्तेमाल कर सकता हूं?


इस साइट में आपका स्वागत है, जो। अपनी पोस्ट में साइन इन करने की आवश्यकता नहीं है, आपका नाम हमेशा आपके ग्रेवटर के नीचे दिखाई देगा :)
chl

ठीक है, और धन्यवाद! यह बहुत अच्छी वेबसाइट है, बहुत अच्छी तरह से बनाई गई है।
जो

"व्यक्तियों को उनके आकार के अनुसार घोंसला बनाना, और स्थान (व्यक्ति / प्रतिकृति / स्थान) के भीतर प्रतिकृति को घोंसला बनाना" गैर-नेस्टेड रूपों की तुलना में एक अच्छा विचार लगता है। आपकी छह उप-आबादी का एक LO कैसा दिखता है?
Fr.

1
आपके जवाब के लिए बहुत बहुत धन्यवाद, वास्तव में इसकी सराहना की। खैर, मुझे बहुत समय हो गया, लेकिन मैं इस (खूनी) डेटासेट का विश्लेषण करने में कामयाब रहा। मैं बहुत महत्वाकांक्षी था, मुझे लगता है कि एक ही समय में सब कुछ मॉडल करना चाहता था। इसलिए मैंने प्रत्येक समस्या (औसत आवृत्ति अंतर, आवृत्ति में वृद्धि, आदि) के लिए कई मॉडलों में नौकरी में विभाजित किया। निष्कर्ष: कभी-कभी नौकरी को विभाजित करने के लिए यह बेहतर है!
जो

जवाबों:


2

यह सिर्फ कुछ सामान्य सुझाव हैं जो आपको मददगार लग सकते हैं, एक नुस्खा से अधिक रोडमैप।

  • मेरी वृत्ति एक बायेसियन पदानुक्रमित मॉडल बनाने की होगी, क्योंकि यह खुद को पुनरावृत्त मॉडल के विकास के लिए उधार देता है - मुझे नहीं लगता कि आपको एक मौजूदा मॉडल मिलेगा जिसमें आपके बाद सभी घंटियाँ और सीटी हैं। लेकिन इससे परिकल्पना परीक्षण कठिन हो जाता है, मुझे नहीं पता कि आपके लिए परिकल्पना परीक्षण कितना आवश्यक है।
  • ऐसा लगता है कि आपको अपने सिर में थोड़ा अनौपचारिक मॉडल मिला है कि कीड़े कैसे व्यवहार करते हैं; आप "थका हुआ" जैसी चीजें कहते हैं और आप जानते हैं कि तापमान आवृत्ति को उच्च बनाता है, संभवतः क्योंकि जानवर में अधिक ऊर्जा होती है। ऐसा लगता है कि आप अपने दिमाग में एक छोटा सा जेनेरेटिव मॉडल ले आए हैं कि कीड़े कैसे अपने गाने बनाते हैं।
  • समस्या "एक शॉट में" मॉडल के लिए बहुत जटिल लगती है। मुझे लगता है कि आपको कुछ टुकड़ों का निर्माण करना होगा। मैं कुछ "मजबूत सरल मान्यताओं" के साथ शुरू करूंगा - यानी, डेटासेट की अधिकांश जटिलता को दूर फेंक दें, इसे बाद में एक बार जोड़ने के लिए एक योजना के साथ जब आप एक सरल मॉडल प्राप्त करते हैं जो काम करता है।

तो शुरू करने के लिए, मैं एक (मतलब फ़्रीक्वेंसी, फ़्रीक्वेंसी ट्रेंड) पेयर जैसे कुछ-कुछ-फ़ुटने के आधार पर सब-यूनिट फ़्रीक्वेंसी को प्री-फ़ॉर प्रीप्रोसेस की तरह करूँगा - ओएलएस के साथ ऐसा करें, और फ़्रीक्वेंसी माध्य और ट्रेंड को मॉडल करें एक विस्फोट के बजाय तब उप-इकाइयां स्वयं। या आप कर सकते हैं (मतलब, प्रवृत्ति, उप इकाइयों का #), अगर सबयूनिट की संख्या कीट से कितनी थका रही है। फिर एक बायेसियन श्रेणीबद्ध मॉडल का निर्माण करें जहां माध्य का वितरण और फटने की प्रवृत्ति का अर्थ, रिकॉर्डिंग की प्रवृत्ति, और यह बदले में, स्थान की प्रवृत्ति के माध्यम से निर्धारित होता है।

फिर रिकॉर्डिंग माध्य / प्रवृत्ति के कारक के रूप में तापमान जोड़ें।

यह सरल मॉडल आपको तापमान और स्थान द्वारा निर्धारित रिकॉर्डिंग में व्यक्तिगत फटने का मतलब और प्रवृत्ति देखने की अनुमति देता है। कोशिश करो और यह काम करने के लिए मिलता है।

फिर मैं स्थान और रिकॉर्डिंग द्वारा निर्धारित एक चर के रूप में जोड़कर, फटने (या ट्रेंड के बीच शांत समय से अधिक को विभाजित करके) की औसत आवृत्ति के बीच अंतर का अनुमान लगाने की कोशिश करूंगा। अगला चरण एक रिकॉर्डिंग के भीतर फट माध्य का एक एआर मॉडल है।

कुछ पुजारियों और फोड़ों की प्रकृति के बारे में कुछ बहुत मजबूत धारणाओं को देखते हुए (कि सभी जानकारी माध्य और प्रवृत्ति द्वारा दी गई है), यह मूल मॉडल आपको बताएगा:

  • कैसे एक फट अलग स्थान की औसत आवृत्ति स्थान और अस्थायी द्वारा अस्थायी है
  • कैसे स्थान के भीतर फटने की प्रवृत्ति अलग-अलग है और अस्थायी द्वारा अस्थायी
  • कैसे बाहर-फट प्रवृत्ति अलग स्थान और अस्थायी द्वारा अस्थायी स्थान है

एक बार जब आपको काम करने के लिए कुछ ऐसा मिल जाता है, तो हो सकता है कि यह सब-यूनिटों को मॉडल करने और मूल ओएलएस अनुमान को फेंकने का समय हो। मैं इस बिंदु पर डेटा को देखूंगा कि किस प्रकार का समय-श्रृंखला मॉडल फिट हो सकता है, और समय-श्रृंखला मॉडल के मापदंडों को मॉडल करें (बजाय, प्रवृत्ति) जोड़े।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.