एकत्रीकरण के तहत कौन से आंकड़े संरक्षित हैं?


12

अगर हमारे पास एक लंबी, उच्च रिज़ॉल्यूशन टाइम सीरीज़ है, तो बहुत सारे शोर के साथ, यह अक्सर डेटा को कम रिज़ॉल्यूशन (कहने के लिए, दैनिक मासिक मूल्यों पर) को बेहतर बनाने के लिए समझ में आता है कि क्या चल रहा है, प्रभावी रूप से कुछ को हटाने के लिए शोर।

मैंने कम से कम एक पेपर देखा है जो तब एकत्रित डेटा पर कुछ आँकड़े लागू करता है, जिसमें एक अलग चर पर रैखिक प्रतिगमन के लिए एक भी शामिल है । क्या यह मान्य है? मैंने सोचा होगा कि कम शोर के कारण औसत प्रक्रिया परिणाम को थोड़ा संशोधित करेगी।r2

सामान्य तौर पर, कुछ आंकड़े एकत्रित समय श्रृंखला डेटा पर लागू किए जा सकते हैं, और अन्य नहीं? यदि हां, तो कौन? कि रैखिक संयोजन कर रहे हैं, शायद?



1
@cbeleites की टिप्पणी के बारे में, मुझे लगता है कि यहाँ एक सैद्धांतिक जवाब है - आपके सुझाव का एक विस्तार कि रैखिक संयोजन संरक्षित हैं। हालांकि, व्यावहारिक अनुप्रयोग शर्तों में, एक दृष्टिकोण की वैधता पर एक सामान्य निष्कर्ष निकालना बहुत कठिन है, और एक विशिष्ट उदाहरण होने की आवश्यकता होगी।
जोनाथन

जवाबों:


6

मुझे लगता है कि हेडलाइन के रूप में सवाल एक उपयोगी तरीके से उत्तर देने के लिए बहुत व्यापक है, उतना ही यह संभवतः एग्रीगेटिंग विधि और प्रश्न में सांख्यिकीय दोनों पर निर्भर करेगा।

  • यह "माध्य" पर भी लागू होगा: क्या आप सिग्नल आकार और तीव्रता (जैसे सविट्ज़की-गोल फिल्टर) को संरक्षित करने की कोशिश करते हैं, या क्या आप सिग्नल के तहत क्षेत्र को संरक्षित करने की कोशिश करते हैं (जैसे लोस)?

  • शोर से संबंधित आंकड़े स्पष्ट रूप से प्रभावित होते हैं: यह आमतौर पर एकत्रीकरण का उद्देश्य होता है।

मैंने कम से कम एक पेपर देखा है जो तब एकत्रित आंकड़ों पर कुछ आँकड़े लागू करता है [...] क्या यह मान्य है? मैंने सोचा होगा कि कम शोर के कारण औसत प्रक्रिया परिणाम को थोड़ा संशोधित करेगी।

यह संशोधन सबसे अधिक एकत्रीकरण का उद्देश्य है।

सामान्य तौर पर, आपको अपने डेटा पर बहुत सारी चीज़ें करने की अनुमति होती है, लेकिन आपको इसकी आवश्यकता होती है

  • कहो कि तुम क्या कर रहे हो (और अधिमानतः तुम भी ऐसा क्यों करते हो)
  • परिणामी मॉडल की गुणवत्ता दिखाएं (स्वतंत्र डेटा के साथ परीक्षण)


n


5

YtXτm

Yt=α+βX¯t+ut,(1)

X¯t=1mh=0m1Xtmh.

tX30(t1)+1,...,X30t

Yt=α+βX¯t(w)+ut,(2)

साथ में

Xt(w)=h=1m1whXtmh.

whwh=g(h,α)gα

wh=1m

एक गैर-प्रतिगमन सेटिंग में ऐसे परिणाम होते हैं जो बताते हैं कि एकत्रीकरण समय श्रृंखला के गुणों को बदल सकता है। उदाहरण के लिए यदि आप AR (1) प्रक्रियाओं को एकत्र करते हैं, जिसमें अल्पावधि मेमोरी होती है (समय श्रृंखला के दो अवलोकनों के बीच संबंध जल्दी से बंद हो जाता है जब उनके बीच की दूरी बढ़ जाती है), तो आप दीर्घकालिक स्मृति के साथ एक प्रक्रिया प्राप्त कर सकते हैं।

तो उत्तर देने के लिए कुल आंकड़ों पर आंकड़ों के आवेदन की वैधता एक सांख्यिकीय सवाल है। मॉडल के आधार पर आप एक परिकल्पना का निर्माण कर सकते हैं कि यह एक वैध अनुप्रयोग है या नहीं।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.