रैखिक प्रतिगमन मॉडल में आवधिक घटक कैसे जोड़ें?


17

मेरे पास कुछ संचयी आवृत्ति डेटा है। एक लाइन y=ax+b ऐसा लगता है कि यह डेटा को बहुत अच्छी तरह से फिट करता है, लेकिन लाइन में चक्रीय / आवधिक झटके हैं। मैं अनुमान लगाना चाहूंगा कि जब संचयी आवृत्ति एक निश्चित मूल्य तक पहुंच जाएगी c । जब मैं अवशेषों बनाम सज्जित मूल्यों की साजिश करता हूं, तो मुझे एक सुंदर साइनसोइडल व्यवहार मिलता है।

अब, एक और जटिलता जोड़ने के लिए, ध्यान दें कि अवशिष्ट भूखंडों में

वैकल्पिक शब्द

दो चक्र हैं जिनमें दूसरों की तुलना में कम मूल्य हैं, जो एक सप्ताहांत प्रभाव का प्रतिनिधित्व करता है जिसे भी ध्यान में रखा जाना चाहिए।

अब मुझे यहां से कहां जाना है? मैं लगभग एक प्रतिगमन मॉडल में कुछ कोसाइन, साइन या चक्रीय शब्द को कैसे जोड़ सकता हूं। अनुमान है कि जब संचयी आवृत्ति बराबर होगी c?

जवाबों:


9

आप अद्भुत stl()विधि की कोशिश कर सकते हैं - यह loess()प्रवृत्ति और मौसमी और शेष में (उपयोग की गई फिटिंग) का विघटन करता है । यह यहाँ आपके दोलनों को उठा सकता है।


8

यदि आप दोलन की आवृत्ति जानते हैं, तो आप दो अतिरिक्त भविष्यवाणियों को शामिल कर सकते हैं, पाप (2 the wt) और cos (2 - wt) - वांछित तरंग दैर्ध्य प्राप्त करने के लिए w सेट करें - और यह दोलन को मॉडल करेगा। आपको आयाम और चरण कोण को फिट करने के लिए दोनों शब्दों की आवश्यकता है। यदि एक से अधिक आवृत्ति है, तो आपको प्रत्येक आवृत्ति के लिए साइन और कोसाइन शब्द की आवश्यकता होगी।

यदि आपको पता नहीं है कि आवृत्तियाँ क्या हैं, तो कई आवृत्तियों को अलग करने का मानक तरीका है कि आप डेटा को डिरेल करें (रैखिक फिट से अवशिष्ट प्राप्त करें, जैसा कि आपने किया है) और अवशिष्ट के विरुद्ध एक असतत फूरियर ट्रांसफॉर्म चलाते हैं। ऐसा करने का एक त्वरित और गंदा तरीका MS-Excel में है, जिसमें डेटा विश्लेषण ऐड-इन में एक फूरियर विश्लेषण उपकरण है। अवशेषों के खिलाफ विश्लेषण चलाएं, परिवर्तनों का पूर्ण मूल्य लें, और परिणाम को बार ग्राफ करें। चोटियाँ आपके प्रमुख आवृत्ति घटक होंगे जिन्हें आप मॉडल करना चाहते हैं।

जब आप इन चक्रीय भविष्यवाणियों को जोड़ते हैं, तो अपने प्रतिगमन में उनके पी-मूल्यों पर ध्यान दें, और ओवरफिट न करें। केवल उन आवृत्तियों का उपयोग करें जो सांख्यिकीय रूप से महत्वपूर्ण हैं। दुर्भाग्य से, यह कम आवृत्तियों को थोड़ा कठिन बना सकता है।


2
जब आप डेटा से आवृत्तियों (जैसे फूरियर विश्लेषण के साथ) का अनुमान लगाते हैं और फिर उन्हें प्रतिगमन में पाप / कॉशन शर्तों के रूप में शामिल करते हैं, तो उनके पी-मूल्य निरर्थक होंगे।
whuber

4

आइए यह देखते हुए शुरू करें कि इन आंकड़ों के लिए सामान्य कम से कम वर्ग फिटिंग अनुचित है। व्यक्तिगत डेटा एकत्र किया जा रहा ग्रहण कर रहे हैं, तो हमेशा की तरह, यादृच्छिक त्रुटि घटकों के लिए है, तो संचयी डेटा में त्रुटि है ( नहीं संचयी आवृत्तियों --that की तुम्हारे पास क्या है की तुलना में कुछ अलग) सभी त्रुटि शर्तों के संचयी योग है। यह संचयी डेटा को विषमलैंगिक बनाता है (वे समय के साथ अधिक से अधिक परिवर्तनशील हो जाते हैं) और दृढ़ता से सकारात्मक रूप से सहसंबद्ध होते हैं। क्योंकि ये डेटा नियमित रूप से व्यवहार किया जाता है, और उनमें से बहुत कुछ है, फिट के साथ थोड़ी समस्या है आप प्राप्त करेंगे, लेकिन आपकी त्रुटियों का अनुमान, आपकी भविष्यवाणियां (जो कि सवाल सब के बारे में है), और विशेष रूप से आपकी भविष्यवाणी की मानक त्रुटियां दूर हो सकती हैं।

इस तरह के डेटा के विश्लेषण के लिए एक मानक प्रक्रिया मूल मूल्यों से शुरू होती है। उच्च आवृत्ति वाले साइनसोइडल घटक को हटाने के लिए दिन-प्रतिदिन के अंतरों को लें। सप्ताह-दर-सप्ताह चक्र को हटाने के लिए उन लोगों के साप्ताहिक अंतर को लें। जो बचा है उसका विश्लेषण करें। ARIMA मॉडलिंग एक शक्तिशाली लचीला दृष्टिकोण है, लेकिन बस शुरू करें: उन विभेदित डेटा को ग्राफ़ करें जो देखने के लिए कि क्या चल रहा है, फिर वहां से आगे बढ़ें। ध्यान दें, भी, कि दो सप्ताह के कम डेटा के साथ साप्ताहिक चक्र के आपके अनुमान खराब होंगे और यह अनिश्चितता भविष्यवाणियों में अनिश्चितता पर हावी होगी।


2

स्पष्ट रूप से प्रमुख दोलन की अवधि एक दिन है। ऐसा लगता है कि सप्ताह के दिन से संबंधित कम-आवृत्ति वाले घटक भी हैं, इसलिए एक सप्ताह में आवृत्ति के साथ एक घटक जोड़ें (यानी एक दिन का सातवाँ भाग) और इसके पहले कुछ हारमोन्स। यह फॉर्म का एक मॉडल देता है:

E(y)=c+a0cos(2πt)+b0sin(2πt)+a1cos(2πt/7)+b1sin(2πt/7)+a2cos(4πt/7)+b2sin(4πt/7)+

ty


-2

क्रमिक रूप से एक साइन (या कोसाइन) श्रृंखला के आयाम, अवधि और चरण को खोजने के लिए जीए का उपयोग क्यों न करें, फिर संयुक्त। निम्नलिखित का अनुकूलन करें: (n (n-1) / ((np-1) ^ 2 (np-2)) RSS


1
यह स्पष्ट नहीं है कि यह उलटा संचयी आवृत्ति फ़ंक्शन की गणना के बारे में सवाल का जवाब कैसे देता है। और "जीए" से आपका क्या मतलब है? अनुवांशिक कलन? कुछ और?
whuber
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.