स्वायत्तता के साथ सौदा क्या है?


13

इसकी प्रस्तावना के लिए, मेरे पास एक बहुत गहरी गणितीय पृष्ठभूमि है, लेकिन मैंने वास्तव में समय श्रृंखला, या सांख्यिकीय मॉडलिंग से कभी नहीं निपटा है। तो तुम मेरे साथ बहुत कोमल होना नहीं है :)

मैं व्यावसायिक भवनों में मॉडलिंग ऊर्जा उपयोग के बारे में यह पत्र पढ़ रहा हूं, और लेखक यह दावा करता है:

[आटोक्लेररेशन की उपस्थिति उत्पन्न होती है] क्योंकि मॉडल को ऊर्जा उपयोग के समय श्रृंखला डेटा से विकसित किया गया है, जो स्वाभाविक रूप से स्वतःसंबंधित है। समय श्रृंखला डेटा के लिए कोई भी शुद्ध रूप से निर्धारक मॉडल में स्वतःसंक्रमण होगा। यदि [अधिक फ़ॉयर गुणांक] मॉडल में शामिल हैं, तो ऑटोकैरेलेशन को कम करने के लिए पाया जाता है। हालांकि, ज्यादातर मामलों में फूरियर मॉडल में कम सीवी होता है, इसलिए, मॉडल व्यावहारिक उद्देश्यों के लिए स्वीकार्य हो सकता है जो उच्च परिशुद्धता की मांग नहीं करता है।

0.) "किसी भी विशुद्ध रूप से निर्धारक मॉडल समय श्रृंखला डेटा के लिए ऑटोकैरेलेशन होगा" क्या मतलब है? मैं अस्पष्ट रूप से समझ सकता हूं कि इसका क्या अर्थ है - उदाहरण के लिए, आप अपनी समय श्रृंखला में अगले बिंदु की भविष्यवाणी करने की उम्मीद कैसे करेंगे यदि आपके पास 0 ऑटोकॉर्लेशन था? यह एक गणितीय तर्क नहीं है, यह सुनिश्चित करने के लिए, यही कारण है कि यह है 0 :)

1.) मैं इस धारणा के तहत था कि ऑटोक्रेलेशन मूल रूप से आपके मॉडल को मार देता है, लेकिन इसके बारे में सोचते हुए, मैं यह नहीं समझ सकता कि ऐसा क्यों होना चाहिए। तो क्यों ऑटोकैरेक्शन एक बुरी (या अच्छी) चीज है?

2.) ऑटोक्रेलेशन से निपटने के लिए मैंने जो समाधान सुना है, वह समय श्रृंखला को अलग करना है। लेखक के दिमाग को पढ़ने की कोशिश किए बिना, अगर कोई नगण्य ऑटोक्रेलेशन मौजूद है, तो कोई फर्क क्यों नहीं करेगा ?

3.) एक मॉडल पर गैर-नगण्य autocorrelations क्या सीमाएं होती हैं? क्या यह एक धारणा है कहीं (यानी, सामान्य रूप से वितरित अवशिष्ट जब साधारण रेखीय प्रतिगमन के साथ मॉडलिंग करते हैं)?

वैसे भी, अगर ये बुनियादी सवाल हैं, तो क्षमा करें और मदद करने के लिए अग्रिम धन्यवाद।

जवाबों:


10
  1. मुझे लगता है कि लेखक शायद मॉडल के अवशेषों के बारे में बात कर रहा है । मैं इस बात के कारण तर्क देता हूं कि अधिक फूरियर गुणांक जोड़ने के बारे में उनका बयान; यदि, जैसा कि मेरा मानना ​​है, वह एक फूरियर मॉडल फिट कर रहा है, तो अधिक गुणांक जोड़ने से उच्च सीवी की कीमत पर अवशिष्टों के स्वतःसंक्रमण को कम किया जाएगा।

    यदि आपको इसे देखने में परेशानी हो रही है, तो निम्न उदाहरण के बारे में सोचें: मान लें कि आपके पास निम्नलिखित 100 अंक डेटा सेट है, जो कि दो-गुणांक फूरियर मॉडल के साथ आता है, जिसमें जोड़ा गया सफेद गॉसियन शोर होता है:

    डेटा अंक

    निम्नलिखित ग्राफ दो फिट दिखाता है: एक 2 फूरियर गुणांक के साथ किया जाता है, और एक 200 फूरियर गुणांक के साथ किया जाता है:

    फिट

    जैसा कि आप देख सकते हैं, 200 फूरियर गुणांक DATAPOINTS को बेहतर ढंग से फिट करते हैं, जबकि 2 गुणांक फिट ('वास्तविक' मॉडल) मॉडल को बेहतर तरीके से फिट करते हैं। इसका तात्पर्य यह है कि 200 गुणांक वाले मॉडल के अवशिष्टों का स्वतःसंक्रमण लगभग निश्चित रूप से 2 गुणांक मॉडल के अवशिष्टों की तुलना में सभी अंतरालों पर शून्य के करीब होगा, क्योंकि 200 गुणांक वाले मॉडल बिल्कुल सभी डेटा पॉइंट्स (यानी, अवशिष्टों) के अनुरूप होंगे लगभग सभी शून्य हो)। हालाँकि, आपको लगता है कि क्या होगा यदि आप छोड़ते हैं, कहते हैं, नमूना से 10 डेटा पॉइंट और समान मॉडल फिट होते हैं? 2-गुणांक मॉडल बेहतर तरीके से अनुमान लगाएगा कि आपने नमूने से किस तरह का अंकन किया है! इस प्रकार, यह 200-गुणांक मॉडल के रूप में कम सीवी त्रुटि का उत्पादन करेगा; इसे ओवरफिटिंग कहा जाता है। इस 'जादू' के पीछे का कारण यह है कि सीवी वास्तव में क्या मापने की कोशिश करता है, भविष्यवाणी त्रुटि है , अर्थात, आपका मॉडल आपके डेटासेट में नहीं बल्कि डेटापैट्स की कितनी अच्छी भविष्यवाणी करता है।

  2. इस संदर्भ में, अवशिष्टों पर स्वायत्तता 'बुरा' है, क्योंकि इसका मतलब है कि आप डेटापॉइंट के बीच संबंध को बहुत अच्छी तरह से मॉडलिंग नहीं कर रहे हैं। लोगों द्वारा श्रृंखला में अंतर न करने का मुख्य कारण यह है कि वे वास्तव में अंतर्निहित प्रक्रिया को मॉडल करना चाहते हैं जैसा कि यह है। एक समय श्रृंखला आमतौर पर आवधिकता या प्रवृत्तियों से छुटकारा पाने के लिए भिन्न होती है, लेकिन यदि वह आवधिकता या प्रवृत्ति वास्तव में आप मॉडल करने की कोशिश कर रहे हैं, तो उन्हें अलग करना एक अंतिम उपाय विकल्प की तरह लग सकता है (या अवशेषों को मॉडल करने के लिए एक विकल्प) एक अधिक जटिल स्टोकेस्टिक प्रक्रिया)।
  3. यह वास्तव में उस क्षेत्र पर निर्भर करता है जिस पर आप काम कर रहे हैं। यह नियतात्मक मॉडल के साथ भी एक समस्या हो सकती है। हालाँकि, स्वतःसंक्रमण के रूप पर निर्भर करते हुए, यह आसानी से देखा जा सकता है, जब ऑटोकॉर्लेशन उत्पन्न होता है, जैसे, झिलमिलाहट शोर, ARMA- जैसा शोर या यदि यह एक अवशिष्ट अंतर्निहित आवधिक स्रोत है (जिसमें आप शायद वृद्धि करना चाहते हैं) फूरियर गुणांक की संख्या)।

आपकी प्रतिक्रिया के लिए धन्यवाद, और यदि आप तैयार हैं, तो मैं एक बार में इन एक को पचाने और पचाने का प्रयास करूंगा। 1.), क्या यह समझने का एक सहज तरीका है कि क्यों अधिक फूरियर गुणांक ऑटोकॉर्लेशन को कम करता है और सीवी बढ़ाता है (मुझे लगता है कि यह अवशिष्ट का सीवी है)?
बेनडुंडी

1
मैंने एक उदाहरण जोड़ा। आशा करता हूँ की ये काम करेगा। और हाँ, वह अवशिष्टों के सीवी का उल्लेख कर रहा है।
Néstor

आह ठीक है, मुझे लगता है कि मैं देख रहा हूं। इस संबंध में मैं जो पूछना चाह रहा था, वह 2. इस मॉडल (उदारतापूर्वक) के सहसंबंध को बेहतर ढंग से समझने के लिए कोई कैसे इस मॉडल को पैच कर सकता है? क्या आप फूरियर गुणांक के सहसंबंध मैट्रिक्स के बारे में एक बाधा जोड़ सकते हैं?
19

1
यह एक मुश्किल काम है जो मैं भी कर रहा हूं। विशेष रूप से आवधिक निर्धारक मॉडल के साथ, यह जानना मुश्किल है कि किस प्रकार के शोर मॉडल का उपयोग करना है। बड़ी समस्या यह है कि आपको फूरियर मॉडल के गुणांकों की संख्या एक प्राथमिकताओं को नहीं पता है, इसलिए वे यादृच्छिक चर हैं जिन्हें आपको मॉडल करना होगा। डेटा पॉइंट्स की कम संख्या की उपस्थिति में, मैं निश्चित रूप से इसे मॉडल करने के लिए एक प्रतिवर्ती कूद एमसीएमसी के लिए जाना होगा। मैं विभिन्न शोर मॉडल की कोशिश करूंगा और उनके बीच एआईसी / बीआईसी की तुलना करूंगा। बड़े डेटासेट के लिए, हालांकि, यह अक्षम्य है।
नेस्टर

3

मैंने इस पत्र को ' इकोनोमेट्रिक्स में Spurious Regressions ' मददगार पाया जब ट्रेंड को खत्म करने के लिए मेरा सिर घूमने की कोशिश करना आवश्यक है। अनिवार्य रूप से यदि दो चर चल रहे हैं तो वे सह-भिन्न होंगे, जो परेशानी का एक नुस्खा है।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.