मुझे एक मॉडल की तलाश कब बंद करनी है?


11

मैं ऊर्जा और मौसम के भंडार के बीच एक मॉडल की तलाश कर रहा हूं। मेरे पास यूरोप के देशों के बीच खरीदे गए MWatt की कीमत है, और मौसम पर बहुत सारे मूल्य हैं (ग्रिब फाइलें)। 5 साल (2011-2015) की अवधि पर प्रत्येक घंटे।

मूल्य / दिन

यहाँ छवि विवरण दर्ज करें

यह प्रति वर्ष एक वर्ष के लिए है। मेरे पास यह प्रति घंटे 5 साल है।

मौसम का उदाहरण

यहाँ छवि विवरण दर्ज करें 3Dscatterplot, केल्विन में, एक घंटे के लिए। मेरे पास प्रति घंटे प्रति 1000 मान और 200 डेटा हैं, जैसे कि केल्विन, पवन, भूगर्भीय आदि।

मैं Mwatt के प्रति घंटे औसत मूल्य का अनुमान लगाने की कोशिश कर रहा हूं।

मौसम पर मेरा डेटा बहुत घना है, 10000 से अधिक मूल्य / घंटे और इतने ही उच्च सहसंबंध के साथ। यह छोटे, बड़े डेटा की समस्या है।

मैंने परिणाम के रूप में MWatt के माध्य मूल्य और आय के रूप में मेरे मौसम के आंकड़ों के साथ लास्सो, रिज और एसवीआर तरीकों की कोशिश की है। मैंने प्रशिक्षण डेटा के रूप में 70% और परीक्षण के रूप में 30% लिया। यदि मेरे परीक्षण का डेटा गैर-पूर्वानुमान है (मेरे प्रशिक्षण डेटा के अंदर कहीं भी) तो मुझे एक अच्छी भविष्यवाणी (R² = 0.89) है। लेकिन मैं अपने डेटा पर पूर्वानुमान करना चाहता हूं।

इसलिए यदि परीक्षण डेटा मेरे प्रशिक्षण डेटा के बाद कालानुक्रमिक रूप से हो तो यह कुछ भी भविष्यवाणी नहीं करता है (R 0.0 = 0.05)। मुझे लगता है कि यह सामान्य है क्योंकि यह एक समय सीरी है। और बहुत सारे आटोक्लेरेशन है।

मैंने सोचा कि मुझे ARIMA जैसे टाइम सीरी मॉडल का उपयोग करना था। मैंने विधि के क्रम की गणना की (सीरी स्थिर है) और मैंने इसका परीक्षण किया। लेकिन यह काम नहीं करता है। मेरा मतलब है कि पूर्वानुमान का 0.05 मीटर है। परीक्षण डेटा पर मेरी भविष्यवाणी मेरे परीक्षण डेटा पर बिल्कुल नहीं है। मैंने अपने मौसम को प्रतिगामी के रूप में ARIMAX विधि की कोशिश की। रखो यह कोई जानकारी नहीं जोड़ता है।

एसीएफ / पीसीएफ, टेस्ट / ट्रेन डेटा

इसलिए मैंने प्रति दिन और प्रति सप्ताह एक मौसमी कटौती की है

दिन

यहाँ छवि विवरण दर्ज करें

पहले के रुझान पर सप्ताह

यहाँ छवि विवरण दर्ज करें

और मेरे पास यह हो सकता है अगर मैं अपने स्टॉक मूल्य की प्रवृत्ति की प्रवृत्ति को पूर्व निर्धारित कर सकता हूं: यहाँ छवि विवरण दर्ज करें

नीला रंग मेरी भविष्यवाणी है और लाल वास्तविक मूल्य है।

मैं आय के रूप में मौसम के एक रोलिंग साधन और स्टॉकप्राइस के रुझान की प्रवृत्ति के साथ एक प्रतिगमन करने जा रहा हूं। लेकिन अभी के लिए, मुझे कोई रिश्ता नहीं मिला।

लेकिन अगर कोई बातचीत नहीं है, तो मुझे कैसे पता चलेगा कि कुछ भी नहीं है? शायद यह है कि मैं इसे नहीं मिला है।


आपका सवाल जवाबदेह होने के लिए बहुत व्यापक है। आप क्या मॉडलिंग कर रही हैं? क्या "काम नहीं करता है"? प्रतिगमन और ARIMA पूरी तरह से अलग मॉडल हैं, तो आप वास्तव में क्या कर रहे थे ..?
टिम

मैं मूल्य के विकास को मॉडलिंग कर रहा हूं। और मुझे मेरे पूर्वानुमान पर 0.2 से कम R i मिला
एल जोसो

1
और वास्तव में यहाँ समस्या क्या है? क्या आप इस बारे में विस्तार से बता सकते हैं कि आपका डेटा क्या है, आपने कौन से मॉडल आज़माए हैं, आपको क्या समस्याएँ हैं और सबसे महत्वपूर्ण बात: यहाँ आपका सवाल क्या है? आप "मूल्य के विकास" को कैसे परिभाषित करते हैं? जैसा कि मैंने कहा, आपका प्रश्न बहुत अस्पष्ट और बहुत व्यापक है और इसलिए एक उम्मीदवार को अचूक के रूप में बंद किया जाना चाहिए।
टिम

क्या मुझे ग्राफिक्स जोड़ने की आवश्यकता है?
एल जोसो

आप अगर यह मदद करता है (कई मामलों में यह होता है) :) कर सकते हैं
टिम

जवाबों:


7

आपको "कम्प्यूटेशनल मैकेनिक्स" नामक एक औपचारिक विज्ञान डोमेन में रुचि हो सकती है। जेम्स क्रचफील्ड और डेविड फेल्डमैन के एक लेख में, उन्होंने कम्प्यूटेशनल यांत्रिकी के कार्यक्रम को पूरा किया - जहां तक ​​मैं इसे समझता हूं - (1) निर्धारक अनिश्चितता और निर्धारक संबंधों की सूचना लागत के बीच की सीमाओं को पार करना, (2) स्टोकेस्टिक अनिश्चितता और सूचना की लागत का अनुमान संभावना वितरण, और (3) एन्ट्रापिक अनिश्चितता और जानकारी के खराब होने के परिणाम।

अपने सवाल का सीधा जवाब देने के लिए (यद्यपि यह भी काफी हद तक, चूंकि आपने एक व्यापक सवाल पूछा था), हम कैसे जानते हैं कि जब हमने "पर्याप्त," या "हम सब कर सकते हैं" डेटा से सीखा है तो यह एक खुला डोमेन है। पूर्व आवश्यक रूप से दुनिया में एक शोधकर्ता और अभिनेता के रूप में किसी की जरूरतों पर आकस्मिक होगा (उदाहरण के लिए, कितना समय दिया गया; बहुत अधिक प्रसंस्करण शक्ति? कितनी स्मृति, कितना आग्रह, आदि)।

मैं इस क्षेत्र पर नहीं हूं, या इस विशेष लेख के साथ भी गहरा हूं, लेकिन वे कुछ अच्छे विचारक हैं। :)

क्रचफील्ड, जेपी और फेल्डमैन, डीपी (2003)। नियमितता अनदेखी, यादृच्छिकता देखी गई: एन्ट्रापी अभिसरण के स्तरअराजकता , 13 (1): 25-54।


1
यकीन नहीं तो यह 'ओपी सवाल का जवाब दिया, लेकिन मुझे यह परिप्रेक्ष्य पसंद है।
राशिफल

यह वास्तव में मैं क्या देख रहा था, लेकिन यह एक अच्छा लेख नहीं है।
एल जोसो
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.