सबसे पहले: मैंने जो समझा, उसमें से बूटस्ट्रैपिंग अवशिष्ट काम करता है:
- फिट मॉडल डेटा के लिए
- अवशिष्टों की गणना करें
- अवशिष्टों को फिर से भरें और उन्हें 1 में जोड़ें।
- 3 से नए डाटासेट के लिए फिट मॉडल।
- बार-
n
बार दोहराएं , लेकिन 1 से फिट किए गए रेजिड्यूलेटेड अवशेषों को हमेशा जोड़ दें।
क्या यह अब तक सही है?
मैं जो करना चाहता हूं वह कुछ अलग है:
मैं एक एल्गोरिथ्म के लिए पैरामीटर और भविष्यवाणी अनिश्चितता का अनुमान लगाना चाहता हूं जो कुछ पर्यावरण चर का अनुमान लगाता है।
मेरे पास उस चर की एक त्रुटि-मुक्त समय-श्रृंखला (एक अनुकार से) है x_true
, जिसमें x_noise
एक सिंथेटिक डेटा जनरेट करने के लिए मैं कुछ शोर जोड़ता हूं x
। मैं तो वर्गों का योग के साथ अपने एल्गोरिथ्म फिटिंग द्वारा इष्टतम मानकों खोजने की कोशिश sum((x_estimate - x_true)^2)
(! नहीं x_estimate - x
!) एक उद्देश्य समारोह के रूप में। यह देखने के लिए कि मेरा एल्गोरिथ्म कैसे प्रदर्शन करता है और मेरे मापदंडों के वितरण के नमूने बनाने के लिए, मैं फिर से x_noise
जोड़ना चाहता हूं , इसे जोड़ना x_true
, अपने मॉडल को फिर से फिट करना, कुल्ला करना और दोहराना। क्या पैरामीटर अनिश्चितता का आकलन करने के लिए एक वैध दृष्टिकोण है? क्या मैं बूटस्ट्रैप किए गए डेटासेट के लिए पूर्वानुमान अनिश्चितता के रूप में फिट बैठता हूं, या क्या मुझे ऊपर बताई गई प्रक्रिया का पालन करना होगा?
/ संपादित करें: मुझे लगता है कि मैंने वास्तव में स्पष्ट नहीं किया है कि मेरा मॉडल क्या करता है। इसे अनिवार्य रूप से डी-नॉइज़िंग पद्धति की तरह समझें। यह एक पूर्वानुमान मॉडल नहीं है, यह एक एल्गोरिथ्म है जो पर्यावरणीय डेटा के शोर समय-श्रृंखला के अंतर्निहित संकेत को निकालने की कोशिश करता है।
/ संपादित ^ 2: MATLAB- उपयोगकर्ताओं के लिए वहाँ से बाहर, मैंने कुछ त्वरित और गंदे रेखीय प्रतिगमन उदाहरण लिखा है जिसका मेरा मतलब है।
यह मेरा मानना है कि अवशिष्ट के "साधारण" बूटस्ट्रैपिंग है (कृपया मुझे गलत होने पर सही करें): http://pastebin.com/C0CJp3d1
यह वही है जो मैं करना चाहता हूं: http://pastebin.com/mbapsz4c