सबसे पहले: मैंने जो समझा, उसमें से बूटस्ट्रैपिंग अवशिष्ट काम करता है:
- फिट मॉडल डेटा के लिए
- अवशिष्टों की गणना करें
- अवशिष्टों को फिर से भरें और उन्हें 1 में जोड़ें।
- 3 से नए डाटासेट के लिए फिट मॉडल।
- बार-
nबार दोहराएं , लेकिन 1 से फिट किए गए रेजिड्यूलेटेड अवशेषों को हमेशा जोड़ दें।
क्या यह अब तक सही है?
मैं जो करना चाहता हूं वह कुछ अलग है:
मैं एक एल्गोरिथ्म के लिए पैरामीटर और भविष्यवाणी अनिश्चितता का अनुमान लगाना चाहता हूं जो कुछ पर्यावरण चर का अनुमान लगाता है।
मेरे पास उस चर की एक त्रुटि-मुक्त समय-श्रृंखला (एक अनुकार से) है x_true, जिसमें x_noiseएक सिंथेटिक डेटा जनरेट करने के लिए मैं कुछ शोर जोड़ता हूं x। मैं तो वर्गों का योग के साथ अपने एल्गोरिथ्म फिटिंग द्वारा इष्टतम मानकों खोजने की कोशिश sum((x_estimate - x_true)^2)(! नहीं x_estimate - x!) एक उद्देश्य समारोह के रूप में। यह देखने के लिए कि मेरा एल्गोरिथ्म कैसे प्रदर्शन करता है और मेरे मापदंडों के वितरण के नमूने बनाने के लिए, मैं फिर से x_noiseजोड़ना चाहता हूं , इसे जोड़ना x_true, अपने मॉडल को फिर से फिट करना, कुल्ला करना और दोहराना। क्या पैरामीटर अनिश्चितता का आकलन करने के लिए एक वैध दृष्टिकोण है? क्या मैं बूटस्ट्रैप किए गए डेटासेट के लिए पूर्वानुमान अनिश्चितता के रूप में फिट बैठता हूं, या क्या मुझे ऊपर बताई गई प्रक्रिया का पालन करना होगा?
/ संपादित करें: मुझे लगता है कि मैंने वास्तव में स्पष्ट नहीं किया है कि मेरा मॉडल क्या करता है। इसे अनिवार्य रूप से डी-नॉइज़िंग पद्धति की तरह समझें। यह एक पूर्वानुमान मॉडल नहीं है, यह एक एल्गोरिथ्म है जो पर्यावरणीय डेटा के शोर समय-श्रृंखला के अंतर्निहित संकेत को निकालने की कोशिश करता है।
/ संपादित ^ 2: MATLAB- उपयोगकर्ताओं के लिए वहाँ से बाहर, मैंने कुछ त्वरित और गंदे रेखीय प्रतिगमन उदाहरण लिखा है जिसका मेरा मतलब है।
यह मेरा मानना है कि अवशिष्ट के "साधारण" बूटस्ट्रैपिंग है (कृपया मुझे गलत होने पर सही करें): http://pastebin.com/C0CJp3d1
यह वही है जो मैं करना चाहता हूं: http://pastebin.com/mbapsz4c