मैं कैसे कोई भी अनुपलब्ध या अनुपलब्ध डेटा नहीं संभालता?


12

मैंने एक पूर्वानुमान विधि की कोशिश की और जांचना चाहता हूं कि मेरी विधि सही है या नहीं।

मेरा अध्ययन विभिन्न प्रकार के म्यूचुअल फंडों की तुलना कर रहा है। मैं उनमें से एक के लिए एक बेंचमार्क के रूप में जीसीसी सूचकांक का उपयोग करना चाहता हूं, लेकिन समस्या यह है कि सितंबर 2011 में जीसीसी सूचकांक बंद हो गया और मेरा अध्ययन जनवरी 2003 से जुलाई 2014 तक है। इस प्रकार, मैंने एक और सूचकांक, एमएससीआई सूचकांक, का उपयोग करने की कोशिश की। रेखीय प्रतिगमन बनाने के लिए, लेकिन समस्या यह है कि MSCI सूचकांक सितंबर 2010 से डेटा गायब है।

इसके आसपास जाने के लिए, मैंने निम्नलिखित कार्य किया। क्या ये कदम वैध हैं?

  1. MSCI सूचकांक जुलाई 2012 के माध्यम से सितंबर 2010 के लिए डेटा अनुपलब्ध है। मैंने इसे पांच टिप्पणियों के लिए चलती औसत लागू करके "प्रदान किया"। क्या यह दृष्टिकोण मान्य है? यदि हां, तो मुझे कितने टिप्पणियों का उपयोग करना चाहिए?

  2. अनुपलब्ध डेटा का अनुमान लगाने के बाद, मैंने जीसीसी सूचकांक (आश्रित चर) बनाम MSCI सूचकांक (स्वतंत्र चर के रूप में) परस्पर उपलब्ध अवधि (जनवरी 2007 से सितंबर 2011 तक) के लिए एक प्रतिगमन का प्रदर्शन किया, फिर सभी समस्याओं से मॉडल को ठीक किया। प्रत्येक महीने के लिए, मैं बाकी की अवधि के लिए MSCI सूचकांक से डेटा द्वारा एक्स को प्रतिस्थापित करता हूं। क्या यह मान्य है?

नीचे कॉमा-सेपरेटेड-वैल्यू फॉर्मेट में डेटा हैं, जिसमें पंक्तियों द्वारा वर्षों और स्तंभों द्वारा महीनों को शामिल किया गया है। इस लिंक के माध्यम से डेटा भी उपलब्ध हैं ।

श्रृंखला जीसीसी:

,Jan,Feb,Mar,Apr,May,Jun,Jul,Aug,Sep,Oct,Nov,Dec
2002,NA,NA,NA,NA,NA,NA,NA,NA,NA,NA,NA,117.709
2003,120.176,117.983,120.913,134.036,145.829,143.108,149.712,156.997,162.158,158.526,166.42,180.306
2004,185.367,185.604,200.433,218.923,226.493,230.492,249.953,262.295,275.088,295.005,328.197,336.817
2005,346.721,363.919,423.232,492.508,519.074,605.804,581.975,676.021,692.077,761.837,863.65,844.865
2006,947.402,993.004,909.894,732.646,598.877,686.258,634.835,658.295,672.233,677.234,491.163,488.911
2007,440.237,486.828,456.164,452.141,495.19,473.926,492.782,525.295,519.081,575.744,599.984,668.192
2008,626.203,681.292,616.841,676.242,657.467,654.66,635.478,603.639,527.326,396.904,338.696,308.085
2009,279.706,252.054,272.082,314.367,340.354,325.99,326.46,327.053,354.192,339.035,329.668,318.267
2010,309.847,321.98,345.594,335.045,311.363,299.555,310.802,306.523,315.496,324.153,323.256,334.802
2011,331.133,311.292,323.08,327.105,320.258,312.749,305.073,297.087,298.671,NA,NA,NA

श्रृंखला एमएससीआई:

,Jan,Feb,Mar,Apr,May,Jun,Jul,Aug,Sep,Oct,Nov,Dec
2007,NA,NA,NA,NA,1000,958.645,1016.085,1049.468,1033.775,1118.854,1142.347,1298.223
2008,1197.656,1282.557,1164.874,1248.42,1227.061,1221.049,1161.246,1112.582,929.379,680.086,516.511,521.127
2009,487.562,450.331,478.255,560.667,605.143,598.611,609.559,615.73,662.891,655.639,628.404,602.14
2010,601.1,622.624,661.875,644.751,588.526,587.4,615.008,606.133,NA,NA,NA,NA
2011,NA,NA,NA,NA,NA,NA,NA,NA,NA,NA,NA,NA
2012,NA,NA,NA,NA,NA,NA,NA,609.51,598.428,595.622,582.905,599.447
2013,627.561,619.581,636.284,632.099,651.995,651.39,687.194,676.76,694.575,704.806,727.625,739.842
2014,759.036,787.057,817.067,824.313,857.055,805.31,873.619,NA,NA,NA,NA,NA

डेटा


अंतिम पैराग्राफ में वर्णित x क्या है?
निक कॉक्स

y, gcc इंडेक्स की क़ीमत है और x msci इंडेक्स के लिए क़रीब है
TG Zain

आपको इस पोस्ट में दिलचस्पी हो सकती है , जो एक ARIMA समय श्रृंखला मॉडल के ढांचे में लागू किए गए कलमन फ़िल्टर के माध्यम से समय श्रृंखला में अंतराल को भरने के बारे में एक उदाहरण दिखाता है।
javlacalle

धन्यवाद javlacalle यह मेरे लापता डेटा के साथ काम करता है? यहाँ लापता डेटा के लिए मेरी फाइल है 4shared.com/file/qR0UZgfGba/missing_data.html
TG Zain

मैं फ़ाइल डाउनलोड नहीं कर सका। आप डेटा को पोस्ट कर सकते हैं, उदाहरण के लिए पंक्तियों और महीनों के आधार पर कॉलम और मानों को अल्पविराम से अलग करके प्रदर्शित करना।
javlacalle

जवाबों:


9

मेरा सुझाव आपके प्रस्ताव के समान है सिवाय इसके कि मैं चलती औसत के बजाय एक समय श्रृंखला मॉडल का उपयोग करूंगा। ARIMA मॉडल का ढांचा पूर्वानुमान प्राप्त करने के लिए भी उपयुक्त है, जिसमें न केवल MSCI को एक प्रतिगामी के रूप में शामिल किया गया है, बल्कि GCC श्रृंखला के अंतराल भी हैं जो डेटा की गतिशीलता को भी पकड़ सकते हैं।

सबसे पहले, आप MSCI श्रृंखला के लिए एक ARIMA मॉडल फिट कर सकते हैं और इस श्रृंखला में लापता टिप्पणियों को प्रक्षेपित कर सकते हैं। उसके बाद, आप MSCI का उपयोग करते हुए श्रृंखला GCC के लिए एक ARIMA मॉडल फिट कर सकते हैं जो बहिर्जात रजिस्टरों के रूप में है और इस मॉडल के आधार पर GCC के लिए पूर्वानुमान प्राप्त करते हैं। ऐसा करने में, आपको उन ब्रेक से निपटने में सावधानी बरतनी चाहिए जो श्रृंखला में ग्राफिक रूप से देखे गए हैं और जो एआरआईएमए मॉडल के चयन और फिट को विकृत कर सकते हैं।


यहाँ मैं इस विश्लेषण में क्या कर रहा हूँ R। मैं forecast::auto.arimaARIMA मॉडल का चयन tsoutliers::tsoकरने और संभावित स्तर की बदलावों (LS), अस्थायी परिवर्तनों (TC) या एडिटिव आउटलेर्स (AO) का पता लगाने के लिए फ़ंक्शन का उपयोग करता हूं ।

ये डेटा एक बार लोड किए गए हैं:

gcc <- structure(c(117.709, 120.176, 117.983, 120.913, 134.036, 145.829, 143.108, 149.712, 156.997, 162.158, 158.526, 166.42, 180.306, 185.367, 185.604, 200.433, 218.923, 226.493, 230.492, 249.953, 262.295, 275.088, 295.005, 328.197, 336.817, 346.721, 363.919, 423.232, 492.508, 519.074, 605.804, 581.975, 676.021, 692.077, 761.837, 863.65, 844.865, 947.402, 993.004, 909.894, 732.646, 598.877, 686.258, 634.835, 658.295, 672.233, 677.234, 491.163, 488.911, 440.237, 486.828, 456.164, 452.141, 495.19, 473.926, 
492.782, 525.295, 519.081, 575.744, 599.984, 668.192, 626.203, 681.292, 616.841, 676.242, 657.467, 654.66, 635.478, 603.639, 527.326, 396.904, 338.696, 308.085, 279.706, 252.054, 272.082, 314.367, 340.354, 325.99, 326.46, 327.053, 354.192, 339.035, 329.668, 318.267, 309.847, 321.98, 345.594, 335.045, 311.363, 
299.555, 310.802, 306.523, 315.496, 324.153, 323.256, 334.802, 331.133, 311.292, 323.08, 327.105, 320.258, 312.749, 305.073, 297.087, 298.671), .Tsp = c(2002.91666666667, 2011.66666666667, 12), class = "ts")
msci <- structure(c(1000, 958.645, 1016.085, 1049.468, 1033.775, 1118.854, 1142.347, 1298.223, 1197.656, 1282.557, 1164.874, 1248.42, 1227.061, 1221.049, 1161.246, 1112.582, 929.379, 680.086, 516.511, 521.127, 487.562, 450.331, 478.255, 560.667, 605.143, 598.611, 609.559, 615.73, 662.891, 655.639, 628.404, 602.14, 601.1, 622.624, 661.875, 644.751, 588.526, 587.4, 615.008, 606.133, 
NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, 609.51, 598.428, 595.622, 582.905, 599.447, 627.561, 619.581, 636.284, 632.099, 651.995, 651.39, 687.194, 676.76, 694.575, 704.806, 727.625, 739.842, 759.036, 787.057, 817.067, 824.313, 857.055, 805.31, 873.619), .Tsp = c(2007.33333333333, 2014.5, 12), class = "ts")

चरण 1: श्रृंखला के लिए एक ARIMA मॉडल को MSCI फिट करें

ग्राफिक के अनुसार कुछ टूटने की उपस्थिति का पता चलता है, किसी भी आउटलेयर द्वारा पता नहीं लगाया गया था tso। यह इस तथ्य के कारण हो सकता है कि नमूने के बीच में कई लापता अवलोकन हैं। हम इससे दो चरणों में निपट सकते हैं। सबसे पहले, एक ARIMA मॉडल को फिट करें और इसका उपयोग लापता टिप्पणियों को प्रक्षेपित करने के लिए करें; दूसरा, संभव एलएस, टीसी, एओ के लिए प्रक्षेपित श्रृंखला की जाँच के लिए एक एआरआईएमए मॉडल फिट करें और परिवर्तन पाए जाने पर प्रक्षेपित मूल्यों को परिष्कृत करें।

श्रृंखला MSCI के लिए ARIMA मॉडल चुनें:

require("forecast")
fit1 <- auto.arima(msci)
fit1
# ARIMA(1,1,2) with drift         
# Coefficients:
#           ar1     ma1     ma2    drift
#       -0.6935  1.1286  0.7906  -1.4606
# s.e.   0.1204  0.1040  0.1059   9.2071
# sigma^2 estimated as 2482:  log likelihood=-328.05
# AIC=666.11   AICc=666.86   BIC=678.38

इस पोस्ट के मेरे उत्तर में चर्चा की गई दृष्टिकोण के बाद लापता टिप्पणियों को भरें :

kr <- KalmanSmooth(msci, fit1$model)
tmp <- which(fit1$model$Z == 1)
id <- ifelse (length(tmp) == 1, tmp[1], tmp[2])
id.na <- which(is.na(msci))
msci.filled <- msci
msci.filled[id.na] <- kr$smooth[id.na,id]

भरी हुई श्रृंखला के लिए एक ARIMA मॉडल फिट करें msci.filled। अब कुछ आउटलेयर पाए जाते हैं। फिर भी, वैकल्पिक विकल्पों का उपयोग करके विभिन्न आउटलेयर का पता लगाया गया। मैं वह रखूंगा जो ज्यादातर मामलों में पाया गया था, अक्टूबर 2008 में एक स्तर बदलाव (अवलोकन 18)। आप उदाहरण के लिए इन और अन्य विकल्पों की कोशिश कर सकते हैं।

require("tsoutliers")
tso(msci.filled, remove.method = "bottom-up", tsmethod = "arima", 
  args.tsmethod = list(order = c(1,1,1)))
tso(msci.filled, remove.method = "bottom-up", args.tsmethod = list(ic = "bic"))

चुना मॉडल अब है:

mo <- outliers("LS", 18)
ls <- outliers.effects(mo, length(msci))
fit2 <- auto.arima(msci, xreg = ls)
fit2
# ARIMA(2,1,0)                    
# Coefficients:
#           ar1     ar2       LS18
#       -0.1006  0.4857  -246.5287
# s.e.   0.1139  0.1093    45.3951
# sigma^2 estimated as 2127:  log likelihood=-321.78
# AIC=651.57   AICc=652.06   BIC=661.39

लापता टिप्पणियों के प्रक्षेप को परिष्कृत करने के लिए पिछले मॉडल का उपयोग करें:

kr <- KalmanSmooth(msci, fit2$model)
tmp <- which(fit2$model$Z == 1)
id <- ifelse (length(tmp) == 1, tmp[1], tmp[2])
msci.filled2 <- msci
msci.filled2[id.na] <- kr$smooth[id.na,id]

प्रारंभिक और अंतिम प्रक्षेप की तुलना एक भूखंड में की जा सकती है (अंतरिक्ष को बचाने के लिए यहां नहीं दिखाया गया है):

plot(msci.filled, col = "gray")
lines(msci.filled2)

चरण 2: msci.filled2 का उपयोग कर एक्सोजेनस रेजिस्टर के रूप में GCC को ARIMA मॉडल फिट करें

मैं शुरुआत में गायब टिप्पणियों को अनदेखा करता हूं msci.filled2। इस बिंदु पर मैंने पाया कुछ कठिनाइयों का उपयोग करने auto.arimaके साथ-साथ tso, तो मैं हाथ से में कई ARIMA मॉडल की कोशिश की tsoऔर अंत में ARIMA (1,1,0) चुना है।

xreg <- window(cbind(gcc, msci.filled2)[,2], end = end(gcc))
fit3 <- tso(gcc, remove.method = "bottom-up", tsmethod = "arima",  
  args.tsmethod = list(order = c(1,1,0), xreg = data.frame(msci=xreg)))
fit3
# ARIMA(1,1,0)                    
# Coefficients:
#           ar1    msci     AO72
#       -0.1701  0.5131  30.2092
# s.e.   0.1377  0.0173   6.7387
# sigma^2 estimated as 71.1:  log likelihood=-180.62
# AIC=369.24   AICc=369.64   BIC=379.85
# Outliers:
#   type ind    time coefhat tstat
# 1   AO  72 2008:11   30.21 4.483

GCC का प्लॉट 2008 की शुरुआत में एक बदलाव दिखाता है। हालांकि, ऐसा लगता है कि यह पहले से ही रजिस्ट्रार MSCI द्वारा कब्जा कर लिया गया था और नवंबर 2008 में एडिटिव आउटर को छोड़कर कोई एडिटोनल रजिस्टर्स शामिल नहीं थे।

अवशिष्टों के कथानक ने किसी भी स्व-संरचना संरचना का सुझाव नहीं दिया था, लेकिन भूखंड ने नवंबर 2008 में एक स्तर पर बदलाव और फरवरी 2011 में एक योज्य परिवर्तन का सुझाव दिया। हालांकि, इसी हस्तक्षेप को जोड़ते हुए मॉडल का निदान बदतर था। इस बिंदु पर और विश्लेषण की आवश्यकता हो सकती है। यहां, मैं पिछले मॉडल के आधार पर पूर्वानुमान प्राप्त करना जारी रखूंगा fit3

पूर्वानुमान आसानी से प्राप्त किया जा सकता है। नीचे दिया गया कथानक मूल श्रृंखला, MSCI के लिए प्रक्षेपित मान और GCC के लिए विश्वास अंतराल के साथ पूर्वानुमान प्रदर्शित करता है । MSCA में मानों के अंतर में अनिश्चितता का अंतर नहीं होता है।95%

newxreg <- data.frame(msci=window(msci.filled2, start = c(2011, 10)), AO72=rep(0, 34))
p <- predict(fit3$fit, n.ahead = 34, newxreg = newxreg)
head(p$pred)
# [1] 298.3544 298.2753 298.0958 298.0641 297.6829 297.7412
par(mar = c(3,3.5,2.5,2), las = 1)
plot(cbind(gcc, msci), xaxt = "n", xlab = "", ylab = "", plot.type = "single", type = "n")
grid()
lines(gcc, col = "blue", lwd = 2)
lines(msci, col = "green3", lwd = 2)
lines(window(msci.filled2, start = c(2010, 9), end = c(2012, 7)), col = "green", lwd = 2)
lines(p$pred, col = "red", lwd = 2)
lines(p$pred + 1.96 * p$se, col = "red", lty = 2)
lines(p$pred - 1.96 * p$se, col = "red", lty = 2)
xaxis1 <- seq(2003, 2014)
axis(side = 1, at = xaxis1, labels = xaxis1)
legend("topleft", col = c("blue", "green3", "green", "red", "red"), lwd = 2, bty = "n", lty = c(1,1,1,1,2), legend = c("GCC", "MSCI", "Interpolated values", "Forecasts", "95% confidence interval"))

परिणाम


बहुत बहुत धन्यवाद javlacalle ,,, मैं वास्तव में आपकी मदद की सराहना करता हूँ जो कि मैं देख रहा हूँ ,, मैं अपना समय लेने के लिए माफी चाहता हूँ ,,, मैं ईव्यू पर सभी चरणों को करने जा रहा हूं क्योंकि मेरे पास कार्यक्रम आर नहीं है और मुझे नहीं पता कि इसका उपयोग कैसे करना है .... धन्यवाद फिर से धन्यवाद
टीजी ज़ैन

मुझे यह देखकर खुशी हुई कि आपने इसे उपयोगी पाया।
javlacalle

मैं आरआई के लिए नया हूँ, मुझे साक्षात्कार में उत्तर नहीं मिला ... इसलिए मैंने आर का उपयोग करना शुरू कर दिया है और मेरे पास कुछ प्रश्न हैं, मुझे डेटा कैसे आयात करना चाहिए .. मेरा मतलब है कि सभी डेटा न तो वैरबल्स के लिए या केवल उपलब्ध डेटा के लिए हैं msci to R + वहाँ कोई kalmansmooth या चलाने के बारे में त्रुटि संदेश है मैंने पाया कि मैं पहले से ही kalman फ़िल्टर के लिए पैकेज डाउनलोड कर चुका हूं मुझे क्या करना चाहिए? ..थैंक यू
टीजी ज़ैन

इस साइट में सॉफ्टवेयर उपयोग से संबंधित प्रश्न ऑफ टॉपिक हैं। इस तरह के सवालों के लिए स्टैक ओवरफ्लो अधिक उपयुक्त है। यदि यह मेरे उत्तर के लिए कुछ विशिष्ट है तो आप मुझे एक ई-मेल भेज सकते हैं।
javlacalle

1
  1. यदि मूल्य यादृच्छिक रूप से गायब हैं, तो प्रतिष्ठा (यानी 'प्रदान की गई औसत से') मान्य है। यदि यह काफी लम्बाई की निर्बाध अवधि है, तो यह संभव नहीं है। प्रश्न का दूसरा भाग अस्पष्ट है।
  2. इस सवाल के आधार पर, अपने डेटा के दायरे से परे पूर्वानुमान के लिए अपने मॉडल का उपयोग करने के लिए इसे उप-अपनाने से अमान्य कुछ भी माना जाता है: उदाहरण के लिए, यदि 2012-2014 में दो सूचकांकों के बीच संबंध बदलता है तो क्या होगा? अनुपस्थित डेटापॉइंट के लिए आप प्रतिगमन-अनुमानित मान (लेकिन सीधे किसी अन्य अनुक्रमणिका के कच्चे मान से प्रतिस्थापित नहीं) का उपयोग कर सकते हैं, लेकिन यह तभी समझ में आएगा जब दो सूचकांकों के बीच एक मजबूत संबंध हो, और यह महत्वपूर्ण है कि ये मूल्य हैं स्पष्ट रूप से अनुमान के रूप में चिह्नित। और "सभी समस्याओं से मॉडल को सही करने" से आपका क्या मतलब है?

2
समय श्रृंखला विश्लेषण का कुछ बड़ा अंश भविष्य की भविष्यवाणी करने के लिए समर्पित है। कुछ के लिए, यह आँकड़ों का मुख्य कारण है! # 2 इस प्रकार समय-श्रृंखला के पूर्वानुमानों से डरपोक को विभाजित करने वाले पूर्णता के एक वकील हैं।
निक कॉक्स

पर्याप्त रूप से, मैं सहमत हूं / सही हूं। मुझे अभी भी आश्चर्य है कि क्या ग्रेड के मध्य-ग्रेडिएंट बनाम अंत में लापता मूल्यों के साथ एक भविष्यवक्ता चुनना अधिक विवेकपूर्ण है। यदि वे संबंधित हैं।
कात्या

मुझे खेद है कि मैंने अपनी फ़ाइल अपलोड करने की कोशिश की, लेकिन मुझे नहीं पता कि कैसे या कहाँ :( ... + मेरा मतलब था कि विषमलैंगिकता और धारावाहिक संबंध से मॉडल को ठीक किया
TG Zain


1

2 ठीक लगता है। मैं इसके साथ जाऊंगा।

1. जैसा कि मैं आपको डेटासेट में उपलब्ध सभी विशेषताओं का उपयोग करके जीसीसी की भविष्यवाणी करने के लिए एक मॉडल को प्रशिक्षित करने का सुझाव दूंगा (जो कि सेप्ट 2011 की अवधि के दौरान NA नहीं हैं) (पंक्तियों को प्रशिक्षित करते समय sep2011 से पहले कोई NA मान है)। मॉडल बहुत अच्छा होना चाहिए (K- गुना क्रॉस सत्यापन का उपयोग करें)। अब सेप्ट 2011 और उसके बाद की अवधि के लिए जीसीसी की भविष्यवाणी करें।

वैकल्पिक रूप से, आप एक मॉडल को प्रशिक्षित कर सकते हैं जो MSCI की भविष्यवाणी करता है, इसका उपयोग लापता MSCI मूल्यों की भविष्यवाणी करने के लिए करता है। अब एमएससीआई का उपयोग करके जीसीसी की भविष्यवाणी करने के लिए एक मॉडल को प्रशिक्षित करें और फिर सितंबर 2011 और उसके बाद की अवधि के लिए जीसीसी की भविष्यवाणी करें


धन्यवाद, आप बताएं .. आपका उत्तर मुझे var मॉडल के बारे में सोचने के लिए प्रेरित करेगा ... क्या यह काम करेगा?
टीजी ज़ैन

सैद्धांतिक रूप से, VAR मॉडल को काम करना चाहिए, लेकिन जब आप भविष्य में बहुत देर से पूर्वानुमान करना शुरू करते हैं, तो संचित त्रुटि बहुत अधिक हो जाती है। यानी यदि आप y (t) पर खड़े हैं और आप y (t + 10) का मान चाहते हैं, तो आपको कई बार पुनरावर्ती भविष्यवाणी करने की आवश्यकता होगी। पहले आप y (t + 1) की भविष्यवाणी करेंगे, उसके बाद y (t + 2) और इसी तरह की भविष्यवाणी करने के लिए भविष्यवाणी का उपयोग करेंगे।
शो_स्टॉपर

मैं आपकी मदद की सराहना करता हूं ... तो क्या आपका मतलब उस विधि से है जिसे आपने ट्रेन एमोडेल से बेहतर बताया है, लेकिन मुझे इसके बारे में कोई भी जानकारी नहीं है ... क्या आप कृपया बता सकते हैं कि आपके पास कोई ट्यूटोरियल कैसे या क्या है? मुझे किस तरह के मॉडल का उपयोग करना चाहिए?
टीजी ज़ैन

ठीक है। तो अब जब मैंने आपके डेटासेट को देख लिया है, तो निम्न कार्य करें। एक साधारण मॉडल डिज़ाइन करें जो GCC की भविष्यवाणी करने के लिए MSCI का उपयोग करता है। अब अगस्त 2012 और उसके बाद के समय के लिए जीसीसी की भविष्यवाणी करें। अक्टूबर 2011 से जुलाई 2012 की समयावधि के लिए GCC मानों की भविष्यवाणी करने के लिए VAR या एक साधारण AR मॉडल का उपयोग करें
show_stopper

1
सरल मॉडल से मेरा मतलब है, एक रैखिक या लॉग-रेखीय प्रतिगमन मॉडल। K- गुना सत्यापन सरल है। कुल डेटा को k सिलवटों में विभाजित करें। k कोई भी संख्या हो सकती है। K-1 विभाजन का उपयोग करके मॉडल को प्रशिक्षित करें, अंतिम विभाजन पर मॉडल का परीक्षण करें। इसे दोहराएं, जब तक कि हर थूक का परीक्षण न हो जाए। अब RMSE मानों की गणना करें। उपरोक्त करने का कारण यह सुनिश्चित करना है कि आपके द्वारा चुना गया मॉडल एक अच्छी भविष्य कहनेवाला शक्ति है
शो_स्टॉपर
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.