मैं भविष्य में वित्तीय समय 1 या अधिक चरणों की भविष्यवाणी करने के लिए मशीन सीखने का उपयोग करने के बारे में समझ पाने की कोशिश कर रहा हूं।
मेरे पास कुछ वर्णनात्मक डेटा के साथ एक वित्तीय समय है और मैं एक मॉडल बनाना चाहूंगा और फिर मॉडल का उपयोग करके n-कदमों की भविष्यवाणी करूंगा।
मैं अब तक क्या कर रहा हूं:
getSymbols("GOOG")
GOOG$sma <- SMA(Cl(GOOG))
GOOG$range <- GOOG$GOOG.High-GOOG$GOOG.Low
tail(GOOG)
GOOG.Open GOOG.High GOOG.Low GOOG.Close GOOG.Volume GOOG.Adjusted sma range
2013-05-07 863.01 863.87 850.67 857.23 1959000 857.23 828.214 13.20
2013-05-08 857.00 873.88 852.91 873.63 2468300 873.63 834.232 20.97
2013-05-09 870.84 879.66 868.23 871.48 2200600 871.48 840.470 11.43
2013-05-10 875.31 880.54 872.16 880.23 1897700 880.23 848.351 8.38
2013-05-13 878.89 882.47 873.38 877.53 1448500 877.53 854.198 9.09
2013-05-14 877.50 888.69 877.14 887.10 1579300 887.10 860.451 11.55
तब मैंने इस डेटा के लिए एक यादृच्छिक मॉडल को फिट किया है।
fit <- randomForest(GOOG$GOOG.Close ~ GOOG$sma + GOOG$range, GOOG)
जो आश्चर्यजनक रूप से अच्छी तरह से फिट होता है:
> fit
Call:
randomForest(formula = GOOG$GOOG.Close ~ GOOG$sma + GOOG$range, data = GOOG)
Type of random forest: regression
Number of trees: 500
No. of variables tried at each split: 1
Mean of squared residuals: 353.9844
% Var explained: 97.28
और भविष्यवाणी करने के लिए इसका उपयोग करने की कोशिश की:
predict(fit, GOOG, n.ahead=2)
लेकिन इस भविष्यवाणी का कोई फायदा नहीं हुआ।
मैं क्लोज़ की भविष्यवाणी करने की कोशिश करता हूं, क्या मुझे मॉडल को फिट करने से पहले, अन्य चरणों को भी उतने ही चरणों में रखना चाहिए जितना कि मैं भविष्यवाणी करना चाहता हूं?
संभवत: बहुत सारे अन्य सामानों को भी मुझे ध्यान में रखना चाहिए, लेकिन ये वास्तव में मशीन सीखने का मेरा पहला कदम है।