रैंडम फ़ॉरेस्ट कार्यान्वयन प्रतिस्थापन के साथ नमूना लेने पर भी, टिप्पणियों की संख्या से परे नमूनाकरण की अनुमति नहीं देता है। ऐसा क्यों है?
ठीक काम करता है:
rf <- randomForest(Species ~ ., iris, sampsize=c(1, 1, 1), replace=TRUE)
rf <- randomForest(Species ~ ., iris, sampsize=3, replace=TRUE)
मुझे क्या करने का मन है:
rf <- randomForest(Species ~ ., iris, sampsize=c(51, 1, 1), replace=TRUE)
Error in randomForest.default(m, y, ...) :
sampsize can not be larger than class frequency
स्तरीकृत नमूने के बिना समान त्रुटि:
rf <- randomForest(Species ~ ., iris, sampsize=151, replace=TRUE)
Error in randomForest.default(m, y, ...) : sampsize too large
चूंकि मैं बूटस्ट्रैप के नमूने लेने की विधि की उम्मीद कर रहा था, जब दोनों मामलों में = TRUE दिया गया था, इसलिए मुझे इस सीमा की उम्मीद नहीं थी।
मेरा उद्देश्य स्तरीकृत नमूनाकरण विकल्प के साथ इसका उपयोग करना है, ताकि अपेक्षाकृत दुर्लभ वर्ग से पर्याप्त रूप से बड़ा नमूना तैयार किया जा सके।