आरएटीआर (आर) का उपयोग करके एक कार्ट मॉडल (विशेष रूप से वर्गीकरण ट्री) का निर्माण करते समय, यह जानना अक्सर दिलचस्प होता है कि मॉडल के लिए पेश किए गए विभिन्न चर का क्या महत्व है।
इस प्रकार, मेरा प्रश्न है: कार्ट मॉडल में भाग लेने वाले चर के रैंकिंग महत्व को मापने / मापने के लिए क्या सामान्य उपाय मौजूद हैं? और आर का उपयोग करके इसकी गणना कैसे की जा सकती है (उदाहरण के लिए, जब समकक्ष पैकेज का उपयोग करते हुए)
उदाहरण के लिए, यहां कुछ डमी कोड बनाए गए हैं, ताकि आप उस पर अपने समाधान दिखा सकें। इस उदाहरण को संरचित किया गया है ताकि यह स्पष्ट हो सके कि चर X1 और x2 "महत्वपूर्ण" हैं जबकि (कुछ अर्थों में) X1 अधिक महत्वपूर्ण है तो x2 (क्योंकि X1 को अधिक मामलों पर लागू करना चाहिए, इस प्रकार डेटा की संरचना पर अधिक प्रभाव पड़ता है, तब x2)।
set.seed(31431)
n <- 400
x1 <- rnorm(n)
x2 <- rnorm(n)
x3 <- rnorm(n)
x4 <- rnorm(n)
x5 <- rnorm(n)
X <- data.frame(x1,x2,x3,x4,x5)
y <- sample(letters[1:4], n, T)
y <- ifelse(X[,2] < -1 , "b", y)
y <- ifelse(X[,1] < 0 , "a", y)
require(rpart)
fit <- rpart(y~., X)
plot(fit); text(fit)
info.gain.rpart(fit) # your function - telling us on each variable how important it is
(संदर्भों का हमेशा स्वागत है)