मुझे ROC वक्र को समझने में परेशानी हो रही है।
आरओसी वक्र के तहत क्षेत्र में कोई लाभ / सुधार है यदि मैं प्रशिक्षण सेट के प्रत्येक अद्वितीय सबसेट से अलग मॉडल बनाता हूं और इसका उपयोग संभावना पैदा करने के लिए करता हूं? उदाहरण के लिए, यदि का मान होता है { एक , एक , एक , एक , ख , ख , ख , ख } , और मैं मॉडल बनाने एक का उपयोग करके एक के 1-4 मूल्यों से y के और 8 वीं 9 वीं मान y और निर्माण मॉडल बी का उपयोग करके ट्रेन डेटा बने रहे। अंत में, संभावना उत्पन्न करें। किसी भी विचार / टिप्पणी की बहुत सराहना की जाएगी।
यहाँ मेरे प्रश्न के लिए बेहतर स्पष्टीकरण के लिए आर कोड है:
Y = factor(0,0,0,0,1,1,1,1)
X = matirx(rnorm(16,8,2))
ind = c(1,4,8,9)
ind2 = -ind
mod_A = rpart(Y[ind]~X[ind,])
mod_B = rpart(Y[-ind]~X[-ind,])
mod_full = rpart(Y~X)
pred = numeric(8)
pred_combine[ind] = predict(mod_A,type='prob')
pred_combine[-ind] = predict(mod_B,type='prob')
pred_full = predict(mod_full, type='prob')
तो मेरा सवाल है, pred_combine
बनाम आरओसी वक्र के तहत क्षेत्र pred_full
।