मैंने 8 चर (विभिन्न शरीर मुद्राओं और चालन) के आधार पर 6 जानवरों के व्यवहार (उदाहरण के लिए खड़े, चलना, तैरना आदि) को वर्गीकृत करने के लिए यादृच्छिक रूप से उपयोग किया।
RandomForest पैकेज में MDSplot मुझे यह आउटपुट देता है और मुझे परिणाम की व्याख्या करने में समस्या है। मैंने एक ही डेटा पर एक PCA किया और PC1 और PC2 में सभी वर्गों के बीच पहले से ही अच्छा तालमेल बैठा लिया, लेकिन यहाँ Dim1 और Dim2 सिर्फ 3 व्यवहार को अलग करते हैं। क्या इसका मतलब यह है कि ये तीनों व्यवहार अन्य सभी व्यवहारों की तुलना में अधिक भिन्न हैं (इसलिए एमडीएस चर के बीच सबसे बड़ी असमानता को खोजने की कोशिश करता है, लेकिन जरूरी नहीं कि सभी चर पहले चरण में हों)? तीन समूहों की स्थिति क्या है (जैसे कि Dim1 और Dim2 में) इंगित करता है? चूंकि मैं आरआई के लिए नया हूं, इसलिए इस प्लॉट के लिए एक किंवदंती की साजिश रचने में भी समस्याएं हैं (हालांकि मुझे इस बात का अंदाजा है कि अलग-अलग रंगों का क्या मतलब है), लेकिन शायद कोई मदद कर सकता है? बहुत बहुत धन्यवाद!!
मैं रैंडमफोरेस्ट में क्लासकेंटर फ़ंक्शन के साथ किए गए एक प्लॉट को जोड़ता हूं। यह फ़ंक्शन प्रोटोटाइप प्लॉटिंग के लिए निकटता मैट्रिक्स (एमडीएस प्लॉट में भी) का उपयोग करता है। लेकिन सिर्फ छह अलग-अलग व्यवहारों के लिए डेटा पॉइंट्स को देखने से, मैं समझ नहीं पा रहा हूं कि निकटता मैट्रिक्स मेरे प्रोटोटाइप को प्लॉट क्यों करेगा जैसा कि यह करता है। मैंने आईरिस डेटा के साथ क्लासकेंटर फ़ंक्शन की भी कोशिश की और यह काम करता है। लेकिन ऐसा लगता है कि यह मेरे डेटा के लिए काम नहीं करता है ...
इस कोड को मैंने इस प्लॉट के लिए इस्तेमाल किया है
be.rf <- randomForest(Behaviour~., data=be, prox=TRUE, importance=TRUE)
class1 <- classCenter(be[,-1], be[,1], be.rf$prox)
Protoplot <- plot(be[,4], be[,7], pch=21, xlab=names(be)[4], ylab=names(be)[7], bg=c("red", "green", "blue", "yellow", "turquoise", "orange") [as.numeric(factor(be$Behaviour))])
points(class1[,4], class1[,7], pch=21, cex=2, bg=c("red", "green", "blue", "yellow", "turquoise", "orange"))
मेरा वर्ग स्तंभ पहले वाला है, उसके बाद 8 भविष्यवक्ता हैं। मैंने x और y के रूप में दो सर्वश्रेष्ठ भविष्यवक्ता चरों की साजिश रची।