पार्टी के लिए देर से, लेकिन यहां मेरा जवाब वैसे भी है, और यह "हां" है, किसी को हमेशा मॉडल / विधि के रैखिक या नहीं होने या मुख्य कार्य भविष्यवाणी या वर्गीकरण होने की परवाह किए बिना, कोलिनियरिटी के बारे में चिंतित होना चाहिए।
विधि के रूप में डेटा सेट और रैंडम फ़ॉरेस्ट में मौजूद रैखिक रूप से सहसंबंधित सहसंयोजक / सुविधाओं की एक संख्या मान लें। जाहिर है, प्रति नोड यादृच्छिक चयन केवल (या अधिकतर) कोलीनर विशेषताओं को चुन सकता है, जिसके परिणामस्वरूप / खराब विभाजन हो सकता है, और यह बार-बार हो सकता है, इस प्रकार प्रदर्शन को नकारात्मक रूप से प्रभावित कर सकता है।
अब, कोलिनर फीचर्स अन्य (नॉन-कोलीनियर) फीचर्स की तुलना में परिणाम के बारे में कम जानकारीपूर्ण हो सकते हैं और जैसे कि उन्हें वैसे भी सेट किए गए फीचर से एलिमिनेशन के लिए माना जाना चाहिए। हालाँकि, मान लें कि RF द्वारा निर्मित 'फ़ीचर महत्व' सूची में सुविधाएँ उच्च स्थान पर हैं। जैसे वे डेटा सेट में रखा जाएगा अनावश्यक रूप से आयामीता में वृद्धि। तो, व्यवहार में, मैं हमेशा खोजपूर्ण कदम (कई संबंधितों में से) के रूप में रैखिक सहसंबंध सहित सुविधाओं की जोड़ीबद्ध संघ की जांच करूंगा।