मैं निम्नलिखित प्रक्रिया का उपयोग करके एक यादृच्छिक वन बनाना चाहूंगा:
- विभाजन को निर्धारित करने के लिए सूचना के लाभ का उपयोग करके डेटा और सुविधाओं के यादृच्छिक नमूनों पर एक पेड़ बनाएं
- एक पत्ती नोड को समाप्त करें यदि यह पूर्व-परिभाषित गहराई से अधिक है या किसी भी विभाजन के परिणामस्वरूप एक पूर्व-निर्धारित न्यूनतम से कम पत्ती की गिनती होगी
- प्रत्येक पेड़ के लिए एक क्लास लेबल असाइन करने के बजाय, पत्ती नोड में कक्षाओं के अनुपात को असाइन करें
- पूर्व-निर्धारित संख्या के निर्माण के बाद पेड़ों का निर्माण रोकें
यह पारंपरिक यादृच्छिक वन प्रक्रिया को दो तरीकों से पूरा करता है। एक, यह कांटेदार पेड़ों का उपयोग करता है जो वर्ग लेबल के बजाय अनुपात प्रदान करते हैं। और दो, स्टॉप मानदंड कुछ आउट-ऑफ-बैग त्रुटि अनुमान के बजाय पेड़ों की पूर्व-निर्धारित संख्या है।
मेरा सवाल यह है:
उपरोक्त प्रक्रिया के लिए जो एन पेड़ों का उत्पादन करती है, क्या मैं फिर LASSO चयन के साथ लॉजिस्टिक प्रतिगमन का उपयोग कर एक मॉडल फिट कर सकता हूं ? क्या किसी को लॉजिस्टिक LASSO के साथ रैंडम फ़ॉरेस्ट क्लासिफ़ायर और पोस्ट-प्रोसेसिंग की फिटिंग का अनुभव है?
ISLE फ्रेमवर्क में LASSO का उपयोग प्रतिगमन समस्याओं के लिए पोस्ट-प्रोसेसिंग कदम के रूप में किया गया है, लेकिन वर्गीकरण समस्याओं का नहीं। इसके अलावा, जब "रैंडम फ़ॉरेस्ट लास्सो" को गुगली किया जाता है, तो मुझे कोई सहायक परिणाम नहीं मिलते हैं।