क्या एक आर यादृच्छिक वन कार्यान्वयन है जो बहुत विरल डेटा के साथ अच्छी तरह से काम करता है? मेरे पास हजारों या लाखों बूलियन इनपुट वैरिएबल हैं, लेकिन केवल सैकड़ों या किसी भी उदाहरण के लिए TRUE होगा।
मैं R के लिए अपेक्षाकृत नया हूं और देखा है कि विरल डेटा से निपटने के लिए 'मैट्रिक्स' पैकेज है, लेकिन मानक 'randomForest' पैकेज इस डेटा प्रकार को पहचानता नहीं है। यदि यह मायने रखता है, तो इनपुट डेटा R के बाहर निर्मित होने जा रहा है और आयात किया जा रहा है।
कोई सुझाव? मैं Weka, Mahout या अन्य पैकेजों का उपयोग कर भी देख सकता हूं।