मेरे पास एक डेटासेट है जिसमें एक बाइनरी क्लास विशेषता है। कक्षा 1 (कैंसर पॉजिटिव) के साथ 623 उदाहरण हैं और कक्षा -1 (कैंसर नकारात्मक) के साथ 101,671 उदाहरण हैं।
मैंने विभिन्न एल्गोरिदम (Naive Bayes, Random Forest, AODE, C4.5) की कोशिश की है और उन सभी में अस्वीकार्य झूठे नकारात्मक अनुपात हैं। रैंडम फ़ॉरेस्ट में सबसे अधिक समग्र भविष्यवाणी सटीकता (99.5%) और सबसे कम गलत नकारात्मक अनुपात है, लेकिन अभी भी 79% सकारात्मक कक्षाएं याद आती हैं (यानी 79% घातक ट्यूमर का पता लगाने में विफल)।
किसी भी विचार मैं इस स्थिति में कैसे सुधार कर सकता हूं?
धन्यवाद!