मैं एक बीमा जोखिम पूर्वानुमान मॉडल विकसित करने पर काम कर रहा हूं। ये मॉडल "दुर्लभ घटनाओं" जैसे एयरलाइन नो-शो भविष्यवाणी, हार्डवेयर दोष का पता लगाने, आदि जैसे हैं। जैसा कि मैंने अपना डेटा सेट तैयार किया, मैंने वर्गीकरण लागू करने की कोशिश की, लेकिन मैं नकारात्मक मामलों के उच्च अनुपात के कारण उपयोगी क्लासिफायर प्राप्त नहीं कर सका। ।
मेरे पास हाई स्कूल के आँकड़ों से परे आँकड़ों और मॉडलिंग के आंकड़ों का बहुत अनुभव नहीं है इसलिए मैं थोड़े भ्रमित हूँ।
जैसा कि पहले सोचा था, मैं एक अमानवीय पॉइसन प्रक्रिया मॉडल का उपयोग करने के बारे में सोच रहा हूं। मैंने किसी विशेष दिन किसी विशेष स्थान पर किसी विशेष समय पर जोखिम के अवसर का एक अच्छा अनुमान प्राप्त करने के लिए इसे इवेंट डेटा (दिनांक, लाट, लोन) के आधार पर वर्गीकृत किया।
मैं जानना चाहता हूं, दुर्लभ घटनाओं की भविष्यवाणी करने के लिए क्या तरीके / एल्गोरिदम हैं?
इस समस्या से निपटने के लिए एक दृष्टिकोण के रूप में आप क्या सलाह देते हैं?