हम दुर्लभ घटनाओं की भविष्यवाणी कैसे करते हैं?


11

मैं एक बीमा जोखिम पूर्वानुमान मॉडल विकसित करने पर काम कर रहा हूं। ये मॉडल "दुर्लभ घटनाओं" जैसे एयरलाइन नो-शो भविष्यवाणी, हार्डवेयर दोष का पता लगाने, आदि जैसे हैं। जैसा कि मैंने अपना डेटा सेट तैयार किया, मैंने वर्गीकरण लागू करने की कोशिश की, लेकिन मैं नकारात्मक मामलों के उच्च अनुपात के कारण उपयोगी क्लासिफायर प्राप्त नहीं कर सका। ।

मेरे पास हाई स्कूल के आँकड़ों से परे आँकड़ों और मॉडलिंग के आंकड़ों का बहुत अनुभव नहीं है इसलिए मैं थोड़े भ्रमित हूँ।

जैसा कि पहले सोचा था, मैं एक अमानवीय पॉइसन प्रक्रिया मॉडल का उपयोग करने के बारे में सोच रहा हूं। मैंने किसी विशेष दिन किसी विशेष स्थान पर किसी विशेष समय पर जोखिम के अवसर का एक अच्छा अनुमान प्राप्त करने के लिए इसे इवेंट डेटा (दिनांक, लाट, लोन) के आधार पर वर्गीकृत किया।

मैं जानना चाहता हूं, दुर्लभ घटनाओं की भविष्यवाणी करने के लिए क्या तरीके / एल्गोरिदम हैं?
इस समस्या से निपटने के लिए एक दृष्टिकोण के रूप में आप क्या सलाह देते हैं?

जवाबों:


9

मानक दृष्टिकोण " चरम मूल्य सिद्धांत " है, स्टुअर्ट कोल्स द्वारा विषय पर एक उत्कृष्ट पुस्तक है (हालांकि वर्तमान मूल्य बल्कि, अति ... लगता है)।

वर्गीकरण या प्रतिगमन विधियों का उपयोग करके आपको अच्छे परिणाम प्राप्त करने की संभावना नहीं है, यह है कि ये विधियां आमतौर पर डेटा के सशर्त माध्य की भविष्यवाणी करने पर निर्भर करती हैं, और चरम घटनाएं आमतौर पर "यादृच्छिक" कारकों के संयोजन के कारण होती हैं जो सभी एक ही दिशा में संरेखित करते हैं, इसलिए वे प्रशंसनीय परिणामों के वितरण की पूंछ में हैं, जो आमतौर पर सशर्त साधनों से एक लंबा रास्ता तय करते हैं। आप जो कर सकते हैं, वह केवल अपने मतलब के बजाय पूरे सशर्त वितरण की भविष्यवाणी करना है, और कुछ सीमा के ऊपर वितरण की पूंछ को एकीकृत करके किसी चरम घटना की संभावना पर कुछ जानकारी प्राप्त करना है। मैंने पाया कि भारी वर्षा के सांख्यिकीय डाउनस्कलिंग पर एक आवेदन में यह अच्छी तरह से काम करता है ।


1
क्या अजगर पर इस सिद्धांत का कोई कार्यान्वयन है?
user3378649

क्षमा करें, मैं पायथन (अभी तक) में कार्यक्रम नहीं करता, इसलिए मैं वहां मदद नहीं कर सकता।
डिक्रान मार्सुपियल

yएक्स1,...,एक्सny>Y0पी(y>Y0|एक्स1,...,एक्सn)(y|एक्स1,...,एक्सn)y>Y0पी(y>Y0|एक्स1,...,एक्सn)

हां, आप ऐसा कर सकते हैं, हालांकि आपके द्वारा कम किए जा रहे लागत फ़ंक्शन को वितरण की पूंछ प्राप्त करने पर ध्यान केंद्रित नहीं किया जाता है, इसलिए यदि आप जिस चीज में रुचि रखते हैं, तो यह कोशिश करना बेहतर है और पूंछ में घटनाओं को अधिक स्पष्ट रूप से मॉडल करें। ।
डिक्रान मार्सुपियल
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.