मैं जानता हूँ कि कॉक्स आनुपातिक खतरों प्रतिगमन और कुछ कापलान-मायर मॉडल की तरह है कि पारंपरिक सांख्यिकीय मॉडल एक घटना कहते हैं विफलता की अगली आवृत्ति तक दिनों की भविष्यवाणी करने के लिए किया जा सकता आदि यानी जीवन रक्षा विश्लेषण
प्रशन
- किसी घटना के घटने तक दिनों की भविष्यवाणी करने के लिए GBM, न्यूरल नेटवर्क आदि जैसे मशीन लर्निंग मॉडल्स का रिग्रेशन वर्जन कैसे इस्तेमाल किया जा सकता है?
- मेरा मानना है कि केवल लक्ष्य चर के रूप में होने तक के दिनों का उपयोग करना और बस एक प्रतिगमन मॉडल चलाने से काम नहीं चलेगा? यह काम क्यों नहीं करेगा और इसे कैसे ठीक किया जा सकता है?
- क्या हम उत्तरजीविता विश्लेषण समस्या को वर्गीकरण में बदल सकते हैं और फिर उत्तरजीविता प्राप्त कर सकते हैं? यदि फिर बाइनरी टारगेट चर कैसे बनाया जाए?
- मशीन लर्निंग अप्रोच बनाम कॉक्स आनुपातिक खतरों के प्रतिगमन और कापलान-मायर मॉडल आदि के पेशेवरों और विपक्ष क्या है?
कल्पना कीजिए कि इनपुट इनपुट डेटा नीचे प्रारूप का है
ध्यान दें:
- सेंसर 10 मिनट के अंतराल पर डेटा को पिंग करता है लेकिन कई बार नेटवर्क इश्यू आदि के कारण डेटा गायब हो सकता है क्योंकि एनए के साथ पंक्ति द्वारा दर्शाया गया है।
- var1, var2, var3 भविष्यवक्ता, व्याख्यात्मक चर हैं।
- विफलता_फ्लैग बताता है कि मशीन विफल हुई या नहीं।
- हमारे पास प्रत्येक मशीन आईडी के लिए प्रत्येक 10 मिनट के अंतराल पर 6 महीने का डेटा है
संपादित करें:
अपेक्षित आउटपुट की भविष्यवाणी नीचे प्रारूप में होनी चाहिए
नोट: मैं अगले 30 दिनों के लिए दैनिक स्तर पर प्रत्येक मशीन के लिए विफलता की संभावना का अनुमान लगाना चाहता हूं।
failure_flag
।