घटना की भविष्यवाणी के लिए उत्तरजीविता विश्लेषण


9

मेरे डेटासेट में प्रत्येक रिकॉर्ड के लिए मेरे पास निम्न जानकारी है

(X1 , ,Xm ,δ ,T )

कहाँ पे Xi विशेषताएं हैं, δ यदि लक्ष्य घटना घटित होती है तो १ और अन्यथा होती है Tहुई घटना का टाइमस्टैम्प है। विशेष रूप से,T अनुवर्ती समाप्त होने पर कोई घटना या समय निर्धारित न होने के कारण गायब हो सकता है।

मैं अपने डेटासेट में प्रत्येक रिकॉर्ड के लिए एक जोखिम सूचकांक की गणना करना चाहता हूं।

मैं एक वर्गीकरण मॉडल के लिए जाने की सोच रहा था जो सुविधाओं का उपयोग करता है Xi वर्ग की भविष्यवाणी करने के लिए δ। तथापि,T महत्वपूर्ण है: यदि घटना δ जल्द ही जोखिम अधिक होने की संभावना है।

इसीलिए इस समस्या के लिए एक उत्तरजीविता विश्लेषण अनुकूल होना चाहिए। मुझे इसके पूर्ण आकलन की आवश्यकता नहीं हैS(t)=P(T>t) लेकिन सिर्फ एक ही सूचकांक जो एकल रिकॉर्ड के लिए जोखिम का प्रतिनिधित्व करता है।

औसत उत्तरजीविता समय, जिसे प्रत्येक रिकॉर्ड के लिए गणना की जा सकती है, एक अच्छा जोखिम सूचकांक लगता है - जोखिम जितना कम होता है।

मेरा प्रश्न हैं:

  1. क्या उत्तरजीविता विश्लेषण मेरे उद्देश्यों के लिए उपयुक्त है?
  2. मैं अपने मॉडल के प्रदर्शन का मूल्यांकन कैसे कर सकता हूं?

प्रश्न के बारे में (2): मैं हरेल का उपयोग करने का इच्छुक हूं cउदाहरण के लिए -index, लेकिन मुझे यकीन नहीं है कि इसकी गणना करने के लिए किस अनुमानित परिणाम का उपयोग किया जाता है। हरेल की पुस्तक प्रतिगमन मॉडलिंग रणनीतियाँ पृष्ठ 247 से:

cअनुक्रमणिका [...] की गणना सभी सम्भावित विषयों के युग्मों के द्वारा की जाती है जैसे कि एक विषय ने उत्तर दिया और दूसरे ने नहीं। सूचकांक ऐसे जोड़े का अनुपात है, जिसमें उत्तरदाता के पास गैर-उत्तरदाता की तुलना में प्रतिक्रिया की अधिक अनुमानित संभावना है।

यदि उत्तरजीविता विश्लेषण एक सही विकल्प है, तो मुझे लगता है कि कुछ भिन्न तरीकों का उपयोग करना आसान होना चाहिए ताकि समय भिन्न हो। Xi(t)

जवाबों:


3

क्या उत्तरजीविता विश्लेषण मेरे उद्देश्यों के लिए उपयुक्त है?

केवल एक चीज जो इसे अस्तित्व के विश्लेषण के लिए कम लागू लगती है:

... TT अनुवर्ती समाप्त होने पर कोई घटना या समय निर्धारित न होने के कारण गायब हो सकता है।

आपको यह जानने की आवश्यकता होगी कि अंतिम अवधि को अधिकांश मॉडलों में जीवित रहने के लिए मनाया गया था। अन्यथा यह उत्तरजीविता विश्लेषण का उपयोग करने के लिए सीधा और लागू होना चाहिए। उदाहरण के लिए survival::coxphआर या एक पैरामीट्रिक मॉडल के साथ कॉक्स आनुपातिक खतरा survival::survreg

औसत उत्तरजीविता समय, जिसे प्रत्येक रिकॉर्ड के लिए गणना की जा सकती है, एक अच्छा जोखिम सूचकांक लगता है - जोखिम जितना कम होता है।

हां, आप दो पूर्व उल्लिखित (वर्गों) मॉडल के लिए औसत उत्तरजीविता समय या सिर्फ रैखिक भविष्यवक्ता का उपयोग कर सकते हैं।

मैं अपने मॉडल के प्रदर्शन का मूल्यांकन कैसे कर सकता हूं?

cसूचकांक एयूसी के "प्राकृतिक" सामान्यीकरण के रूप में मेरे लिए एक समझदार पसंद है। ध्यान दें कि उदाहरण के लिए R के साथ कार्यान्वित किया जाता है Hmisc::rcorr.cens

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.