असतत समय अस्तित्व विश्लेषण के बारे में बुनियादी सवाल


18

मैं एक लॉजिस्टिक रिग्रेशन मॉडल का उपयोग करके असतत समय उत्तरजीविता विश्लेषण करने का प्रयास कर रहा हूं, और मुझे यकीन नहीं है कि मैं पूरी तरह से प्रक्रिया को समझता हूं। मैं कुछ बुनियादी सवालों के साथ सहायता की बहुत सराहना करूंगा।

यहाँ सेट है:

मैं एक समूह में पांच साल की समय खिड़की में सदस्यता देख रहा हूं। प्रत्येक सदस्य के पास प्रत्येक महीने सदस्यता का मासिक रिकॉर्ड होता है जो सदस्य समूह में होता है। मैं उन सभी सदस्यों पर विचार कर रहा हूँ जिनकी सदस्यता पाँच वर्ष की खिड़की के दौरान शुरू हुई थी (पहले से जुड़े सदस्यों के साथ "बाएं सेंसरशिप" के मुद्दों से बचने के लिए)। प्रत्येक रिकॉर्ड को समय के साथ अनुक्रमित किया जाएगा, समय के साथ वह महीना जिसमें सदस्य शामिल हुए। तो, एक सदस्य जो ढाई साल तक रहता है उसके पास तीस मासिक रिकॉर्ड होंगे, जिनकी संख्या एक से तीस तक होती है। प्रत्येक रिकॉर्ड को एक बाइनरी चर भी दिया जाएगा, जिसमें सदस्यता के अंतिम महीने के लिए एक का मूल्य होगा, और अन्यथा शून्य; बाइनरी वैरिएबल के लिए एक का मान उस घटना को चिह्नित करता है जो सदस्य ने समूह को छोड़ दिया है। प्रत्येक सदस्य के लिए जिसकी सदस्यता पाँच वर्ष की विश्लेषण विंडो से आगे जारी है,

तो, लॉजिस्टिक रिग्रेशन मॉडल द्विआधारी घटना चर के मूल्यों की भविष्यवाणी करने के लिए बनाया गया है। अब तक सब ठीक है। बाइनरी प्रेडिक्टिव मॉडल का मूल्यांकन करने के लिए विशिष्ट तरीकों में से एक होल्डआउट नमूना पर लिफ्ट को मापना है। सदस्यता खत्म होने की घटना की भविष्यवाणी करने के लिए मैंने जो लॉजिस्टिक रिग्रेशन मॉडल बनाया है, उसके लिए मैंने इवेंट के लिए गैर-ईवेंट के पांच से एक अनुपात के साथ एक होल्डआउट डेटा पर लिफ्ट की गणना की है। मैंने भविष्यवाणी के मूल्यों को डिकाइल में स्थान दिया। उच्चतम अनुमानित मूल्यों के साथ निर्णय में सत्तर प्रतिशत वाले होते हैं, चार से अधिक की लिफ्ट। पहले दो निर्णयों के संयुक्त भाग में सभी में पैंसठ प्रतिशत शामिल हैं। कुछ संदर्भों में यह एक काफी सभ्य भविष्य कहनेवाला मॉडल माना जाएगा, लेकिन मुझे आश्चर्य है कि क्या यह एक जीवित विश्लेषण करने के लिए पर्याप्त है।

चलो व्यक्ति के लिए खतरा समारोह हो महीने में , और संभावना हो कि व्यक्ति महीने के माध्यम से जीवित रहने ।जे के एस [ जे , के ] जे केh[j,k]jkS[j,k]jk

यहाँ मेरे मौलिक प्रश्न हैं:

  1. असतत खतरा कार्य, h[j,k] , प्रत्येक महीने में गैर-जीवित रहने (समूह को छोड़ने) की सशर्त संभावना है?

  2. क्या हवादार फ़ंक्शन के लॉजिस्टिक रिग्रेशन मॉडल अनुमान से अनुमानित मूल्य हैं? (यानी, h [j, k] महीने k में h[j,k]अलग-अलग j के लिए मॉडल की अनुमानित कीमत के बराबर है , या क्या खतरे के कार्य का अनुमान प्राप्त करने के लिए कुछ और करने की आवश्यकता है?)jk

  3. व्यक्ति के लिए महीने के क्ष को अस्तित्व ऊपर की संभावना है एक के उत्पाद शून्य माह एक अप करने के लिए से खतरा समारोह के बराबर , यह है कि, करता है ?क्ष एस [ j , क्ष ] = ( 1 - [ j , 1 ] ) ( 1 - [ j , 2 ] ) ... ( 1 - [ j , क्ष ] )jqS[j,q]=(1h[j,1])(1h[j,2])(1h[j,q])

  4. की औसत मान है सभी व्यक्तियों से अधिक हर बार के लिए कुल आबादी मतलब अस्तित्व संभावना का एक उचित अनुमान?जे केS[j,k]jk

  5. मासिक कपलान-मेयर ग्राफ के समान महीने भर की कुल आबादी के अस्तित्व की संभावना बचनी चाहिए?

यदि इनमें से किसी भी प्रश्न का उत्तर नहीं है, तो मुझे एक गंभीर गलतफहमी है, और वास्तव में कुछ सहायता / स्पष्टीकरण का उपयोग कर सकता है। इसके अलावा, क्या बाइनरी प्रेडिक्टिव मॉडल को एक सटीक उत्तरजीविता प्रोफ़ाइल बनाने के लिए कितना अच्छा होना चाहिए, इसके लिए अंगूठे का कोई नियम है?


हो सकता है कि यह आपके कुछ सवालों में मदद कर सकता है
jujae

जवाबों:


7

मान लें का सबसे बड़ा मूल्य है (यानी सबसे बड़ा माह / अवधि आपके डेटा में मनाया)।Kk

  1. यहाँ समय की पूरी तरह से असतत पैराट्रिएजेशन के साथ, और पैरामीटर का वेक्टर वेक्टर है, जो कंडीशनिंग वैरिएबल : । खतरा फ़ंक्शन समय के वैकल्पिक मापदंडों के आसपास भी बनाया जा सकता है (जैसे कि मॉडल में एक चर के रूप में या इसके कार्य शामिल हैं ), या दोनों के एक संकर के आसपास।BXhj,k=eαk+BX1+eαk+BXk

    आधारभूत logit खतरा समारोह टाइम में ईवेंट घटित होने की संभावना का वर्णन करता है , समय के लिए बच गया होने पर सशर्त । मॉडल में भविष्यवाणियों ( ) को जोड़ने से इस स्थिति को और कमज़ोर किया जा सकता है।kकश्मीर एक्सkX

  2. नहीं है, रसद प्रतिगमन अनुमान (जैसे , , , ) कर रहे हैं नहीं जोखिम कार्यों के लिए खुद को। लॉजिस्टिक रिग्रेशन मॉडल: , और आपको खतरनाक अनुमान प्राप्त करने के लिए ऊपर (1) एंटी-लॉगिट ट्रांस्फ़ॉर्म करने की आवश्यकता है।α^1 ... α कश्मीर बी (j,k)=αकश्मीर+बीएक्सα^KB^(hj,k)=αk+BX

  3. हाँ। हालाँकि मैं इसे । उत्तरजीविता समारोह समय द्वारा घटना का अनुभव नहीं करने की संभावना है , और निश्चित रूप से भी पर वातानुकूलित किया जा सकता है ।S^j,q=i=1q(1hj,i)kX

  4. यह एक सूक्ष्म प्रश्न है, निश्चित नहीं कि मेरे पास उत्तर हैं। मेरे पास प्रश्न हैं, हालांकि। :) सही-सेंसर के कारण और घटना घटने के कारण प्रत्येक समय अवधि में नमूना आकार समय के साथ कम हो जाता है: क्या आप मीन बचे समय की अपनी गणना में इसके लिए जिम्मेदार होंगे? कैसे? "जनसंख्या" से आपका क्या अभिप्राय है? आपके अध्ययन के सामान्यीकरण के लिए व्यक्तियों को किस जनसंख्या में भर्ती किया जाता है? या आप कुछ सांख्यिकीय "सुपर-जनसंख्या" अवधारणा का मतलब है? इन मॉडलों में इंट्रेंस एक बड़ी चुनौती है, क्योंकि हम अनुमान लगाते हैं कि और उनकी मानक त्रुटियां हैं, लेकिन , और (से मानक त्रुटियों को प्राप्त करने के लिए डेल्टा-विधि बैक-फ़्लिप करने की आवश्यकता है मेरा अपना काम) लिए मान्य मानक त्रुटियों को प्राप्त करनाβh^j,kS^j,kकेवल कागज पर काम करता है (मैं सशर्त मॉडल में लिए सही सीआई कवरेज नहीं प्राप्त कर सकता हूं )।S^j,k

  5. आप कापलान-मायर-जैसे चरण-फ़ंक्शन ग्राफ़ का उपयोग कर सकते हैं, और आप सीधी रेखा रेखाओं का भी उपयोग कर सकते हैं (अर्थात समय को रेखाओं के बीच के बिंदुओं को एक रेखा से जोड़ते हैं)। आपको बाद के मामले का उपयोग केवल तभी करना चाहिए जब "असतत समय" की अवधारणा स्वयं उपविभाजित अवधि की संभावना को स्वीकार करती है। तुम भी प्लॉट कर सकते हैं / के अनुमान संवाद संचयी घटना (जो ... कम से कम महामारीविदों अक्सर "संचयी घटना" इस तरह से परिभाषित करेगा, अवधि के जोखिम मॉडल प्रतिस्पर्धा में अलग ढंग से प्रयोग किया जाता है अवधि। तेज यहाँ भी इस्तेमाल किया जा सकता है।)1Sj,k


मुझे लगता है कि प्रश्न 2 में, ओपी लॉजिस्टिक मॉडल से अनुमानित मूल्य के बारे में पूछ रहा है, न कि प्रतिगमन गुणांक के अनुमानों के बारे में। यह प्रासंगिक हो सकता है
jujae

@ जाजाए मैंने स्पष्ट रूप से # 2 में अपने उत्तर में लॉजिस्टिक फ़ंक्शन दिया, और ओपी का ध्यान लॉग-इन पैरामीटर के एंटी-लॉगिट के उपयोग को निर्देशित करने के लिए लॉजिक पैरामीटर अनुमानों को _ में बदलने के लिए दिया , इसलिए मैं आपकी टिप्पणी को नहीं समझ रहा हूं। h^(t)
एलेक्सिस

एक लॉजिस्टिक मॉडल का अनुमानित मूल्य नहीं है बाइनरी आरवी की सफलता की संभावना ऐसी है कि कोई एंटी-लॉगिट की आवश्यकता नहीं है। वह ? ypred=exp(βTx)/(1+exp(βTx))
जूजे

मूल प्रश्न 2 पर वापस जाएं, ओपी ने पूछा: "क्या खतरा फ़ंक्शन के लॉजिस्टिक रिग्रेशन मॉडल अनुमान से अनुमानित मूल्य हैं?" मैं हां कहूंगा (यदि मेरी भविष्यवाणी की समझ सही है)। और आप नहीं कह रहे हैं और यह तर्क देते हैं कि अनुमानित गुणांक खतरनाक अनुमान के समान नहीं हैं। मैं आपके कथन से सहमत हूं, वे सही हैं लेकिन ऐसा नहीं है जो ओपी ने मेरी समझ से पूछा है।
जूजा

और सवाल 4 के लिए, मुझे लगता है कि ओपी प्रत्येक अंतराल पर अस्तित्व संभावना के बारे में पूछ रहा है और अनुमानित की औसत एस जे ( कश्मीर ) वास्तव में के लिए एक उचित आकलनकर्ता है एस ( कश्मीर ) । आपके उत्तर में, आप पहली बार उत्तरजीविता के समय का उल्लेख कर रहे हैं जो मुझे एक पाठक के रूप में भ्रमित कर रहा है। इस बीच, मेरा यह भी मानना ​​है कि जिस अनुमानक की हम चर्चा कर रहे हैं, वह अनिवार्य रूप से कापलान-मेयर है, और (उदाहरण के लिए) केएम के लिए ग्रीनवुड के विचरण अनुमानक का सीधा उपयोग किया जा सकता है और मैं आपके द्वारा ऊपर बताई गई कठिनाइयों की सराहना करने में विफल रहता हूं। kS^j(k)S(k)
जूजा
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.