संचयी खतरे समारोह के लिए अंतर्ज्ञान (अस्तित्व विश्लेषण)


17

मैं एक्चुअरिअल साइंस (विशेष रूप से कॉक्स आनुपातिक खतरा मॉडल के लिए) में मुख्य कार्यों में से प्रत्येक के लिए अंतर्ज्ञान प्राप्त करने की कोशिश कर रहा हूं। यहाँ मेरे पास अभी तक क्या है:

  • f(x) : प्रारंभ समय पर शुरू, आप कब मरेंगे की संभावना वितरण।
  • F(x) : सिर्फ संचयी वितरण। समय , जनसंख्या का कितना% मृत हो जाएगा?T
  • 1 - एफ ( एक्स )S(x) : । समय , जनसंख्या का कितना% जीवित होगा?1F(x)T
  • h(x) : खतरा फ़ंक्शन। एक निश्चित समय , अभी भी जीवित लोगों की, इसका उपयोग यह अनुमान लगाने के लिए किया जा सकता है कि अगली बार के अंतराल में कितने लोग मरेंगे, या यदि अंतराल-> 0, 'तात्कालिक' मृत्यु संभावना।T
  • H(x) : संचयी खतरा। कोई जानकारी नहीं।

खतरनाक मूल्यों के संयोजन के पीछे क्या विचार है, खासकर जब वे निरंतर होते हैं? यदि हम चार सत्रों में मृत्यु दर के साथ असतत उदाहरण का उपयोग करते हैं, और खतरे का कार्य निम्नानुसार है:

  • वसंत से शुरू होकर, हर कोई जीवित है, और 20% मर जाएगा
  • अब शेष गर्मियों में, 50% लोग मर जाएंगे
  • अब फॉल में, शेष बचे लोगों में से 75% मर जाएंगे
  • फाइनल सीजन विंटर है। बचे हुए लोगों में से, 100% मर जाएगा

फिर संचयी खतरा 20%, 70%, 145%, 245% है ?? इसका क्या मतलब है, और यह क्यों उपयोगी है?


1
आपका का x होना चाहिए या इसके विपरीत होना चाहिए । Tx
Glen_b -Reinstate मोनिका

5
बारे में , आपसे एक गलती है (हालाँकि यह एक बहुत ही आम भ्रम है)। आप लिखते हैं, "अंतराल-> 0, 'तात्कालिक' मौत की संभावना"। एक सही कथन 'तात्कालिक मृत्यु दर ' होगा। यह प्रायिकता नहीं हो सकती क्योंकि यह d t द्वारा विभाजित की गई संभावना है ; इसके अलावा, यह> 1 हो सकता है। h(x)dt
गूँग - मोनिका

जवाबों:


6

मरने के अनुपात के संयोजन के रूप में आप कर रहे हैं आप संचयी खतरा नहीं दे रहा है। निरंतर समय में खतरनाक दर एक सशर्त संभावना है कि बहुत कम अंतराल के दौरान एक घटना घटित होगी:

h(t)=limΔt0P(t<Tt+Δt|T>t)Δt

Δtt

mx

यदि आप R का उपयोग करते हैं, तो यहां 1 वर्ष की आयु के अंतराल पर होने वाली मौतों की संख्या से इन कार्यों का अनुमान लगाने का एक छोटा सा उदाहरण दिया गया है: 1

dx <-  c(3184L, 268L, 145L, 81L, 64L, 81L, 101L, 50L, 72L, 76L, 50L, 
         62L, 65L, 95L, 86L, 120L, 86L, 110L, 144L, 147L, 206L, 244L, 
         175L, 227L, 182L, 227L, 205L, 196L, 202L, 154L, 218L, 279L, 193L, 
         223L, 227L, 300L, 226L, 256L, 259L, 282L, 303L, 373L, 412L, 297L, 
         436L, 402L, 356L, 485L, 495L, 597L, 645L, 535L, 646L, 851L, 689L, 
         823L, 927L, 878L, 1036L, 1070L, 971L, 1225L, 1298L, 1539L, 1544L, 
         1673L, 1700L, 1909L, 2253L, 2388L, 2578L, 2353L, 2824L, 2909L, 
         2994L, 2970L, 2929L, 3401L, 3267L, 3411L, 3532L, 3090L, 3163L, 
         3060L, 2870L, 2650L, 2405L, 2143L, 1872L, 1601L, 1340L, 1095L, 
         872L, 677L, 512L, 376L, 268L, 186L, 125L, 81L, 51L, 31L, 18L, 
         11L, 6L, 3L, 2L)

x <- 0:(length(dx)-1) # age vector

plot((dx/sum(dx))/(1-cumsum(dx/sum(dx))), t="l", xlab="age", ylab="h(t)", 
     main="h(t)", log="y")
plot(cumsum((dx/sum(dx))/(1-cumsum(dx/sum(dx)))), t="l", xlab="age", ylab="H(t)", 
     main="H(t)")

उम्मीद है की यह मदद करेगा।


क्या यह कहना सही है कि h (t) * dt t के आसपास लंबाई dt के अंतराल में होने वाली घटना की संभावना है? इसलिए, मान h (t) एक घटना की संभावना है जो समय के लगभग 1 इकाई के भीतर घटित होती है जो t के आसपास केंद्रित होती है। यह केवल तभी होगा यदि h (t) <= 1
क्रो

10

मारियो क्लीवेज की पुस्तक "एन इंट्रोडक्शन टू सर्वाइवल एनालिसिस स्टैटिंग यूजिंग स्टाटा" (दूसरा संस्करण) का उस विषय पर एक अच्छा अध्याय है।

आप Google पुस्तकों पर अध्याय पा सकते हैं , पी। 13-15। लेकिन मैं पूरे अध्याय 2 को पढ़ने की सलाह दूंगा।

यहाँ संक्षिप्त रूप है:

  • "यह समय टी तक संचित कुल जोखिम को मापता है" (पृष्ठ 8)
  • डेटा की व्याख्या की गणना करें: "यह एक निश्चित अवधि में विफलताओं [या अन्य घटनाओं] का निरीक्षण करने के लिए (गणितीय रूप से) हमें उम्मीद है कि यदि कोई विफलता घटना दोहराई गई थी, तो कई बार मिल जाएगी" (पृष्ठ 13)

5

मैं चाहता हूँ के लिए खतरा एक अनुमान है कि यह नैदानिक भूखंडों में इसके उपयोग के कारण उल्लेखनीय है:

(एक्स)=βटीz0(एक्स)βz0(एक्स)लॉगएच(एक्स)=βटीz+एच0(एक्स)लॉगएच^(एक्स)एक्स

(एक्स)=αθ(एक्सθ)α-1θαलॉगएच(एक्स)=αलॉगएक्स-αलॉगθलॉगएच^(एक्स)लॉगएक्सα^-α^लॉगθ^, बशर्ते वेइबुल धारणा सही है। और बेशक 1 के पास ढलान एक घातीय मॉडल फिट हो सकता है।

एच(एक्स)एक्स


3

Paraphrasing में @Scortchi क्या कह रही है, मैं इस बात पर जोर दूंगा कि संचयी खतरे के कार्य की अच्छी व्याख्या नहीं होती है, और जैसे कि मैं परिणामों की व्याख्या करने के तरीके के रूप में इसका उपयोग करने की कोशिश नहीं करूंगा; एक गैर-सांख्यिकीय शोधकर्ता को यह बताते हुए कि संचयी खतरे अलग हैं सबसे अधिक संभावना "मिमी-एचएम" उत्तर में होगी और फिर वे विषय के बारे में फिर कभी नहीं पूछेंगे, न कि अच्छे तरीके से।

हालाँकि, संचयी खतरा फ़ंक्शन गणितीय रूप से बहुत उपयोगी होता है, जैसे कि खतरनाक फ़ंक्शन और उत्तरजीविता फ़ंक्शन को जोड़ने का एक सामान्य तरीका। इसलिए यह जानना महत्वपूर्ण है कि संचयी खतरा क्या है और इसका उपयोग विभिन्न सांख्यिकीय तरीकों में कैसे किया जा सकता है। लेकिन सामान्य तौर पर, मुझे नहीं लगता कि संचयी खतरों के संदर्भ में वास्तविक डेटा के बारे में सोचना विशेष रूप से उपयोगी है।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.