कॉक्स प्रतिगमन में भविष्यवाणी


38

मैं एक बहुभिन्नरूपी कॉक्स प्रतिगमन कर रहा हूं, मेरे पास मेरे महत्वपूर्ण स्वतंत्र चर और बीटा मान हैं। मॉडल मेरे डेटा के लिए बहुत अच्छी तरह से फिट बैठता है।

अब, मैं अपने मॉडल का उपयोग करना चाहता हूं और एक नए अवलोकन के अस्तित्व की भविष्यवाणी करना चाहता हूं। मैं स्पष्ट नहीं हूं कि कॉक्स मॉडल के साथ ऐसा कैसे किया जाए। एक रेखीय या उपस्कर प्रतिगमन में, यह आसान होगा, बस प्रतिगमन में नए अवलोकन के मूल्यों को रखें और उन्हें बेटास के साथ गुणा करें और इसलिए मेरे पास मेरे परिणाम की भविष्यवाणी है।

मैं अपने आधारभूत खतरे को कैसे निर्धारित कर सकता हूं? मुझे भविष्यवाणी की गणना के अलावा इसकी आवश्यकता है।

यह एक कॉक्स मॉडल में कैसे किया जाता है?

जवाबों:


30

कॉक्स मॉडल के बाद, covariate वेक्टर साथ व्यक्तिगत लिए अनुमानित खतरे में फॉर्म जहां आंशिक संभावना को अधिकतम करके पाया जाता है, जबकि नेल्सन-ऐलन अनुमानक से होता है, साथ , अलग-अलग ईवेंट बार और से पर मौतों की संख्या (देखें, उदाहरण के लिए, धारा 3.6 )।एक्स मैं मैं ( टी ) = 0 ( टी ) exp ( एक्स ' मैं β ) , β 0 0 ( टी मैं ) = मैंixi

h^i(t)=h^0(t)exp(xiβ^),
β^h^0 टी1टी2,...dमैंटीमैं
h^0(ti)=dij:tjtiexp(xjβ^)
t1t2,diti

इसी प्रकार, साथ और एस 0(टी)=exp( - Λ 0(टी)) Λ 0(टी)=Σj:टीजेटी एच 0(टीजे)

S^i(t)=S^0(t)exp(xiβ^)
S^0(t)=exp(Λ^0(t))
Λ^0(t)=j:tjth^0(tj).

संपादित करें: यह भी ब्याज की हो सकती है :-)


1
यह वास्तव में मेरा सवाल है ... मुझे भविष्यवाणी, सही होने में सक्षम होने के लिए आधारभूत खतरे के कार्य के आकलन की आवश्यकता है? क्या आप इसका आकलन करने के लिए कोई विधि जानते हैं?
मारजा

2
@ मार्जन जैकिनलाइफ चर चयन के कारण अनिश्चितता को ठीक से प्रतिबिंबित नहीं कर सकता है। बूटस्ट्रैप ठीक से अधिक परिवर्तनशीलता दिखाता है जिसमें चर "महत्वपूर्ण" लेबल होते हैं। यदि आप एक "सापेक्ष सत्यापन" करना चाहते हैं, तो आप दिखा सकते हैं कि ओवरफिटिंग के लिए सही करने के बाद भविष्य कहनेवाला भेदभाव अच्छा है। इसके लिए आधारभूत खतरे से निपटने की आवश्यकता नहीं है, लेकिन सापेक्ष लॉग खतरा अनुमानों को मान्य कर रहा है। validateआर में समारोह rmsके साथ संयोजन के रूप में पैकेज cphसमारोह है कि क्या करेंगे। केवल चरणबद्ध एल्गोरिथ्म लागू किया गया validateहै जो पीछे की ओर है।
फ्रैंक हरेल

1
सापेक्ष खतरों (यानी, रैखिक भविष्यवक्ता) की भविष्यवाणी करना काफी सरल है। लेकिन मैंने 1991 में एसएएस का उपयोग करना छोड़ दिया।
फ्रैंक हरेल

8
लिंक मृत हो गया है :-(।
फिर से बहाल करते मोनिका - गुंग

2
क्या एक विशिष्ट व्यक्ति के लिए अस्तित्व टी टाइम की भविष्यवाणी करने का एक तरीका है? मेरा मतलब है कि कोवरियों के लिए मूल्यों की एक सूची दी गई है, उस समय का पता लगाने का क्या तरीका है जिसके बाद व्यक्ति के मरने की संभावना सबसे अधिक है?
स्टेटबिनर

14

पैकेज predictSurvProbमें फ़ंक्शन pecआपको मौजूदा कॉक्स मॉडल के आधार पर नए डेटा के लिए पूर्ण जोखिम अनुमान दे सकता है यदि आप आर का उपयोग करते हैं।

गणितीय विवरण मैं समझा नहीं सकता।

संपादित करें: फ़ंक्शन जीवित रहने की संभावनाएं प्रदान करता है, जिसे मैंने अब तक 1- (इवेंट प्रायिकता) के रूप में लिया है।

संपादित करें 2:

एक pec पैकेज के बिना कर सकते हैं। केवल जीवित पैकेज का उपयोग करते हुए, निम्न फ़ंक्शन कॉक्स मॉडल के आधार पर पूर्ण जोखिम देता है

risk = function(model, newdata, time) {
  as.numeric(1-summary(survfit(model, newdata = newdata, se.fit = F, conf.int = F), times = time)$surv)
}

1-उत्तरजीविता संभाव्यता संचयी खतरा है। मुझे लगता है कि ओपी तात्कालिक खतरनाक कार्य (आधार रेखा) या इसके किसी प्रकार के सुचारू अनुमान ( muhazआर में पैकेज) का अनुरोध करता है ।
ईसीआई

1
1-जीवन रक्षा संभावना संचयी खतरा नहीं है। प्रतिस्पर्धी जोखिमों के अभाव में दोनों को en.wikipedia.org/wiki/… पर विस्तृत रूप से जोड़ा जाता है ।
मिउरा

1-उत्तरजीविता संभाव्यता = विफलता दर (केवल 1x विधि विफलता)। संचयी खतरे के लिए जीवन रक्षा की संभावना को स्वीकार किए गए उत्तर में उल्लिखित किया गया है: S(t)=exp(−Λ(t))जहां Λ(t)संचयी खतरा है।
निकराबुनागेल

11

शायद आप भी कुछ इस तरह की कोशिश करना चाहेंगे? एक कॉक्स आनुपातिक खतरों के मॉडल को फिट करें और एक नए उदाहरण के लिए अनुमानित सर्वाइवल वक्र प्राप्त करने के लिए इसका उपयोग करें।

R में बची हुई फ़ाइल के लिए मदद फ़ाइल से बाहर ले जाया गया। R में I (मैंने अभी लाइनें जोड़ी हैं)

# fit a Cox proportional hazards model and plot the  
# predicted survival for a 60 year old 
fit <- coxph(Surv(futime, fustat) ~ age, data=ovarian) 
plot(survfit(fit, newdata=data.frame(age=60)),
     xscale=365.25, xlab="Years", ylab="Survival", conf.int=F) 
# also plot the predicted survival for a 70 year old
lines(survfit(fit, newdata=data.frame(age=70)),
     xscale=365.25, xlab="Years", ylab="Survival") 

हालांकि आपको यह ध्यान रखना चाहिए कि आनुपातिक खतरों के लिए अभी भी आपकी भविष्यवाणी के लिए पकड़ है, जिस रोगी के लिए आप अनुमान लगाते हैं, वह ऐसे समूह से होना चाहिए जो गुणात्मक रूप से उसी तरह का हो जैसे कि कॉक्स आनुपातिक खतरों के मॉडल का उपयोग करने के लिए इस्तेमाल किया जाता है। भविष्यवाणी।


6

संकुल का basehazकार्य survivalघटना समय बिंदुओं पर आधारभूत खतरा प्रदान करता है। उस से आप उस गणित को अपने तरीके से काम कर सकते हैं जो ऑसम प्रदान करता है और आपके कॉक्स अनुमान का ओआरएस शामिल करता है।


2

कॉक्स मॉडल का पूरा बिंदु आनुपातिक खतरे की धारणा और आंशिक संभावना का उपयोग है। आंशिक संभावना है कि बेसलाइन खतरा कार्य समाप्त हो गया है। तो आपको एक निर्दिष्ट करने की आवश्यकता नहीं है। यही इसकी सुंदरता है!


2
यदि आप कोवरिएट वेक्टर के किसी विशेष मूल्य के लिए खतरे या अस्तित्व का अनुमान प्राप्त करना चाहते हैं, तो आपको आधारभूत खतरे या उत्तरजीविता के अनुमान की आवश्यकता है। नेल्सन-
ऐलन का

1
अक्सर कॉक्स मॉडल के साथ आप दो उत्तरजीविता कार्यों की तुलना कर रहे हैं और कुंजी खतरनाक कार्य के बजाय खतरनाक अनुपात है। बेसलाइन खतरा एक उपद्रव पैरामीटर की तरह है जो आनुपातिक खतरों की धारणा का उपयोग करके कॉक्स को समस्या से इतनी चतुराई से समाप्त कर देता है। मॉडल के संदर्भ में खतरे के कार्य और / या आधार रेखा के खतरे के आकलन के लिए आप जो भी विधि का उपयोग करना चाहते हैं, उसे मॉडल के कॉक्स रूप का उपयोग करने की आवश्यकता होगी जो आनुपातिकता को मजबूर करता है।
माइकल चेरिक

बहुत बहुत धन्यवाद, यह बहुत अच्छा होगा यदि आप ओश्रम के उत्तर पर मेरी टिप्पणी देखते हैं। शायद आप मेरी भी मदद कर सकते हैं?
मरजा

3
आप उन कारकों पर भी स्तरीकरण कर सकते हैं जो आनुपातिक खतरों में नहीं हैं। लेकिन किसी भी दर पर बेसलाइन के खतरे के कॉक्स मॉडल और इसके बाद के फिट अनुमानक का उपयोग उत्तरजीविता समय की अनुमानित मात्राओं, विभिन्न जीवित रहने की संभावनाओं और भविष्यवाणी की गई उत्तरजीविता के समय के लिए किया जा सकता है यदि आपके पास दीर्घकालिक अनुवर्ती है। इन सभी मात्राओं को आर पैकेज में प्राप्त करना आसान है rms
फ्रैंक हरेल

आपको इसे निर्दिष्ट करने की आवश्यकता नहीं है, लेकिन यह अनुमानित है।
डीडिन
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.