क्या कोई मुझे सादे अंग्रेजी में मेरे कॉक्स मॉडल की व्याख्या कर सकता है?
मैंने फ़ंक्शन का उपयोग करके अपने डेटा के सभी के लिए निम्न कॉक्स प्रतिगमन मॉडल फिट किया है cph
। मेरा डेटा नामक ऑब्जेक्ट में सहेजा गया है Data
। चर w
, x
और y
निरंतर हैं; z
दो स्तरों का एक कारक है। समय महीनों में मापा जाता है। मेरे कुछ मरीज़ चर के लिए डेटा गायब कर रहे हैं z
( एनबी : मैंने डॉ। हैरेल के सुझाव को विधिवत नोट किया है, कि मैं इन मूल्यों को लागू करता हूं ताकि मेरे मॉडल को पूर्वाग्रह से बचा जा सके, और भविष्य में ऐसा करेंगे)।
> fit <- cph(formula = Surv(time, event) ~ w + x + y + z, data = Data, x = T, y = T, surv = T, time.inc = 12)
Cox Proportional Hazards Model
Frequencies of Missing Values Due to Each Variable
Surv(time, event) w x y z
0 0 0 0 14
Model Tests Discrimination
Indexes
Obs 152 LR chi2 8.33 R2 0.054
Events 64 d.f. 4 g 0.437
Center 0.7261 Pr(> chi2) 0.0803 gr 1.548
Score chi2 8.07
Pr(> chi2) 0.0891
Coef S.E. Wald Z Pr(>|Z|)
w -0.0133 0.0503 -0.26 0.7914
x -0.0388 0.0351 -1.11 0.2679
y -0.0363 0.0491 -0.74 0.4600
z=1 0.3208 0.2540 1.26 0.2067
मैंने cox.zph
नीचे दिए गए आदेश का उपयोग करके आनुपातिक खतरों की धारणा का परीक्षण करने का भी प्रयास किया , लेकिन इसके परिणामों की व्याख्या करना नहीं जानता। लाना plot()
आदेश चारों ओर एक त्रुटि संदेश देता है।
cox.zph(fit, transform="km", global=TRUE)
rho chisq p
w -0.1125 1.312 0.2520
x 0.0402 0.179 0.6725
y 0.2349 4.527 0.0334
z=1 0.0906 0.512 0.4742
GLOBAL NA 5.558 0.2347
पहली समस्या
- क्या कोई मुझे सादे अंग्रेजी में उपरोक्त आउटपुट के परिणामों की व्याख्या कर सकता है? मेरे पास एक चिकित्सा पृष्ठभूमि है और आंकड़ों में कोई औपचारिक प्रशिक्षण नहीं है।
दूसरी समस्या
जैसा कि डॉ। हैरेल द्वारा सुझाया गया है, मैं
rms
पैकेज का उपयोग करके 10-गुना क्रॉस-सत्यापन के 100 पुनरावृत्तियों को निष्पादित करके अपने मॉडल को आंतरिक रूप से मान्य करना चाहूंगा (जो मुझे समझ में आता है, यह100 * 10 = 1000
अलग-अलग मॉडल का निर्माण करेगा और फिर उन्हें जीवित रहने के समय की भविष्यवाणी करने के लिए कहेगा। रोगियों की है कि वे कभी नहीं देखा था)।मैंने
validate
फ़ंक्शन का उपयोग करने की कोशिश की , जैसा कि दिखाया गया है।> v1 <- validate(fit, method="crossvalidation", B = 10, dxy=T) > v1 index.orig training test optimism index.corrected n Dxy -0.2542 -0.2578 -0.1356 -0.1223 -0.1320 10 R2 0.0543 0.0565 0.1372 -0.0806 0.1350 10 Slope 1.0000 1.0000 0.9107 0.0893 0.9107 10 D 0.0122 0.0128 0.0404 -0.0276 0.0397 10 U -0.0033 -0.0038 0.0873 -0.0911 0.0878 10 Q 0.0155 0.0166 -0.0470 0.0636 -0.0481 10 g 0.4369 0.4424 0.6754 -0.2331 0.6700 10
आप 100x के पुनर्निर्माण को कैसे करते हैं? मुझे लगता है कि मेरा उपरोक्त कोड केवल एक बार क्रॉस-सत्यापन करता है।
मैं तब जानना चाहता था कि भविष्यवाणी में मेरा मॉडल कितना अच्छा था। मैंने निम्नलिखित कोशिश की:
> c_index <- abs(v1[1,5])/2 + 0.5 > c_index [1] 0.565984
क्या इसका मतलब यह है कि मेरा मॉडल सिक्का उछालने से थोड़ा बेहतर है?
तीसरी समस्या
डॉ। हरेल बताते हैं कि मैंने कोवरिएट प्रभावों के लिए रैखिकता ग्रहण की है, और यह कि मेरे नमूने में घटनाओं की संख्या मुश्किल से एक विश्वसनीय मॉडल के लिए पर्याप्त बड़ी है यदि सभी कोवरिएट प्रभाव रैखिक होते हैं।
- क्या इसका मतलब यह है कि मुझे अपने मॉडल में किसी प्रकार का इंटरैक्शन टर्म शामिल करना चाहिए? यदि हां, किसी भी सलाह के रूप में क्या रखा जाए?
cph
मुझे सीधे अंग्रेजी में उपरोक्त आउटपुट की व्याख्या करने का प्रयास करेगा , या मुझे एक संदर्भ में इंगित करेगा जो ऐसा करेगा। डॉ। हैरेल, अब तक आपकी मदद के लिए बहुत बहुत धन्यवाद!