कॉक्लन रिग्रेशन के बजाय कपलान-मायर घटता लगता है


9

आर में, मैं कैंसर रोगियों का उत्तरजीविता डेटा विश्लेषण कर रहा हूं।

मैं CrossValidated और अन्य स्थानों में अस्तित्व विश्लेषण के बारे में बहुत उपयोगी सामग्री पढ़ रहा हूं और मुझे लगता है कि मैं समझ गया कि कॉक्स प्रतिगमन परिणामों की व्याख्या कैसे करें। हालांकि, एक परिणाम अभी भी मुझे कीड़े ...

मैं अस्तित्व बनाम लिंग की तुलना कर रहा हूं। कपलान-मियर वक्र महिला रोगियों के स्पष्ट पक्ष में हैं (मैंने कई बार जाँच की है कि मैंने जो किंवदंती जोड़ी है वह सही है, अधिकतम जीवित रहने वाले रोगी, 4856 दिन, वास्तव में एक महिला है): यहाँ छवि विवरण दर्ज करें

और कॉक्स प्रतिगमन वापस आ रहा है:

Call:
coxph(formula = survival ~ gender, data = Clinical)

  n= 348, number of events= 154 

              coef exp(coef) se(coef)      z Pr(>|z|)  
gendermale -0.3707    0.6903   0.1758 -2.109    0.035 *
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1   1

           exp(coef) exp(-coef) lower .95 upper .95
gendermale    0.6903      1.449    0.4891    0.9742

Concordance= 0.555  (se = 0.019 )
Rsquare= 0.012   (max possible= 0.989 )
Likelihood ratio test= 4.23  on 1 df,   p=0.03982
Wald test            = 4.45  on 1 df,   p=0.03499
Score (logrank) test = 4.5  on 1 df,   p=0.03396

तो पुरुष रोगियों के लिए खतरा अनुपात (HR) gendermale0.6903 है। जिस तरह से मैं व्याख्या करता हूं कि (कपलान-मेयर वक्र को देखे बिना) है: जैसा कि एचआर <1 है, पुरुष लिंग का रोगी होना सुरक्षात्मक है। या अधिक सटीक रूप से, एक महिला रोगी 1 / 0.6903 = ऍक्स्प (-coef) = 1.449 पुरुष की तुलना में किसी भी विशिष्ट समय पर मरने की अधिक संभावना है।

लेकिन ऐसा नहीं लगता कि कपलान-मेयर कर्व्स को क्या कहते हैं! मेरी व्याख्या में क्या गलत है?


3
आपके केएम वक्र से, ऐसा लगता है कि कॉक्स रिग्रेशन का PH अनुमान नहीं है।
दीप उत्तर

समझा। मैं उस से पहले नहीं देखा है! आलेखीय रूप से, इसका मतलब है कि मेरा कपलान-मेयर वक्र समानांतर होना चाहिए ताकि मैं सुरक्षित रूप से कॉक्स का उपयोग कर सकूं? यह ~ 2200 दिनों से पहले कम या ज्यादा ठीक लगता है। चौराहे से थोड़ा पहले सभी डेटा के लिए कॉक्स परिणामों पर एक नज़र रखना ठीक है?
फ्रेंकोइस्क्रोल

4
NB यह घटता , जहां समूह लिए अनुमानित उत्तरजीविता फ़ंक्शन है , जिसे आनुपातिक खतरों के तहत समानांतर होना चाहिए। @IWS बताते हैं, विश्वास के अंतराल लगभग 3000 दिनों के बाद महिला समूह के लिए बहुत व्यापक हो जाएगा (देखते हैं केवल दो उस बिंदु अतीत बना?) तो शारीरिक रूप से विकलांग धारणा हो सकता है बहुत बुरा नहीं हो। loglogS^i(t)S^i(t)i
Scortchi - को पुनः स्थापित मोनिका

@ डीप नोर्थ: मैं वास्तव में आनुपातिक खतरों के खिलाफ मजबूत सबूत नहीं देखता हूं। हाँ घटता तकनीकी रूप से ओवरलैप करता है ... लेकिन यह चरम सीमा पर है।
क्लिफ एबी

अन्य उत्तरों और टिप्पणियों के पूरक के लिए, औसत उत्तरजीविता या पुरुषों और महिलाओं के लिए पांच साल के अस्तित्व की तुलना करें। कॉक्स पीएच विश्लेषण के साथ समझौते में इस डेटा के पुरुषों के लिए एक स्पष्ट लाभ है।
इटाराम

जवाबों:


12

यह गैर-आनुपातिक खतरों या अस्तित्व विश्लेषण में 'कमी' के प्रभाव का एक बहुत अच्छा उदाहरण है। मैं समझाने की कोशिश करूंगा।

पहले अपने कपलान-मीयर (केएम) वक्र पर एक अच्छी नज़र डालें: आप पहले भाग (लगभग 3000 दिनों तक) में देख सकते हैं कि समय पर जोखिम वाले आबादी में जीवित रहने वाले पुरुषों का अनुपात महिलाओं के अनुपात से बड़ा है। (अर्थात नीली रेखा लाल की तुलना में 'अधिक' है)। इसका मतलब यह है कि वास्तव में अध्ययन (मृत्यु) के लिए पुरुष लिंग 'सुरक्षात्मक' है। तदनुसार खतरनाक अनुपात 0 और 1 के बीच होना चाहिए (और गुणांक नकारात्मक होना चाहिए)।

हालाँकि, दिन 3000 के बाद, लाल रेखा अधिक होती है! यह वास्तव में इसके विपरीत सुझाव देगा। अकेले केएम ग्राफ के आधार पर, यह आगे एक गैर-आनुपातिक खतरे का सुझाव देगा। इस मामले में 'गैर-आनुपातिक' का अर्थ है कि आपके स्वतंत्र चर (लिंग) का प्रभाव समय के साथ स्थिर नहीं है। दूसरे शब्दों में, समय बढ़ने के साथ खतरा अनुपात परिवर्तनशील होता है। जैसा कि ऊपर बताया गया है, यह मामला लगता है। नियमित आनुपातिक खतरा कॉक्स मॉडल ऐसे प्रभावों को समायोजित नहीं करता है। दरअसल, मुख्य मान्यताओं में से एक यह है कि खतरे आनुपातिक हैं! अब आप वास्तव में गैर-आनुपातिक खतरों को भी मॉडल कर सकते हैं, लेकिन यह इस उत्तर के दायरे से परे है।

बनाने के लिए एक अतिरिक्त टिप्पणी है: यह अंतर वास्तविक खतरों के गैर-आनुपातिक होने या होने के कारण हो सकता हैतथ्य यह है कि केएम घटता के पूंछ अनुमानों में बहुत अधिक भिन्नता है। ध्यान दें कि इस समय 348 रोगियों का कुल समूह जोखिम में अभी भी बहुत कम आबादी के लिए मना कर दिया है। जैसा कि आप देख सकते हैं, दोनों लिंग समूहों में रोगियों को घटना का अनुभव होता है और रोगियों को सेंसर किया जाता है (ऊर्ध्वाधर रेखाएं)। जैसा कि जोखिम में आबादी घट जाती है, अस्तित्व का अनुमान कम निश्चित हो जाएगा। यदि आप KM लाइनों के चारों ओर 95% विश्वास अंतराल लगाते हैं, तो आपको विश्वास अंतराल की चौड़ाई बढ़ती हुई दिखाई देगी। यह खतरों के आकलन के लिए भी महत्वपूर्ण है। सीधे शब्दों में कहें, क्योंकि आपके अध्ययन की अंतिम अवधि में जोखिम और घटनाओं की आबादी कम है, यह अवधि आपके प्रारंभिक कॉक्स मॉडल में अनुमानों में कम योगदान देगी।

अंत में, यह बताता है कि अंतिम समापन बिंदु के बजाय खतरा क्यों (समय के साथ निरंतर माना जाता है) आपके KM के पहले भाग के अनुरूप है।

संपादित करें: मूल प्रश्न के लिए @ स्क्रोटची की स्पॉट-ऑन टिप्पणी देखें: जैसा कि कहा गया है, अध्ययन की अंतिम अवधि में कम संख्या का प्रभाव यह है कि समय पर उन बिंदुओं पर खतरों का अनुमान अनिश्चित है। नतीजतन आप भी कम निश्चित हैं कि क्या आनुपातिक खतरों का स्पष्ट उल्लंघन मौका के कारण नहीं है। @ स्क्रोटची के राज्यों के रूप में, PH धारणा खराब नहीं हो सकती है।


1
(-1) पूंछ चरम सिरों पर होती है, जहाँ हमारे पास बहुत कम डेटा होता है। वास्तव में, "गैर-आनुपातिक खतरों" के लिए प्रमाण केवल दो अवलोकनों पर आधारित है (अर्थात जब t> 2800, महिला काउहोट में केवल दो विषय बचे थे, और इसके अलावा, समूह में इससे पहले की अंतिम घटना थी t = 2100)
एबी

2
@ क्लिफ फीडबैक क्लिफ एबी के लिए धन्यवाद। मैं थोड़ा भ्रमित हूँ, हालांकि आपकी टिप्पणी ठीक वैसी ही है जैसा मैं कहना चाह रहा था। मैं मानता हूँ: यह थोड़ा कम हो सकता था। -1 हालांकि थोड़ा सा कठोर है: '(
IWS

2
शायद यह मेरे लिए थोड़ा मतलबी था। मेरा एकमात्र बिंदु यह है कि जब मैं इसे देखता हूं, तो मुझे गैर आनुपातिक खतरों का एक अच्छा उदाहरण नहीं दिखता है, बल्कि पूंछ पर बहुत कम डेटा दिखाई देता है। मैं देख रहा हूं कि पहले वाक्य को संशोधित किया गया है (मुझे लगता है कि जब तक मैं पहली बार याद नहीं करता?) हालांकि, यह पता करने के लिए, इसलिए अब (-1) निश्चित रूप से बिना रुके है।
क्लिफ एबी

1
ओह, ऐसा प्रतीत होता है कि मैंने इसे पहली बार याद किया। माफ़ करना!
क्लिफ एबी

कोई बात नहीं, कम से कम हम जवाब पर सहमत हैं: D
IWS

5

आप अपने आउटपुट की प्रकृति के अनुसार भ्रमित हैं। ये आंकड़े कहते हैं: यदि आप एक पुरुष हैं तो आप एक महिला की तुलना में अधिक समय तक जीवित रहने की संभावना रखते हैं; मादाओं की तुलना में मादाओं के पास जीवित रहने की क्षमता होती है। यह प्रतिगमन आउटपुट में परिलक्षित होता है क्योंकि MALE होने का प्रभाव एक नकारात्मक लॉग खतरा अनुपात होता है, जैसे पुरुषों में महिलाओं की तुलना में कम जोखिम होता है। ज्यादातर घटना के समय (जब घटता है "कदम"), पुरुष उत्तरजीविता वक्र महिलाओं की तुलना में अधिक है, कॉक्स मॉडल के परिणाम और ग्राफ बहुत अच्छी तरह से सहमत हैं। केएम घटता प्रतिगमन मॉडल आउटपुट के रूप में इसकी पुष्टि करता है। "क्रॉस" एक असंगत है।

केएम घटता पूंछ में खराब व्यवहार करते हैं, खासकर जब वे 0% के पास और / या सपाट रूप से बंद हो जाते हैं। Y- अक्ष अनुपात जीवित है। अपेक्षाकृत कुछ जो अध्ययन में लंबे समय तक जीवित रहते हैं, और कुछ जो उस समय मर जाते हैं, अनुमानों की विश्वसनीयता सहज और ग्राफिक रूप से भयानक है। उदाहरण के लिए, मैं ध्यान देता हूं कि पुरुषों की तुलना में आपके कोहोर्ट में महिलाएं बहुत कम होती हैं और 2,800 दिनों के बाद, कॉहोर्ट में 10 से कम महिलाएं बची रहती हैं, क्योंकि जीवित अवस्था में कदम और सेंसर युक्त घटनाओं की कमी के कारण।

एक दिलचस्प टिप्पणी के रूप में, का उपयोग करें क्योंकि के.एम. घटता, लॉग रैंक परीक्षण, और कॉक्स मॉडल का उपयोग अस्तित्व विश्लेषण स्थान पर रहीं अस्तित्व समय, अस्तित्व की वास्तविक अवधि कुछ हद तक अप्रासंगिक है। आपकी सबसे लंबे समय तक जीवित रहने वाली महिला, 100 साल तक जीवित रह सकती है और इसका विश्लेषण पर कोई प्रभाव नहीं पड़ेगा। इसका कारण यह है कि बेसलाइन खतरा फ़ंक्शन (पिछले 13 वर्षों से कोई भी घटना नहीं देखी गई) मानेंगे कि अगले 87 वर्षों में मृत्यु का कोई जोखिम नहीं था क्योंकि तब तक किसी की मृत्यु नहीं हुई थी।

यदि आप इसके लिए सही 95% CI और p-मान प्राप्त करने के लिए एक मजबूत HR चाहते हैं robust=TRUE, तो कॉक्स-PH में सैंडविच मानक त्रुटियाँ प्राप्त करने के लिए निर्दिष्ट करें । उस स्थिति में, एचआर एक समय-औसत एचआर है जो सभी असफल समय में पुरुषों की तुलना महिलाओं से करती है।


स्पष्ट करने के लिए: केएम भूखंड में, पुरुषों के पास लगभग 2700 दिनों तक बेहतर अस्तित्व है। उसके बाद महिलाओं का बेहतर अस्तित्व है। लेकिन यह पूंछ सटीक नहीं है क्योंकि वहाँ बहुत कम डेटा है। आप देख सकते हैं कि केएम वक्र में दो कदम लगभग 35% से 0% तक महिला उत्तरजीविता लेते हैं, इसलिए यह दो लोगों की सबसे अधिक संभावना है। यह आत्मविश्वास बैंड के साथ केएम घटता को प्लॉट करने में सहायक होगा। तब मुझे लगता है कि आप लगभग 2000 दिनों तक स्पष्ट अलगाव देखेंगे, और उसके बाद ओवरलैप करेंगे।
हार्वे मोटुलस्की जू

2
@HarveyMotulsky सच है लेकिन KMs की पूंछ बहुत अविश्वसनीय हैं। यदि ओपी ने सीआई को आकर्षित किया, तो वे दृढ़ता से ओवरलैप करेंगे, जिससे कि हम यह कहेंगे कि उत्तरजीविता संभवतः 2,7 दिनों के बाद समान थी।
एडम

बिल्कुल मेरी बात। डेटा स्पष्ट रूप से दिखाते हैं कि पुरुषों (इस स्थिति में, जो कुछ भी है) कम से कम पहले 2000+ दिनों के लिए बेहतर अस्तित्व है।
हार्वे मोटुलस्की
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.