कॉक्स रिग्रेशन और टाइम स्केल


9

क्या कॉक्स आनुपातिक खतरे प्रतिगमन विश्लेषण में एक्स (खतरा) चर हमेशा समय होना चाहिए? यदि नहीं, तो क्या आप एक उदाहरण प्रदान कर सकते हैं?

क्या कैंसर के मरीज की उम्र एक खतरनाक चर हो सकती है? यदि हां, तो क्या इसे एक निश्चित उम्र में कैंसर होने के जोखिम के रूप में समझा जा सकता है? क्या जीन अभिव्यक्ति और आयु के बीच संबंध का अध्ययन करने के लिए कॉक्स प्रतिगमन एक वैध विश्लेषण होगा?

जवाबों:


8

आमतौर पर, बेसलाइन पर उम्र एक कोवरिएट के रूप में उपयोग की जाती है (क्योंकि यह अक्सर बीमारी / मृत्यु से जुड़ी होती है), लेकिन इसका उपयोग आपके समय के पैमाने के रूप में भी किया जा सकता है (मुझे लगता है कि इसका उपयोग कुछ अनुदैर्ध्य अध्ययनों में किया जाता है, क्योंकि आपको पर्याप्त होने की आवश्यकता है समय के पैमाने पर लोगों को जोखिम है, लेकिन मैं वास्तव में याद नहीं कर सकता - बस इन स्लाइड्स का विश्लेषण लगातार समय के पैमाने पर अध्ययन करने वाले कोहर्ट अध्ययनों के बारे में पाया गया जो कोहोर्ट अध्ययनों के बारे में बात करते हैं)। व्याख्या में, आपको घटना के समय को उम्र के अनुसार बदल देना चाहिए, और आप निदान में एक कोवरिएट के रूप में उम्र को शामिल कर सकते हैं। इसका मतलब यह होगा कि जब आप किसी विशेष बीमारी की उम्र-विशिष्ट मृत्यु दर का अध्ययन करते हैं (जैसा कि इन स्लाइड्स में सचित्र है )।

शायद यह लेख दिलचस्प है क्योंकि यह दो दृष्टिकोणों, समय-पर-अध्ययन बनाम कालानुक्रमिक युग के विपरीत है: कॉक्स मॉडल में टाइम स्केल: गुणांक अनुमानों पर प्रवेश युगों में भिन्नता का प्रभाव । यहाँ एक और कागज है:

चेउंग, वाईबी, गाओ, एफ, और खो, केएस (2003)। निदान पर आयु और कैंसर महामारी विज्ञान में जीवित रहने के विश्लेषण के तरीकों की पसंदजर्नल ऑफ क्लिनिकल एपिडेमियोलॉजी , 56 (1), 38-43।

लेकिन निश्चित रूप से बेहतर कागजात हैं।


@ साची: बहुत बहुत धन्यवाद। मैं कागजात देखूंगा। क्या आप कृपया पहला प्रश्न टिप्पणी करेंगे? क्या हमेशा खतरनाक चर होता है?
युक

@ युक जरूरी नहीं, जैसा कि @whuber ने सुझाव दिया है। मेरे पास शैक्षिक परीक्षण में लापता प्रतिक्रियाओं के व्यवस्थित पैटर्न के उपचार से निपटने वाले कॉक्स प्रतिगमन का एक और आवेदन है, क्योंकि यह तब उठता है जब किसी छात्र के पास परीक्षण पूरा करने के लिए पर्याप्त समय नहीं होता है (लापता प्रतिक्रियाओं को सही-सेंसर के रूप में माना जा सकता है) - - इस मामले में, यह आइटम ऑर्डरिंग है जिसे टाइम स्केल माना जाता है। मैं मूल पेपर को देखूंगा (हालांकि मुझे लगता है कि यह पीएचडी का विषय भी था)।
chl

+1। अन्य कागजात हैं, लेकिन मुझे यकीन नहीं है कि वे जरूरी बेहतर हैं; मुझे लगता है कि चालिस एक अच्छा काम करता है जो स्थिति को समेटता है।
ars

7

नहीं, यह हमेशा समय नहीं होता है। कई सेंसर युक्त प्रतिक्रियाओं को उत्तरजीविता विश्लेषण तकनीकों के साथ तैयार किया जा सकता है। अपनी पुस्तक नॉनडेट्स एंड डेटा एनालिसिस में , डेनिस हेलसेल समय की जगह पर एक एकाग्रता के नकारात्मक का उपयोग करने की वकालत करता है (नॉनडेट्स का सामना करने के लिए, जो कि नकारात्मक होने पर सही-सेंसर किए गए मान बन जाते हैं)। एक सारांश वेब (पीडीएफ प्रारूप) और एक आर पैकेज, एनएडीए पर उपलब्ध है , इसे लागू करता है।


+1, NADA पैकेज को इंगित करने के लिए धन्यवाद। मैंने देखा कि उत्तरजीविता पैकेज के माध्यम से बाएं-सेंसर किए गए डेटा को संभालना आसान हो जाता है - क्या पर्यावरण डेटा के साथ सामान्य परिदृश्य को छोड़ दिया गया है?
ars

@whuber: टिप्पणी के लिए धन्यवाद, NADA पैकेज बहुत दिलचस्प लग रहा है।
युक

@ ऑंडी: लिंक के लिए धन्यवाद। मुझे लगता है कि इसका एक जवाब होना चाहिए। मैं उत्थान करूंगा।
युक

@ आपके अनुरोध के अनुसार, मैंने अपनी टिप्पणी एक उत्तर में दी, और @whuber आपके उदाहरण के लिए धन्यवाद।
एंडी डब्ल्यू

@ जार: हाँ, लेफ्ट सेंसरिंग पर्यावरणीय डेटा की विशेषता है (और सामान्य तौर पर कीमोमीट्रिक्स की एक प्रमुख चिंता है)। यह एक मुश्किल और दिलचस्प समस्या है। कारणों में से (1) सेंसरिंग सीमाएं स्वयं सांख्यिकीय अनुमानों (एक अंशांकन प्रक्रिया के माध्यम से) द्वारा निर्धारित की जाती हैं, (2) सेंसर कई तरीकों से हो सकते हैं - पता लगाने की सीमा, परिमाणीकरण की सीमा, या "रिपोर्टिंग सीमा", ( 3) थ्रेशोल्ड अक्सर कोवरिएट्स ("मैट्रिक्स इंटरफेरेंस") के जवाब में भिन्न होते हैं जिन्हें मूल सेंसर किए गए मानों के साथ दृढ़ता से सहसंबद्ध किया जा सकता है, (4) डेटा अक्सर तार्किक रूप से वितरित किया जाता है।
whuber

4

आयु-पैमाने बनाम समय-स्केल के मुद्दे पर, chl के पास कुछ अच्छे संदर्भ हैं और यह अनिवार्य रूप से पकड़ता है - विशेष रूप से, आवश्यकता है कि at-risk सेट में सभी उम्र के पर्याप्त विषय शामिल हैं जैसा कि एक अनुदैर्ध्य अध्ययन में उत्पन्न होगा।

मैं केवल इस बात पर ध्यान देना चाहूंगा कि इस बारे में अभी तक कोई आम सहमति नहीं है, लेकिन यह सुझाव देने के लिए कुछ साहित्य हैं कि कुछ मामलों में समय के पैमाने के रूप में उम्र को प्राथमिकता दी जानी चाहिए। विशेष रूप से, यदि आपके पास ऐसी स्थिति है जहां सभी विषयों के लिए समय एक ही तरीके से जमा नहीं होता है, उदाहरण के लिए कुछ विषाक्त पदार्थों के संपर्क में आने के कारण, तो उम्र अधिक उपयुक्त हो सकती है।

दूसरी ओर, आप उस विशिष्ट उदाहरण को टाइम-स्केल Cox PH मॉडल पर उम्र के साथ-साथ एक अलग कोवेरेट के रूप में उपयोग करके संभाल सकते हैं - बजाय शुरुआत के समय में एक निश्चित कोवरिएट के बजाय। आपको यह जानने के लिए अध्ययन के अपने उद्देश्य के पीछे के तंत्र के बारे में सोचने की ज़रूरत है कि कौन सा समय स्केल अधिक उपयुक्त है। कभी-कभी यह मौजूदा डेटा में दोनों मॉडलों को फिट करने के लिए लायक होता है यह देखने के लिए कि क्या विसंगतियां उत्पन्न होती हैं और आपके नए अध्ययन को डिजाइन करने से पहले उन्हें कैसे समझाया जा सकता है।

अंत में, दो का विश्लेषण करने में स्पष्ट अंतर यह है कि एक उम्र-पैमाने पर, अस्तित्व की व्याख्या एक पूर्ण पैमाने (आयु) के संबंध में है, जबकि एक समय-पैमाने पर, यह अध्ययन की शुरुआत / प्रवेश तिथि के सापेक्ष है ।


3

ओपी के अनुरोध के अनुसार, एक अन्य आवेदन में मैंने देखा है कि उत्तरजीविता विश्लेषण का उपयोग एक स्थानिक संदर्भ में किया गया है (हालांकि स्पष्ट रूप से व्हूबर द्वारा उल्लिखित पर्यावरणीय पदार्थों को मापने से अलग ) अंतरिक्ष में घटनाओं के बीच की दूरी को मॉडलिंग कर रहा है। अपराध विज्ञान में एक उदाहरण यहाँ है और यहाँ एक महामारी विज्ञान में है

घटनाओं के बीच की दूरी को मापने के लिए उत्तरजीविता विश्लेषण का उपयोग करने के पीछे तर्क यह नहीं है कि सेंसरिंग का एक मुद्दा है (हालांकि सेंसर निश्चित रूप से एक स्थानिक संदर्भ में हो सकता है), यह घटना के विशेषताओं के बीच समय के समान वितरण और घटनाओं के बीच की दूरी के कारण ऐसा है। विशेषताएँ (अर्थात इन दोनों में समान प्रकार की त्रुटि संरचनाएँ हैं (अक्सर दूरी क्षय) जो OLS का उल्लंघन करती हैं और इसलिए गैर-पैरामीट्रिक समाधान दोनों के लिए आदर्श हैं)।


मेरी खराब प्रशस्ति पत्र प्रथाओं के कारण मुझे ऊपर दिए गए लिंक का सही लिंक / संदर्भ खोजने में खर्च करना और समय देना पड़ा।

अपराध विज्ञान में उदाहरण के लिए,

किकुची, जॉर्ज, मोमरू अम्मीया, टोमोनोरी सैटो, ताकाहितो शिमदा और युताका हरदा। 2010. जापान में पुनरावृत्ति के शिकार के पास एक अनुपात-अस्थायी विश्लेषण । 8 वां राष्ट्रीय अपराध मानचित्रण सम्मेलन। जिल डांडो इंस्टीट्यूट ऑफ क्राइम साइंस। पीडीएफ वर्तमान में संदर्भित वेबपेज पर उपलब्ध है।

महामारी विज्ञान में,

पाठक, स्टीवन। 2000. भौगोलिक महामारी विज्ञान में स्थानिक बिंदु पैटर्न का अध्ययन करने के लिए उत्तरजीविता विश्लेषण का उपयोग करना। सोशल साइंस एंड मेडिसिन 50 (7-8): 985-1000।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.