आर के कॉक्सफ़ () दोहराया उपायों को कैसे संभालता है?


10

प्रसंग

मैं यह समझने की कोशिश कर रहा हूं कि आर का कॉक्सफ़ () विषयों के लिए दोहराई गई प्रविष्टियों को स्वीकार करता है और संभालता है (या यदि आप चाहें तो रोगी / ग्राहक)। कुछ लोग इसे लंबे प्रारूप कहते हैं, अन्य इसे 'दोहराए गए उपाय' कहते हैं।

उदाहरण के लिए देखें डेटा सेट जिसमें उत्तर अनुभाग में आईडी कॉलम शामिल है:

कॉक्स मॉडल के लिए बेस्ट पैकेज अलग-अलग समय के साथ

यह भी मान लें कि कोवरिएट्स समय-समय पर अलग-अलग होते हैं और बिल्कुल एक सेंसर (यानी ईवेंट) चर होता है, जो बाइनरी होता है।

प्रशन

1) उपरोक्त लिंक के उत्तर में, अगर आईडी को कॉक्सफ़ () में कॉल के पैरामीटर के रूप में नहीं दिया गया है, तो क्या परिणाम कॉक्स () में एक पैरामीटर के रूप में क्लस्टर (आईडी) सहित समान होना चाहिए?

मैंने दस्तावेज़ीकरण की खोज करने का प्रयास किया, लेकिन निम्नलिखित स्पष्ट रूप से पता नहीं लगता है (1): https://stat.ethz.ch/pipermail/r-help//2013-July/357466.html

2) यदि (1) का उत्तर 'नहीं' है, तो (गणितीय रूप से) क्यों? ऐसा लगता है कि कॉक्स () में क्लस्टर () पृष्ठ पर उपधारा 'क्लस्टर' के अनुसार विषयों के बीच सहसंबंध चाहता है। 20 पर

https://cran.r-project.org/web/packages/survival/survival.pdf

3) अस्पष्ट प्रश्न: कैसे कॉक्सफ () दोहराया उपायों के साथ आर के फ्राॅल्टिपैक रिग्रेशन विधियों की तुलना करता है?

परिशिष्ट

क्लस्टर (आईडी) का उपयोग करने पर निम्नलिखित संकेत:

क्या लॉगरेंक परीक्षण के बार-बार ज्ञात उपाय है?

जैसा हुआ:

https://stat.ethz.ch/pipermail/r-help//2013-July/357466.html

जीईई दृष्टिकोण: कॉक्सफ में मॉडल स्टेटमेंट में "+ क्लस्टर (विषय)" जोड़ें मिश्रित मॉडल दृष्टिकोण: कॉक्समे में मॉडल स्टेटमेंट के लिए "+ (1 | विषय)" जोड़ें।

अग्रिम में धन्यवाद!

जवाबों:


11
  1. सहित cluster(ID)मापदंडों के बिंदु अनुमानों को नहीं बदलता है। यह उस तरीके को बदलता है जिससे मानक त्रुटियों की गणना की जाती है।

    अधिक जानकारी Therneau & Grambsch की पुस्तक विस्तृतीकरण कॉक्स मॉडल , अध्याय 8.2 में देखी जा सकती है । ध्यान दें कि उनके उदाहरण में, वे method = "breslow"संबंधों के लिए सुधार के रूप में उपयोग करते हैं , लेकिन डिफ़ॉल्ट के साथ भी ( method = "efron") से के लिए एक समान गणना का उपयोग किया जाएगा, और सारांश में "मजबूत से" के रूप में दिखाई देता है।

  2. यदि क्लस्टर (ID) का उपयोग किया जाता है, तो मानक त्रुटियों का "मजबूत" अनुमान लगाया जाता है और विषयों के बीच संभावित निर्भरता को मापा जाता है (जैसे मानक त्रुटियों और विचरण स्कोर)। दूसरी ओर, क्लस्टर (आईडी) का उपयोग नहीं करना, प्रत्येक अवलोकन पर स्वतंत्रता को लागू करता है और डेटा में अधिक "सूचना" को ग्रहण किया जाता है। अधिक तकनीकी शब्दों में, मापदंडों के लिए स्कोर फ़ंक्शन नहीं बदलता है, लेकिन इस स्कोर का विचरण करता है। एक अधिक सहज तर्क यह है कि 100 व्यक्तियों पर 100 अवलोकन 10 व्यक्तियों (या समूहों) पर 100 टिप्पणियों से अधिक जानकारी प्रदान करते हैं।

  3. वास्तव में अस्पष्ट। संक्षेप में, +frailty(ID)में coxph()फिट गामा या लॉग-सामान्य यादृच्छिक प्रभाव के साथ मानक दोष मॉडल और गैर पैरामीट्रिक आधारभूत खतरा / तीव्रता के साथ। frailtypackपैरामीट्रिक बेसलाइन का उपयोग करता है (स्प्लिंस या टुकड़े-टुकड़े निरंतर कार्यों के साथ लचीला संस्करण) और अधिक जटिल मॉडल भी फिट बैठता है, जैसे कि सहसंबद्ध धोखाधड़ी, नेस्टेड क्रैटिल्टी, आदि।

अंत में, +cluster()कुछ हद तक GEE की भावना में है, जिसमें आप स्वतंत्र टिप्पणियों के साथ संभावना से स्कोर समीकरण लेते हैं, और मानक त्रुटियों के लिए एक अलग "मजबूत" अनुमानक का उपयोग करते हैं।

संपादित करें: पोस्ट की स्पष्टता के बारे में सुझाव के लिए @ इवान का धन्यवाद।


धन्यवाद। के बारे में (2): "ऐसा इसलिए है क्योंकि यदि आप (गलत तरीके से) मान लेते हैं ..." को "यदि आप कॉक्सफ़ () को कॉल में क्लस्टर (आईडी) का उपयोग नहीं करते हैं, तो आप गलत तरीके से मानते हैं ..."
क्वेटज़ालकोटल

मेरा मतलब था: यदि टिप्पणियों का खंडन किया जाता है, तो वे स्वतंत्र हो सकते हैं या नहीं। यह मानते हुए कि वे स्वतंत्र हैं (अर्थात क्लस्टर (आईडी) का उपयोग नहीं करना) इस मामले में लगभग निश्चित रूप से गलत है, लेकिन यह जानने का कोई विचार नहीं है कि
थियोडोर

(2) के रूप में rephrased किया जा सकता है: यदि क्लस्टर (आईडी) का उपयोग किया जाता है, तो मानक त्रुटियों का "मजबूत" अनुमान लगाया जाता है और विषयों के बीच संभावित निर्भरता मापा जाता है (जैसे मानक त्रुटियों और विचरण स्कोर)। दूसरी ओर, क्लस्टर (आईडी) का उपयोग नहीं करना, प्रत्येक अवलोकन पर स्वतंत्रता को लागू करता है और डेटा में अधिक "सूचना" को ग्रहण किया जाता है।
Quetzalcoatl

संदर्भ लिंक आप में (1) प्रदान की जानी चाहिए: springer.com/us/book/9780387987842 (यह मानते हुए आप Therneau और Grambsch की किताब का हवाला देते हुए कर रहे हैं)
Quetzalcoatl

यह भी ध्यान दें: जैसा कि थर्नो और ग्रामबश की किताब में बताया गया है, ऊपर (1) में उत्तर का कारण सही है क्योंकि कॉक्सफ़ () संबंधों के लिए डिफ़ॉल्ट के रूप में ब्रेस्लो विधि का उपयोग करता है।
Quetzalcoatl

1

यहाँ एक survivalपैकेज vignette का उत्तर दिया गया है, जो मुझे मददगार लगा - यह आपके द्वारा जुड़े पहले प्रश्न के पहले उत्तर में जुड़ा हुआ है:

कॉक्स मॉडल के लिए बेस्ट पैकेज अलग-अलग समय के साथ

वे लंबे फ़ॉर्म डेटा सेटअप या विषयों के लिए बार-बार प्रविष्टियों के साथ डेटा का उल्लेख कर रहे हैं।

इस डेटा सेटअप के साथ एक सामान्य प्रश्न यह है कि क्या हमें सहसंबंधित डेटा के बारे में चिंता करने की आवश्यकता है, क्योंकि किसी दिए गए विषय में कई अवलोकन हैं। जवाब है नहीं, हम नहीं। कारण यह है कि यह प्रतिनिधित्व केवल एक प्रोग्रामिंग चाल है। किसी भी समय बिंदु पर संभावना समीकरण किसी भी विषय की केवल एक प्रति का उपयोग करते हैं, कार्यक्रम प्रत्येक समय डेटा की सही पंक्ति चुनता है। इस नियम के दो अपवाद हैं:

  • जब विषयों में कई घटनाएँ होती हैं, तो घटनाओं के लिए पंक्तियों को विषय के भीतर सहसंबद्ध किया जाता है और एक क्लस्टर संस्करण की आवश्यकता होती है।
  • जब कोई विषय ओवरलैपिंग अंतराल में प्रकट होता है। हालांकि यह लगभग हमेशा एक डेटा त्रुटि है, क्योंकि यह एक ही समय में एक ही समय में मौजूद विषय की दो प्रतियों से मेल खाती है, उदाहरण के लिए, वह एक पार्टी में खुद से मिल सकती है।

वे जो उदाहरण देते हैं वह है

fit <- coxph(Surv(time1, time2, status) ~ age + creatinine, data=mydata)

यह सुझाव देते हुए कि यदि आप Survएक के बजाय दो बार (शुरुआत और समाप्ति अवधि) प्रदान करते हैं, coxph()तो बाकी का पता लगा लेंगे।


जब तक मुझे कुछ गलत नहीं लगता, मुझे लगता है कि यह टिप्पणी भ्रामक है? यदि हम विचरण के सटीक अनुमान प्राप्त करना चाहते हैं, तो हमें सहसंबंधित डेटा के बारे में चिंता करने की आवश्यकता है, इसलिए एक + क्लस्टर (ID) शब्द को जोड़ने से अनुमानित प्रसरण शर्तों में परिवर्तन क्यों होता है?
एपी 30
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.