कॉक्स आनुपातिक खतरा मॉडल और गैर-यादृच्छिक रूप से चयनित नमूना


9

क्या गैर-बेतरतीब ढंग से चुने गए नमूने (हेकमैन के सुधार जैसा कुछ) के कारण कॉक्स आनुपातिक खतरे वाले मॉडल में पूर्वाग्रह को सही करने के लिए कोई तरीके हैं?

पृष्ठभूमि :
कहते हैं कि स्थिति इस प्रकार दिखती है:
- पहले दो वर्षों के दौरान सभी ग्राहक स्वीकार किए जाते हैं।
- उन दो वर्षों के बाद एक कॉक्स पीएच मॉडल का निर्माण होता है। मॉडल भविष्यवाणी करता है कि ग्राहक हमारी सेवा का उपयोग कब तक करेंगे।
- कंपनी की नीति के कारण अब से केवल 3 महीने में 0.5 से अधिक जीवित रहने की संभावना वाले ग्राहक स्वीकार किए जाते हैं, अन्य को अस्वीकार कर दिया जाता है।
- एक और दो साल के बाद एक नया मॉडल बनाने की जरूरत है। समस्या यह है कि हमारे पास केवल स्वीकृत ग्राहकों के लिए लक्ष्य है और केवल इन ग्राहकों का उपयोग करने से कुछ गंभीर पूर्वाग्रह हो सकते हैं।


1
इस विश्लेषण का क्या मतलब है? जब तक आप कुछ चौरसाई विधियों या पैरामीट्रिक मॉडलिंग को शामिल नहीं करते हैं, तब तक कॉक्स PH मॉडल स्पष्ट रूप से समय-विफलता की भविष्यवाणी नहीं करता है। इस मॉडल में क्या स्तरीकरण / समायोजन चर हैं?
एडमो

जवाबों:


4

अर्ध-पैरामीट्रिक कॉक्स मॉडल के साथ पैरामीट्रिक दृष्टिकोण की गणना के साथ समस्या यह है कि यह विशिष्ट समस्या वास्तव में एक लापता डेटा से संबंधित है। इसके बावजूद कि लेखक ने यह नहीं बताया है कि वह कॉक्स मॉडल से पूर्ण जोखिम की भविष्यवाणियां कैसे प्राप्त कर रहा है, यह देखते हुए कि हमारे पास मॉडल मापदंडों (और आधारभूत खतरे के कार्य के अनुमान) के आधार पर इस तरह का जोखिम पूर्वानुमान है, डेटा के दूसरे चरण में शामिल होने की संभावना संग्रह मूल जोखिम की भविष्यवाणी पर निर्भर करता है, इसलिए लापता होना अवलोकन किए गए चर पर निर्भर करता है, अर्थात यादृच्छिक डेटा पर गायब होना।
एडमो

2

सरल जवाब वजन है। यही है, आप "स्वीकार किए जाते हैं" समूह में ब्याज की आबादी के समूहों को मानकीकृत करने के लिए वजन का उपयोग कर सकते हैं। पहले और दूसरे 2 साल के चरणों का उपयोग करके पूलित विश्लेषण में इस तरह के वजन का उपयोग करने से उत्पन्न होने वाली समस्या यह है कि अनुमानित जनसंख्या भार और पैरामीटर अब निर्भर हैं। Pseudolikelihood दृष्टिकोण आमतौर पर उपयोग किया जाता है (इस मामले में, यह किसी प्रकार का छद्म आंशिक संभावना होगा) जहां आप नमूना भार और पैरामीटर अनुमानों के बीच निर्भरता को अनदेखा करते हैं। हालांकि, कई व्यावहारिक परिस्थितियों में (और यह कोई अलग नहीं है), इस निर्भरता के लिए लेखांकन आवश्यक है। खतरनाक अनुपात का एक कुशल अनुमानक बनाने का मुद्दा एक मुश्किल है, और जहां तक ​​मुझे पता है कि खुले समाप्त हो गया है।

दो चरण के स्तरीकृत नमूनों से मॉडल पैरामीटर्स का बेहतर हॉर्विट्ज़-थॉम्पसन अनुमान: महामारी विज्ञान में अनुप्रयोग

लेख में सर्वेक्षण के तरीकों पर चर्चा की गई है, जो आमतौर पर लॉजिस्टिक रिग्रेशन में लागू होता है, हालांकि आप जीवित डेटा को भी वेट कर सकते हैं। कुछ महत्वपूर्ण विचार जिनका आपने उल्लेख किया है कि क्या आप एक ऐसी भविष्यवाणी बनाने में रुचि रखते हैं जो पूरी आबादी पर लागू होती है, या 2 साल के अनुमानों के आधार पर "योग्य" आबादी, या परिणाम के आधार पर "योग्य" आबादी है। नमूना। आपने यह भी उल्लेख नहीं किया है कि कॉक्स मॉडल से इस तरह का "पूर्वानुमान" मॉडल कैसे बनाया जाता है, क्योंकि कॉक्स मॉडल से फिट किए गए मूल्यों को जोखिम के रूप में व्याख्या नहीं किया जा सकता है। मुझे लगता है कि आप जोखिम अनुपात का अनुमान लगाते हैं, फिर आधारभूत खतरे के कार्य का एक सहज अनुमान प्राप्त करते हैं।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.