बेतरतीब प्रभाव मॉडल अतिरेक से निपटने


9

मैं बार-बार द्विआधारी परिणामों का उपयोग करके एक समय-से-घटना विश्लेषण से निपटने की कोशिश कर रहा हूं। माना कि समय-समय पर घटना को दिनों में मापा जाता है, लेकिन फिलहाल हम हफ्तों के लिए विवेक रखते हैं। मैं बार-बार द्विआधारी परिणामों का उपयोग करके एक कापलान-मायर अनुमानक (लेकिन कोवरिएट्स के लिए अनुमति) का अनुमान लगाना चाहता हूं। यह जाने के लिए एक राउंडअबाउट तरीका की तरह प्रतीत होगा लेकिन मैं यह खोज रहा हूं कि यह क्रमिक परिणामों और आवर्तक घटनाओं तक कैसे फैलता है।

यदि आप एक द्विआधारी अनुक्रम बनाते हैं जो 3 सप्ताह में किसी के लिए 000 की तरह दिखता है, तो 4w पर सेंसर किए गए किसी व्यक्ति के लिए 0000, और 0000111111111111 पर .... किसी ऐसे विषय के लिए जो 5w में विफल हो गया (1s उस बिंदु तक विस्तारित होता है जिसके लिए अंतिम विषय था अध्ययन में अनुसरण किया गया), जब आप 1s के सप्ताह-विशिष्ट अनुपात की गणना करते हैं, तो आप साधारण संचयी घटनाओं को प्राप्त कर सकते हैं (जब तक कि आप चर सेंसरिंग समय तक नहीं पहुंचते हैं, जहां यह केवल अनुमान लगाता है लेकिन कपलान-मेयर संचयी घटना अनुमानों के बराबर नहीं है)।

मैं जीईई का उपयोग करके बाइनरी लॉजिस्टिक मॉडल के साथ दोहराया बाइनरी टिप्पणियों को फिट कर सकता हूं, इसके बजाय समय के साथ ऊपर के रूप में असतत बनाने के बजाय। क्लस्टर सैंडविच कोविरियन अनुमानक काफी अच्छी तरह से काम करता है। लेकिन मैं एक मिश्रित प्रभाव मॉडल का उपयोग करके अधिक सटीक निष्कर्ष निकालना चाहता हूं। समस्या यह है कि पहले 1 के बाद 1 निरर्थक हैं। क्या किसी को यादृच्छिक प्रभावों को निर्दिष्ट करने या किसी ऐसे मॉडल को निर्दिष्ट करने का तरीका पता है जो अतिरेक को ध्यान में रखता है ताकि मानक त्रुटियों को समाप्त नहीं किया जाएगा?

ध्यान दें कि यह सेटअप Efron से अलग है क्योंकि वह जोखिम सेट में सशर्त संभावनाओं का अनुमान लगाने के लिए लॉजिस्टिक मॉडल का उपयोग कर रहा था। मैं बिना शर्त संभावनाओं का अनुमान लगा रहा हूं।

जवाबों:


3

जहां तक ​​मैं बार-बार द्विआधारी टिप्पणियों के लिए जीईई या मिश्रित मॉडल दोनों के साथ देख सकता हूं, आपको यह समस्या होगी कि मॉडल पहले '1' के देखे जाने के बाद '0' के लिए सकारात्मक संभावना प्रदान करेगा।

किसी भी मामले में, यह देखते हुए कि आप मिश्रित प्रभाव लॉजिस्टिक रिग्रेशन से अनुमान प्राप्त करना चाहते हैं, जिसकी GEE में समान व्याख्या होगी ( अधिक जानकारी के लिए यहां देखें ), आप GLMMadaptive पैकेज mixed_model()से फ़ंक्शन का उपयोग करके मॉडल को फिट कर सकते हैं , और फिर उपयोग करें । एक उदाहरण के लिए, यहां देखें ।marginal_coefs()


1
धन्यवाद दिमित्रिस बेमानी 1 के साथ मेरे मामले के लिए (मतलब फ़ंक्शन को सही करने के लिए) मुझे लगता है कि मुझे एक संशोधित मॉडल या एक अजीब यादृच्छिक प्रभाव सेटअप की आवश्यकता होगी। GLMMadaptiveपैकेज अधिक सामान्य सेटअप के लिए भयानक लग रहा है।
फ्रैंक हरेल

2

इस बारे में विचारों की जोड़ी:

  1. ऐसा लगता है कि मिश्रित-प्रभाव वाला मॉडल मूल रूप से एक 'सशर्त' संभाव्यता मॉडल है, अर्थात, उस विषय के लिए किसी घटना की संभावना क्या है जो उस घटना के लिए जोखिम में है।

  2. हम जानते हैं कि पहले '1' के बाद '1' की संभावना एक है। इस प्रकार, बाद के '1' मूल्यों में कोई अतिरिक्त जानकारी नहीं है।

  3. ऐसा लगता है कि, क्योंकि बाद के '1' मानों में कोई अतिरिक्त जानकारी नहीं है, इसलिए उनके संभावित कार्य पर कोई प्रभाव नहीं होना चाहिए, और इस तरह संभावना आधारित अनुमानकों की मानक त्रुटियों पर कोई प्रभाव नहीं पड़ता है, न ही खुद अनुमान। वास्तव में, बाद के '1' मूल्यों का कोई प्रभाव नहीं होगा यदि p (y = '1' | x) = 1 मॉडल पैरामीटर मानों की परवाह किए बिना, जैसा कि होना चाहिए।

  4. हम इस व्यवहार (यानी, पी (y = '1' | x) = 1) को लागू करने में सक्षम हो सकते हैं, और वांछित मतलब फ़ंक्शन को बनाए रख सकते हैं, इसके बाद मॉडल पर एक संकेतक सहसंयोजक जोड़कर और उसके गुणांक को मजबूर करके। बहुत बड़ा होना ताकि प्रभावी रूप से p (y = '1' | x) = 1 हो।

  5. जैसा कि आपने उल्लेख किया है, पहले '1' और बाद की प्रतिक्रियाओं को 100% सहसंबंध के लिए बाध्य करने का एक तरीका भी हो सकता है। लेकिन एक द्विपद मॉडल में, बाद की प्रतिक्रियाओं के लिए p (y = '1' | x) = 1 के समान है।


1
धन्यवाद मैट। अगर मैं एक पूर्ण मॉडल नहीं चाहता था, लेकिन समीकरणों का आकलन करने के साथ संतुष्ट था, तो आप जो प्राप्त कर रहे हैं वह स्कोर फ़ंक्शन के लिए डुप्लिकेट प्रतिक्रियाओं को सही फ़ंक्शन को जोड़ने के लिए जोड़ रहा है, लेकिन उन्हें सूचना फ़ंक्शन में नहीं जोड़ रहा है। मुझे नहीं लगता कि मैं एक संकेतक कोवरिएट जोड़ सकता हूं, क्योंकि इससे उपचार प्रभाव होगा। मैं मिश्रित प्रभाव वाले मॉडल को बिना शर्त मॉडल के रूप में देखता हूं। जब घटना एक अवशोषित स्थिति नहीं है, तो आप समय-निर्भर तरीके से सीमांत प्रभावों को मॉडलिंग कर रहे हैं।
फ्रैंक हार्ले

1

मुझे ठीक से पता नहीं है कि आप क्या करने की कोशिश कर रहे हैं, लेकिन क्या आप एक पूलित लॉजिस्टिक रिग्रेशन मॉडल ( https://www.ncbi.nlm.nih.gov/pubmed/2281238 ) फिट कर सकते हैं ? इस मामले में आप टर्मिनल घटना के अंतराल के दौरान केवल 1 को शामिल करेंगे - यह घटना होने के बाद नहीं दोहराएगा। आप एक लचीले तरीके से मॉडल में समय शामिल करेंगे (उदाहरण के लिए, स्पाइन का उपयोग करके विस्तारित)।


1
हे ब्रायन - मुझे वास्तव में लाजिस्टिक लॉजिस्टिक प्रतिगमन पसंद है और अक्सर इसका उपयोग किया है। लेकिन अगर आप टर्मिनल इवेंट में किसी विषय के अवलोकन को समाप्त करते हैं, और अन्य विषयों के बिना किसी बिंदु के उस बिंदु से परे हैं, तो आपको माध्य फ़ंक्शन (पी (समय टी द्वारा घटना)) गलत मिलेगा। मैं कम से कम विशेष मामलों में मीन फ़ंक्शन के लिए निकट-कापलान-मेयर संचयी घटना अनुमान प्राप्त करना चाहता हूं।
फ्रैंक हरेल
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.