क्या एक नियमित प्रभाव मॉडल में नियमितीकरण तकनीकों का उपयोग किया जा सकता है?


11

नियमितीकरण तकनीकों द्वारा मैं लैस्सो, रिज रिग्रेशन, इलास्टिक नेट और लाइक की बात कर रहा हूं।

जनसांख्यिकीय और निदान डेटा वाले स्वास्थ्य देखभाल डेटा पर एक पूर्वानुमान मॉडल पर विचार करें जहां इन-पेशेंट के ठहरने की लंबाई की भविष्यवाणी की जा रही है। कुछ व्यक्तियों के लिए आधारभूत समयावधि के दौरान एकाधिक एलओएस अवलोकन (यानी, एक से अधिक आईपी एपिसोड) होते हैं जो सहसंबद्ध होते हैं।

क्या यह समझ में आता है, उदाहरण के लिए, एक लोचदार शुद्ध भविष्य कहनेवाला मॉडल जिसमें प्रत्येक व्यक्ति के लिए एक यादृच्छिक प्रभाव अवरोधन शब्द होता है?


अपनी पहली पंक्ति के लिए उपशीर्षक: "यादृच्छिक प्रभाव तकनीकों द्वारा (यानी यह मानकर कि कैसे एक पैरामीटर को यादृच्छिक रूप से वितरित किया जाता है) मैं प्रतिगमन मापदंडों पर लाप्लास पादरियों और सामान्य पुजारियों का उल्लेख कर रहा हूं ... और जैसे" :-)
संयुग्मक

जवाबों:


7

कुछ प्रश्न हैं जो इस प्रश्न से निपटते हैं। मैं किसी विशेष क्रम में नहीं देखूंगा:

  1. पेन.एलएमई: हॉवर्ड डी बॉन्डेल, अरुण कृष्णा, और सुजीत के घोष। रैखिक मिश्रित-ईयर्स मॉडल में फिक्स्ड और रैंडम ईईएस के लिए संयुक्त वेरिएबल चयन। बॉयोमीट्रिक्स, 66 (4): 1069-1077, 2010।

  2. GLMMLASSO: जुर्ग स्केल्डोर्फर, पीटर बुहल्मन, सारा वैन डे जेर। L1- दंड के उपयोग से उच्च-आयामी रैखिक मिश्रित-ईएस मॉडल के लिए अनुमान। सांख्यिकी के स्कैंडिनेवियाई जर्नल, 38 (2): 197-214, 2011।

जो ऑनलाइन पाया जा सकता है।

मैं मिश्रित मॉडल (एलएमएमईएन) को एक लोचदार शुद्ध जुर्माना लागू करने पर एक पेपर खत्म कर रहा हूं और इसे आगामी महीने में पत्रिका समीक्षा के लिए भेजने की योजना है।

  1. LMMEN: सिदी, रिटोव, अनगर। लोचदार नेट दंड के माध्यम से रैखिक मिश्रित मॉडल का नियमितीकरण और वर्गीकरण

यदि आप डेटा को मॉडलिंग कर रहे हैं या तो सामान्य नहीं है या मेरे पास पहचान लिंक नहीं है, तो मैं GLMMLASSO के साथ जाऊंगा, (लेकिन सावधान रहें कि यह बहुत सारे आरई को संभाल नहीं सकता है)। अन्यथा पेन एलएमई अच्छा है कि आपके पास अत्यधिक सहसंबद्ध डेटा नहीं है, यह निश्चित या यादृच्छिक प्रभावों में हो। बाद के मामले में आप मुझे मेल कर सकते हैं और मुझे आपको कोड / पेपर भेजने में खुशी होगी (मैं इसे निकट भविष्य में क्रेन पर रखूंगा)।

मैंने आज CRAN - lmmen पर अपलोड किया । यह एक साथ फिक्स्ड और यादृच्छिक प्रभावों पर एक लोचदार-नेट प्रकार के दंड के साथ रैखिक मिश्रित मॉडल समस्या को हल करता है।

इसमें lmmlasso और glmmLasso पैकेज के लिए पैकेज cv फ़ंक्शंस में भी है।


1
Yonicd, लीनियर मिक्स्ड मॉडल्स के लिए इलास्टिक नेट का अनुप्रयोग ठीक वही है जो मैं खोज रहा हूं। मैं आनुवंशिक डेटा के साथ काम कर रहा हूं जो सहसंबद्ध हैं, इसलिए एक लोचदार नेट का समूहीकृत चयन बहुत उपयोगी होगा। मैंने आपसे संपर्क करने की कोशिश की है, लेकिन इस उत्तर को पोस्ट करने के अलावा और कोई रास्ता नहीं खोज पाया, क्योंकि संदेश भेजना असंभव लगता है। वैसे भी, मैं आपके पेपर को पढ़ने के लिए उत्सुक हूं और यह उपलब्ध होते ही आपके कोड की कोशिश करेगा।

5

मैं हमेशा रिज रिग्रेशन को सिर्फ अनुभवजन्य यादृच्छिक प्रभाव मॉडल के रूप में देखता था जो कि एक एकल श्रेणीगत चर (और कोई फैंसी सहसंबंध matrices) तक सीमित नहीं है। आप लगभग हमेशा एक ही अनुमान लगा सकते हैं क्रॉस से एक रिज दंड और फिटिंग / एक सरल यादृच्छिक प्रभाव का आकलन। आपके उदाहरण में, आप फैंसी प्राप्त कर सकते हैं और डेमो / डायग सुविधाओं पर एक अलग रिज जुर्माना कर सकते हैं और रोगी संकेतकों पर एक और एक (कुछ लाइन पेनल्टी स्केलिंग कारक का उपयोग करके glmnet) कर सकते हैं। वैकल्पिक रूप से, आप एक फैंसी रैंडम प्रभाव शामिल कर सकते हैं जिसका व्यक्ति द्वारा समय-सहसंबंधित प्रभाव होता है। इन संभावनाओं में से कोई भी सही या गलत नहीं है, वे सिर्फ उपयोगी हैं।


2

मैं फिलहाल एक ऐसे ही सवाल के बारे में सोच रहा हूं। मुझे लगता है कि आवेदन में, आप इसे कर सकते हैं यदि यह काम करता है और आप मानते हैं कि यह उचित है। यदि यह यादृच्छिक प्रभावों में एक सामान्य सेटिंग है (इसका मतलब है, आपने प्रत्येक समूह के लिए माप दोहराया है), तो यह सिर्फ अनुमान तकनीक के बारे में है, जो कम विवादास्पद है। यदि आप वास्तव में अधिकांश समूहों के लिए कई बार-बार माप नहीं करते हैं, तो यह सामान्य यादृच्छिक प्रभाव मॉडल की सीमा रेखा पर झूठ हो सकता है और यदि आप इसे सामान्य रूप से प्रस्तावित करना चाहते हैं, तो आप इसकी वैधता (कार्यप्रणाली के नजरिए से) को सावधानीपूर्वक उचित ठहराना चाह सकते हैं। तरीका।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.