आर में जटिल सर्वेक्षण डेटा के लिए बहुस्तरीय मॉडल फिटिंग


11

मैं आर में मल्टीलेवल मॉडल के साथ जटिल सर्वेक्षण डेटा का विश्लेषण करने के तरीके के बारे में सलाह ले रहा हूं। मैंने surveyएक-स्तरीय मॉडल में चयन की असमान संभावनाओं के लिए वजन करने के लिए पैकेज का उपयोग किया है , लेकिन इस पैकेज में मल्टीलेवल मॉडलिंग के लिए फ़ंक्शन नहीं हैं। lme4पैकेज बहुस्तरीय मॉडलिंग के लिए महान है, लेकिन वहाँ एक रास्ता है कि मैं क्लस्टरिंग के विभिन्न स्तरों पर भार शामिल करने के लिए पता नहीं है। Asparouhov (2006) ने इस समस्या को हल किया:

बहुस्तरीय मॉडल अक्सर क्लस्टर नमूनाकरण डिजाइन से डेटा का विश्लेषण करने के लिए उपयोग किया जाता है। हालांकि इस तरह के सैंपलिंग डिज़ाइन अक्सर क्लस्टर स्तर पर और व्यक्तिगत स्तर पर चयन की असमान संभावना का उपयोग करते हैं। सैंपलिंग वेट इन संभावनाओं को दर्शाने के लिए एक या दोनों स्तरों पर दिए जाते हैं। यदि नमूने के वज़न को किसी भी स्तर पर अनदेखा किया जाता है तो पैरामीटर का अनुमान काफी हद तक पक्षपाती हो सकता है।

दो-स्तरीय मॉडल के लिए एक दृष्टिकोण बहुस्तरीय छद्म अधिकतम संभावना (MPML) अनुमानक है जो MPLUS ( Asparouhov et al? ) में लागू किया गया है । कार्ले (2009) प्रमुख सॉफ्टवेयर पैकेजों की समीक्षा करता है और आगे बढ़ने के बारे में कुछ सिफारिशें करता है:

जटिल सर्वेक्षण डेटा और डिजाइन वेट के साथ एमएलएम को ठीक से संचालित करने के लिए, विश्लेषकों को सॉफ़्टवेयर की आवश्यकता होती है जो प्रोग्राम के बाहर मापे गए वज़न को शामिल कर सकते हैं और स्वचालित प्रोग्राम संशोधन के बिना "नए" स्केल वेट शामिल कर सकते हैं। वर्तमान में, तीन प्रमुख एमएलएम सॉफ्टवेयर प्रोग्राम इसकी अनुमति देते हैं: Mplus (5.2), MLwiN (2.02), और GLLAMM। दुर्भाग्य से, न तो एचएलएम और न ही एसएएस ऐसा कर सकते हैं।

वेस्ट एंड गेल्की (2013) एक अधिक अद्यतन समीक्षा देता है, और मैं संबंधित प्रस्ताव को लंबाई में उद्धृत करूंगा:

कभी-कभी, विश्लेषक जटिल डिजाइनों वाले नमूनों से एकत्र किए गए डेटा सेटों का सर्वेक्षण करने के लिए LMMs फिट करने की इच्छा रखते हैं (देखें हीरिंगा एट अल, 2010, अध्याय 12)। कॉम्प्लेक्स सैंपल डिज़ाइनों को आम तौर पर आबादी के विभाजन, स्ट्रैट के भीतर से व्यक्तियों के समूहों के बहु-चरण चयन, और दोनों समूहों और अंतिम व्यक्तियों के लिए चयन की असमान संभावनाओं की विशेषता होती है। चयन की इन असमान संभावनाओं से आम तौर पर व्यक्तियों के लिए नमूना भार का निर्माण होता है, जो एक विश्लेषण में शामिल होने पर वर्णनात्मक मापदंडों का निष्पक्ष अनुमान सुनिश्चित करता है। इन वेटों को सर्वेक्षण गैर-जिम्मेदारियों के लिए और अधिक समायोजित किया जा सकता है और ज्ञात जनसंख्या योगों में अंशांकित किया जा सकता है। परंपरागत रूप से, प्रतिगमन मॉडल का अनुमान लगाते समय विश्लेषक इन जटिल नमूने सुविधाओं को शामिल करने के लिए एक डिज़ाइन-आधारित दृष्टिकोण पर विचार कर सकते हैं (हीरिंगा एट अल।, 2010)। हाल ही में, सांख्यिकीविदों ने नमूना डेटा के निर्धारित प्रभावों और नमूना समूहों के यादृच्छिक प्रभावों को शामिल करने के लिए LMM का उपयोग करते हुए, इन आंकड़ों का विश्लेषण करने के लिए मॉडल-आधारित दृष्टिकोणों का पता लगाना शुरू कर दिया है।

इन आंकड़ों का विश्लेषण करने के लिए मॉडल-आधारित दृष्टिकोणों के विकास के साथ प्राथमिक कठिनाई नमूना वजन को शामिल करने के लिए उपयुक्त तरीकों का चयन करती रही है (मुद्दों के सारांश के लिए गेलमैन, 2007 देखें)। फाफरमैन एट अल। (1998), असपरोहोव और मुथेन (2006), और रबे-हेसेथ और स्केरोनोल्ड (2006) ने एक तरह से मल्टीलेवल मॉडल का अनुमान लगाने के लिए सिद्धांत विकसित किया है जो सर्वे वेट को शामिल करता है, और रबे-हेसेथ और स्के्रनडाल (2006), कार्ले (2009) और हीरिंगा एट अल। (2010, अध्याय 12) ने वर्तमान सॉफ्टवेयर प्रक्रियाओं का उपयोग करके आवेदन प्रस्तुत किए हैं, लेकिन यह सांख्यिकीय अनुसंधान का एक सक्रिय क्षेत्र है। LMMs को फिट करने में सक्षम सॉफ़्टवेयर प्रक्रियाएं, इस तरह के जटिल डिजाइन विशेषताओं को शामिल करने के लिए साहित्य में प्रस्तावित दृष्टिकोणों को लागू करने के विभिन्न चरणों में हैं, और विश्लेषकों को इस पर विचार करने की आवश्यकता है जब LMMs को जटिल नमूना सर्वेक्षण डेटा के लिए उपयुक्त किया जाए। जटिल नमूना सर्वेक्षणों से एकत्र किए गए डेटा को LMMs में फिट करने के लिए इच्छुक विश्लेषक उन प्रक्रियाओं की ओर आकर्षित होंगे, जो अनुमान प्रक्रियाओं (HLM, MLwiN, Mplus, xtmixed, और gllamm) में सर्वेक्षण भार को सही ढंग से शामिल करने में सक्षम हैं, जो इस में वर्तमान साहित्य के अनुरूप है। क्षेत्र।

यह मुझे मेरे सवाल में लाता है: क्या किसी को एलएमएम को आर में जटिल सर्वेक्षण डेटा फिट करने के लिए सर्वोत्तम अभ्यास सिफारिशें हैं?


1
हाय एरिक, addhealth पर इस पोस्टi've never said it before से wih शुरू होता है कि पैराग्राफ में लिंक ब्याज की हो सकती है .. :(
एंथोनी Damico


@BenBolker यह है! उन्होंने माइक्रोडाटा का नाम बदल दिया है, इसलिए मैंने भी किया :) नया स्थान: asdfree.com/search/label/…
एंथनी

क्षमा करें, यदि मैंने आपके प्रश्न का गलत अर्थ निकाला है, लेकिन मेरी समझ यह है कि आपने प्रयोग के डिज़ाइन से निश्चित (ज्ञात) वज़न तय कर लिया है, और आप एक रैखिक मिश्रित मॉडल का उपयोग करना चाहते हैं जिसमें ये डिज़ाइन वज़न शामिल हैं। lmerमें समारोह lme4पैकेज एक के विनिर्देश की अनुमति देता है weightsमॉडल-फिटिंग प्रक्रिया के लिए तर्क, इसलिए यदि आप डिजाइन वजन तय कर दी है, तो आप उन्हें कि तर्क के साथ शामिल करने के लिए सक्षम होना चाहिए। क्या मुझे यहां छड़ी का गलत अंत मिल गया है? क्या कोई कारण है जो आपकी आवश्यकताओं के लिए अपर्याप्त है?
बेन -

जवाबों:


4

जहाँ तक मैं जानता हूँ कि आप इस समय आर में वास्तव में ऐसा नहीं कर सकते हैं, अगर आपको वास्तव में एक मिश्रित मॉडल की आवश्यकता है (जैसे, यदि आप विचरण घटकों की परवाह करते हैं)

वेट्स तर्क lme4::lmer() नहीं करते कि आप क्या चाहते हैं, क्योंकि lmer()वेट की व्याख्या सटीक वेट के रूप में होती है, न कि सैंपलिंग वेट की। साधारण रैखिक और सामान्यीकृत रैखिक मॉडल के विपरीत, आपको कोड के साथ सही बिंदु अनुमान भी नहीं मिलता है जो नमूना भार को मिश्रित मॉडल के लिए सटीक भार के रूप में मानता है।

यदि आपको विचरण घटकों का अनुमान लगाने की आवश्यकता नहीं है और आप केवल मॉडल की बहुस्तरीय विशेषताओं को सही मानक त्रुटियां प्राप्त करना चाहते हैं जो आप उपयोग कर सकते हैं survey::svyglm()


0

WeMix पैकेज अब कम से कम रैखिक और रसद बहुस्तरीय मॉडल के लिए एक विकल्प है। हालांकि, इन मॉडलों को स्टाटा या MPlus में चलाने की तुलना में बहुत धीमा लगता है।


0

मेरे द्वारा भी यही समस्या का सामना किया जा रहा है। पिछले कुछ दिनों में बहुत खोज करने के बाद, मैंने पाया है कि BIFIEsurvey पैकेज जटिल सर्वेक्षण डेटा के साथ नमूना और भार दोहराने के लिए बहुस्तरीय मॉडल का विश्लेषण करने के लिए निकटतम है, और प्रशंसनीय मूल्य: https://cran.r-propro.org/web /packages/BIFIEsurvey/index.html पैकेज, हालांकि, दो-स्तरीय मॉडलों के लिए प्रतिबंधित है। मैंने यह भी पढ़ा है कि "intsvy" पैकेज के लेखक ने बहु-स्तरीय मॉडल का विश्लेषण करने में सक्षम होने के लिए "intsvy" बनाने के लिए दीर्घकालिक योजना बनाई है, लेकिन आज तक यह अभी भी नहीं बन सका है। अगर इस समस्या के समाधान के बारे में कोई प्रगति हुई है जो मुझे गलती से याद हो सकती है, तो मुझे खुशी होगी अगर कोई इसे साझा कर सकता है।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.