मल्टीलेवल मॉडल बनाम प्रत्येक स्तर के लिए अलग-अलग मॉडल


10

अलग-अलग मॉडल बनाम मल्टीलेवल मॉडलिंग चलाने के फायदे और नुकसान क्या हैं?

विशेष रूप से, मान लें कि एक अध्ययन किया गया परीक्षण किया गया है कि देशों के भीतर नेस्टेड डॉक्टरों के व्यवहारों में निहित मरीज हैं। प्रत्येक देश बनाम तीन स्तरीय नेस्टेड मॉडल के लिए अलग-अलग मॉडल चलाने के क्या फायदे / नुकसान हैं?


2
यदि आपको 3-स्तरीय मॉडल (आमतौर पर बोलना, किसी भी मल्टीलेवल मॉडल में नमूना आकार विशेष रूप से उच्चतम स्तर पर महत्वपूर्ण है) में निष्पक्ष पैरामीटर पैरामीटर अनुमान प्राप्त करने जा रहे हैं, तो आपको तकनीकी रूप से स्तर -3 इकाइयों की थोड़ी बहुत आवश्यकता है, इसलिए जब तक आपके पास न हो देशों का एक बड़ा यादृच्छिक नमूना (50+ शायद), आपको शायद अलग-अलग 2-स्तरीय मॉडल चलाने पर विचार करना चाहिए, या यदि आपके पास कुछ देश हैं, तो आप देश को 2-स्तरीय मॉडल में एक श्रेणी-स्तर -2 भविष्यवक्ता के रूप में मान सकते हैं
पैट्रिक कॉलोम्बे जुले 6'13

हाय @gung मैं दूर था, मैं अब उन्हें देखूंगा।
पीटर Flom

जवाबों:


6

प्रश्न दिनांकित है, लेकिन मुझे लगता है कि यह बहुत महत्वपूर्ण है। सबसे अच्छा उत्तर मुझे जोप जे होक्स (2010) की पुस्तक "मल्टीलेवल एनालिसिस टेक्निक्स एंड एप्लीकेशंस, द्वितीय संस्करण" से मिला है।

मान लीजिए कि निम्नतम स्तर पर व्याख्यात्मक चर और उच्चतम स्तर पर व्याख्यात्मक चर के साथ दो-स्तरीय पदानुक्रमित डेटा है। फिर, 55 पेज पर, वह लिखते हैं:क्यूpq

समान डेटा के लिए एक साधारण एकल-स्तरीय प्रतिगमन मॉडल केवल अवरोधन, एक त्रुटि विचरण और p + q प्रतिगमन ढलानों का अनुमान लगाता है। बहुस्तरीय प्रतिगमन मॉडल की श्रेष्ठता स्पष्ट है, अगर हम यह मानते हैं कि डेटा समूहों में क्लस्टर किए गए हैं। यदि हमारे पास 100 समूह हैं, तो प्रत्येक समूह में अलग-अलग एक साधारण एकाधिक प्रतिगमन मॉडल का आकलन करने के लिए अलग से 100 × (1 प्रतिगमन अवरोधन + 1 अवशिष्ट विचरण + पी प्रतिगमन ढलान) के साथ-साथ q समूह-स्तरीय चर के साथ संभावित इंटरैक्शन की आवश्यकता होती है। बहुस्तरीय प्रतिगमन समूहों के पार एक औसत अवरोधन प्लस इसके अवशिष्ट विचरण का अनुमान लगाकर 100 इंटरसेप्ट्स का आकलन करता है, इन अवशिष्टों के लिए एक सामान्य वितरण मानता है। इस प्रकार, बहुस्तरीय प्रतिगमन विश्लेषण दो मापदंडों (अंतर का माध्य और विचरण), और एक सामान्यता धारणा का अनुमान लगाकर 100 अलग-अलग अनुमानों की जगह लेता है। उसी सरलीकरण का उपयोग प्रतिगमन ढलानों के लिए किया जाता है। व्याख्यात्मक चर पुतली लिंग के लिए 100 ढलानों का आकलन करने के बजाय, हम समूहों में इसके विचरण के साथ औसत ढलान का अनुमान लगाते हैं, और मान लेते हैं कि ढलानों का वितरण सामान्य है। फिर भी, व्याख्यात्मक चर की एक मामूली संख्या के साथ, बहुस्तरीय प्रतिगमन विश्लेषण एक जटिल मॉडल का अर्थ है। आम तौर पर, हम पूर्ण मॉडल का अनुमान नहीं लगाना चाहते हैं, पहले क्योंकि यह हमें कम्प्यूटेशनल समस्याओं में ले जाने की संभावना है, लेकिन यह भी क्योंकि इस तरह के एक जटिल मॉडल की व्याख्या करना बहुत मुश्किल है।

वह वर्णन के लिए है। अब 29-30 पृष्ठ आपके प्रश्न का अधिक सटीक उत्तर देंगे।

100 वर्ग के लिए अनुमानित इंटरसेप्ट और ढलान उन मूल्यों के समान नहीं हैं जिन्हें हम प्राप्त करेंगे यदि हमने 100 साधारण कक्षाओं में से प्रत्येक में 100 अलग-अलग साधारण प्रतिगमन विश्लेषण किए, जो मानक सामान्य न्यूनतम वर्ग (ओएलएस) तकनीकों का उपयोग करते हैं। यदि हम परिणामों को 100 अलग-अलग ओएलएस प्रतिगमन विश्लेषणों से बहुस्तरीय प्रतिगमन विश्लेषण से प्राप्त मूल्यों की तुलना करने के लिए थे, तो हम पाएंगे कि अलग-अलग विश्लेषणों के परिणाम अधिक परिवर्तनशील हैं। ऐसा इसलिए है क्योंकि 100 वर्गों के प्रतिगमन गुणांक के बहुस्तरीय अनुमानों का भार है। उन्हें तथाकथित अनुभवजन्य बे (ईबी) या संकोचन अनुमान कहा जाता है: प्रत्येक वर्ग में विशिष्ट ओएलएस अनुमान का एक भारित औसत और सभी समान वर्गों के लिए अनुमानित कुल प्रतिगमन गुणांक।

नतीजतन, प्रतिगमन गुणांक पूरे डेटा सेट के लिए वापस गुणांक की ओर सिकुड़ जाता है। संकोचन भार अनुमानित गुणांक की विश्वसनीयता पर निर्भर करता है। छोटे सटीकता के साथ अनुमानित गुणांक बहुत सटीक रूप से अनुमानित गुणांक से अधिक सिकुड़ते हैं। अनुमान की सटीकता दो कारकों पर निर्भर करती है: समूह नमूना आकार, और समूह-आधारित अनुमान और समग्र अनुमान के बीच की दूरी। छोटे समूहों के लिए अनुमान कम विश्वसनीय हैं, और बड़े समूहों के लिए अनुमानों से अधिक सिकुड़ते हैं। अन्य चीजें समान होने के कारण, अनुमान जो समग्र अनुमान से बहुत दूर हैं, उन्हें कम विश्वसनीय माना जाता है, और वे अनुमान से अधिक सिकुड़ते हैं जो समग्र औसत के करीब हैं। उपयोग की जाने वाली सांख्यिकीय पद्धति को अनुभवजन्य बेस अनुमान कहा जाता है। इस संकोचन प्रभाव के कारण, अनुभवजन्य बेस अनुमानक पक्षपाती हैं। हालांकि, वे आमतौर पर अधिक सटीक होते हैं, एक संपत्ति जो अक्सर निष्पक्ष होने से अधिक उपयोगी होती है (केंडल, 1959 देखें)।

मुझे आशा है कि यह संतोषजनक है।


2

एक यादृच्छिक प्रभाव को निर्दिष्ट करने में यह मानना ​​शामिल है कि उन स्तरों के साधन एक सामान्य वितरण से नमूने हैं। निश्चित प्रभाव के रूप में उन्हें निर्दिष्ट करने के लिए बेहतर है, अगर यह धारणा आपके डेटा पर फिट नहीं होती है तो AKA डमी वैरिएबल। इस तरह आप माध्य (उस स्तर पर) में समूहगत विविधता के लिए नियंत्रित कर रहे हैं, लेकिन आप अपने निचले स्तर के चर के जवाब में विषमता की अनुमति नहीं दे रहे हैं।

यदि आप अपने निचले-स्तर के व्याख्यात्मक चर के जवाब में विषमता की अपेक्षा करते हैं, तो अलग-अलग मॉडल समझ में आते हैं, जब तक कि आप किसी प्रकार का यादृच्छिक गुणांक मॉडल नहीं चलाना चाहते हैं (जिसमें फिर से यह धारणा शामिल है कि गुणांक सामान्य रूप से वितरित किए जाते हैं)।

(मेरा मानना ​​है कि गैर-सामान्य यादृच्छिक प्रभावों के लिए विधियां हैं, लेकिन कुछ भी नहीं है जो व्यापक रूप से उपयोग किया जाता है या लाम के रूप में सुलभ है)


1

लाभ: क्लस्टर द्वारा मापदंडों में अंतर के लिए स्पष्ट रूप से परीक्षण करने की क्षमता (अर्थात महत्व में अंतर का मतलब महत्वपूर्ण अंतर नहीं है)।


2
यह उत्तर बहुत छोटा है। एक उत्तर की तुलना में अधिक टिप्पणी।
एरिक पीटरसन
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.