दो अलग-अलग रजिस्टरों से गुणांक के परीक्षण समानता


44

यह एक मूल मुद्दा लगता है, लेकिन मुझे सिर्फ यह महसूस हुआ कि मुझे वास्तव में यह पता नहीं है कि दो अलग-अलग व्यवस्थाओं से गुणांक की समानता का परीक्षण कैसे किया जाता है। क्या कोई इस पर रोशनी डाल सकता है?

अधिक औपचारिक रूप से, मान लीजिए मैं निम्नलिखित दो प्रतिगमन भाग गया: और जहां प्रतिगमन के डिजाइन मैट्रिक्स को संदर्भित करता है , और प्रतिगमन में गुणांकों के वेक्टर के लिए । ध्यान दें कि और संभावित रूप से बहुत भिन्न हैं, अलग-अलग आयामों आदि के साथ उदाहरण के लिए मुझे दिलचस्पी है कि क्या ।y 2 = एक्स 2 बीटा 2 + ε 2 एक्स मैं मैं बीटा मैं मैं एक्स 1 एक्स 2 बीटा 11बीटा 21

y1=X1β1+ϵ1
y2=X2β2+ϵ2
XiiβiiX1X2β^11β^21

यदि ये एक ही प्रतिगमन से आते हैं, तो यह तुच्छ होगा। लेकिन जब से वे अलग-अलग लोगों से आते हैं, मुझे यकीन नहीं है कि यह कैसे करना है। क्या किसी के पास कोई विचार है या मुझे कुछ संकेत दे सकते हैं?

विस्तार से मेरी समस्या: मेरा पहला अंतर्ज्ञान आत्मविश्वास के अंतराल को देखना था, और अगर वे ओवरलैप करते हैं, तो मैं कहूंगा कि वे अनिवार्य रूप से एक ही हैं। यह प्रक्रिया परीक्षण के सही आकार के साथ नहीं आती है, हालांकि (यानी प्रत्येक व्यक्तिगत आत्मविश्वास अंतराल में , कहते हैं, लेकिन उन्हें संयुक्त रूप से देखने की संभावना नहीं होगी)। मेरा "दूसरा" अंतर्ज्ञान एक सामान्य टी-टेस्ट आयोजित करना था। वह है, लेनाα=0.05

β11β21sd(β11)

जहां मेरे परिकल्पना के मूल्य के रूप में लिया जाता है। यह अनुमान के अनिश्चितता को ध्यान में नहीं , हालांकि, और उत्तर प्रतिगमन के आदेश पर निर्भर हो सकता है (जिसे मैं 1 और 2 कहता हूं)। β 21β21β21

मेरा तीसरा विचार एक ही प्रतिगमन से दो गुणांकों की समानता के लिए एक मानक परीक्षण के रूप में करना था, जो कि

β11β21sd(β11β21)

इस तथ्य के कारण जटिलता पैदा होती है कि दोनों अलग-अलग रजिस्ट्रियों से आते हैं। ध्यान दें कि

Var(β11β21)=Var(β11)+Var(β21)2Cov(β11,β21)
लेकिन तब से वे विभिन्न प्रतिगमन से हैं, मुझे कैसे ?Cov(β11,β21)

इसके चलते मैंने यहां यह सवाल पूछा। यह एक मानक प्रक्रिया / मानक परीक्षण होना चाहिए, लेकिन मुझे लगता है कि इस समस्या के लिए पर्याप्त रूप से कुछ भी नहीं मिला। इसलिए, अगर कोई मुझे सही प्रक्रिया की ओर इशारा कर सकता है, तो मैं बहुत आभारी रहूंगा!


2
यह संरचनात्मक / युगपत समीकरण मॉडलिंग से संबंधित लगता है। इस समस्या को हल करने का एक तरीका दोनों समीकरणों को एक साथ फिट करना है, उदाहरण के लिए अधिकतम संभावना के साथ, और फिर एक असंबंधित मॉडल के खिलाफ विवश (बराबर पैरामीटर मॉडल) की संभावना अनुपात परीक्षण का उपयोग करें। व्यावहारिक रूप से यह एसईएम सॉफ्टवेयर (Mplus, lavaan आदि) के साथ किया जा सकता है
tomka

2
क्या आप Seemately असंबंधित प्रतिगमन (SUR) के बारे में जानते हैं?
दिमित्री वी। मास्टरोव

2
मुझे लगता है कि आपके प्रश्न, अर्थात दोनों गुणांक के cov कैसे प्राप्त करें, SEM द्वारा हल किया गया है, जो आपको सभी गुणांक के var-cov मैट्रिक्स प्रदान करेगा। फिर आप संभवतः LRT परीक्षण के बजाय आपके द्वारा सुझाए गए तरीके से Wald परीक्षण का उपयोग कर सकते हैं। इसके अलावा आप रि-सैंपलिंग / बूटस्ट्रैप का भी उपयोग कर सकते हैं, जो अधिक प्रत्यक्ष हो सकता है।
टॉम्का

3
हां, आप उस बारे में सही हैं, @tomka एक एसयूआर मॉडल में (जिसे आप संक्षिप्त रूप से एसईएम मॉडल के एक विशेष मामले पर विचार कर सकते हैं), मैं उचित परीक्षण प्राप्त कर सकता हूं। मुझे उस दिशा में इशारा करने के लिए धन्यवाद! मुझे लगता है कि मैंने इसके बारे में नहीं सोचा था क्योंकि ऐसा लगता है कि तोप के साथ गौरैया की शूटिंग करना थोड़ा मुश्किल है, लेकिन मैं वास्तव में बेहतर तरीके से नहीं सोच सकता। यदि आप कोई उत्तर लिखते हैं, तो मैं इसे सही मानूंगा। अन्यथा, मैं इसे जल्द ही लिखूंगा, एक त्वरित सैद्धांतिक स्पष्टीकरण और संभावित रूप से एक उदाहरण के साथ।
coffeinjunky

1
SUR को लागू करना बहुत आसान है। यहाँ Stata के साथ एक उदाहरण है । आर के साथ, आप सिस्टमफिट चाहते हैं ।
दिमित्री वी। मास्टरोव

जवाबों:


30

हालांकि यह एक सामान्य विश्लेषण नहीं है, यह वास्तव में रुचि में से एक है। स्वीकृत उत्तर आपके प्रश्न को पूछने के तरीके पर फिट बैठता है, लेकिन मैं एक और अच्छी तरह से स्वीकृत तकनीक प्रदान करने जा रहा हूं जो समकक्ष हो सकती है या नहीं भी हो सकती है (मैं उस पर टिप्पणी करने के लिए इसे बेहतर दिमाग में छोड़ दूंगा)।

यह दृष्टिकोण निम्नलिखित Z परीक्षण का उपयोग करने के लिए है:

Z=β1β2(SEβ1)2+(SEβ2)2

कहाँ की मानक त्रुटि है ।βSEββ

यह समीकरण Clogg, CC, Petkova, E., और Haritou, A. (1995) द्वारा प्रदान किया गया है मॉडल के बीच प्रतिगमन गुणांक की तुलना करने के लिए सांख्यिकीय तरीके। अमेरिकन जर्नल ऑफ सोशियोलॉजी , 100 (5), 1261-1293। और पैटरनॉस्टर, आर।, ब्रैम, आर।, मेज़रोल, पी।, और पिकेरो, ए (1998) द्वारा उद्धृत किया गया है प्रतिगमन गुणांक की समानता के लिए सही सांख्यिकीय परीक्षण का उपयोग करना। क्रिमिनोलॉजी , 36 (4), 859-866। समीकरण 4, जो एक पेवेल के लिए मुफ्त उपलब्ध है। मैंने पेटर्नोस्टर के फार्मूले को बजाय का उपयोग करने के लिए अनुकूलित किया हैबी ββbक्योंकि यह संभव है कि आप कुछ भयानक कारण और क्लॉग एट अल की मेरी स्मृति के लिए अलग-अलग डीवी में दिलचस्पी ले सकते हैं। यह था कि उनका सूत्र उपयोग करता था । मुझे यह भी याद है कि कोहेन, कोहेन, वेस्ट, और एकेन के खिलाफ इस फॉर्मूले की जाँच करना और समान सोच की जड़ को गुणांक, समीकरण 2.8.6, पृष्ठ 46-47 के बीच अंतर के विश्वास अंतराल में पाया जा सकता है।β



β1β2
Z=Aβ1Bβ2(SEAβ1)2+(SEBβ2)2

1
इसके अलावा, मैं नोटिस करता हूं कि पेपर उस मामले पर चर्चा करता है जहां एक मॉडल दूसरे के अंदर नेस्टेड है, और डीवी के दो मॉडल समान हैं। अगर ये दोनों शर्तें पूरी नहीं हुईं तो क्या होगा? इसके बजाय, मेरे पास दो मॉडलों के डिजाइन मैट्रीक समान हैं, लेकिन उनके पास अलग-अलग DV हैं। क्या यह सूत्र अभी भी लागू होता है? आपका बहुत बहुत धन्यवाद!
साइब्स जुआ

1
@ सिबेस जुआ: आप अधिक ध्यान आकर्षित करने के लिए अपने आप में एक प्रश्न बनाना चाहते हैं।
रसलपियरस

β1β2

12

समान प्रश्न वाले लोगों के लिए, मुझे उत्तर की एक सरल रूपरेखा प्रदान करें।

y1y2

(y1y2)=(X1  00  X2)(β1β2)+(e1e2)

यह एक भिन्नता-कोवरियन मैट्रिक्स का नेतृत्व करेगा जो दो गुणांकों की समानता के लिए परीक्षण करने की अनुमति देता है।


11
मैंने आपके सुझाए तरीके को लागू किया और इसकी तुलना ऊपर के तरीके से की। मैंने पाया कि अंतर यह है कि त्रुटि विचरण समान है या नहीं। आपका तरीका मानता है कि त्रुटि भिन्नता समान है और ऊपर का तरीका इसे ग्रहण नहीं करता है।
केएच किम

2
इसने मेरे लिए अच्छा काम किया। स्टैटा में, मैंने कुछ ऐसा किया: expand =2, generate(indicator); generate y = cond(indicator, y2, y1); regress y i.indicator##c.X, vce(cluster id); क्लस्टर किए गए मानक त्रुटियों का उपयोग इस तथ्य के लिए किया जाता है कि डेटासेट को स्टैक करने के बाद e1 और e2 समान अवलोकन के लिए स्वतंत्र नहीं हैं।
wkschwartz

1
  • Var(β1β2)=Var(β1)+Var(β2)

  • covar(β1,β2)0

  • (क्लॉग, सीसी, पेटकोवा, ई।, और हरीतौ, ए। (1995)। मॉडल के बीच प्रतिगमन गुणांक की तुलना करने के लिए सांख्यिकीय तरीके। अमेरिकन जर्नल ऑफ सोशियोलॉजी, 100 (5), 1261-1293।) विशेष मामले में एक उत्तर प्रस्तुत करता है। नेस्टेड समीकरणों (यानी, दूसरा समीकरण प्राप्त करने के लिए, पहले समीकरण पर विचार करें और कुछ व्याख्यात्मक चर जोड़ें) वे कहते हैं कि इसे लागू करना आसान है।

  • यदि मैं इसे अच्छी तरह से समझता हूं, तो इस विशेष मामले में, एक हॉसमैन परीक्षण भी लागू किया जा सकता है। मुख्य अंतर यह है कि उनका परीक्षण दूसरे (पूर्ण) समीकरण को सही मानता है, जबकि हौसमैन परीक्षण को पहले समीकरण को सही मानता है।

  • ध्यान दें कि क्लॉग एट अल (1995) पैनल डेटा के लिए अनुकूल नहीं है। लेकिन उनके परीक्षण को सामान्य किया गया है (यान, जे।, एसेल्टीन जूनियर, आरएच, और हरेल, ओ। (2013)। सामान्यीकृत आकलन समीकरणों के साथ क्लस्टर किए गए डेटा के लिए नेस्टेड रैखिक मॉडल के बीच तुलनात्मक प्रतिगमन गुणांक। जर्नल ऑफ एजुकेशनल एंड बिहेवियरल स्टैटिस्टिक्स, 38। (2), 172-189।) आर: जीपैक पैकेज में प्रदान किए गए पैकेज के साथ: https://www.jstor.org/stable/pdf/41999419.pdf?refreqid=excelsior%3Aaa3b20f2bc68223edb59e3254c234be&seq=1

और (R- पैकेज के लिए): https://cran.r-project.org/web/packages/geepack/ind.net.html

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.