गुणांक के बीच महत्वपूर्ण अंतर के लिए परीक्षण करने का सही तरीका क्या है?


18

मुझे उम्मीद है कि कोई मेरे लिए भ्रम की स्थिति को सीधा करने में मदद कर सकता है। कहो मैं परीक्षण करना चाहता हूं कि क्या प्रतिगमन गुणांक के 2 सेट एक दूसरे से काफी अलग हैं, निम्नलिखित सेट के साथ:

  • yi=α+βxi+ϵi , जिसमें 5 स्वतंत्र चर हैं।
  • 2 समूह, लगभग समान आकार (हालांकि यह भिन्न हो सकते हैं)n1,n2
  • हजारों समान प्रतिगमन एक साथ किए जाएंगे, इसलिए किसी प्रकार की कई परिकल्पना में सुधार करना होगा।

एक दृष्टिकोण जो मुझे सुझाया गया था वह एक जेड-परीक्षण का उपयोग करना है:

Z=b1b2(SEb12+SEb22)

एक और जो मैंने इस बोर्ड पर सुझाया है वह है कि समूह के लिए एक डमी चर पेश करना और मॉडल को फिर से लिखना:

yi=α+βxi+δ(xigi)+ϵi , जहाँ को समूहीकरण चर, 0 के रूप में कोडित किया जाता है।g

मेरा सवाल यह है कि ये दोनों अलग-अलग कैसे हैं (जैसे अलग-अलग धारणाएँ, लचीलापन)? क्या एक दूसरे से अधिक उपयुक्त है? मुझे संदेह है कि यह बहुत बुनियादी है, लेकिन किसी भी स्पष्टीकरण की बहुत सराहना की जाएगी।


मेरा मानना ​​है कि इसी तरह के सवाल के जवाब और टिप्पणियां आपको चाहने वाले स्पष्टीकरण प्रदान कर सकती हैं।
whuber

शुक्रिया शुक्रिया। मैं उस जवाब से परिचित था। स्वीकृत उत्तर के नीचे चर्चा से (और वहां आपकी टिप्पणी) मुझे इस धारणा के साथ छोड़ दिया गया कि 2 अलग-अलग फिट के गुणांक की तुलना करना उचित नहीं था। क्या अलग-अलग फिट से गुणांक पर लागू जेड-टेस्ट गलत है या यह है कि डमी वेरिएबल कोडिंग बस आसान है और एक समकक्ष उत्तर प्रदान करता है?

1
कृपया मेरे उत्तर का अंतिम पैराग्राफ देखें ("मुख्य सीमा ...")। Z- परीक्षण मान्य है बड़े हैं (अन्यथा परीक्षण में उपयोग) और अनुमानित मानक विचलन एक दूसरे से बहुत अलग नहीं हैं। न तो दृष्टिकोण सबसे अच्छा है जब मानक विचलन बहुत भिन्न होता है (मोटे तौर पर, 3: 1 के अनुपात से अधिक)। S E b iniSEbi
whuber

जवाबों:


13

दो दृष्टिकोण अलग हैं।

बता दें कि दो की अनुमानित मानक त्रुटियां और । फिर, क्योंकि संयुक्त प्रतिगमन (सभी गुणांक-डमी इंटरैक्शन के साथ) एक ही गुणांक फिट बैठता है, इसमें एक ही अवशिष्ट है, जहां इसकी मानक त्रुटि की गणना की जा सकती हैs 2s1s2

s=(n1p)s12+(n2p)s22)n1+n22p.

पैरामीटर की संख्या उदाहरण में 6 के बराबर होती है : पांच ढलान और प्रत्येक प्रतिगमन में एक अवरोधन।p6

को एक प्रतिगमन में एक पैरामीटर का अनुमान लगाने दें, बी 2 दूसरे प्रतिगमन में एक ही पैरामीटर का अनुमान लगाते हैं , और संयुक्त में उनके अंतर का अनुमान लगाते हैं । तब उनकी मानक त्रुटियां संबंधित होती हैंb1 बीb2b

SE(b)=s(SE(b1)/s1)2+(SE(b2)/s2)2.

यदि आपने संयुक्त प्रतिगमन नहीं किया है, लेकिन केवल पृथक प्रतिगमन के आंकड़े हैं, तो लिए पूर्ववर्ती समीकरण में प्लग करें । यह टी-टेस्ट के लिए भाजक होगा। जाहिर तौर पर यह प्रश्न में प्रस्तुत भाजक के समान नहीं है।s

संयुक्त प्रतिगमन द्वारा बनाई गई धारणा यह है कि दोनों अलग-अलग रजिस्टरों में अवशिष्टों के प्रकार अनिवार्य रूप से समान हैं। यदि यह मामला नहीं है, हालांकि, z- परीक्षण अच्छा नहीं होने जा रहा है, या तो (जब तक कि नमूना आकार बड़ा न हो): आप CABF परीक्षण या वेल्च- सटरथाइट टी परीक्षण का उपयोग करना चाहेंगे


9

दो समूहों के बीच गुणांक में अंतर के लिए परीक्षण करने का सबसे सीधा तरीका अपने प्रतिगमन में एक इंटरैक्शन शब्द शामिल करना है , जो आपके प्रश्न में वर्णित लगभग है। आपके द्वारा चलाया जाने वाला मॉडल निम्नलिखित है:

yi=α+βxi+γgi+δ(xi×gi)+εi

ध्यान दें कि मैंने समूह चर को मॉडल में एक अलग रजिस्ट्रार के रूप में शामिल किया है। इस मॉडल, एक साथ शून्य परिकल्पना के साथ टेस्ट गुणांक दो समूहों के बीच एक ही होने का एक परीक्षण है। इसे देखने के लिए, पहले उपरोक्त मॉडल में दें । फिर, हमें समूह 0 के लिए निम्नलिखित समीकरण मिलता है:एच 0 : δ = 0 जी मैं = 0tH0:δ=0gi=0

yi=α+βxi+εi

अब, अगर , तो हमारे पास है:gi=1

yi=(α+γ)+(β+δ)xi+εi

इस प्रकार, जब 0 होता है, तो दो समूहों में समान गुणांक होता है।δ


मॉडल को सही करने के लिए धन्यवाद (मेरा मानना ​​है कि ऊपर दिए गए मेरे संस्करण का अर्थ है कि अवरोधन दोनों समूहों में समान है ...)। इस बिंदु पर अधिक, क्या यह मेरे द्वारा ऊपर पोस्ट किए गए z- परीक्षण के बराबर होगा?
कैश

यदि कोई यह परीक्षण करना चाहता है कि क्या प्रभाव दो से अधिक समूहों के बीच भिन्न है, तो क्या कोई ANOVA मॉडल की तुलना करेगा और इस उत्तर में दिखाया गया उपयुक्त होना चाहिए? yi=α+βxi+γgi+εiyi=α+βxi+γgi+δ(xi×gi)+εi
मिउरा

@ मैट-ब्लैकवेल यह वैचारिक रूप से जी के प्रत्येक मूल्य द्वारा मॉडल को स्तरीकृत करने के समान है? (यानी। बी x का गुणांक होगा जब g = 0, और बीटा + डेल्टा जब g = 1 होगा) हालांकि मैं सराहना करता हूं कि स्तरीकरण सांख्यिकीय तुलना की अनुमति नहीं देता है।
bobmcpop
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.