ठीक है, चलो अपनी स्थिति को देखो। आपके पास मूल रूप से दो प्रतिगमन (APD = एटरो-पोस्टीरियर व्यास, NOL = नासो-ओसीपिटल लंबाई, HL = कम लंबाई) है:
- A Pडी = β0 , 1+ β1 , 1⋅ एनओ एल
- एचल = β0 , 2+ β1 , 2⋅ एनओ एल
परिकल्पना परीक्षण करने के लिए , आप निम्नलिखित कार्य कर सकते हैं:β1 , 1= β1 , 2
- केवल को एचएल में जोड़कर एक नया आश्रित चर ( ) बनाएंYएन ई डब्ल्यू
- अपने आप को NOL ( ) जोड़कर एक नया स्वतंत्र चर बनाएं (यानी NOL की नकल करते हुए)एक्सएन ई डब्ल्यू
- एक डमी वैरिएबल ( ) बनाएं जो 1 है यदि डेटा दूसरे डेटासेट (HL) के साथ आया है और 0 यदि डेटा पहले डेटासेट (APD) से आया है।डी
- निर्भर चर के रूप में साथ प्रतिगमन की गणना करें , और मुख्य प्रभाव और और डमी चर बीच बातचीत को व्याख्यात्मक चर के रूप में। EDIT @Jake वेस्टफॉल ने बताया कि अवशिष्ट मानक त्रुटि प्रत्येक DV के लिए दो रजिस्टरों के लिए अलग हो सकती है। जेक ने उत्तर प्रदान किया जो एक सामान्यीकृत न्यूनतम वर्ग मॉडल (जीएलएस) को फिट करने के लिए है जो अवशिष्ट मानक त्रुटि को दो रजिस्टरों के बीच अंतर करने की अनुमति देता है। X n e w DYएन ई डब्ल्यूएक्सएन ई डब्ल्यूडी
आइए बने हुए डेटा (इन R
) के साथ एक उदाहरण देखें :
# Create artificial data
library(nlme) # needed for the generalized least squares
set.seed(1500)
NOL <- rnorm(10000,100,12)
APD <- 10 + 15*NOL+ rnorm(10000,0,2)
HL <- - 2 - 5*NOL+ rnorm(10000,0,3)
mod1 <- lm(APD~NOL)
mod1
Coefficients:
(Intercept) NOL
10.11 15.00
mod2 <- lm(HL~NOL)
mod2
Coefficients:
(Intercept) NOL
-1.96 -5.00
# Combine the dependent variables and duplicate the independent variable
y.new <- c(APD, HL)
x.new <- c(NOL, NOL)
# Create a dummy variable that is 0 if the data are from the first data set (APD) and 1 if they are from the second dataset (HL)
dummy.var <- c(rep(0, length(APD)), rep(1, length(HL)))
# Generalized least squares model allowing for differend residual SDs for each regression (strata of dummy.var)
gls.mod3 <- gls(y.new~x.new*dummy.var, weights=varIdent(form=~1|dummy.var))
Variance function:
Structure: Different standard deviations per stratum
Formula: ~1 | dummy.var
Parameter estimates:
0 1
1.000000 1.481274
Coefficients:
Value Std.Error t-value p-value
(Intercept) 10.10886 0.17049120 59.293 0
x.new 14.99877 0.00169164 8866.430 0
dummy.var -12.06858 0.30470618 -39.607 0
x.new:dummy.var -19.99917 0.00302333 -6614.939 0
नोट: लिए अवरोधन और ढलान पहले प्रतिगमन (mod1) के समान ही हैं। गुणांक दो रजिस्ट्रियों के अवरोधन के बीच अंतर को दर्शाता है। इसके अलावा: दूसरे प्रतिगमन के अवशिष्ट मानक विचलन का अनुमान पहले के एसडी (लगभग 1.5 गुना बड़ा) से बड़ा था। यह वही है जो हमने डेटा की पीढ़ी (2 बनाम 3) में निर्दिष्ट किया है। हम लगभग वहाँ हैं: सहभागिता शब्द का गुणांक ढलानों की समानता का परीक्षण करता है। यहाँ दूसरे प्रतिगमन (mod2) का ढलान लगभग या लगभग । का अंतर β एक्स । एन ई डब्ल्यू - β एक्स । n ई डब्ल्यू × घ यू मी मी y । v a r 15 - 20 = - 5 20एक्सएन ई डब्ल्यूdummy.var
x.new:dummy.var
βx । एन ई डब्ल्यू- βx । एन ई डब्ल्यू × डीयू एम एम वाई। v एक आर15 - 20 = - 520जब हमने डेटा जनरेट किया है तो ठीक यही हमने निर्दिष्ट किया है। यदि आप स्टैटा में काम करते हैं, तो यहां एक अच्छी व्याख्या है।
चेतावनी: यह केवल तभी काम करता है जब एटरो-पोस्टीरियर व्यास और नासो-ओसीपिटल लंबाई (दो आश्रित चर) स्वतंत्र हों। अन्यथा यह बहुत जटिल हो सकता है।
संपादित करें
साइट पर ये दो पोस्ट एक ही सवाल से निपटते हैं: पहला और दूसरा ।