एकाधिक प्रतिगमन में एक दबानेवाला यंत्र चर क्या है और दृष्टिगोचर प्रभाव (इसके यांत्रिकी या परिणामों में इसके प्रमाण) को प्रदर्शित करने के तरीके क्या हो सकते हैं? मैं हर उस व्यक्ति को आमंत्रित करना चाहता हूं जिसके पास विचार है, साझा करने के लिए।
एकाधिक प्रतिगमन में एक दबानेवाला यंत्र चर क्या है और दृष्टिगोचर प्रभाव (इसके यांत्रिकी या परिणामों में इसके प्रमाण) को प्रदर्शित करने के तरीके क्या हो सकते हैं? मैं हर उस व्यक्ति को आमंत्रित करना चाहता हूं जिसके पास विचार है, साझा करने के लिए।
जवाबों:
Frequenly उल्लेख regressional प्रभाव जो धारणात्मक अलग हैं लेकिन शेयर में ज्यादा आम में जब विशुद्ध रूप से सांख्यिकीय देखा की एक संख्या मौजूद है (जैसे देखने के इस पत्र । "मध्यस्थता तर्क गुमराह और दमन प्रभाव की समतुल्यता" डेविड MacKinnon एट अल, या विकिपीडिया लेख से):
मैं इस बात पर चर्चा नहीं करने जा रहा हूं कि कुछ या सभी किस हद तक तकनीकी रूप से समान हैं (इसके लिए, ऊपर दिए गए पेपर पढ़ें)। मेरा उद्देश्य ग्राफिक रूप से यह दिखाने की कोशिश करना है कि दबानेवाला व्यक्ति क्या है। उपरोक्त परिभाषा कि "शमन एक चर है जो समावेशन DV पर एक और IV के प्रभाव को मजबूत करता है" मुझे संभावित रूप से व्यापक लगता है क्योंकि यह ऐसी वृद्धि के तंत्र के बारे में कुछ भी नहीं बताता है। नीचे मैं एक तंत्र की चर्चा कर रहा हूं - केवल एक जिसे मैं दमन मानता हूं। यदि अन्य तंत्र भी हैं (जैसे अभी के लिए, मैंने ऐसे किसी अन्य का ध्यान करने की कोशिश नहीं की है) तो या तो उपरोक्त "व्यापक" परिभाषा को अभेद्य माना जाना चाहिए या दमन की मेरी परिभाषा को बहुत संकीर्ण माना जाना चाहिए।
दबानेवाला यंत्र स्वतंत्र चर है, जो मॉडल में जोड़े जाने पर, आर-वर्ग को ज्यादातर इसके बिना मॉडल द्वारा छोड़े गए अवशेषों के लिए लेखांकन के कारण मनाया जाता है, न कि डीवी के साथ अपने स्वयं के जुड़ाव के कारण (जो तुलनात्मक रूप से कमजोर है)। हम जानते हैं कि IV जोड़ने की प्रतिक्रिया में R- वर्ग में वृद्धि उस नए मॉडल में उस IV के वर्ग अंश सहसंबंध है। इस तरह, यदि DV के साथ IV का भाग सहसंबंध उनके बीच के शून्य-क्रम r की तुलना में अधिक (निरपेक्ष मान से) अधिक है, तो यह कि IV एक दबानेवाला यंत्र है।
इसलिए, एक दबानेवाला यंत्र ज्यादातर कम मॉडल की त्रुटि को "दबा देता है", खुद एक भविष्यवक्ता के रूप में कमजोर होता है। त्रुटि शब्द भविष्यवाणी का पूरक है। भविष्यवाणी "पर आधारित है" या "आईवीएस (प्रतिगमन गुणांक) के बीच साझा की है, और इसलिए त्रुटि शब्द (गुणांक के लिए" पूरक) है। दबानेवाला यंत्र ऐसे त्रुटि घटकों को असमान रूप से दबा देता है: कुछ IVs के लिए अधिक, अन्य IV के लिए कम। उन IVs के लिए "जिनके" ऐसे घटक इसे दबाते हैं, यह वास्तव में उनके प्रतिगमन गुणांक को बढ़ाकर काफी सुविधाजनक सहायता देता है ।
मजबूत दबाने वाले प्रभाव अक्सर और बेतहाशा नहीं होते हैं ( इस साइट पर एक उदाहरण )। मजबूत दमन आमतौर पर होशपूर्वक पेश किया जाता है। एक शोधकर्ता एक ऐसी विशेषता की तलाश करता है, जिसे DV के साथ संभवत: कमज़ोर के रूप में संबद्ध करना चाहिए और साथ ही साथ IV के संबंध में कुछ के साथ सहसंबद्ध होना चाहिए जिसे DV के संबंध में अप्रासंगिक, भविष्यवाणी-शून्य माना जाता है। वह इसे मॉडल में प्रवेश करता है और उस IV की भविष्य कहनेवाला शक्ति में काफी वृद्धि करता है। दबाने वाले के गुणांक की आमतौर पर व्याख्या नहीं की जाती है।
मैं अपनी परिभाषा संक्षेप में लिख सकता हूं [ऊपर @ जेक के जवाब और @ गंग की टिप्पणियों पर]]
"सपोर्टर" एक विशिष्ट मॉडल में केवल एक IV की भूमिका है , अलग-अलग चर की विशेषता नहीं। जब अन्य IV को जोड़ा या हटा दिया जाता है, तो दबानेवाला अचानक दबाने या दबाने को रोक सकता है या अपनी दबाने की गतिविधि का ध्यान बदल सकता है।
नीचे दी गई पहली तस्वीर में दो भविष्यवक्ताओं (हम रैखिक प्रतिगमन की बात करेंगे) के साथ एक विशिष्ट प्रतिगमन को दर्शाता है। चित्र यहाँ से कॉपी किया गया है जहाँ इसे और अधिक विवरण में समझाया गया है। संक्षेप में, मध्यम रूप से सहसंबद्ध (= उनके बीच तीव्र कोण होने) भविष्यवक्ता और एक्स 2 स्पैन 2-डिमैशियल स्पेस "प्लेन एक्स"। आश्रित चर वाई orthogonally यह पर पेश किया है, भविष्यवाणी की चर छोड़ने वाई ' और सेंट के साथ बच गया। ई की लंबाई के बराबर विचलन । आर-वर्ग प्रतिगमन के बीच का कोण है Y और Y ', और दो प्रतिगमन गुणांक क्रमशः तिरछा निर्देशांक और बी 2 से संबंधित हैं। इस स्थिति को मैंने सामान्य या विशिष्ट कहा है क्योंकि दोनों एक्स 1 और एक्स 2 वाई के साथ सहसंबंधी हैं (प्रत्येक स्वतंत्र और आश्रित के बीच तिरछा कोण मौजूद है) और भविष्यवक्ता भविष्यवाणी के लिए प्रतिस्पर्धा करते हैं क्योंकि वे सहसंबद्ध हैं।
इसे अगली तस्वीर पर दिखाया गया है। यह एक पहले की तरह है; हालांकि वेक्टर अब दर्शक से कुछ हद तक दूर है और X 2 ने अपनी दिशा को काफी बदल दिया है। एक दबानेवाला के रूप में कार्य करता है। सबसे पहले ध्यान दें कि यह शायद ही साथ संबंध रखता है । इसलिए यह एक मूल्यवान भविष्यवक्ता नहीं हो सकता है। दूसरा। कल्पना करें कि अनुपस्थित है और आप केवल द्वारा भविष्यवाणी ; इस एक-चर प्रतिगमन की भविष्यवाणी को लाल वेक्टर के रूप में दर्शाया गया है , वेक्टर के रूप में त्रुटि , और गुणांक समन्वय द्वारा दिया गया है (जो कि का समापन बिंदु है )। वाई एक्स 2 एक्स 1 वाई ∗ ई ∗ बी ∗ वाई ∗
अब अपने आप को पूर्ण मॉडल पर वापस लाएं और ध्यान दें कि साथ काफी सहसंबद्ध है । इस प्रकार, मॉडल में पेश किए जाने पर , किए गए मॉडल की उस त्रुटि के काफी हिस्से को समझा सकता है, जिससे से तक कट जाता है । यह तारामंडल: (1) करने के लिए एक प्रतिद्वंद्वी नहीं है एक के रूप में कारक ; और (2) , द्वारा गए अनपेक्षितता को लेने के लिए , - एक दबाने वाला बनाता है । इसके प्रभाव के परिणामस्वरूप, की शक्ति कुछ हद तक बढ़ी है:ई * एक्स 2 ई * ई एक्स 2 एक्स 1 एक्स 2 एक्स 1 एक्स 2 एक्स 1 ख 1 ख * से बड़ा है ।
ठीक है, क्यों है करने के लिए एक शमन कहा जाता और यह कि यह कैसे को सुदृढ़ कर सकते हैं जब "दबा" यह? अगली तस्वीर को देखिए।एक्स 1
यह पूर्व की तरह ही है। एकल भविष्यवक्ता मॉडल के बारे में फिर से । इस भविष्यवक्ता को दो भागों या घटकों (ग्रे में दिखाया गया है) में विघटित किया जा सकता है: वह भाग जो भविष्यवाणी के लिए "जिम्मेदार" है (और इस तरह उस वेक्टर के साथ मेल खाता है) और वह हिस्सा जो अप्रत्याशितता के लिए "जिम्मेदार" है (और इस प्रकार ) के समानांतर । यह का यह दूसरा भाग है - लिए अप्रासंगिक हिस्सा - द्वारा दबाया जाता है जब उस दबानेवाला को मॉडल में जोड़ा जाता है। अप्रासंगिक भाग को दबा दिया जाता है और इस प्रकार, यह देखते हुए कि दबानेवाला यंत्र खुद भविष्यवाणी नहीं करता है वाई ई * एक्स 1 वाई एक्स 2 Yकिसी भी, संबंधित हिस्सा मजबूत दिखता है। एक दबानेवाला एक भविष्यवक्ता नहीं है, बल्कि एक अन्य / अन्य भविष्यवक्ता / s के लिए एक सुविधा है। क्योंकि यह भविष्यवाणी करने के लिए उन्हें किस चीज के साथ प्रतिस्पर्धा करता है।
यह दमनकर्ता और त्रुटि चर बीच सहसंबंध का संकेत है जो कम (बिना-दबाने वाला) मॉडल द्वारा छोड़ा गया है। ऊपर चित्रण में, यह सकारात्मक है। अन्य सेटिंग्स में (उदाहरण के लिए, की दिशा को वापस करें ) यह नकारात्मक हो सकता है।एक्स 2
एक वैरिएबल जोड़ना जो एक सुपरसॉर की सेवा करेगा और साथ ही कुछ अन्य चर के गुणांक के संकेत को नहीं बदल सकता है। "दमन" और "परिवर्तन संकेत" प्रभाव एक ही बात नहीं है। इसके अलावा, मेरा मानना है कि एक दबानेवाला व्यक्ति उन भविष्यवक्ताओं के संकेत को कभी नहीं बदल सकता है जिन्हें वे दबाने वाले की सेवा करते हैं। (यह एक चर को सुविधाजनक बनाने के लिए दबाने के लिए एक चौंकाने वाली खोज होगी और फिर इसे खोजने के लिए कि यह वास्तव में मजबूत हो सकती है, लेकिन विपरीत दिशा में है! मैं आभारी हूं कि अगर कोई मुझे दिखा सकता है तो यह संभव है।)
सामान्य प्रतिगामी स्थिति को अक्सर वेन आरेख की मदद से समझाया जाता है।
y x1 x2
1.64454000 .35118800 1.06384500
1.78520400 .20000000 -1.2031500
-1.3635700 -.96106900 -.46651400
.31454900 .80000000 1.17505400
.31795500 .85859700 -.10061200
.97009700 1.00000000 1.43890400
.66438800 .29267000 1.20404800
-.87025200 -1.8901800 -.99385700
1.96219200 -.27535200 -.58754000
1.03638100 -.24644800 -.11083400
.00741500 1.44742200 -.06923400
1.63435300 .46709500 .96537000
.21981300 .34809500 .55326800
-.28577400 .16670800 .35862100
1.49875800 -1.1375700 -2.8797100
1.67153800 .39603400 -.81070800
1.46203600 1.40152200 -.05767700
-.56326600 -.74452200 .90471600
.29787400 -.92970900 .56189800
-1.5489800 -.83829500 -1.2610800
रैखिक प्रतिगमन परिणाम:
वैसे, चुकता भाग सहसंबंधों का योग आर-वर्ग से अधिक था: .4750^2+(-.2241)^2 = .2758 > .2256
जो सामान्य प्रतिगामी स्थिति में नहीं होगा ( ऊपर वेन आरेख देखें )।
PS अपना उत्तर पूरा करने के बाद मुझे यह उत्तर (@gung द्वारा) एक अच्छे सरल (योजनाबद्ध) आरेख के साथ मिला, जो मुझे वैक्टरों द्वारा ऊपर दिखाए गए चीज़ों के अनुरूप प्रतीत होता है।
यहाँ दमन का एक और ज्यामितीय दृश्य है, लेकिन @ ttnphns के उदाहरण के रूप में अवलोकन स्थान में होने के बजाय , यह एक चर स्थान में है , वह स्थान जहाँ रोज़ स्कैल्पल रहते हैं।
हम अपने प्रतिगमन समीकरण को इस तरह दिखने वाले चर स्थान में एक विमान के रूप में प्लॉट कर सकते हैं:
यदि आप इन उदाहरणों के साथ खेलना चाहते हैं, तो उदाहरण मानों के अनुरूप डेटा उत्पन्न करने और विभिन्न प्रतिगमन चलाने के लिए कुछ आर कोड है।
library(MASS) # for mvrnorm()
set.seed(7310383)
# confounding case --------------------------------------------------------
mat <- rbind(c(5,1.5,1.5),
c(1.5,1,.5),
c(1.5,.5,1))
dat <- data.frame(mvrnorm(n=50, mu=numeric(3), empirical=T, Sigma=mat))
names(dat) <- c("y","x","z")
cor(dat)
# y x z
# y 1.0000000 0.6708204 0.6708204
# x 0.6708204 1.0000000 0.5000000
# z 0.6708204 0.5000000 1.0000000
lm(y ~ x, data=dat)
#
# Call:
# lm(formula = y ~ x, data = dat)
#
# Coefficients:
# (Intercept) x
# -1.57e-17 1.50e+00
lm(y ~ x + z, data=dat)
#
# Call:
# lm(formula = y ~ x + z, data = dat)
#
# Coefficients:
# (Intercept) x z
# 3.14e-17 1.00e+00 1.00e+00
# @ttnphns comment: for x, zero-order r = .671 > part r = .387
# for z, zero-order r = .671 > part r = .387
lm(x ~ z, data=dat)
#
# Call:
# lm(formula = x ~ z, data = dat)
#
# Coefficients:
# (Intercept) z
# 6.973e-33 5.000e-01
# suppression case --------------------------------------------------------
mat <- rbind(c(2,.5,.5),
c(.5,1,-.5),
c(.5,-.5,1))
dat <- data.frame(mvrnorm(n=50, mu=numeric(3), empirical=T, Sigma=mat))
names(dat) <- c("y","x","z")
cor(dat)
# y x z
# y 1.0000000 0.3535534 0.3535534
# x 0.3535534 1.0000000 -0.5000000
# z 0.3535534 -0.5000000 1.0000000
lm(y ~ x, data=dat)
#
# Call:
# lm(formula = y ~ x, data = dat)
#
# Coefficients:
# (Intercept) x
# -4.318e-17 5.000e-01
lm(y ~ x + z, data=dat)
#
# Call:
# lm(formula = y ~ x + z, data = dat)
#
# Coefficients:
# (Intercept) x z
# -3.925e-17 1.000e+00 1.000e+00
# @ttnphns comment: for x, zero-order r = .354 < part r = .612
# for z, zero-order r = .354 < part r = .612
lm(x ~ z, data=dat)
#
# Call:
# lm(formula = x ~ z, data = dat)
#
# Coefficients:
# (Intercept) z
# 1.57e-17 -5.00e-01
R
, मैंने ऊपर दिए गए कोड का उपयोग करके उत्पन्न दो डेटासेट अपलोड किए हैं, जिन्हें आप अपनी पसंद के आँकड़े पैकेज का उपयोग करके डाउनलोड और विश्लेषण कर सकते हैं। लिंक हैं: (1) psych.colorado.edu/~westfaja/confounding.csv (2) psych.colorado.edu/ ~westfaja/suppression.csv । मैं एक बीज जोड़ूंगा, मुझे लगता है।
यहां बताया गया है कि मैं कैसे दमनकारी प्रभाव के बारे में सोचता हूं। लेकिन कृपया मुझे बताएं कि क्या मैं गलत हूं।
यहां एक द्विआधारी परिणाम (वर्गीकरण, लॉजिस्टिक प्रतिगमन) का एक उदाहरण है। हम देख सकते हैं कि X1 में कोई महत्वपूर्ण अंतर नहीं है, X2 में कोई अंतर नहीं है, लेकिन X1 और X2 को एक साथ रखें (यानी X2 या इसके विपरीत के लिए सही X1) और नमूनों को लगभग पूरी तरह से वर्गीकृत किया जा सकता है और इस प्रकार चर अब अत्यधिक महत्वपूर्ण हैं ।