स्पष्ट और निरंतर चर के बीच बातचीत के गुणांक की व्याख्या करना


10

मेरे पास निरंतर और श्रेणीगत चर के बीच बातचीत के गुणांकों की व्याख्या के बारे में एक प्रश्न है। यहाँ मेरा मॉडल है:

model_glm3=glm(cog~lg_hag+race+pdg+sex+as.factor(educa)+(lg_hag:as.factor(educa)), 
               data=base_708)

Coefficients:
                         Estimate Std. Error t value Pr(>|t|)    
(Intercept)               21.4836     2.0698  10.380  < 2e-16 ***
lg_hag                     8.5691     3.7688   2.274  0.02334 *  
raceblack                 -8.4715     1.7482  -4.846 1.61e-06 ***
racemexican               -3.0483     1.7073  -1.785  0.07469 .  
racemulti/other           -4.6002     2.3098  -1.992  0.04687 *  
pdg                        2.8038     0.4268   6.570 1.10e-10 ***
sexfemale                  4.5691     1.1203   4.078 5.15e-05 ***
as.factor(educa)2         13.8266     2.6362   5.245 2.17e-07 ***
as.factor(educa)3         21.7913     2.4424   8.922  < 2e-16 ***
as.factor(educa)4         19.0179     2.5219   7.541 1.74e-13 ***
as.factor(educa)5         23.7470     2.7406   8.665  < 2e-16 ***
lg_hag:as.factor(educa)2 -21.2224     6.5904  -3.220  0.00135 ** 
lg_hag:as.factor(educa)3 -19.8083     6.1255  -3.234  0.00129 ** 
lg_hag:as.factor(educa)4  -8.5502     6.6018  -1.295  0.19577    
lg_hag:as.factor(educa)5 -17.2230     6.3711  -2.703  0.00706 ***

मान लें कि मॉडल का समीकरण है:

E [cog] = a + b1 (lg_hag) + b2 (educationa2 * lg_hag) + b3 (educationa3 * lg_hag) + b4 (educationa4 * lg_hag) +5 (pdg, केंद्रित) + अन्य covars, जहाँ

b1 = difference in cog  with higher lg_hag among lowest education (coded as 1)
b1 + b2 = difference in cog with higher lg_hag among middle education (coded as 2)
b1 + b3 = difference in cog with higher lg_hag among high education (coded as 3)
b1 + b3 = difference in cog with higher lg_hag among very high education (coded as 4)
b5 = difference in cog with each unit increase in pdg

मेरा प्रश्न है: यदि मेरी व्याख्या सही है, तो बी 1 और बी 2 के आत्मविश्वास अंतराल से बातचीत के प्रत्येक प्रभाव अनुमान (जैसे: बी 1 + बी 2) के लिए आत्मविश्वास अंतराल का निर्माण कैसे करें।


इस बात से बहुत परिचित नहीं हैं कि आर।
सोस

जवाबों:


8

मॉडल के गुणांक की आपकी व्याख्या पूरी तरह से सटीक नहीं है। मुझे पहले मॉडल की शर्तों को संक्षेप में बताएं।

श्रेणीबद्ध चर (कारक): race, sex, तथा educa

कारक raceके चार स्तर हैं:race={white,black,mexican,multi/other}

कारक sexके दो स्तर हैं:sex={male,female}

कारक educaके पांच स्तर हैं:educa={1,2,3,4,5}

डिफ़ॉल्ट रूप से, R श्रेणीबद्ध चर के लिए उपचार विरोधाभासों का उपयोग करता है। इन विरोधाभासों में, कारक का पहला मान एक संदर्भ स्तर का उपयोग किया जाता है और शेष मानों को संदर्भ के खिलाफ परीक्षण किया जाता है। एक श्रेणीगत चर के लिए विरोधाभासों की अधिकतम संख्या के स्तर की संख्या शून्य से एक है।

raceनिम्नलिखित अंतरों के परीक्षण के लिए विरोधाभास : race=black vs.race=white, race=mexican vs.race=white, तथा race=multi/other vs.race=white

कारक के लिए educa, संदर्भ स्तर है 1विरोधाभासों का पैटर्न सादृश्य है। इन प्रभावों की व्याख्या आश्रित चर के अंतर के रूप में की जा सकती है। आपके उदाहरण में, का औसत मूल्य cogहै13.8266 इकाइयों के लिए उच्च educa=2 की तुलना में educa=1( as.factor(educa)2)।

एक महत्वपूर्ण नोट: यदि एक मॉडल में एक श्रेणीगत चर के लिए उपचार विरोधाभास मौजूद हैं, तो आगे के प्रभावों का अनुमान श्रेणीगत चर के संदर्भ स्तर पर आधारित है यदि आगे के प्रभाव और श्रेणीगत चर के बीच बातचीत भी शामिल है। यदि वैरिएबल किसी इंटरैक्शन का हिस्सा नहीं है, तो इसका गुणांक इस वेरिएबल के अलग-अलग ढलानों के औसत के साथ सभी शेष श्रेणीगत चरों के साथ मेल खाता है। इसके प्रभावrace तथा educaअन्य चर के कारक स्तरों के संबंध में औसत प्रभावों के अनुरूप। के समग्र प्रभावों का परीक्षण करने के लिएrace, आपको छोड़ने की आवश्यकता होगी educa तथा sex मॉडल से बाहर।

संख्यात्मक चर: lg_hag तथा pdg

दोनों lg_hagऔर pdgसंख्यात्मक चर हैं इसलिए गुणांक वृद्धि की वृद्धि के साथ जुड़े निर्भर चर में परिवर्तन का प्रतिनिधित्व करते हैं1 पूर्वसूचक में।

सिद्धांत रूप में, इन प्रभावों की व्याख्या सीधी है। लेकिन ध्यान दें कि यदि हस्तक्षेप मौजूद हैं, तो गुणांक का अनुमान कारकों के संदर्भ श्रेणियों (यदि उपचार विरोधाभासी कार्यरत हैं) पर आधारित है। जबसेpdgएक सहभागिता का हिस्सा नहीं है, इसके गुणांक में सम्मान के साथ चर के औसत ढलान है। चरlg_hag के साथ बातचीत का भी हिस्सा है educa। इसलिए, इसका प्रभाव पड़ता हैeduca=1, आधार स्तर ;; यह संख्यात्मक चर के समग्र प्रभाव का परीक्षण नहीं हैlg_hag कारकों के स्तर के बावजूद।

श्रेणीबद्ध और संख्यात्मक चर के बीच बातचीत: lg_hag×educa

मॉडल में न केवल मुख्य प्रभाव शामिल हैं, बल्कि संख्यात्मक चर के बीच बातचीत भी शामिल है lg_hag और चार विरोधाभासों के साथ जुड़े educa। इन प्रभावों की व्याख्या ढलानों में अंतर के रूप में की जा सकती हैlg_hag के एक निश्चित स्तर के बीच educa और संदर्भ स्तर (educa=1)।

उदाहरण के लिए, गुणांक lg_hag:as.factor(educa)2( -21.2224) का अर्थ है कि ढलानlg_hag है 21.2224 इकाइयों के लिए कम है educa=2 की तुलना में educa=1


"ये इंटरैक्शन गुणांक भी race=whiteऔर sex=maleकेवल के लिए पकड़ते हैं ।" क्या आप इस बारे में निश्चित हैं? मैं पूछता हूं क्योंकि न तो raceऔर न ही शब्द के sexसाथ बातचीत में है lg_hag×educa... मैं कई ग्रंथों को देख रहा हूं जिन्हें मैं स्पष्ट रूप से इंगित नहीं करता हूं।
लैंड्रोनी

2
@landroni ढलान उस बिंदु के लिए अनुमानित हैं जहां सभी शेष भविष्यवाणियां 0. के बराबर हैं।
स्वेन होइनस्टीन

हाँ, यह मेरी भी समझ है। अन्य सभी भविष्यवाणियों को स्थिर रखा जाता है, जिसका अर्थ है कि कारक उनके आधारभूत स्तर पर तय होते हैं। लेकिन इसमें मेरी पहेली निहित है: मैंने कई किताबों पर ध्यान दिया है जो इस सूक्ष्म लेकिन दूरगामी बारीकियों पर ज़्यादातर नज़र आती हैं। इसके अलावा, कागजात अक्सर "उद्योग द्वारा नियंत्रण" के रूप में निष्कर्ष निकालते हैं जैसे कि गुणांक पूर्ण नमूने पर बिना शर्त के थे, बल्कि यह बताता
लैंड्रोनी 19

1
"यदि उपचार संबंधी चर एक मॉडल में मौजूद हैं, तो आगे के प्रभावों का अनुमान श्रेणीगत चर के संदर्भ स्तर पर आधारित है।" आगे विचार करने के बाद, मैं आश्वस्त नहीं हूं (या मैं आपके तर्क का पूरी तरह से पालन नहीं करता हूं)। आपको यह प्रतीत होता है कि उदाहरण के लिए बीटा का अनुमान pdgसंदर्भ स्तर पर निर्भर करता है, जो स्पष्ट रूप से ऐसा नहीं है। यदि मैं किसी भी कारक (जैसे sex) के संदर्भ स्तर को बदल देता हूं , तो अनुमान pdgनहीं बदलेगा ...
लैंड्रोनी

1
@landroni इशारा करने के लिए धन्यवाद। आप सही हैं, यह कथन भ्रामक है। दरअसल, यह केवल उन भविष्यवाणियों के लिए है जो श्रेणीबद्ध चर के साथ बातचीत की शर्तों का भी हिस्सा हैं। इसलिए, का अनुमान pdgवास्तव में विरोधाभासों के विनिर्देश पर निर्भर नहीं करता है। मैं तदनुसार उत्तर को संशोधित करूंगा।
स्वेन हॉन्स्टीन
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.