क्या होगा अगर बातचीत प्रतिगमन में मेरे प्रत्यक्ष प्रभावों को मिटा देती है?


25

एक प्रतिगमन में, बातचीत शब्द दोनों संबंधित प्रत्यक्ष प्रभावों को मिटा देता है। क्या मैं बातचीत को छोड़ देता हूं या परिणाम की रिपोर्ट करता हूं? बातचीत मूल परिकल्पना का हिस्सा नहीं थी।


6
यदि आप अपने प्रयोगात्मक डिजाइन, शोध प्रश्न और सांख्यिकीय मॉडल के बारे में अधिक जानकारी प्रदान करते हैं, तो आपको बेहतर उत्तर मिल सकता है।
डेविड लेबॉउर

मेरे पास सर्वेक्षण डेटा है, v1 और v2 परिणाम की भविष्यवाणी करते हैं, जैसा कि मुझे उम्मीद थी; हालाँकि, v1 (डाइकोटोमस) और v2 (5 समूह) के बीच की बातचीत महत्वपूर्ण नहीं है - और (मेरा सवाल) यह मेरे v1 और v2 के प्रत्यक्ष प्रभाव को भी महत्वपूर्ण बनाता है। मुझे साहित्य में इसकी रिपोर्ट करने पर कोई उदाहरण नहीं मिला।
जेन

यदि v1: v2 इंटरैक्शन महत्वपूर्ण नहीं है, तो क्या आपको इसे मॉडल में शामिल करने की आवश्यकता है?
क्रिस्टोफर एडन

शायद यह सवाल प्रासंगिक है? आंकड़े.stackexchange.com/questions/5184/…
Glen

एक अन्य संभावना विरोधाभासी उलझन है: उदाहरण 1: epm.sagepub.com/content/56/3/430.abstract उदाहरण 2: इष्टतमप्रतिष्ठा.com
pdf

जवाबों:


24

मुझे लगता है कि यह एक मुश्किल है; जैसा कि आप संकेत देते हैं, यहां 'नैतिक खतरा' है: यदि आपने बातचीत को बिल्कुल नहीं देखा था, तो आप स्वतंत्र और स्पष्ट होंगे, लेकिन अब आपके पास डेटा-ड्रेजिंग का संदेह है अगर आप इसे छोड़ देते हैं।

कुंजी संभवतः आपके प्रभावों के अर्थ में एक बदलाव है जब आप मुख्य प्रभाव-केवल बातचीत मॉडल से जाते हैं। 'मुख्य प्रभाव' के लिए आपको जो मिलता है, वह इस बात पर बहुत निर्भर करता है कि आपके उपचार और विरोधाभासों को किस प्रकार कोडित किया गया है। आर में, डिफ़ॉल्ट पहले कारक स्तरों (वर्णमाला क्रम में पहले नाम वाले लोगों के साथ उपचार विपरीत है जब तक कि आप बेसलाइन स्तरों के रूप में उन्हें अलग तरीके से कोड करने के लिए अपने तरीके से बाहर नहीं गए हैं)।

कहें (सादगी के लिए) कि आपके पास प्रत्येक कारक के लिए दो स्तर हैं, 'नियंत्रण' और 'टीआरटी'। बातचीत के बिना, 'v1.trt' पैरामीटर का अर्थ (उपचार विरोधाभासों को आर के रूप में डिफ़ॉल्ट है) "v1.control 'और' v1.trt 'समूह के बीच औसत अंतर है; 'v2.trt' पैरामीटर का अर्थ "v2.control 'और' v2.trt 'के बीच औसत अंतर है"।

इंटरैक्शन के साथ, 'v1.trt' 'v2.control' समूह में 'v1.control' और 'v1.trt' के बीच औसत अंतर है, और इसी तरह 'v2.trt' v2 समूहों के बीच औसत अंतर है। 'v1.control' समूह। इस प्रकार, यदि आपके नियंत्रण समूहों में से प्रत्येक में काफी छोटे उपचार प्रभाव हैं, लेकिन उपचार समूहों में एक बड़ा प्रभाव है, तो आप आसानी से देख सकते हैं कि आप क्या देख रहे हैं।

एकमात्र तरीका मैं इसे महत्वपूर्ण अंतःक्रियात्मक अवधि के बिना देख रहा हूं , हालांकि, यदि सभी प्रभाव काफी कमजोर हैं (ताकि आप वास्तव में "गायब हुए प्रभाव" से क्या मतलब है, तो आप p = 0.06 से p = 0.04 पर चले गए) जादुई महत्व रेखा के पार)।

एक और संभावना यह है कि आप 'स्वतंत्रता के कई डिग्री का उपयोग कर रहे हैं' - यानी, पैरामीटर का अनुमान वास्तव में इतना नहीं बदलता है, लेकिन अवशिष्ट त्रुटि शब्द एक और 4 का अनुमान लगाने के लिए पर्याप्त रूप से फुलाया जाता है [= (2- 1) * (5-1)] ऐसे पैरामीटर जो आपके महत्वपूर्ण शब्द गैर-महत्वपूर्ण हो जाते हैं। फिर, मैं केवल एक छोटे डेटा सेट / अपेक्षाकृत कमजोर प्रभावों के साथ इसकी उम्मीद करूंगा।

एक संभावित समाधान सम विषमों को स्थानांतरित करना है, हालांकि यह भी नाजुक है - आपको यह आश्वस्त होना होगा कि 'औसत प्रभाव' आपके मामले में सार्थक है। सबसे अच्छी बात यह है कि अपने डेटा को प्लॉट करें और गुणांक को देखें और समझें कि अनुमानित मापदंडों के संदर्भ में क्या हो रहा है।

उम्मीद है की वो मदद करदे।


4
कोई नैतिक खतरा नहीं है। शामिल बातचीत के साथ मुख्य प्रभावों की गणना इसके बिना गणना से काफी अलग है। आपको मुख्य प्रभावों की रिपोर्ट करने के लिए एडिटिव मॉडल करना होगा और फिर एक अलग मॉडल में बातचीत को शामिल करना होगा। आप मॉडल में मुख्य प्रभावों को अनदेखा करते हैं जिसमें इंटरैक्शन शामिल है क्योंकि वे वास्तव में मुख्य प्रभाव नहीं हैं, वे अन्य भविष्यवक्ताओं (बातचीत सहित) के विशिष्ट स्तरों पर प्रभाव डालते हैं।
जॉन

जॉन: एक, उस तर्क से, एक द्विघात अंतःक्रियात्मक प्रभाव / मॉडरेटिंग प्रभाव (यानी, (1) मुख्य प्रभाव सहित, (2) उन मुख्य प्रभावों में और 2 (एक द्विघात) के बीच बातचीत का आकलन करने वाले मॉडल में इंटरैक्शन शब्द को भी अनदेखा कर देगा) मुख्य प्रभावों में से एक और एक वक्रता प्रभाव (मॉडरेशन) के लिए?
बेंटो

11

क्या आप सुनिश्चित हैं कि चर उचित रूप से व्यक्त किए गए हैं? दो स्वतंत्र चर और X 2 पर विचार करें । समस्या कथन इस बात की पुष्टि करता है कि आप फॉर्म में एक अच्छे से फिट हो रहे हैंX1X2

Y=β0+β12X1X2+ϵ

यदि कुछ सबूत हैं कि साथ अवशिष्टों का विचरण बढ़ता है , तो एक बेहतर मॉडल गुणात्मक त्रुटि का उपयोग करता है, जिनमें से एक हैY

Y=β0+(β12X1X2)δ

इसे फिर से लिखा जा सकता है

log(Yβ0)=log(β12)+log(X1)+log(X2)+log(δ);

यदि आप फॉर्म में अपने चर को फिर से व्यक्त करते हैं

η=log(Yβ0)ξ1=log(X1)ξ2=log(X2)ζ=log(δ)N(0,σ2)

फिर मॉडल रैखिक है और संभावना है कि होमोसैडेस्टिक अवशेष हैं:

η=γ0+γ1ξ1+γ2ξ2+ζ,

γ1γ2

β0Y

β0β0

Y=(θ1+X1)(θ2+X2)+ϵ

θ1θ2=β0θ1θ2θ1X2θ2X1ϵ

यह विश्लेषण दिखाता है कि यह कैसे संभव है - यहां तक ​​कि कुछ अनुप्रयोगों में भी संभव है - एक मॉडल है जिसमें केवल प्रभाव बातचीत करते दिखाई देते हैं। यह तब उत्पन्न होता है जब चर (स्वतंत्र, निर्भर, या दोनों) आपको अनुपयुक्त रूप में प्रस्तुत किए जाते हैं और उनके लघुगणक मॉडलिंग के लिए अधिक प्रभावी लक्ष्य होते हैं। चर और प्रारंभिक अवशिष्ट के वितरण यह निर्धारित करने के लिए आवश्यक सुराग प्रदान करते हैं कि क्या यह मामला हो सकता है: चर के तिरछे वितरण और अवशेषों की विषमता (विशेष रूप से, वैरिएंट लगभग अनुमानित मानों के समानुपाती) के संकेतक हैं।


हममम। यह सब मेरे समाधान की तुलना में प्रशंसनीय लेकिन अधिक जटिल लगता है (मूल प्रश्न पर टिप्पणी से यह पता चलता है कि भविष्यवक्ता दोनों श्रेणीबद्ध हैं)। लेकिन हमेशा की तरह, जवाब "डेटा को देखो" (या अवशेष) है।
बेन बोल्कर

1
@ लेकिन मैं सहमत हूं, लेकिन मुझे समझ नहीं आया कि "अधिक जटिल" की धारणा कहां से आती है, क्योंकि किसी भी प्रतिगमन व्यायाम में अवशिष्ट वितरण और अवशिष्ट के पोस्ट-हॉक विश्लेषण का विश्लेषण आवश्यक है। यहां केवल आवश्यक अतिरिक्त काम के बारे में सोचना है कि इन विश्लेषणों का क्या मतलब है।
whuber

1
शायद "अधिक जटिल" से मेरा मतलब है "मेरे अनुभव में, मैंने उन मुद्दों को देखा है जिन्हें मैंने अपने उत्तर में संदर्भित किया था (इसके विपरीत कॉर्डिंग) उन लोगों की तुलना में अधिक बार उठता है जो आपने (गैर-व्यसनीकरण)" - लेकिन यह वास्तव में एक है डेटा / लोगों के प्रकार के बारे में बयान जो मैं दुनिया के बजाय काम करता हूं।
बेन बोल्कर

5

Y=β0+β1X1+β2X2+β3(X1X2)=(b0+b2X2)+(b1+b3X2)X1

यह आम तौर पर उच्च बहुस्तरीयता का परिचय देता है क्योंकि उत्पाद दोनों मूल चर के साथ दृढ़ता से सहसंबद्ध होगा। मल्टीकोलिनरिटी के साथ, व्यक्तिगत पैरामीटर अनुमान दृढ़ता से निर्भर करता है जिस पर अन्य चर को माना जाता है - जैसे आपके मामले में। एक काउंटर-माप के रूप में, चरों को केंद्रित करने से अक्सर बहुक्रियाशीलता कम हो जाती है जब बातचीत पर विचार किया जाता है।

मुझे यकीन नहीं है कि यह सीधे आपके मामले पर लागू होता है क्योंकि आप स्पष्ट भविष्यवक्ता लगते हैं, लेकिन "एनोवा" के बजाय "प्रतिगमन" शब्द का उपयोग करते हैं। बेशक बाद का मामला अनिवार्य रूप से एक ही मॉडल है, लेकिन बेन के रूप में कंट्रास्ट कोडिंग योजना चुनने के बाद ही।


5

यह व्याख्या की समस्या हो सकती है, एक तथाकथित "प्रत्यक्ष प्रभाव" गुणांक की गलतफहमी वास्तव में है।

निरंतर पूर्वानुमानक चर के साथ प्रतिगमन मॉडल में और कोई इंटरैक्शन शब्द नहीं है - अर्थात, ऐसे शब्दों के साथ जो अन्य शर्तों के उत्पाद के रूप में निर्मित किए गए हैं - प्रत्येक चर का गुणांक उस चर की दिशा में प्रतिगमन सतह का ढलान है। यह चर के मूल्यों की परवाह किए बिना स्थिर है, और स्पष्ट रूप से उस चर के प्रभाव का एक उपाय है।

इंटरैक्शन वाले मॉडल में - अर्थात, ऐसे शब्दों के साथ, जो अन्य शर्तों के उत्पादों के रूप में निर्मित होते हैं - यह व्याख्या केवल बिना किसी योग्यता के उन योग्यताओं के लिए बनाई जा सकती है जो किसी भी इंटरैक्शन में शामिल नहीं हैं । एक चर के गुणांक है बातचीत में शामिल है कि चर की दिशा में प्रतिगमन सतह की ढलान है जब सभी चरों के मान उस सवाल का शून्य हैं में चर सहभागिता के साथ , और गुणांक के महत्व को परीक्षण के लिए संदर्भित करता प्रतिगामी अंतरिक्ष के केवल उस क्षेत्र में प्रतिगमन सतह का ढलान। चूंकि इस बात की कोई आवश्यकता नहीं है कि वास्तव में अंतरिक्ष के उस क्षेत्र में डेटा हो, तो स्पष्ट प्रत्यक्ष प्रभाव गुणांक भविष्यवाणियों के क्षेत्र में प्रतिगमन सतह के ढलान से थोड़ा सा मेल खाता हो सकता है जहां डेटा वास्तव में देखे गए थे। ऐसे मामलों में कोई भी "प्रत्यक्ष प्रभाव" नहीं है; सबसे अच्छा विकल्प शायद "औसत प्रभाव" है: प्रश्न में चर की दिशा में प्रतिगमन सतह का ढलान, प्रत्येक डेटा बिंदु पर लिया गया और सभी डेटा बिंदुओं पर औसत है। इस पर अधिक जानकारी के लिए, देखें कि स्वतंत्र चर को केंद्रित करना मॉडरेशन के साथ मुख्य प्रभावों को क्यों बदल सकता है?

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.