क्या मुख्य प्रभावों को शामिल किए बिना किसी मॉडल में दो-तरफ़ा बातचीत को शामिल करना कभी मान्य है? क्या होगा यदि आपकी परिकल्पना केवल बातचीत के बारे में है, क्या आपको अभी भी मुख्य प्रभावों को शामिल करने की आवश्यकता है?
क्या मुख्य प्रभावों को शामिल किए बिना किसी मॉडल में दो-तरफ़ा बातचीत को शामिल करना कभी मान्य है? क्या होगा यदि आपकी परिकल्पना केवल बातचीत के बारे में है, क्या आपको अभी भी मुख्य प्रभावों को शामिल करने की आवश्यकता है?
जवाबों:
मेरे अनुभव में, न केवल मॉडल में सभी निचले क्रम के प्रभाव होना आवश्यक है, जब वे उच्च क्रम के प्रभावों से जुड़े होते हैं, लेकिन यह ठीक से मॉडल के लिए भी महत्वपूर्ण है (उदाहरण के लिए, अशुभ होने की अनुमति) मुख्य प्रभाव जो प्रतीत नहीं होते हैं। ब्याज की बातचीत में कारक। ऐसा इसलिए है क्योंकि के बीच संपर्क है और का मुख्य प्रभाव के लिए स्टैंड-इन किया जा सकता है और । कभी-कभी सहभागिता की आवश्यकता प्रतीत होती है क्योंकि वे लोप किए गए चर या लोप किए गए ग़ैर-रेखीय (उदाहरण के लिए, वर्तनी) शब्दों से मेल खाते हैं।x 2 x 3 x 4
आप पूछते हैं कि क्या यह कभी वैध है। मुझे एक सामान्य उदाहरण प्रदान करते हैं, जिसकी व्याख्या आपके लिए अतिरिक्त विश्लेषणात्मक दृष्टिकोण सुझा सकती है।
इंटरैक्शन का सबसे सरल उदाहरण एक मॉडल है जिसमें एक आश्रित चर और दो स्वतंत्र चर , फॉर्म में हैंएक्स वाई
शून्य उम्मीद के साथ एक यादृच्छिक शब्द चर साथ , और मापदंडों का उपयोग करके और । यह अक्सर सार्थक जाँच करता है कि क्या अनुमान लगाता है , क्योंकि एक ही मॉडल का बीजगणितीय समकक्ष अभिव्यक्ति हैअल्फा , β ' , γ ' , δ ' δ ' β ' γ '
(जहाँ , आदि)।
यदि कोई कारण है, तो को कारण है, हम इसे त्रुटि शब्द में अवशोषित कर सकते हैं । इतना ही नहीं यह एक "शुद्ध अंतःक्रिया" देता है, ऐसा वह निरंतर कार्यकाल के बिना करता है । यह बदले में जोर से लॉगरिथम लेने का सुझाव देता है। अवशिष्टों में कुछ विषमलैंगिकता - अर्थात, बड़े मूल्यों से जुड़े अवशिष्टों की प्रवृत्ति औसत से अधिक पूर्ण मूल्य में बड़ी है - इस दिशा में भी इंगित करेगी। हम तब एक वैकल्पिक सूत्रीकरण का पता लगाना चाहेंगेε जेड
iid यादृच्छिक त्रुटि । इसके अलावा, अगर हम उम्मीद करते हैं और बड़े की तुलना में होने की , हम बजाय सिर्फ मॉडल पेश करेंगेबीटा एक्स γ Y 1
इस नए मॉडल में चार मापदंडों ( , , आदि) के बजाय एक एकल पैरामीटर है जो एक द्विघात संबंध ( ) के अधीन है , काफी सरलीकरण है।अल्फा बीटा ' δ ' = बीटा ' γ '
मैं यह नहीं कह रहा हूं कि यह एक आवश्यक या यहां तक कि एकमात्र कदम है, लेकिन मैं सुझाव दे रहा हूं कि मॉडल के इस प्रकार के बीजीय पुनर्व्यवस्था आमतौर पर विचार करने के लायक है जब भी अकेले बातचीत महत्वपूर्ण प्रतीत होती है।
बातचीत के साथ मॉडल का पता लगाने के कुछ उत्कृष्ट तरीके, विशेष रूप से सिर्फ दो और तीन स्वतंत्र चर के साथ, तुकी के ईडीए के अध्याय 10 - 13 में दिखाई देते हैं ।
हालांकि यह अक्सर पाठ्यपुस्तकों में कहा जाता है कि किसी को कभी भी संबंधित मुख्य प्रभावों के बिना एक मॉडल में इंटरैक्शन शामिल नहीं करना चाहिए, निश्चित रूप से ऐसे उदाहरण हैं जहां यह सही अर्थ होगा। मैं आपको सबसे सरल उदाहरण दे सकता हूं जिसकी मैं कल्पना कर सकता हूं।
मान लीजिए कि बेतरतीब ढंग से दो समूहों को सौंपे गए विषयों को दो बार मापा जाता है, एक बार बेसलाइन पर (यानी, रैंडमाइजेशन के ठीक बाद) और एक बार समूह टी के बाद किसी तरह का उपचार प्राप्त किया जाता है, जबकि समूह सी नहीं था। फिर इन आंकड़ों के लिए एक दोहराया-माप मॉडल में माप के अवसर के लिए एक मुख्य प्रभाव शामिल होगा (एक डमी चर जो बेसलाइन के लिए 0 है और अनुवर्ती के लिए 1 है) और समूह डमी (सी के लिए 0, टी के लिए 1) के बीच एक इंटरैक्शन टर्म है ) और समय डमी।
मॉडल अवरोधन तब आधारभूत विषयों पर औसत स्कोर का अनुमान लगाता है (समूह की परवाह किए बिना)। माप के अवसर डमी के लिए गुणांक बेसलाइन और फॉलो-अप के बीच नियंत्रण समूह में परिवर्तन को इंगित करता है। और इंटरैक्शन शब्द के लिए गुणांक इंगित करता है कि नियंत्रण समूह की तुलना में उपचार समूह में कितना बड़ा / छोटा परिवर्तन था।
यहां, समूह के लिए मुख्य प्रभाव को शामिल करना आवश्यक नहीं है, क्योंकि आधारभूत पर, समूह यादृच्छिकरण के कारण परिभाषा के बराबर हैं।
कोई भी यह तर्क दे सकता है कि समूह के लिए मुख्य प्रभाव को अभी भी शामिल किया जाना चाहिए, ताकि, रैंडमाइजेशन विफल होने पर, यह विश्लेषण द्वारा प्रकट किया जाएगा। हालाँकि, यह दो समूहों के आधारभूत साधनों को एक-दूसरे के विरुद्ध परीक्षण करने के बराबर है। और ऐसे बहुत से लोग हैं जो यादृच्छिक अध्ययनों में आधारभूत अंतरों के परीक्षण पर भड़कते हैं (बेशक, बहुत सारे ऐसे भी हैं जो इसे उपयोगी पाते हैं, लेकिन यह एक और मुद्दा है)।
मॉडल में मुख्य प्रभाव रखने का कारण पहचान के लिए है। इसलिए, यदि उद्देश्य प्रत्येक प्रभाव के बारे में सांख्यिकीय निष्कर्ष है, तो आपको मॉडल में मुख्य प्रभाव रखना चाहिए। हालांकि, यदि आपका मॉडलिंग उद्देश्य केवल नए मूल्यों की भविष्यवाणी करने के लिए है, तो यह केवल पूरी तरह से वैधता को शामिल करने के लिए वैध है अगर यह भविष्यवाणी की सटीकता में सुधार करता है।
यह उन कई उत्तरों में निहित है जो दूसरों ने दिए हैं, लेकिन सरल बिंदु यह है कि मॉडल w / उत्पाद शब्द लेकिन w / & w / o मॉडरेटर और भविष्यवक्ता सिर्फ अलग-अलग मॉडल हैं। यह पता लगाएं कि प्रत्येक प्रक्रिया का क्या अर्थ है जिसे आप मॉडलिंग कर रहे हैं और क्या कोई मॉडल w / o मॉडरेटर और भविष्यवक्ता आपके सिद्धांत या सम्मोहन को देखते हुए अधिक समझ में आता है। अवलोकन कि उत्पाद शब्द महत्वपूर्ण है, लेकिन केवल जब मॉडरेटर और भविष्यवक्ता शामिल नहीं होते हैं, तो आपको कुछ भी नहीं बताता है (सिवाय इसके कि शायद आप "महत्व" के लिए चारों ओर मछली पकड़ रहे हैं) w / oa इस बारे में स्पष्ट व्याख्या करें कि उन्हें छोड़ने का क्या मतलब है ।
यकीनन, यह इस बात पर निर्भर करता है कि आप अपने मॉडल का उपयोग किस लिए कर रहे हैं। लेकिन मैंने कभी भी एक कारण नहीं देखा कि वे मुख्य प्रभावों वाले मॉडल को न चलाएं और उनका वर्णन करें, यहां तक कि उन मामलों में जहां परिकल्पना केवल बातचीत के बारे में है।
मैं किताब से एक पैराग्राफ उधार होगा Stata का उपयोग कर अस्तित्व विश्लेषण के लिए एक परिचय द्वारा M.Cleves, R.Gutierrez, W.Gould, Y.Marchenko द्वारा संपादित Stata प्रेस आपके सवाल का जवाब देने के लिए।
यह पढ़ना आम है कि इंटरेक्शन प्रभाव को मॉडल में तभी शामिल किया जाना चाहिए जब संबंधित मुख्य प्रभाव भी शामिल हो, लेकिन इसमें स्वयं द्वारा इंटरेक्शन प्रभाव शामिल करने के साथ कुछ भी गलत नहीं है। [...] एक शोधकर्ता का लक्ष्य पैरामीरीज़ के लिए है जो डेटा पर हाथ में समस्या पर विचार करने और केवल एक नुस्खे का पालन न करने के लिए उचित रूप से होने की संभावना है।
एक्स और वाई दोनों को एक्सवाई के साथ सहसंबद्ध किया जाएगा (जब तक कि आपने इसे केंद्र में रखकर इसे रोकने के लिए एक विशिष्ट उपाय नहीं किया है)। इस प्रकार यदि आप अपने दृष्टिकोण के साथ एक पर्याप्त बातचीत प्रभाव प्राप्त करते हैं, तो यह एक बातचीत के रूप में एक या एक से अधिक मुख्य प्रभावों की मात्रा की संभावना होगी। यह स्पष्ट, व्याख्यात्मक परिणाम देने वाला नहीं है। इसके बजाय वांछनीय क्या है यह देखने के लिए कि एक्स , वाई और (मुख्य रूप से बाद के चरण में अधिमानतः) xy सहित, मुख्य प्रभाव क्या करते हैं, पर इंटरैक्शन कितना अधिक समझा सकता है ।
शब्दावली के रूप में: हाँ, is 0 को "स्थिरांक" कहा जाता है। दूसरी ओर, "आंशिक" के प्रतिगमन में विशिष्ट अर्थ हैं और इसलिए मैं आपकी रणनीति का वर्णन करने के लिए उस शब्द का उपयोग नहीं करूंगा।
नीले धागे में एक बार उत्पन्न होने वाले कुछ रोचक उदाहरण इस सूत्र में वर्णित हैं ।
मेरा सुझाव है कि यह मॉडल अनिश्चितता का एक विशेष मामला है। एक बायेसियन दृष्टिकोण से, आप इसे ठीक उसी तरह से मानते हैं, जिस तरह से आप किसी अन्य प्रकार की अनिश्चितता का इलाज करेंगे:
यह वही है जो लोग सामान्य मात्रा के बजाय टी-क्वांटिल्स का उपयोग करके "महत्वपूर्ण प्रभावों" के लिए परीक्षण करते समय करते हैं। क्योंकि आपके पास "सही शोर स्तर" के बारे में अनिश्चितता है, इसलिए आप परीक्षण में अधिक फैल आउट वितरण का उपयोग करके इसे ध्यान में रखते हैं। तो आपके नजरिए से "मुख्य प्रभाव" वास्तव में उस सवाल के संबंध में एक "उपद्रव पैरामीटर" है जो आप पूछ रहे हैं। तो आप बस उन दो मामलों (या आमतौर पर, जिन मॉडलों पर आप विचार कर रहे हैं) से औसत निकालते हैं। इसलिए मेरे पास (अस्पष्ट) परिकल्पना होगी: डी मैं पी ( एच मैं एन टी | डी मैं ) = पी ( एच मैं एन टी | मैं ) पी ( डी | एच मैं एन टी मैं )
और आप इस से देख सकते हैं कि mth मॉडल के तहत परिकल्पना का "सशर्त निष्कर्ष" है (यह आमतौर पर सभी के लिए माना जाता है, एक चुने हुए "सर्वश्रेष्ठ" मॉडल के लिए )। ध्यान दें कि यह मानक विश्लेषण उचित है जब भी - एक "स्पष्ट रूप से सर्वश्रेष्ठ" मॉडल - या जब भी - सभी मॉडल समान / समान निष्कर्ष देते हैं। हालांकि, अगर न तो मिले, तो बेयस के प्रमेय का कहना है कि सबसे अच्छी प्रक्रिया परिणामों को औसत करना है, उन मॉडलों पर उच्च भार रखना जो डेटा और पूर्व सूचना द्वारा सबसे अधिक समर्थित हैं।पी ( एम एम | डी मैं ) ≈ 1 पी ( एच मैं एन टी | डी एम जे मैं ) ≈ पी ( एच मैं एन टी | डी एम कश्मीर मैं )
इसमें शामिल मुख्य प्रभावों के बिना इंटरैक्शन शब्द शामिल करना बहुत कम विचार है। CCNY के डेविड रिंडस्कोफ ने उन दुर्लभ उदाहरणों के बारे में कुछ कागजात लिखे हैं।
प्रकृति में विभिन्न प्रक्रियाएं होती हैं जिनमें केवल एक सहभागिता प्रभाव होता है और कानून जो उन्हें डिक्रिप्ट करते हैं। उदाहरण के लिए ओम का नियम। उदाहरण के लिए आपके पास वूमर (1964) का प्रदर्शन मॉडल है: प्रदर्शन = क्षमता x प्रेरणा। अब, जब आप इस कानून के सही होने पर एक महत्वपूर्ण बातचीत प्रभाव पा सकते हैं। अफसोस, यह मामला नहीं है। आप आसानी से दो मुख्य प्रभावों और एक तुच्छ अंतःक्रियात्मक प्रभाव (प्रदर्शन और आगे के स्पष्टीकरण के लिए लैंडशीयर, वैन डेन वेटनबोयर और मासेन (2006), सोशल साइंस रिसर्च 35, 274-294) को देख सकते हैं। अंतःक्रियात्मक प्रभाव का पता लगाने के लिए रैखिक मॉडल बहुत अच्छी तरह से अनुकूल नहीं है; जब उन्होंने रैखिक मॉडल का इस्तेमाल किया था तो ओम को अपना कानून कभी नहीं मिला।
परिणामस्वरूप, रैखिक मॉडल में इंटरैक्शन प्रभाव की व्याख्या करना मुश्किल है। यदि आपके पास एक सिद्धांत है जो एक इंटरैक्शन प्रभाव की भविष्यवाणी करता है, तो आपको इसे महत्वहीन होने पर भी शामिल करना चाहिए। आप मुख्य प्रभावों को अनदेखा करना चाह सकते हैं यदि आपका सिद्धांत उन लोगों को बाहर करता है, लेकिन आपको यह मुश्किल लगेगा, क्योंकि महत्वपूर्ण मुख्य प्रभाव अक्सर एक सच्चे डेटा जनरेटिंग तंत्र के मामले में पाए जाते हैं जिसमें केवल एक गुणक प्रभाव होता है।
मेरा उत्तर है: हां, मुख्य प्रभावों को शामिल किए बिना एक मॉडल में दो-तरफ़ा बातचीत को शामिल करना मान्य हो सकता है। रैखिक मॉडल एक बड़ी संख्या में डेटा जनरेटिंग तंत्र के परिणामों को अनुमानित करने के लिए उत्कृष्ट उपकरण हैं, लेकिन उनके सूत्र को आसानी से डेटा जनरेटिंग तंत्र के वैध विवरण के रूप में व्याख्या नहीं किया जा सकता है।
यह एक मुश्किल है और मेरे आखिरी प्रोजेक्ट में मेरे साथ हुआ। मैं इसे इस तरह समझाऊंगा: मान लीजिए कि आपके पास ए और बी चर थे जो स्वतंत्र रूप से महत्वपूर्ण थे और एक व्यापारिक अर्थ से आपने सोचा था कि ए और बी की बातचीत अच्छी लगती है। आपने उस सहभागिता को शामिल किया जो महत्वपूर्ण थी लेकिन बी ने अपना महत्व खो दिया। आप शुरू में दो परिणाम दिखाकर अपने मॉडल की व्याख्या करेंगे। परिणाम दिखाते हैं कि शुरू में बी महत्वपूर्ण था, लेकिन जब ए के प्रकाश में देखा गया तो इसकी चमक खो गई। तो B एक अच्छा चर है, लेकिन केवल तभी A के विभिन्न स्तरों (यदि A एक श्रेणीगत चर है) के प्रकाश में देखा जाता है। जब ओबामा अपनी सेना की रोशनी में देखा जाता है, तो यह एक अच्छा नेता है। तो ओबामा * सील एक महत्वपूर्ण चर होगा। लेकिन ओबामा जब अकेले दिखे तो शायद उतना महत्वपूर्ण नहीं था। (ओबामा के लिए कोई अपराध नहीं, सिर्फ एक उदाहरण है।)
एफ = एम * ए, बल बड़े पैमाने पर त्वरण के बराबर होता है।
यह F = m + a + ma, या उन मापदंडों के कुछ अन्य रैखिक संयोजन के रूप में प्रतिनिधित्व नहीं करता है। वास्तव में, केवल द्रव्यमान और त्वरण के बीच की बातचीत शारीरिक रूप से समझ में आएगी।
क्या कभी मुख्य प्रभाव के बिना दो-तरफ़ा बातचीत को शामिल करना मान्य है?
हाँ यह मान्य हो सकता है और आवश्यक भी। उदाहरण के लिए 2. यदि आप मुख्य प्रभाव के लिए एक कारक (नीले बनाम लाल स्थिति का औसत अंतर) को शामिल करेंगे, तो यह मॉडल को बदतर बना देगा।
क्या होगा यदि आपकी परिकल्पना केवल बातचीत के बारे में है, क्या आपको अभी भी मुख्य प्रभावों को शामिल करने की आवश्यकता है?
आपकी परिकल्पना मुख्य प्रभाव होने के कारण वहां स्वतंत्र हो सकती है। लेकिन मॉडल को अंतर्निहित प्रक्रिया का सर्वोत्तम वर्णन करने की आवश्यकता हो सकती है। तो हाँ, आप के साथ और बिना कोशिश करनी चाहिए।
नोट: आपको "निरंतर" स्वतंत्र चर (उदाहरण में माप) के लिए कोड को केंद्र में रखने की आवश्यकता है। अन्यथा मॉडल में सहभागिता गुणांक सममित रूप से वितरित नहीं किया जाएगा (उदाहरण में पहले माप के लिए कोई गुणांक नहीं)।
यदि विचाराधीन चर स्पष्ट हैं, तो मुख्य प्रभावों के बिना इंटरैक्शन सहित मॉडल का सिर्फ एक पुनरावर्तन है, और पैरामीटराइजेशन का विकल्प इस बात पर निर्भर करता है कि आप अपने मॉडल के साथ क्या करने की कोशिश कर रहे हैं। श्रेणीगत चरों के साथ अन्य निरंतर चर अयस्क के साथ निरंतर चर को इंटरैक्ट करना एक पूरी अलग कहानी है। देखें: UCLA के इंस्टीट्यूट फॉर डिजिटल रिसर्च एंड एजुकेशन के इस फेक को देखें
हां यह मान्य हो सकता है, हालांकि यह दुर्लभ है। लेकिन इस मामले में आपको अभी भी मुख्य प्रभावों को मॉडल करने की आवश्यकता है, जिसे आप बाद में वापस पा लेंगे।
दरअसल, कुछ मॉडलों में, केवल बातचीत दिलचस्प होती है, जैसे दवा परीक्षण / नैदानिक मॉडल। यह उदाहरण के लिए सामान्यीकृत साइकोफिज़ियोलॉजिकल इंटरेक्शन (जीपीपीआई) मॉडल का आधार है: y = ax + bxh + ch
जहां स्वर x/y
/ हित के क्षेत्र और h
ब्लॉक / ईवेंट डिज़ाइन हैं।
इस मॉडल में, दोनों a
और c
बाहर वहीं किया जाएगा, केवल b
अनुमान (बीटा गुणांक) के लिए रखा जाएगा। दरअसल, दोनों a
और c
हमारे मामले में नकली गतिविधि का प्रतिनिधित्व है, और केवल b
का प्रतिनिधित्व करता है क्या नकली गतिविधि, कार्य के साथ बातचीत के द्वारा समझाया नहीं जा सकता।
संक्षिप्त उत्तर: यदि आप निश्चित प्रभावों में सहभागिता शामिल करते हैं, तो मुख्य प्रभाव स्वचालित रूप से शामिल होते हैं या नहीं, विशेष रूप से आप उन्हें अपने कोड में शामिल करते हैं । एकमात्र अंतर आपके पैरामीट्रिएशन है, अर्थात, आपके मॉडल में पैरामीटर का क्या मतलब है (उदाहरण के लिए, वे समूह साधन हैं या वे संदर्भ स्तरों से अंतर हैं)।
मान्यताओं: मेरा मानना है कि हम सामान्य रैखिक मॉडल में काम कर रहे हैं और पूछ रहे हैं कि हम बजाय निश्चित प्रभाव विनिर्देशन उपयोग कर सकते हैं , जहां और (श्रेणीबद्ध) कारक हैं।
गणितीय स्पष्टीकरण: हम मानते हैं कि प्रतिक्रिया वेक्टर । यदि , और तीन कारकों के लिए डिजाइन मैट्रिक्स कर रहे हैं, तो "मुख्य प्रभाव और बातचीत" के साथ एक मॉडल प्रतिबंध से मेल खाती है अवधि । "केवल बातचीत" के साथ एक मॉडल प्रतिबंध से मेल खाती है अवधि । हालाँकि , स्पैन स्पैन । तो, यह एक ही मॉडल के दो अलग-अलग पैरामीरीज़ेशन हैंएक्स एक एक्स बी एक्स ए बी ξ ∈ { एक्स ए , एक्स बी , एक्स ए बी } ξ ∈ { एक्स ए बी } { एक्स ए बी } = { एक्स ए , एक्स बी , एक्स ए बी } (या वितरण के एक ही परिवार यदि आप उस शब्दावली के साथ अधिक सहज हैं)।
मैंने अभी देखा कि डेविड बीड ने बहुत ही समान उत्तर (माफी) प्रदान किया, लेकिन मुझे लगा कि मैं इसे उन लोगों के लिए छोड़ दूंगा जो एक रैखिक बीजगणित के परिप्रेक्ष्य में अच्छी प्रतिक्रिया देते हैं।