एक मॉडल में बातचीत लेकिन मुख्य प्रभाव शामिल नहीं है


85

क्या मुख्य प्रभावों को शामिल किए बिना किसी मॉडल में दो-तरफ़ा बातचीत को शामिल करना कभी मान्य है? क्या होगा यदि आपकी परिकल्पना केवल बातचीत के बारे में है, क्या आपको अभी भी मुख्य प्रभावों को शामिल करने की आवश्यकता है?


3
मेरा दर्शन बहुत सारे मॉडल चला रहा है, उनकी भविष्यवाणियों की जांच करें, तुलना करें, समझाएं, अधिक मॉडल चलाएं।
माइकल बिशप

11
यदि मॉडल में मुख्य प्रभाव होने पर केवल इंटरैक्शन महत्वपूर्ण हैं, तो हो सकता है कि मुख्य प्रभाव महत्वपूर्ण हों और इंटरैक्शन न हों। 100 के आदेश पर विचरण के साथ एक अत्यधिक महत्वपूर्ण मुख्य प्रभाव पर विचार करें और एक अन्य महत्वहीन मुख्य प्रभाव जिसके लिए सभी मान बहुत कम विचरण के साथ लगभग एक हैं। उनका इंटरैक्शन महत्वपूर्ण नहीं है, लेकिन यदि मॉडल से मुख्य प्रभाव हटा दिए जाते हैं, तो इंटरैक्शन प्रभाव महत्वपूर्ण होगा।
थॉमस लेविन

4
@ थोमस को आपकी पहली पंक्ति को पढ़ना चाहिए 'यदि इंटरैक्शन केवल तभी महत्वपूर्ण हो जब मुख्य प्रभाव मॉडल में न हों, ...'?
ग्लेन

2
अरे हाँ, यह चाहिए!
थॉमस लेविन

जवाबों:


55

मेरे अनुभव में, न केवल मॉडल में सभी निचले क्रम के प्रभाव होना आवश्यक है, जब वे उच्च क्रम के प्रभावों से जुड़े होते हैं, लेकिन यह ठीक से मॉडल के लिए भी महत्वपूर्ण है (उदाहरण के लिए, अशुभ होने की अनुमति) मुख्य प्रभाव जो प्रतीत नहीं होते हैं। ब्याज की बातचीत में कारक। ऐसा इसलिए है क्योंकि के बीच संपर्क है और का मुख्य प्रभाव के लिए स्टैंड-इन किया जा सकता है और । कभी-कभी सहभागिता की आवश्यकता प्रतीत होती है क्योंकि वे लोप किए गए चर या लोप किए गए ग़ैर-रेखीय (उदाहरण के लिए, वर्तनी) शब्दों से मेल खाते हैं।x 2 x 3 x 4x1x2x3x4


1
इसका मतलब है कि हमें y ~ X1 * x2 * x3 * x4 से शर्तों को हटाना शुरू करना चाहिए, उच्चतम-ऑर्डर की शर्तों को हटाना शुरू करना चाहिए, अर्थात सामान्य विलोपन विधि, सही?
जिज्ञासु

9
जब तक आप "चंक" के रूप में शर्तों के पूरे वर्गों का परीक्षण नहीं कर सकते, तब तक शब्दों के विलोपन की सिफारिश नहीं की जाती है। उदाहरण के लिए, यह या तो सभी इंटरैक्शन शर्तों को रखने या हटाने के लिए, या उन सभी इंटरैक्शन को रखने या हटाने के लिए उचित हो सकता है जो 3 या 4 वें क्रम हैं।
फ्रैंक हरेल

किसी विशेष क्रम में केवल कुछ इंटरैक्शन को हटाने में क्या गलत है?
user1205901

3
यदि आपके पास पूरी तरह से पूर्व-निर्दिष्ट आदेश है जो डेटा को देखकर निर्धारित नहीं किया गया था, तो आप ऐसा करने के लिए ठीक हो सकते हैं। सामान्य तौर पर आपको कई पी-मानों का उपयोग करते हुए कई निर्णय लेते समय सह-रैखिकता और बहुलता समस्याएं होंगी।
फ्रैंक हरेल

2
मुझे लगता है कि यह उत्तर अस्पष्ट है, और केवल आंशिक रूप से प्रश्न का उत्तर देता है। वास्तव में, यह उत्तर बताता है कि मुख्य प्रभाव को मॉडल करना आवश्यक है, लेकिन यह जवाब नहीं देता है कि क्या यह केवल बातचीत पर ध्यान केंद्रित करने के लिए इसे वापस लेने के लिए वैध है, जो कि यह है और जीपीपीआई जैसे कुछ मॉडल में उपयोग किया जाता है (मेरा उत्तर देखें) नीचे)।
भूतपूर्व

37

आप पूछते हैं कि क्या यह कभी वैध है। मुझे एक सामान्य उदाहरण प्रदान करते हैं, जिसकी व्याख्या आपके लिए अतिरिक्त विश्लेषणात्मक दृष्टिकोण सुझा सकती है।

इंटरैक्शन का सबसे सरल उदाहरण एक मॉडल है जिसमें एक आश्रित चर और दो स्वतंत्र चर , फॉर्म में हैंएक्स वाईZXY

Z=α+βX+γY+δXY+ε,

शून्य उम्मीद के साथ एक यादृच्छिक शब्द चर साथ , और मापदंडों का उपयोग करके और । यह अक्सर सार्थक जाँच करता है कि क्या अनुमान लगाता है , क्योंकि एक ही मॉडल का बीजगणितीय समकक्ष अभिव्यक्ति हैअल्फा , β ' , γ ' , δ ' δ ' β ' γ 'εα,β,γ,δδβγ

Z=α(1+βX+γY+δXY)+ε

=α(1+βX)(1+γY)+α(δβγ)XY+ε

(जहाँ , आदि)।β=αβ

यदि कोई कारण है, तो को कारण है, हम इसे त्रुटि शब्द में अवशोषित कर सकते हैं । इतना ही नहीं यह एक "शुद्ध अंतःक्रिया" देता है, ऐसा वह निरंतर कार्यकाल के बिना करता है यह बदले में जोर से लॉगरिथम लेने का सुझाव देता है। अवशिष्टों में कुछ विषमलैंगिकता - अर्थात, बड़े मूल्यों से जुड़े अवशिष्टों की प्रवृत्ति औसत से अधिक पूर्ण मूल्य में बड़ी है - इस दिशा में भी इंगित करेगी। हम तब एक वैकल्पिक सूत्रीकरण का पता लगाना चाहेंगेε जेड(δβγ)0εZ

log(Z)=log(α)+log(1+βX)+log(1+γY)+τ

iid यादृच्छिक त्रुटि । इसके अलावा, अगर हम उम्मीद करते हैं और बड़े की तुलना में होने की , हम बजाय सिर्फ मॉडल पेश करेंगेबीटा एक्स γ Y 1τβXγY1

log(Z)=(log(α)+log(β)+log(γ))+log(X)+log(Y)+τ

=η+log(X)+log(Y)+τ.

इस नए मॉडल में चार मापदंडों ( , , आदि) के बजाय एक एकल पैरामीटर है जो एक द्विघात संबंध ( ) के अधीन है , काफी सरलीकरण है।अल्फा बीटा ' δ ' = बीटा ' γ 'ηαβδ=βγ

मैं यह नहीं कह रहा हूं कि यह एक आवश्यक या यहां तक ​​कि एकमात्र कदम है, लेकिन मैं सुझाव दे रहा हूं कि मॉडल के इस प्रकार के बीजीय पुनर्व्यवस्था आमतौर पर विचार करने के लायक है जब भी अकेले बातचीत महत्वपूर्ण प्रतीत होती है।

बातचीत के साथ मॉडल का पता लगाने के कुछ उत्कृष्ट तरीके, विशेष रूप से सिर्फ दो और तीन स्वतंत्र चर के साथ, तुकी के ईडीए के अध्याय 10 - 13 में दिखाई देते हैं ।


क्या आप एक उदाहरण प्रदान कर सकते हैं जब आप को अनुमानित शून्य मान पाएंगे ? मेरे लिए मूल शर्तों के संबंध में उन शब्दों के बारे में सोचना मुश्किल है और उनका क्या मतलब होगा। δβγ
djhocking

@ डॉकिंग किसी भी स्थिति जिसमें वैकल्पिक सूत्रीकरण एक अच्छा मॉडल है, पहले मॉडल में आवश्यक रूप से । एक विशेष मामला अंतिम मॉडल है, जो और और के लॉग के बीच एक सरल रैखिक संबंध है , मूल पैमाने पर एक गुणक संबंध लिए समान है । इस तरह के रिश्ते प्रकृति में प्रचुर मात्रा में हैं - यह बस कहता है कि सीधे और अलग से और दोनों के लिए आनुपातिक है । लॉग ( जेड ) एक्स वाई जेड α एक्स वाई जेड एक्स वाईα(δβγ)0log(Z)XYZXYZXY
whuber

30

हालांकि यह अक्सर पाठ्यपुस्तकों में कहा जाता है कि किसी को कभी भी संबंधित मुख्य प्रभावों के बिना एक मॉडल में इंटरैक्शन शामिल नहीं करना चाहिए, निश्चित रूप से ऐसे उदाहरण हैं जहां यह सही अर्थ होगा। मैं आपको सबसे सरल उदाहरण दे सकता हूं जिसकी मैं कल्पना कर सकता हूं।

मान लीजिए कि बेतरतीब ढंग से दो समूहों को सौंपे गए विषयों को दो बार मापा जाता है, एक बार बेसलाइन पर (यानी, रैंडमाइजेशन के ठीक बाद) और एक बार समूह टी के बाद किसी तरह का उपचार प्राप्त किया जाता है, जबकि समूह सी नहीं था। फिर इन आंकड़ों के लिए एक दोहराया-माप मॉडल में माप के अवसर के लिए एक मुख्य प्रभाव शामिल होगा (एक डमी चर जो बेसलाइन के लिए 0 है और अनुवर्ती के लिए 1 है) और समूह डमी (सी के लिए 0, टी के लिए 1) के बीच एक इंटरैक्शन टर्म है ) और समय डमी।

मॉडल अवरोधन तब आधारभूत विषयों पर औसत स्कोर का अनुमान लगाता है (समूह की परवाह किए बिना)। माप के अवसर डमी के लिए गुणांक बेसलाइन और फॉलो-अप के बीच नियंत्रण समूह में परिवर्तन को इंगित करता है। और इंटरैक्शन शब्द के लिए गुणांक इंगित करता है कि नियंत्रण समूह की तुलना में उपचार समूह में कितना बड़ा / छोटा परिवर्तन था।

यहां, समूह के लिए मुख्य प्रभाव को शामिल करना आवश्यक नहीं है, क्योंकि आधारभूत पर, समूह यादृच्छिकरण के कारण परिभाषा के बराबर हैं।

कोई भी यह तर्क दे सकता है कि समूह के लिए मुख्य प्रभाव को अभी भी शामिल किया जाना चाहिए, ताकि, रैंडमाइजेशन विफल होने पर, यह विश्लेषण द्वारा प्रकट किया जाएगा। हालाँकि, यह दो समूहों के आधारभूत साधनों को एक-दूसरे के विरुद्ध परीक्षण करने के बराबर है। और ऐसे बहुत से लोग हैं जो यादृच्छिक अध्ययनों में आधारभूत अंतरों के परीक्षण पर भड़कते हैं (बेशक, बहुत सारे ऐसे भी हैं जो इसे उपयोगी पाते हैं, लेकिन यह एक और मुद्दा है)।


4
समस्याएँ तब उत्पन्न होती हैं जब समय शून्य (बेसलाइन) माप का उपयोग पहली प्रतिक्रिया चर के रूप में किया जाता है। आधार रेखा का उपयोग अक्सर अध्ययन के लिए प्रवेश मानदंड के रूप में किया जाता है। उदाहरण के लिए, एक अध्ययन सिस्टोलिक रक्तचाप (बीपी)> 140 के साथ रोगियों को भर्ती कर सकता है, फिर 2 बीपी उपचार के लिए यादृच्छिक और बीपीएस का पालन करें। प्रारंभ में, बीपी का एक छोटा वितरण है और बाद में माप अधिक सममित होगा। यह एक ही मॉडल में 2 वितरण आकार बनाने के लिए गड़बड़ है। बेसलाइन को बेसलाइन कोवरिएट के रूप में मानने के कई और कारण हैं।
फ्रैंक हरेल

3
यह एक अच्छा बिंदु है, लेकिन हाल के अध्ययनों से पता चलता है कि यह कोई मुद्दा नहीं है। वास्तव में, ऐसा लगता है कि कोवरिएट के रूप में बेसलाइन स्कोर का उपयोग करने के अधिक नुकसान हैं। देखें: लियू, जीएफ, एट अल। (2009)। क्या आधारभूत नैदानिक ​​परीक्षणों में आधारभूत से परिवर्तन के विश्लेषण में आधारभूत या सहसंयोजक होना चाहिए? चिकित्सा में सांख्यिकी, 28, 2509-2530।
वोल्फगैंग

3
मैंने वह पेपर पढ़ा है। यह आश्वस्त नहीं है, और लियू ने मेरे द्वारा वर्णित नैदानिक ​​परीक्षण स्थितियों के विभिन्न प्रकारों का अध्ययन नहीं किया है। अधिक तर्क biostat.mc.vanderbilt.edu/wiki/pub/Main/RmS/course2.pdf धारावाहिक (अनुदैर्ध्य) डेटा के विश्लेषण के बारे में अध्याय में हैं।
फ्रैंक हरेल

1
लिंक के लिए धन्यवाद। मुझे लगता है कि आप 8.2.3 के तहत चर्चा का उल्लेख कर रहे हैं। वे कुछ दिलचस्प बिंदु हैं, लेकिन मुझे नहीं लगता कि यह निश्चित उत्तर देता है। मुझे यकीन है कि लियू एट अल द्वारा कागज। अंतिम उत्तर या तो नहीं है, लेकिन यह उदाहरण के लिए सुझाव देता है कि आधारभूत मूल्यों की गैर-सामान्यता एक महत्वपूर्ण मुद्दा नहीं है। शायद यह एक अलग चर्चा आइटम के लिए कुछ है, क्योंकि यह सीधे ओपी के प्रश्न से संबंधित नहीं है।
वोल्फगैंग

2
हां, यह गैर-सामान्यता की मात्रा पर निर्भर करता है। एक मॉडल तैयार करते समय अच्छे भाग्य पर निर्भर क्यों करें? आधारभूत माप के रूप में शून्य मापों का इलाज करने के कई विशुद्ध दार्शनिक कारण भी हैं (मेरे नोट्स में सेन और रोचोन के उद्धरण देखें)।
फ्रैंक हरेल

19

मॉडल में मुख्य प्रभाव रखने का कारण पहचान के लिए है। इसलिए, यदि उद्देश्य प्रत्येक प्रभाव के बारे में सांख्यिकीय निष्कर्ष है, तो आपको मॉडल में मुख्य प्रभाव रखना चाहिए। हालांकि, यदि आपका मॉडलिंग उद्देश्य केवल नए मूल्यों की भविष्यवाणी करने के लिए है, तो यह केवल पूरी तरह से वैधता को शामिल करने के लिए वैध है अगर यह भविष्यवाणी की सटीकता में सुधार करता है।


5
क्या आप कृपया पहचान की समस्या के बारे में अधिक स्पष्ट रूप से एक मुकदमेबाजी कर सकते हैं
ओश्राम

6
मुझे विश्वास नहीं है कि मुख्य प्रभाव छोड़ने वाला एक मॉडल आवश्यक रूप से अज्ञात है। शायद आपका मतलब "पहचानने" के बजाय "व्याख्यात्मकता" है (जो एक सटीक परिभाषा के साथ एक तकनीकी शब्द है)
JMS

6
@ जेएमएस: हां, यह व्याख्या को मारता है। हालाँकि, शब्द "पहचान" का उपयोग सांख्यिकीविदों और सामाजिक वैज्ञानिकों द्वारा अलग-अलग किया जाता है। मेरा मतलब बाद में था, जहां (शिथिल रूप से बोलना) आप एक विशेष निर्माण के साथ प्रत्येक सांख्यिकीय पैरामीटर की पहचान करना चाहते हैं। मुख्य प्रभाव को छोड़ने से आप पैरामीटर के निर्माण से मेल नहीं खा सकते हैं।
गैलिट श्मुइली

13

यह उन कई उत्तरों में निहित है जो दूसरों ने दिए हैं, लेकिन सरल बिंदु यह है कि मॉडल w / उत्पाद शब्द लेकिन w / & w / o मॉडरेटर और भविष्यवक्ता सिर्फ अलग-अलग मॉडल हैं। यह पता लगाएं कि प्रत्येक प्रक्रिया का क्या अर्थ है जिसे आप मॉडलिंग कर रहे हैं और क्या कोई मॉडल w / o मॉडरेटर और भविष्यवक्ता आपके सिद्धांत या सम्मोहन को देखते हुए अधिक समझ में आता है। अवलोकन कि उत्पाद शब्द महत्वपूर्ण है, लेकिन केवल जब मॉडरेटर और भविष्यवक्ता शामिल नहीं होते हैं, तो आपको कुछ भी नहीं बताता है (सिवाय इसके कि शायद आप "महत्व" के लिए चारों ओर मछली पकड़ रहे हैं) w / oa इस बारे में स्पष्ट व्याख्या करें कि उन्हें छोड़ने का क्या मतलब है ।


मैं यहां एक महत्वपूर्ण इंटरैक्शन टर्म की उपस्थिति में मुख्य प्रभावों की व्याख्या की जांच करने के लिए आया था और इस जवाब ने वास्तव में बहुत मदद की। धन्यवाद!
पैट्रिक विलियम्स

9

यकीनन, यह इस बात पर निर्भर करता है कि आप अपने मॉडल का उपयोग किस लिए कर रहे हैं। लेकिन मैंने कभी भी एक कारण नहीं देखा कि वे मुख्य प्रभावों वाले मॉडल को न चलाएं और उनका वर्णन करें, यहां तक ​​कि उन मामलों में जहां परिकल्पना केवल बातचीत के बारे में है।


क्या होगा यदि बातचीत केवल महत्वपूर्ण है जब मुख्य प्रभाव मॉडल में नहीं हैं?
ग्लेन

3
@ गेलन - सांख्यिकीय महत्व के अलावा अन्य कई चीजों के बारे में सोचना है। देखें इस । अपने समग्र मॉडल फिट की जांच करने के लिए बेहतर है (आपके द्वारा फिट किए गए प्रत्येक मॉडल के लिए अपनी भविष्यवाणियों के खिलाफ अपने अवशेषों की साजिश करें), आपके सिद्धांत और मॉडलिंग के लिए आपकी प्रेरणाएं।
माइकल बिशप

7

मैं किताब से एक पैराग्राफ उधार होगा Stata का उपयोग कर अस्तित्व विश्लेषण के लिए एक परिचय द्वारा M.Cleves, R.Gutierrez, W.Gould, Y.Marchenko द्वारा संपादित Stata प्रेस आपके सवाल का जवाब देने के लिए।

यह पढ़ना आम है कि इंटरेक्शन प्रभाव को मॉडल में तभी शामिल किया जाना चाहिए जब संबंधित मुख्य प्रभाव भी शामिल हो, लेकिन इसमें स्वयं द्वारा इंटरेक्शन प्रभाव शामिल करने के साथ कुछ भी गलत नहीं है। [...] एक शोधकर्ता का लक्ष्य पैरामीरीज़ के लिए है जो डेटा पर हाथ में समस्या पर विचार करने और केवल एक नुस्खे का पालन न करने के लिए उचित रूप से होने की संभावना है।


3
एकदम भयानक सलाह।
फ्रैंक हरेल

3
@ फ्रेंक, क्या आप अपनी टिप्पणी पर विस्तार करना चाहेंगे? इसके चेहरे पर, "डेटा के लिए सही मायने में सटीक होने की संभावना को मापें" बहुत मायने रखता है।
whuber

6
आँकड़े देखें ।stackexchange.com/questions/11009/… । डेटा आपको यह बताने में असमर्थ है कि क्या सच है, और इस तरह के दृष्टिकोण को गुणा किए जा रहे चर के माप माप पर बहुत अधिक निर्भर करता है। फ़ारेनहाइट में तापमान के पृथक अंतःक्रियात्मक प्रभावों का आकलन करना सेल्सियस का उपयोग करने की तुलना में एक अलग तस्वीर देगा।
फ्रैंक हर्रेल

@ फ्रेंक: धन्यवाद, मुझे यह :-) मिला। यह अब इस धागे का हिस्सा है।
whuber

7

एक्स और वाई दोनों को एक्सवाई के साथ सहसंबद्ध किया जाएगा (जब तक कि आपने इसे केंद्र में रखकर इसे रोकने के लिए एक विशिष्ट उपाय नहीं किया है)। इस प्रकार यदि आप अपने दृष्टिकोण के साथ एक पर्याप्त बातचीत प्रभाव प्राप्त करते हैं, तो यह एक बातचीत के रूप में एक या एक से अधिक मुख्य प्रभावों की मात्रा की संभावना होगी। यह स्पष्ट, व्याख्यात्मक परिणाम देने वाला नहीं है। इसके बजाय वांछनीय क्या है यह देखने के लिए कि एक्स , वाई और (मुख्य रूप से बाद के चरण में अधिमानतः) xy सहित, मुख्य प्रभाव क्या करते हैं, पर इंटरैक्शन कितना अधिक समझा सकता है ।

शब्दावली के रूप में: हाँ, is 0 को "स्थिरांक" कहा जाता है। दूसरी ओर, "आंशिक" के प्रतिगमन में विशिष्ट अर्थ हैं और इसलिए मैं आपकी रणनीति का वर्णन करने के लिए उस शब्द का उपयोग नहीं करूंगा।

नीले धागे में एक बार उत्पन्न होने वाले कुछ रोचक उदाहरण इस सूत्र में वर्णित हैं ।


7

मेरा सुझाव है कि यह मॉडल अनिश्चितता का एक विशेष मामला है। एक बायेसियन दृष्टिकोण से, आप इसे ठीक उसी तरह से मानते हैं, जिस तरह से आप किसी अन्य प्रकार की अनिश्चितता का इलाज करेंगे:

  1. इसकी संभावना की गणना, अगर यह ब्याज की वस्तु है
  2. इसे एकीकृत करना या बाहर निकालना, अगर यह रुचि का नहीं है, लेकिन फिर भी आपके निष्कर्षों को प्रभावित कर सकता है

यह वही है जो लोग सामान्य मात्रा के बजाय टी-क्वांटिल्स का उपयोग करके "महत्वपूर्ण प्रभावों" के लिए परीक्षण करते समय करते हैं। क्योंकि आपके पास "सही शोर स्तर" के बारे में अनिश्चितता है, इसलिए आप परीक्षण में अधिक फैल आउट वितरण का उपयोग करके इसे ध्यान में रखते हैं। तो आपके नजरिए से "मुख्य प्रभाव" वास्तव में उस सवाल के संबंध में एक "उपद्रव पैरामीटर" है जो आप पूछ रहे हैं। तो आप बस उन दो मामलों (या आमतौर पर, जिन मॉडलों पर आप विचार कर रहे हैं) से औसत निकालते हैं। इसलिए मेरे पास (अस्पष्ट) परिकल्पना होगी: डी मैं पी ( एच मैं एन टी | डी मैं ) = पी ( एच मैं एन टी | मैं ) पी ( डी | एच मैं एन टी मैं )

Hint:The interaction between A and B is significant
मैं कहूंगा कि हालांकि सटीक रूप से परिभाषित नहीं किया गया है, यह वह प्रश्न है जिसका उत्तर आप यहां देना चाहते हैं। और ध्यान दें कि यह मौखिक बयान नहीं है जैसे कि ऊपर जो परिकल्पना को "परिभाषित" करता है, लेकिन गणितीय समीकरण भी। हम कुछ डेटा है , और पूर्व जानकारी : तो हम बस की गणना (छोटा नोट: कोई फर्क नहीं पड़ता कि मैं इस समीकरण को कितनी बार लिखता हूं, यह हमेशा मुझे समस्या को बेहतर ढंग से समझने में मदद करता है। अजीब है)। गणना करने के लिए मुख्य मात्रा संभावना , यह मॉडल का कोई संदर्भ नहीं देता है, इसलिए मॉडल को कुल संभावना के कानून का उपयोग करके हटा दिया जाना चाहिए: DI P(
P(Hint|DI)=P(Hint|I)P(D|HintI)P(D|I)
P(D|HintI)
P(D|HintI)=m=1NMP(DMm|HintI)=m=1NMP(Mm|HintI)P(D|MmHintI)
जहाँ mth मॉडल को अनुक्रमित करता है, और है मॉडल की संख्या पर विचार किया जा रहा है। पहला शब्द "मॉडल वजन" है, जो कहता है कि डेटा और पूर्व सूचना कितने mth मॉडल का समर्थन करती है। दूसरा शब्द बताता है कि मिथ मॉडल परिकल्पना का कितना समर्थन करता है। इस समीकरण को मूल बायस प्रमेय में वापस लाने पर देता है: MmNM
P(Hint|DI)=P(Hint|I)P(D|I)m=1NMP(Mm|HintI)P(D|MmHintI)
=1P(D|I)m=1NMP(DMm|I)P(MmHintD|I)P(DMm|I)=m=1NMP(Mm|DI)P(Hint|DMmI)

और आप इस से देख सकते हैं कि mth मॉडल के तहत परिकल्पना का "सशर्त निष्कर्ष" है (यह आमतौर पर सभी के लिए माना जाता है, एक चुने हुए "सर्वश्रेष्ठ" मॉडल के लिए )। ध्यान दें कि यह मानक विश्लेषण उचित है जब भी - एक "स्पष्ट रूप से सर्वश्रेष्ठ" मॉडल - या जब भी - सभी मॉडल समान / समान निष्कर्ष देते हैं। हालांकि, अगर न तो मिले, तो बेयस के प्रमेय का कहना है कि सबसे अच्छी प्रक्रिया परिणामों को औसत करना है, उन मॉडलों पर उच्च भार रखना जो डेटा और पूर्व सूचना द्वारा सबसे अधिक समर्थित हैं।पी ( एम एम | डी मैं ) 1 पी ( एच मैं एन टी | डी एम जे मैं ) पी ( एच मैं एन टी | डी एम कश्मीर मैं )P(Hint|DMmI)P(Mm|DI)1P(Hint|DMjI)P(Hint|DMkI)


5

इसमें शामिल मुख्य प्रभावों के बिना इंटरैक्शन शब्द शामिल करना बहुत कम विचार है। CCNY के डेविड रिंडस्कोफ ने उन दुर्लभ उदाहरणों के बारे में कुछ कागजात लिखे हैं।


5

प्रकृति में विभिन्न प्रक्रियाएं होती हैं जिनमें केवल एक सहभागिता प्रभाव होता है और कानून जो उन्हें डिक्रिप्ट करते हैं। उदाहरण के लिए ओम का नियम। उदाहरण के लिए आपके पास वूमर (1964) का प्रदर्शन मॉडल है: प्रदर्शन = क्षमता x प्रेरणा। अब, जब आप इस कानून के सही होने पर एक महत्वपूर्ण बातचीत प्रभाव पा सकते हैं। अफसोस, यह मामला नहीं है। आप आसानी से दो मुख्य प्रभावों और एक तुच्छ अंतःक्रियात्मक प्रभाव (प्रदर्शन और आगे के स्पष्टीकरण के लिए लैंडशीयर, वैन डेन वेटनबोयर और मासेन (2006), सोशल साइंस रिसर्च 35, 274-294) को देख सकते हैं। अंतःक्रियात्मक प्रभाव का पता लगाने के लिए रैखिक मॉडल बहुत अच्छी तरह से अनुकूल नहीं है; जब उन्होंने रैखिक मॉडल का इस्तेमाल किया था तो ओम को अपना कानून कभी नहीं मिला।

परिणामस्वरूप, रैखिक मॉडल में इंटरैक्शन प्रभाव की व्याख्या करना मुश्किल है। यदि आपके पास एक सिद्धांत है जो एक इंटरैक्शन प्रभाव की भविष्यवाणी करता है, तो आपको इसे महत्वहीन होने पर भी शामिल करना चाहिए। आप मुख्य प्रभावों को अनदेखा करना चाह सकते हैं यदि आपका सिद्धांत उन लोगों को बाहर करता है, लेकिन आपको यह मुश्किल लगेगा, क्योंकि महत्वपूर्ण मुख्य प्रभाव अक्सर एक सच्चे डेटा जनरेटिंग तंत्र के मामले में पाए जाते हैं जिसमें केवल एक गुणक प्रभाव होता है।

मेरा उत्तर है: हां, मुख्य प्रभावों को शामिल किए बिना एक मॉडल में दो-तरफ़ा बातचीत को शामिल करना मान्य हो सकता है। रैखिक मॉडल एक बड़ी संख्या में डेटा जनरेटिंग तंत्र के परिणामों को अनुमानित करने के लिए उत्कृष्ट उपकरण हैं, लेकिन उनके सूत्र को आसानी से डेटा जनरेटिंग तंत्र के वैध विवरण के रूप में व्याख्या नहीं किया जा सकता है।


4

यह एक मुश्किल है और मेरे आखिरी प्रोजेक्ट में मेरे साथ हुआ। मैं इसे इस तरह समझाऊंगा: मान लीजिए कि आपके पास ए और बी चर थे जो स्वतंत्र रूप से महत्वपूर्ण थे और एक व्यापारिक अर्थ से आपने सोचा था कि ए और बी की बातचीत अच्छी लगती है। आपने उस सहभागिता को शामिल किया जो महत्वपूर्ण थी लेकिन बी ने अपना महत्व खो दिया। आप शुरू में दो परिणाम दिखाकर अपने मॉडल की व्याख्या करेंगे। परिणाम दिखाते हैं कि शुरू में बी महत्वपूर्ण था, लेकिन जब ए के प्रकाश में देखा गया तो इसकी चमक खो गई। तो B एक अच्छा चर है, लेकिन केवल तभी A के विभिन्न स्तरों (यदि A एक श्रेणीगत चर है) के प्रकाश में देखा जाता है। जब ओबामा अपनी सेना की रोशनी में देखा जाता है, तो यह एक अच्छा नेता है। तो ओबामा * सील एक महत्वपूर्ण चर होगा। लेकिन ओबामा जब अकेले दिखे तो शायद उतना महत्वपूर्ण नहीं था। (ओबामा के लिए कोई अपराध नहीं, सिर्फ एक उदाहरण है।)


1
यहाँ यह विपरीत की तरह है। इंटरेक्शन (रुचि) केवल तभी महत्वपूर्ण है जब मुख्य प्रभाव मॉडल में न हों।
ग्लेन

3

एफ = एम * ए, बल बड़े पैमाने पर त्वरण के बराबर होता है।

यह F = m + a + ma, या उन मापदंडों के कुछ अन्य रैखिक संयोजन के रूप में प्रतिनिधित्व नहीं करता है। वास्तव में, केवल द्रव्यमान और त्वरण के बीच की बातचीत शारीरिक रूप से समझ में आएगी।


2
एक असंयमित भौतिकी समीकरण पर लागू होता है जिसमें परिवर्तनशीलता के लिए कोई जगह नहीं है जरूरी नहीं कि परिवर्तनशीलता द्वारा विशेषता डेटा की मॉडलिंग करते समय जरूरी सही या सटीक या उत्पादक हो।
rolando2

2

मुख्य प्रभाव के साथ और बिना बातचीत।  नीला एक शर्त है।  लाल दूसरा।  उनके संबंधित प्रभावों को लगातार तीन मापों से अधिक परखा जाता है।

क्या कभी मुख्य प्रभाव के बिना दो-तरफ़ा बातचीत को शामिल करना मान्य है?

हाँ यह मान्य हो सकता है और आवश्यक भी। उदाहरण के लिए 2. यदि आप मुख्य प्रभाव के लिए एक कारक (नीले बनाम लाल स्थिति का औसत अंतर) को शामिल करेंगे, तो यह मॉडल को बदतर बना देगा।

क्या होगा यदि आपकी परिकल्पना केवल बातचीत के बारे में है, क्या आपको अभी भी मुख्य प्रभावों को शामिल करने की आवश्यकता है?

आपकी परिकल्पना मुख्य प्रभाव होने के कारण वहां स्वतंत्र हो सकती है। लेकिन मॉडल को अंतर्निहित प्रक्रिया का सर्वोत्तम वर्णन करने की आवश्यकता हो सकती है। तो हाँ, आप के साथ और बिना कोशिश करनी चाहिए।

नोट: आपको "निरंतर" स्वतंत्र चर (उदाहरण में माप) के लिए कोड को केंद्र में रखने की आवश्यकता है। अन्यथा मॉडल में सहभागिता गुणांक सममित रूप से वितरित नहीं किया जाएगा (उदाहरण में पहले माप के लिए कोई गुणांक नहीं)।


1

यदि विचाराधीन चर स्पष्ट हैं, तो मुख्य प्रभावों के बिना इंटरैक्शन सहित मॉडल का सिर्फ एक पुनरावर्तन है, और पैरामीटराइजेशन का विकल्प इस बात पर निर्भर करता है कि आप अपने मॉडल के साथ क्या करने की कोशिश कर रहे हैं। श्रेणीगत चरों के साथ अन्य निरंतर चर अयस्क के साथ निरंतर चर को इंटरैक्ट करना एक पूरी अलग कहानी है। देखें: UCLA के इंस्टीट्यूट फॉर डिजिटल रिसर्च एंड एजुकेशन के इस फेक को देखें


1

हां यह मान्य हो सकता है, हालांकि यह दुर्लभ है। लेकिन इस मामले में आपको अभी भी मुख्य प्रभावों को मॉडल करने की आवश्यकता है, जिसे आप बाद में वापस पा लेंगे।

दरअसल, कुछ मॉडलों में, केवल बातचीत दिलचस्प होती है, जैसे दवा परीक्षण / नैदानिक ​​मॉडल। यह उदाहरण के लिए सामान्यीकृत साइकोफिज़ियोलॉजिकल इंटरेक्शन (जीपीपीआई) मॉडल का आधार है: y = ax + bxh + chजहां स्वर x/y/ हित के क्षेत्र और hब्लॉक / ईवेंट डिज़ाइन हैं।

इस मॉडल में, दोनों aऔर cबाहर वहीं किया जाएगा, केवल bअनुमान (बीटा गुणांक) के लिए रखा जाएगा। दरअसल, दोनों aऔर cहमारे मामले में नकली गतिविधि का प्रतिनिधित्व है, और केवल bका प्रतिनिधित्व करता है क्या नकली गतिविधि, कार्य के साथ बातचीत के द्वारा समझाया नहीं जा सकता।


1

संक्षिप्त उत्तर: यदि आप निश्चित प्रभावों में सहभागिता शामिल करते हैं, तो मुख्य प्रभाव स्वचालित रूप से शामिल होते हैं या नहीं, विशेष रूप से आप उन्हें अपने कोड में शामिल करते हैं । एकमात्र अंतर आपके पैरामीट्रिएशन है, अर्थात, आपके मॉडल में पैरामीटर का क्या मतलब है (उदाहरण के लिए, वे समूह साधन हैं या वे संदर्भ स्तरों से अंतर हैं)।

मान्यताओं: मेरा मानना ​​है कि हम सामान्य रैखिक मॉडल में काम कर रहे हैं और पूछ रहे हैं कि हम बजाय निश्चित प्रभाव विनिर्देशन उपयोग कर सकते हैं , जहां और (श्रेणीबद्ध) कारक हैं।ABA+B+ABAB

गणितीय स्पष्टीकरण: हम मानते हैं कि प्रतिक्रिया वेक्टर । यदि , और तीन कारकों के लिए डिजाइन मैट्रिक्स कर रहे हैं, तो "मुख्य प्रभाव और बातचीत" के साथ एक मॉडल प्रतिबंध से मेल खाती है अवधि । "केवल बातचीत" के साथ एक मॉडल प्रतिबंध से मेल खाती है अवधि । हालाँकि , स्पैन स्पैन । तो, यह एक ही मॉडल के दो अलग-अलग पैरामीरीज़ेशन हैंएक्स एक एक्स बी एक्स बी ξ { एक्स , एक्स बी , एक्स बी } ξ { एक्स बी } { एक्स बी } = { एक्स , एक्स बी , एक्स बी }YN(ξ,σ2In)XAXBXABξ{XA,XB,XAB}ξ{XAB}{XAB}={XA,XB,XAB} (या वितरण के एक ही परिवार यदि आप उस शब्दावली के साथ अधिक सहज हैं)।

मैंने अभी देखा कि डेविड बीड ने बहुत ही समान उत्तर (माफी) प्रदान किया, लेकिन मुझे लगा कि मैं इसे उन लोगों के लिए छोड़ दूंगा जो एक रैखिक बीजगणित के परिप्रेक्ष्य में अच्छी प्रतिक्रिया देते हैं।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.