एक समूह तुलना के लिए अलग-अलग प्रतिगमन बनाम बातचीत की शर्तों के साथ संयुक्त मॉडल


13

पिछले प्रश्नों और चर्चाओं से मूल्यवान प्रतिक्रिया एकत्र करने के बाद, मैं निम्नलिखित प्रश्न के साथ आया हूं: मान लीजिए कि लक्ष्य दो समूहों में प्रभाव के अंतर का पता लगाना है, उदाहरण के लिए पुरुष बनाम महिला। इसे करने के दो तरीके हैं:

  1. दो समूहों के लिए दो अलग-अलग पंजीकरण चल रहे हैं, और शून्य परिकल्पना : b 1 - b 2 = 0 को अस्वीकार करने के लिए Wald परीक्षण नियोजित करें , जहां b 1 पुरुष प्रतिगमन में एक IV का गुणांक है, और b 2 है महिला प्रतिगमन में समान IV का गुणांक।H0b1b2=0b1b2

  2. एक साथ दो समूहों को पूल करें, और एक लिंग डमी और एक इंटरैक्शन शब्द (IV * लिंगम) को शामिल करके एक संयुक्त मॉडल चलाएं। फिर, समूह प्रभाव का पता लगाने के लिए बातचीत के संकेत और महत्व के लिए टी-टेस्ट पर आधारित होगा।

क्या होगा यदि हो (1) में अस्वीकार कर दिया जाता है, अर्थात समूह अंतर महत्वपूर्ण है, लेकिन मामले में सहभागिता शब्द का गुणांक (2) सांख्यिकीय रूप से महत्वहीन है, अर्थात समूह अंतर महत्वहीन है। या इसके विपरीत, हो को मामले (1) में खारिज नहीं किया जाता है, और मामले में बातचीत का महत्व (2) है। मैं कई बार इस परिणाम के साथ समाप्त हो गया हूं, और मैं सोच रहा था कि क्या परिणाम अधिक विश्वसनीय होगा, और इस विरोधाभास के पीछे क्या कारण है।

बहुत धन्यवाद!


1
प्रक्रियाओं के बीच अंतर यह है कि दोनों समूहों के लिए एक ही भिन्नता है। अलग विश्लेषण विभिन्न भिन्नताओं को मानता है।
probabilityislogic

बहुत बहुत धन्यवाद! क्या आप जानते हैं कि विभिन्न मॉडलों की तुलना करते समय भिन्नताओं के मुद्दे पर चर्चा करने वाले किसी संदर्भ का कृपया ध्यान दें?
Bill718

जवाबों:


7

पहला मॉडल पूरी तरह से मॉडल में अन्य सभी सहसंयोजकों के साथ लिंग की बातचीत करेगा। अनिवार्य रूप से, प्रत्येक कोवरिएट (b2, b3 ... bn) का प्रभाव। दूसरे मॉडल में, लिंग का प्रभाव केवल आपके IV के साथ बातचीत करता है। तो, यह मानकर कि आपके पास केवल IV और लिंग से अधिक सहसंयोजक हैं, यह कुछ अलग परिणाम दे सकता है।

यदि आपके पास सिर्फ दो कोवरिएट्स हैं, तो ऐसे दस्तावेज किए गए अवसर हैं जहां वाल्ड टेस्ट और लिक्लिहुड अनुपात परीक्षण के बीच अधिकतम अंतर में अंतर अलग-अलग उत्तरों तक होता है ( विकिपीडिया पर अधिक देखें )।

अपने स्वयं के अनुभव में, मैं सिद्धांत द्वारा निर्देशित होने की कोशिश करता हूं। यदि एक प्रमुख सिद्धांत है जो सुझाव देता है कि लिंग केवल IV के साथ बातचीत करेगा, लेकिन अन्य सहसंयोजकों के साथ नहीं, तो मैं आंशिक बातचीत के साथ जाऊंगा।


धन्यवाद! हां, वास्तव में विभिन्न कोवरिएट्स हैं, न केवल एक IV, मैंने सरलता के लिए प्रश्न में केवल एक IV का उल्लेख किया है। बात यह है कि एक मजबूत सिद्धांत नहीं है जो लिंग और कुछ सहसंयोजकों के बीच बातचीत का समर्थन कर सकता है, यह खोजपूर्ण विश्लेषण है, इसलिए मुझे कई इंटरैक्शन और मॉडल फिट होने के साथ प्रयोग करने की आवश्यकता है; प्रारंभिक मॉडल में 30 भविष्यवक्ता होते हैं ...
बिल 718

@ Bill718 इसके अलावा अलग-अलग मॉडल में एक अलग अवरोधन होगा, जबकि एकल मॉडल नहीं होगा, जब तक कि आप अकेले लिंग को एक अतिरिक्त IV के रूप में निर्दिष्ट नहीं करते (न कि केवल एक इंटरैक्शन के रूप में)।
रॉबर्ट कुब्रिक

5

कभी भी दो अलग-अलग प्रक्रियाओं का उपयोग एक विशेष परिकल्पना का परीक्षण करने के लिए किया जाता है, अलग-अलग पी-मान होंगे। कहने का मतलब है कि एक महत्वपूर्ण है और दूसरा सिर्फ 0.05 के स्तर पर एक काले और सफेद निर्णय नहीं हो सकता है। यदि एक परीक्षण 0.03 का पी-मूल्य देता है और दूसरा 0.07 कहता है तो मैं परिणामों को विरोधाभासी नहीं कहूंगा। यदि आप ऐसा करने जा रहे हैं कि महत्व के बारे में सोचने में सख्त होना आसान है या तो स्थिति (i) या (ii) तब उत्पन्न होती है जब बोर्डलाइन का महत्व होता है।

जैसा कि मैंने पिछले प्रश्न के उत्तर में उल्लेख किया है कि एक सहभागिता की तलाश के लिए मेरी प्राथमिकता एक संयुक्त प्रतिगमन है।


हां, यह सच है कि संयुक्त प्रतिगमन बेहतर प्रदर्शन करने के लिए लगता है, कम से कम मेरे मामले में, और यह एक बहुत ही लचीली विधि है, क्योंकि कोई व्यक्ति विभिन्न इंटरैक्शन और मॉडल के साथ प्रयास कर सकता है। मैं अभी चाहता था, "सांख्यिकीय" जिज्ञासा के साथ कहता हूं , यह जानने के लिए कि किसी तरह से अलग परिणाम के पीछे क्या कारण है। पी-वैल्यू के बारे में, मैंने कुछ लोगों को केवल 0.5% या उससे कम स्तर पर महत्व स्वीकार करते सुना है। मैं अधिक लचीला हूं, = 1% स्तर का उपयोग कर रहा हूं, लेकिन बड़ा सिरदर्द तब होता है जब पी-मान पूरी तरह से अलग होते हैं।
बिल 718

मैंने उदाहरण के लिए अध्ययनों को देखा है, जहां एक ऑर्डर किए गए लॉगिट मोडेट को नियोजित करने के दौरान एक IV बहुत महत्वपूर्ण है, जबकि एक ओएलएस लागू होने पर वही IV निरर्थक हो जाता है। तो, उस स्थिति में, परिणामों की व्याख्या थोड़ी मुश्किल हो सकती है। आपकी टिप्पणियों और प्रतिक्रिया के लिए बहुत बहुत धन्यवाद!
बिल 718

0.070.03

2

दूसरे मामले में, मानक सॉफ्टवेयर आपको टी-स्टूडेंट पेल्विस के साथ एक टी-स्टैट का सुझाव देगा जबकि पहले मामले के लिए वाल्ड परीक्षणों में दो विकल्प हो सकते हैं। त्रुटियों के तहत सामान्यता धारणा वाल्ड स्टेटिस्टिक एक सटीक फिशर स्टेटिस्टिक का अनुसरण करता है (जो कि टी-स्टेट के बराबर है क्योंकि यह त्रुटि की सामान्यता मानता है)। जबकि स्पर्शोन्मुख सामान्यता के तहत, Wald आँकड़ा एक Chi2 वितरण का अनुसरण करता है (जो कि एक सामान्य वितरण के बाद t-stat के लिए गुदा है) asimptotically? क्या वितरण आप मान रहे हैं? इसके आधार पर आपके पी-मान आपको अलग-अलग परिणाम देने के लिए जोखिम देते हैं।

पाठ्यपुस्तकों में आप पाएंगे कि द्विपक्षीय एकल परीक्षण (एक पैरामीटर) दोनों के लिए, टी-छात्र और फिशर आँकड़े समान हैं।

यदि आपका नमूना बड़ा नहीं है, तो chi2 और t-stat pvalues ​​की तुलना करने से कुछ के लिए अलग-अलग परिणाम प्राप्त होंगे। उस मामले में एक असममित dsitribution संभालने के लिए उचित नहीं होगा। यदि आपका नमूना बल्कि छोटा है, तो सामान्यता अधिक उचित लगती है, इसका अर्थ है क्रमशः 2 और 1 के लिए टी-स्टेट और फिशर पेल्विज।


वास्तव में, मेरे पास असमान आकार के दो नमूने हैं, पहले में 3000 अवलोकन हैं, लेकिन दूसरा अपेक्षाकृत छोटा है, 500 अवलोकन हैं। और सॉफ्टवेयर वाल्ड आँकड़ों की गणना करते समय ची-स्क्वायर की रिपोर्ट करता है। तो, ऐसा लगता है कि यह विसंगति का कारण है। दोनों नमूने आम तौर पर वितरित किए जाते हैं, खासकर बड़े नमूने के मामले में। बहुत धन्यवाद!
बिल 718

1
मैं आपको धोखा देने के लिए माफी चाहता हूं, लेकिन असमान सदस्यता के आकार एक मुद्दा नहीं है। इसके अलावा तुम्हारा मेरा एक बड़ा नमूना लगता है। इसलिए दोनों प्रक्रियाओं को समान परिणाम प्राप्त करने चाहिए। मैंने देखा कि @probabilityislogic ने एक अच्छी बात की। एक पूल किए गए नमूने का उपयोग करने से समान अवशिष्ट भिन्नताएं निकलती हैं, जिससे कि विषमता का स्रोत हो सकता है। पता नहीं है कि आप अलग प्रतिगमन प्रक्रिया को कैसे लागू कर रहे हैं, लेकिन यदि आप स्वयं स्टेट की गणना कर रहे हैं तो गलतियाँ करना आसान है। यह जमाव प्रतिगमन को एक सुरक्षित सीधा दृष्टिकोण बनाता है।
JDav

1
समूहों (विषमयुग्मता) के पार असमान भिन्नताओं के मुद्दे को हल करने के लिए एक सफेद (उर्फ नेवे-वेस्ट, सैंडविच या रोबस्ट यदि आप स्टैटा का उपयोग करते हैं) विचरण अनुमानक का प्रयास करें। यह दृष्टिकोण विषम प्रकार की विषमता के लिए सही है।
JDav

ओह, ठीक है, मैं देखता हूं, वास्तव में नमूने में अवलोकन एक देश के विभिन्न क्षेत्रों से आते हैं, इसलिए यह बहुत संभव है कि मुझे लगता है कि विषमता के मुद्दे मौजूद हैं!
बिल 718
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.