महत्वपूर्ण भविष्यवक्ता एकाधिक लॉजिस्टिक प्रतिगमन में गैर-महत्वपूर्ण हो जाते हैं


11

जब मैं दो अलग-अलग (अविभाज्य) लॉजिस्टिक रिग्रेशन मॉडल में अपने चर का विश्लेषण करता हूं, तो मुझे निम्नलिखित मिलते हैं:

Predictor 1:    B= 1.049,    SE=.352,    Exp(B)=2.85,    95% CI=(1.43, 5.69),    p=.003
   Constant:    B=-0.434,    SE=.217,    Exp(B)=0.65,                            p=.046

Predictor 2:    B= 1.379,    SE=.386,    Exp(B)=3.97,    95% CI=(1.86, 8.47),    p<.001
   Constant:    B=-0.447,    SE=.205,    Exp(B)=0.64,                            p=.029

लेकिन जब मैं उन्हें एक एकल लॉजिस्टिक प्रतिगमन मॉडल में दर्ज करता हूं, तो मुझे यह मिलता है:

Predictor 1:    B= 0.556,    SE=.406,    Exp(B)=1.74,    95% CI=(0.79, 3.86),    p=.171
Predictor 2:    B= 1.094,    SE=.436,    Exp(B)=2.99,    95% CI=(1.27, 7.02),    p=.012
   Constant:    B=-0.574,    SE=.227,    Exp(B)=0.56,                            p=.012

दोनों भविष्यवक्ता द्वंद्वात्मक (श्रेणीबद्ध) हैं। मैंने मल्टीकोलिनरिटी के लिए जाँच की है।

मुझे यकीन नहीं है कि अगर मैंने पर्याप्त जानकारी दी है, लेकिन मैं यह नहीं समझ सकता कि क्यों भविष्यवक्ता 1 महत्वपूर्ण से गैर-महत्वपूर्ण तक चला गया है और कई प्रतिगमन मॉडल में ऑड्स अनुपात इतने भिन्न क्यों हैं। किसी को भी क्या हो रहा है की एक बुनियादी विवरण प्रदान कर सकते हैं?


2
बहुभिन्नरूपी आमतौर पर कई आश्रित चर को इंगित करता है - आपका मतलब कई भविष्यवक्ता है, है ना? यह आमतौर पर कई प्रतिगमन के रूप में जाना जाएगा।
मैक्रो

1
साथ ही, अलग-अलग लॉजिस्टिक रिग्रेशन मॉडल से आमतौर पर तुलनीय नहीं होते हैं। इसका कारण यह है कि पैमाने बदल गए हैं - यह एक सूक्ष्म मुद्दा है, लेकिन मूल विचार यह है कि कुल विचरण (अव्यक्त पैमाने पर जो लॉजिस्टिक प्रतिगमन स्वाभाविक रूप से उत्पन्न होता है - देखें en.wikipedia.org/wiki/… ) मॉडल भर में तय नहीं हुआ है। इसलिए आपको गुणांक के मॉडल के पार समान होने की उम्मीद नहीं करनी चाहिए, हालांकि यह जरूरी नहीं कि सांख्यिकीय महत्व में बदलाव को स्पष्ट करेगा। आपने दो भविष्यवक्ताओं के बीच निर्भरता की जांच कैसे की? β
मैक्रों

आह, ठीक है धन्यवाद। मैंने spss पर रैखिक प्रतिगमन के माध्यम से कोलिनियरिटी डायग्नोस्टिक्स की जाँच की और सहिष्णुता और VIF की जाँच की - क्या यह सही है?
एनी

अच्छी टिप्पणी @Macro मैं पैमाने के बारे में इस मुद्दे को ठीक करने के तरीकों के बारे में पढ़ने को याद करता हूं, लेकिन मुझे याद नहीं है कि कहां है।
पीटर Flom

1
@PeterFlom, एक चीज जो आप कर सकते हैं, वह है रैखिक भविष्यवक्ताओं के विचरण द्वारा गुणांक (प्लस , मानक उपस्कर वितरण का प्रसरण) - यह उन्हें उसी पैमाने पर रखता है। एक बार ऐसा करने के बाद, बेशक, वे व्याख्यात्मक नहीं होते हैं। π2/3
मैक्रो

जवाबों:


20

कई कारण हैं (जिनमें से कोई भी विशेष रूप से लॉजिस्टिक प्रतिगमन से संबंधित नहीं है, लेकिन किसी भी प्रतिगमन में हो सकता है)।

  1. स्वतंत्रता की डिग्री का नुकसान: किसी दिए गए डेटासेट से अधिक मापदंडों का अनुमान लगाने की कोशिश करते समय, आप प्रभावी रूप से इसके बारे में अधिक पूछ रहे हैं, जिससे सटीक लागत होती है, इसलिए टी-आँकड़े कम होते हैं, इसलिए उच्च पी-मान होते हैं।
  2. रजिस्टरों का सहसंबंध: आपके रजिस्टर्स एक दूसरे से संबंधित हो सकते हैं, प्रभावी रूप से कुछ समान माप कर सकते हैं। कहते हैं, आपका लॉगिट मॉडल अनुभव और उम्र के एक समारोह के रूप में श्रम बाजार की स्थिति (काम / काम नहीं करना) की व्याख्या करना है। व्यक्तिगत रूप से, दोनों चर स्थिति से सकारात्मक रूप से संबंधित हैं, क्योंकि अधिक अनुभवी / पुराने (तर्क के लिए बहुत पुराने कर्मचारियों को सत्तारूढ़ करना) कर्मचारियों को हाल के स्नातकों की तुलना में नौकरी ढूंढना आसान लगता है। अब, जाहिर है, दो चर दृढ़ता से संबंधित हैं, क्योंकि आपको अधिक अनुभव होने के लिए पुराना होना चाहिए। इसलिए, दो चर मूल रूप से स्थिति की व्याख्या करने के लिए "प्रतिस्पर्धा" करते हैं, जो विशेष रूप से छोटे नमूनों में हो सकता है, जिसके परिणामस्वरूप दोनों चर "खो" सकते हैं, क्योंकि कोई भी प्रभाव पर्याप्त मजबूत नहीं हो सकता है और दूसरे को प्राप्त करने के लिए नियंत्रित करते समय पर्याप्त रूप से ठीक-ठीक अनुमान लगाया जा सकता है। महत्वपूर्ण अनुमान। अनिवार्य रूप से, आप पूछ रहे हैं: उम्र को स्थिर रखते हुए एक और वर्ष के अनुभव का सकारात्मक प्रभाव क्या है? उस प्रश्न का उत्तर देने के लिए आपके डेटासेट में कोई भी कर्मचारी नहीं हो सकता है, इसलिए प्रभाव का अनुमान लगाया जाएगा, जिससे बड़े पी-मान हो सकते हैं।

  3. गलत वर्तनी वाले मॉडल: टी-सांख्यिकी / पी-मूल्यों के लिए अंतर्निहित सिद्धांत के लिए आवश्यक है कि आप सही ढंग से निर्दिष्ट मॉडल का अनुमान लगाएं। अब, यदि आप केवल एक भविष्यवक्ता के बारे में जानते हैं, तो संभावना काफी अधिक है कि अविभाजित मॉडल अप्रचलित चर पूर्वाग्रह से ग्रस्त है। इसलिए, सभी दांव बंद हो जाते हैं कि पी-वैल्यू कैसे व्यवहार करते हैं। मूल रूप से, आपको अपने मॉडल के सही न होने पर उन पर भरोसा करने के लिए सावधान रहना चाहिए।


आपकी संपूर्ण और त्वरित प्रतिक्रिया के लिए धन्यवाद। मैं पहले किसी भी बहुस्तरीयता को खत्म करने की कोशिश करूंगा। मैंने चर के बीच सहसंबंध चलाए हैं और कुछ पाया है, और जैसा कि मैंने सुना है कि विचरण मुद्रास्फीति कारकों को चलाने की कोशिश करेंगे, साथ ही इस के लिए जाँच करने का एक अच्छा तरीका है। यदि यह सिर्फ स्वतंत्रता के मुद्दे की डिग्री हो, तो क्या मैं इसके बारे में कुछ भी कर सकता हूं? मैं यह समझा सकता हूं कि यह हो रहा है, लेकिन यदि प्रतिगमन इतनी गंभीर रूप से गिरता है तो यह प्रतिगमन की अखंडता से समझौता करता है।
सैम ओ'ब्रायन

3
@ SamO'Brien: ध्यान दें कि यदि आपका लक्ष्य वास्तव में वही है जो आपने कहा था - "यह निर्धारित करने का प्रयास करने के लिए" कि कौन से स्वतंत्र चर संभावित रूप से प्रतिक्रिया देते हैं "-, कुछ को अनदेखा करते हुए सिर्फ इसलिए कि वे दूसरों के साथ सहसंबद्ध हैं" किसी भी बहुपक्षीयता को खत्म करने के लिए " मदद करने के लिए जा नहीं है इसे प्राप्त करने के।
फिर से बहाल करते मोनिका - Scortchi

1
क्या यह संभव है कि इसके चारों ओर एक ही तरीका हो यानी एक ही भविष्यवक्ता साधारण प्रतिगमन में गैर-महत्वपूर्ण लेकिन कई प्रतिगमन में महत्वपूर्ण है?
gkcn

8

ऐसा होने का कोई विशेष कारण नहीं है। एकाधिक प्रतिगमन साधारण प्रतिगमन से एक अलग प्रश्न पूछता है। विशेष रूप से, एकाधिक प्रतिगमन (इस मामले में, कई लॉजिस्टिक प्रतिगमन) आश्रित चर और स्वतंत्र चर के बीच संबंध के बारे में पूछते हैं, अन्य स्वतंत्र चर के लिए नियंत्रित करते हैं। सरल प्रतिगमन एक आश्रित चर और एक (एकल) स्वतंत्र चर के बीच संबंध के बारे में पूछता है।

यदि आप अपने अध्ययन के संदर्भ को जोड़ते हैं (उदाहरण के लिए, ये चर क्या हैं?) तो अधिक विशिष्ट प्रतिक्रियाएं देना संभव हो सकता है। इसके अलावा, यह देखते हुए कि आपके मामले में सभी तीन चर dichotomies हैं, आप हमें डेटा को आसानी से प्रस्तुत कर सकते हैं ... इसे संक्षेप में प्रस्तुत करने के लिए केवल 8 पंक्तियों की आवश्यकता है:

DVIV1IV2CountAAA10AAB20

आदि।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.