बाइनरी निर्भर और स्वतंत्र चर के साथ लॉजिस्टिक प्रतिगमन


15

क्या एक लॉजिस्टिक रिग्रेशन करना उचित है जहां आश्रित और स्वतंत्र चर दोनों बाइनरी हैं? उदाहरण के लिए आश्रित चर 0 और 1 है और भविष्यवाणियां विपरीत कोडित चर -1 और 1 हैं?

जवाबों:


6

ऐसा नहीं करने का कोई कारण नहीं है, लेकिन दो सावधानीपूर्ण विचार हैं:

  1. विश्लेषण के दौरान ध्यान रखें कि कौन सा है। बड़ी परियोजनाओं में, खो जाना आसान हो सकता है, और गलत परिणाम उत्पन्न कर सकता है।

  2. यदि आप प्रतिगमन अनुपात के बजाय प्रतिगमन अनुमानों को रिपोर्ट करना चुनते हैं , तो अपनी रिपोर्ट में अपनी कोडिंग योजना स्पष्ट करें , इसलिए पाठक अपने स्वयं के गलत अनुमानों का उत्पादन नहीं करते हैं, यह मानकर कि वे दोनों 0,1 कोडित थे।

बुनियादी लग सकता है, लेकिन मैंने देखा है कि दोनों समस्याएं इसे प्रकाशित पत्रों में शामिल करती हैं।


तो फिर 6 अलग-अलग मामलों में डेटाफ़ाइल को अलग करना और प्रत्येक डेटासेट के भीतर अलग-अलग तुलनाओं को चलाने के लिए उपयुक्त कोडेड भविष्यवाणियों के साथ उचित होगा?
upabove

मुझे पूरा यकीन नहीं है कि आप इस दूसरे बिट के लिए क्या पूछ रहे हैं। क्या आप वह हासिल कर सकते हैं जिसे आप पूरा करने की उम्मीद कर रहे हैं?
फोमाइट

मेरे पास विषय स्थितियों के भीतर 3 और 4 के साथ एक डेटासेट है। मैं प्रत्येक और हर प्रभाव के लिए परीक्षण करना चाहूंगा, लेकिन सभी इंटरैक्शन के साथ एक एकल प्रतिगमन में बहुत सारी जानकारी याद आती है, जिसमें मैं रुचि रखता हूं। इसके बजाय मैं डेटा को अलग-अलग डेटासेट में विभाजित करूंगा और प्रत्येक डेटासेट पर केंद्रित लॉजिस्टिक रिग्रेशन को विपरीत रूप से चलाऊंगा। अंतर के लिए कोडिंग कोडिंग में रुचि रखता हूं।
upabove

इसके विपरीत कोड को देखने के तरीके के बारे में अधिक जानकारी के लिए आप यहां देखें: आंकड़े
upabove

11

स्पष्टता के लिए: शब्द "बाइनरी" आमतौर पर केवल 1 बनाम 0 कोडिंग के लिए आरक्षित होता है। किसी भी 2-मूल्य कोडिंग के लिए अधिक सामान्य शब्द "डाइकोटोमस" है। डायकोटोमस भविष्यवक्ता निश्चित रूप से लॉजिस्टिक रिग्रेशन की तरह लॉजिस्टिक रिग्रेशन का स्वागत करते हैं, और, क्योंकि उनके केवल 2 मूल्य हैं, इससे कोई फर्क नहीं पड़ता कि उन्हें कारकों के रूप में या कोवरिएट के रूप में इनपुट करना है या नहीं।


5

आमतौर पर यह व्याख्या में मदद करता है यदि आप अपने भविष्यवाणियों को कोड करते हैं 0-1, लेकिन इसके अलावा (और ध्यान दें कि इसकी आवश्यकता नहीं है), इसके साथ कुछ भी गलत नहीं है। कुछ अन्य (आकस्मिकता-आधारित टेबल) दृष्टिकोण हैं, लेकिन अगर मैं सही ढंग से याद करूं, तो ये (कुछ रूप) लॉजिस्टिक रिग्रेशन के बराबर हो जाते हैं।

तो संक्षेप में: मुझे ऐसा नहीं करने का कोई कारण नहीं दिखता।


धन्यवाद! और अगर मेरे पास 3 कंट्रास्ट कोडेड प्रेडिक्टर्स हैं और मैं उन्हें सभी 0-1 कोड देता हूं तो वे ऑर्थोगोनल नहीं होंगे। उदाहरण के लिए मेरी 4 श्रेणियां हैं और मेरे तीन कोड हैं L1: 1, -1,0,0 L2: 0,1, -1,0, L3: 0,0,1, -1। क्या यह कोई समस्या है?
upabove

आपका उदाहरण L- मैट्रिक्स (L1, L2, L3) बार-बार होने वाली विपरीतता है जिससे प्रत्येक श्रेणी की तुलना निम्न श्रेणी से की जाती है। न तो ये विपरीत भविष्यवाणियां ऑर्थोगोनल हैं और न ही वे बाइनरी हैं (0-1 के रूप में कोडित)। वास्तव में, उनके मान .75 बनाम -.25 (प्रथम चर), .5 बनाम -.5 (द्वितीय चर), .25 बनाम -75 (तृतीय चर)
ttnphns

3

इसके अलावा, यदि आपके पास दो से अधिक भविष्यवाणियां हैं, तो यह अधिक संभावना है कि लॉजिस्टिक या मल्टीपल रिग्रेशन के लिए भी बहु-समरूपता की समस्या होगी। हालांकि, सभी बाइनरी चर (यानी, कोडित (0,1)) के साथ लॉजिस्टिक प्रतिगमन का उपयोग करने के लिए कोई नुकसान नहीं है।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.