लॉजिस्टिक रिग्रेशन (SPSS) में गैर-बाइनरी श्रेणीबद्ध चर से कैसे निपटें


10

मुझे बहुत सारे स्वतंत्र चर के साथ बाइनरी लॉजिस्टिक रिग्रेशन करना है। उनमें से ज्यादातर बाइनरी हैं, लेकिन कुछ वैरिएबल चर में दो से अधिक स्तर हैं।

ऐसे चरों से निपटने का सबसे अच्छा तरीका क्या है?

उदाहरण के लिए, तीन संभावित मूल्यों के साथ एक चर के लिए, मुझे लगता है कि दो डमी चर बनाने होंगे। फिर, एक चरण-वार प्रतिगमन प्रक्रिया में, एक ही समय में दोनों डमी चर का परीक्षण करना बेहतर होता है या अलग से परीक्षण करना बेहतर होता है?

मैं SPSS का उपयोग करूंगा, लेकिन मुझे यह बहुत अच्छी तरह से याद नहीं है, इसलिए: SPSS इस स्थिति से कैसे निपटता है?

इसके अलावा, एक क्रमिक श्रेणीगत चर के लिए, डमी चर का उपयोग करना एक अच्छी बात है जो क्रमिक पैमाने को फिर से बनाता है? (उदाहरण के लिए, एक 4-राज्य क्रमसूचक चर, डाल के लिए तीन डमी वेरिएबल का उपयोग करके 0-0-0स्तर के लिए , स्तर के लिए , स्तर के लिए और स्तर के लिए , बजाय , , और 4 स्तरों के लिए।)11-0-021-1-0431-1-140-0-01-0-00-1-00-0-1


2
यह सिर्फ एक आंशिक उत्तर है: यहां तक ​​कि जब आप डमी को स्पष्ट रूप से बनाते हैं (सॉफ़्टवेयर की अंतर्निहित क्षमताओं का उपयोग करने के बजाय), तो उन्हें सभी विश्लेषणों में एक साथ रखें। विशेष रूप से, उन्हें सभी को एक साथ दर्ज करना चाहिए और सभी एक साथ चरणबद्ध प्रतिगमन में छोड़ देना चाहिए, जिसमें कुल शामिल चर की उचित संख्या के लिए पी-मूल्य की गणना की गई है। (यह होसमेर और लेमेशो की सिफारिश है, वैसे भी, और यह बहुत समझ में आता है।)
व्हिबर at


आप अपने स्वतंत्र चर के बारे में बात कर रहे हैं। यह केवल आश्रित चर है जिसे लॉजिस्टिक प्रतिगमन के लिए द्विआधारी होने की आवश्यकता है।
जॉन

1
यहां एक बात ध्यान देने वाली है कि आपको स्टेप वाइज चयन प्रक्रियाओं का उपयोग बिल्कुल नहीं करना चाहिए; वे मान्य नहीं हैं। यदि इससे कोई मतलब नहीं है / आप यह समझना चाहते हैं कि क्यों, यह आपको मेरा जवाब यहाँ पढ़ने में मदद कर सकता है: एल्गोरिदम-के लिए-स्वचालित-मॉडल-चयन
गूँग - मोनिका

जवाबों:


10

यूसीएलए वेबसाइट में सॉफ्टवेयर प्रकार से टूटी हुई प्रत्येक प्रक्रिया के लिए शानदार ट्यूटोरियल का एक समूह है, जिससे आप परिचित हैं। एनोटेटेड एसपीएसएस आउटपुट की जांच करें : लॉजिस्टिक रिग्रेशन - एसईएस चर जो वे उल्लेख करते हैं वह श्रेणीबद्ध है (और बाइनरी नहीं)। SPSS आपके लिए स्वचालित रूप से संकेतक चर बनाएगा। वहाँ भी एक पृष्ठ SPSS के साथ प्रतिगमन में श्रेणीबद्ध भविष्यवाणियों को समर्पित है, जो डिफ़ॉल्ट कोडिंग और लॉजिस्टिक प्रतिगमन के लिए विशिष्ट पृष्ठ को बदलने के बारे में विशिष्ट जानकारी है ।


7

लॉजिस्टिक रिग्रेशन काफी लचीली विधि है। यह आसानी से स्वतंत्र चर श्रेणीगत चर के रूप में उपयोग कर सकता है। लॉजिस्टिक रिग्रेशन का उपयोग करने वाले अधिकांश सॉफ़्टवेयर को आपको श्रेणीबद्ध चर का उपयोग करने देना चाहिए।

एक उदाहरण के रूप में, मान लीजिए कि आपका एक श्रेणीगत चर तापमान को तीन श्रेणियों में परिभाषित किया गया है: ठंडा / हल्का / गर्म। जैसा कि आप सुझाव देते हैं कि आप व्याख्या कर सकते हैं कि तीन अलग-अलग डमी वैरिएबल प्रत्येक में 1 या 0. के मान के साथ हैं, लेकिन सॉफ्टवेयर को आपको टेक्स्ट वैल्यू कोल्ड / माइल्ड / हॉट के बजाय एक एकल वैरिएबल वैरिएबल का उपयोग करने देना चाहिए। और, लॉजिट रिग्रेशन तीन में से प्रत्येक तापमान की स्थिति के लिए गुणांक (या स्थिर) प्राप्त करेगा। यदि कोई महत्वपूर्ण नहीं है, तो सॉफ्टवेयर या उपयोगकर्ता इसे आसानी से निकाल सकते हैं (टी स्टेट और पी मान के अवलोकन के बाद)।

एकल श्रेणीगत चर में श्रेणीगत चर श्रेणियों को समूहीकृत करने का मुख्य लाभ मॉडल दक्षता है। आपके मॉडल में एक एकल स्तंभ एकल श्रेणीगत चर के लिए आवश्यकतानुसार कई श्रेणियों को संभाल सकता है। यदि इसके बजाय, आप एक श्रेणीगत चर की प्रत्येक श्रेणी के लिए एक डमी चर का उपयोग करते हैं, तो आपका मॉडल जल्दी से कई स्तंभों को विकसित कर सकता है जो उल्लेखित विकल्प दिए गए हैं।


1
@gaetan मुझे एकल कॉलम बनाम एकाधिक कॉलम के बारे में टिप्पणी समझ में नहीं आती है। क्या आप यह सुझाव दे रहे हैं कि श्रेणीबद्ध चर को डमी चर का उपयोग करने के बजाय एक कॉलम में 1, 2, 3 आदि के रूप में कोडित किया जाना चाहिए? मुझे यकीन नहीं है कि मेरे लिए समझ में आता है जैसा कि आप तब एक अंतर्निहित बाधा डाल रहे हैं कि लेवी 1s और 2 के बीच में DV पर प्रभाव का अंतर स्तर 2 और 3 के बीच के डीवी के प्रभाव में अंतर के समान है। शायद, मैं मुझे कुछ याद आ रहा है।

1
@ गण मुझे यकीन नहीं है कि मैं आपका अनुसरण कर रहा हूं। अनुमान के उद्देश्य से XLStat ठंड, हल्के या गर्म के 'पाठ' मूल्यों को संख्यात्मक मूल्यों में कैसे बदलता है? अगर कोई ऐसा तरीका है जो आपको डमी वैरिएबल का उपयोग किए बिना श्रेणीबद्ध चर के प्रभावों का अनुमान लगाने देगा, तो निश्चित रूप से आपके द्वारा उपयोग किए जाने वाले सॉफ़्टवेयर से स्वतंत्र होना चाहिए क्योंकि कुछ अंतर्निहित वैचारिक / मॉडल आधारित तर्क होना चाहिए।

kk1

1
@ गेटन ओके, इस मामले में, एसपीएसएस में समान किया जा सकता है (आपके पास प्रत्येक चर के लिए संख्यात्मक / क्रमिक / नाममात्र के बीच विकल्प है) - फिर, तदनुसार डिजाइन मैट्रिक्स का निर्माण किया जाता है।
ch

2
@Gaetan @chl मेरी समझ को सारांशित करने के लिए: SPSS और XLStat की विशेषताएं जिससे आप माप स्केल (नाममात्र, क्रमिक आदि) निर्दिष्ट कर सकते हैं, डेटा फ़ाइल का आकार कम कर देता है। हालाँकि, दोनों उदाहरणों में, सॉफ़्टवेयर सही कोडिंग योजना का उपयोग करता है (जैसे, J श्रेणियों के साथ नाममात्र चर का विस्तार J-1 डमी चर में) पृष्ठभूमि में अनुमान प्रक्रिया के भाग के रूप में। क्या यह स्थिति का उचित आकलन होगा?

0

जहाँ तक मेरी समझ जाती है, श्रेणीबद्ध / नाममात्र डेटा के लिए डमी वैरिएबल का उपयोग करना अच्छा होता है जबकि एक क्रमिक डेटा के लिए हम विभिन्न स्तरों के लिए 1,2,3 की कोडिंग का उपयोग कर सकते हैं। डमी वैरिएबल के लिए हम 1 को कोडिंग करेंगे यदि यह किसी विशेष ऑनर्स और 0 के लिए सही है अन्यथा। साथ ही डमी वैरिएबल न के बराबर 1 कम होगा। स्तरों के लिए, उदाहरण के लिए बाइनरी में हमारे पास 1. डमी वेरिएबल में सभी '0' अवलोकन स्वचालित रूप से कोडित डमी के लिए 1 बना देगा।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.