स्वतंत्र चर के रूप में क्रमिक श्रेणीगत चर को कैसे संभालना है


19

मैं एक लॉजिट मॉडल का उपयोग कर रहा हूं। मेरा आश्रित चर द्विआधारी है। हालांकि मेरे पास एक स्वतंत्र चर है जो स्पष्ट है और इसमें प्रतिक्रियाएं शामिल हैं 1.very good, 2.good, 3.average, 4.poor and 5.very poor:। तो, यह ऑर्डिनल ("मात्रात्मक श्रेणीबद्ध") है। मुझे यकीन नहीं है कि मॉडल में इसे कैसे संभालना है। मैं उपयोग कर रहा हूं gretl

[नोट @ttnphns से: हालांकि सवाल कहता है कि मॉडल लॉजिट है (क्योंकि आश्रित श्रेणीगत है), महत्वपूर्ण मुद्दा - क्रमिक स्वतंत्र चर - मूल रूप से एक जैसा है, निर्भर श्रेणीबद्ध या मात्रात्मक हो। इसलिए यह सवाल भी उतना ही प्रासंगिक है, कहना है, रेखीय प्रतिगमन भी - जैसा कि लॉजिस्टिक रिग्रेशन या अन्य लॉजिट मॉडल के लिए है।]


मेरा आश्रित चर मान 0 और 1 लेता है, मेरे पास 6 स्वतंत्र चर हैं, उनमें से 3 श्रेणीबद्ध हैं ये चर इस तरह हैं "आप अपने क्षेत्र में स्थानीय स्वास्थ्य सेवाओं को कैसे रेट करते हैं? आप अपने क्षेत्र में स्थानीय परिवहन को कैसे दर करते हैं और आप कैसे दर करते हैं? ?। पुलिस सेवाओं अपने क्षेत्र में प्रतिक्रियाओं बहुत अच्छा, अच्छा, औसत, गरीब और बहुत गरीब हैं
रहमत

@ समय यदि आश्रित चर द्विआधारी है, तो किसी भी क्रमिक प्रतिगमन की आवश्यकता नहीं है। निहितार्थ संकेतक (डमी) चर का उपयोग करते हुए एक अध्यापक भविष्यवक्ता को संभालना है।
निक कॉक्स

धन्यवाद टिम, अगर मैं गलत नहीं हूँ कि तुम क्या कहते हो कि मुझे सभी श्रेणियों के लिए डमी बनाना चाहिए ?? उदाहरण के लिए, मेरे पास एक इंडेप वेरिएबल के लिए पांच प्रतिक्रिया (बहुत अच्छा, अच्छा, औसत, गरीब और बहुत गरीब) है, इसलिए मुझे 5 डमी बनाने चाहिए।
रहमत

जवाबों:


14

क्रमिक स्वतंत्र चर के साथ समस्या यह है कि चूंकि, परिभाषा के अनुसार, इसके स्तरों के बीच का वास्तविक मीट्रिक अंतराल ज्ञात नहीं है , कोई उपयुक्त प्रकार का संबंध नहीं है - छतरी "मोनोटोनिक" के अलावा - एपीरीरी माना जा सकता है। हमें इसके बारे में कुछ करना है, उदाहरण के लिए - "स्क्रीन या वेरिएंट को संयोजित करने के लिए" या "कुछ को अधिकतम करने के लिए पसंद करें"।

यदि आप अपनी संभावित रेटिंग IV को आर्डिनल (इंटरवल या नॉमिनल के बजाय) मानने पर जोर देते हैं, तो मुझे आपके लिए विकल्पों की एक जोड़ी मिल गई है।

  1. बहुपद विरोधाभासों का उपयोग करें यानी मॉडल में उपयोग किया जाने वाला प्रत्येक ऐसा पूर्वानुमान न केवल रैखिक रूप से, बल्कि द्विघात और मूल रूप से भी प्रवेश करता है। तो, न केवल रैखिक, बल्कि अधिक सामान्य, मोनोटोनिक प्रभाव को कैप्चर किया जा सकता है (रैखिक प्रभाव पैमाने / अंतराल के रूप में रखे गए भविष्यवक्ता से मेल खाता है और अन्य दो प्रभाव इसे गैर-अंतराल अंतराल के रूप में चखते हैं)। इसके अतिरिक्त, प्रत्येक भविष्यवक्ता की डमी को भी दर्ज किया जा सकता है, जो नाममात्र / तथ्यात्मक प्रभाव के लिए परीक्षण करेगा। उस सब के अंत में, आप जानते हैं कि आपका भविष्यवक्ता कारक के रूप में कितना कार्य करता है, रेखीय कोवरिएट के रूप में कितना, और नॉनलाइनियर कोवरिएट के रूप में कितना। यह विकल्प लगभग किसी भी प्रतिगमन (रैखिक, रसद, अन्य सामान्यीकृत-रैखिक मॉडल) में करना आसान है। यह डीएफ एस का उपभोग करेगा , इसलिए नमूना का आकार काफी बड़ा होना चाहिए।
  2. इष्टतम स्केलिंग प्रतिगमन का उपयोग करें । यह दृष्टिकोण एक अंतराल में एक क्रमिक भविष्यवक्ता को एक रूपांतर में बदल देता है ताकि पूर्वानुमान पर रैखिक प्रभाव को अधिकतम किया जा सके। CATREG (श्रेणीबद्ध प्रतिगमन) SPSS में इस विचार का कार्यान्वयन है। आपके विशिष्ट मामले की एक समस्या यह है कि आप लॉजिस्टिक करना चाहते हैं, रेखीय प्रतिगमन नहीं, लेकिन CATREG लॉगिट आधारित मॉडल नहीं है। मुझे लगता है कि यह बाधा अपेक्षाकृत मामूली है क्योंकि आपका पूर्वानुमान केवल 2-श्रेणी (बाइनरी) है: मेरा मतलब है कि आप अभी भी इष्टतम स्केलिंग के लिए CATREG कर सकते हैं, फिर अंतिम रूपांतरित स्केल भविष्यवक्ताओं के साथ अंतिम लॉजिस्टिक प्रतिगमन करें।
  3. यह भी ध्यान दें कि एक स्केल या ऑर्डिनल डीवी के सरल मामले में और एक ऑर्डिनल IV जोन्केयर-टेरपस्ट्रा टेस्ट रिग्रेशन के बजाय एक उचित विश्लेषण हो सकता है।

अन्य सुझाव भी हो सकते हैं। उपरोक्त तीनों आपके प्रश्न को पढ़ने के तुरंत बाद मेरे दिमाग में आते हैं।

मुझे आपको इन थ्रेड्स पर भी जाने की सलाह देते हैं: नाममात्र और पैमाने या अध्यादेश के बीच संबंध ; ऑर्डिनल और स्केल के बीच जुड़ाव । वे इसके बावजूद मददगार हो सकते हैं कि वे विशिष्ट प्रतिगमन के बारे में नहीं हैं।

लेकिन ये धागे विशेष रूप से लॉजिस्टिक के बारे में हैं: आपको अंदर देखना होगा: एक , दो , तीन , चार , पांच


(+1) (1) आप केवल पहले कुछ बहुपद विरोधाभासों का भी उपयोग कर सकते हैं यदि आपको लगता है कि वे पर्याप्त हैं। (2) एक ही डेटा सेट में प्रतिक्रिया से भविष्यवक्ताओं को परिभाषित करना स्वास्थ्य चेतावनी के साथ आना चाहिए। (3) आप यह भी आसन्न स्तरों के गुणांकों के बीच विसंगति दंडित कर सकते हैं - देख stats.stackexchange.com/q/77796/17230
Scortchi - को पुनः स्थापित मोनिका

1
@Scortchi, टिप्पणी के लिए धन्यवाद। (2) के बारे में - हां, विशेष रूप से, यह निश्चित रूप से डेटा के एक अलग सबसेट पर इष्टतम स्केलिंग करने के लिए अधिक विश्वसनीय है, जिस पर अंतिम प्रतिगमन किया जाएगा। (३) - धन्यवाद, मैं भी इससे परिचित हो जाऊंगा।
tnnphns

1
एक अन्य विकल्प एक विज्ञापन मॉडल का उपयोग करना है, और एक तख़्ता के माध्यम से क्रमिक स्वतंत्र चर का प्रतिनिधित्व करना है।
kjetil b halvorsen

2
@kjetilbhalvorsen, हाँ यह संभव है, धन्यवाद। यह विकल्प हालांकि पहले से ही Pt 2 में निहित है क्योंकि ऑर्डिनल वैरिएबल के लिए इष्टतम स्केलिंग के तरीकों में से एक स्पलाइन का उपयोग करता है।
ttnphns

7

बस अन्य उत्कृष्ट उत्तरों को जोड़ने के लिए: इसे संभालने का एक आधुनिक तरीका एक एडिटिव मॉडल के माध्यम से हो सकता है, एक तख्ते के माध्यम से स्वतंत्र स्वतंत्र चर का प्रतिनिधित्व कर सकता है। यदि आप सुनिश्चित हैं कि चर का प्रभाव मोनोटोन है, तो आप एक मोनोटोन सीमा तक ही सीमित रह सकते हैं। (उपयोग में मोनोटोन स्प्लिन के उदाहरण के लिए, सिग्मॉइड-जैसे वक्र फिट करने के लिए फ़ंक्शन की तलाश में देखें )।

आर में, यदि आप अध्यादेशी भविष्यवक्ता को "आदेशित कारक" (उदाहरण के लिए कोड ord <- factor(sample(1:5,20,replace=TRUE),ordered=TRUE) ) बनाते हैं, तो एक रैखिक मॉडल में इसे ऑर्थोगोनल पॉलीओनियल के माध्यम से दर्शाया जाएगा।


4
यह अच्छा होगा कि इसका थोड़ा विस्तार करें, कुछ और विवरणों को शामिल करने के लिए कि यह कैसे क्रमिक भविष्यवक्ताओं के साथ काम करेगा।
ttnphns

0

k1k


3
n

1
धन्यवाद टिम और निक। इसलिए मुझे प्रतिगमन में सभी चार डमी को चलाना होगा। सही? यदि हां, तो मेरे पास 5 प्रतिक्रिया के साथ प्रत्येक के 3 श्रेणीबद्ध चर हैं। इसलिए, मेरे मॉडल में 12 चर होंगे। सही?
रहमत

1
धन्यवाद @NickCox - मैं सीवी दुनिया के लिए नया हूं और सम्मानजनक सुधार की सराहना करता हूं
ऑस्टिन टी

1
दुर्भाग्य से, आपने यह नहीं बताया कि डमी चरों की आवश्यकता क्यों होगी। मुझे ऐसा नहीं लगता कि यह उत्तर, यह वर्तमान में कैसा है, प्रश्न के उत्तर के रूप में दिखता है।
tnnphns

2
समर्थन में, मुझे नहीं लगता कि यह तर्क देने का मामला है कि संकेतक की आवश्यकता है ; यह सिर्फ इतना है कि वे गैर-मोनोटोनिक रिश्तों सहित विभिन्न प्रकार के प्रभावों को पकड़ने की अनुमति देते हैं।
निक कॉक्स
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.