मुझे लॉजिस्टिक रिग्रेशन विश्लेषण में निरंतर स्वतंत्र चर के लिए लॉजिट को रैखिकता की धारणा की जांच कैसे करनी चाहिए?


13

मैं लॉजिस्टिक रिग्रेशन एनालिसिस में निरंतर प्रेडिक्टर वेरिएबल्स के लिए लॉजिट के लिए रैखिकता की धारणा से भ्रमित हूं। क्या हमें अविभाज्य लॉजिस्टिक रिग्रेशन विश्लेषण का उपयोग करते हुए संभावित भविष्यवक्ताओं की स्क्रीनिंग के दौरान रैखिक संबंध की जांच करने की आवश्यकता है?

मेरे मामले में, मैं प्रतिभागियों के बीच पोषण की स्थिति (विचित्र परिणाम) से जुड़े कारकों की पहचान करने के लिए कई लॉजिस्टिक रिग्रेशन विश्लेषण का उपयोग कर रहा हूं। निरंतर चर, उम्र सहित, चार्लसन कोमर्बिडिटी स्कोर, बार्टेल इंडेक्स स्कोर, हैंड ग्रिप स्ट्रेंथ, जीडीएस स्कोर, बीएमआई आदि। मेरा पहला कदम साधारण लॉजिस्टिक रिग्रेशन का उपयोग करते हुए महत्वपूर्ण वैरिएबल की स्क्रीनिंग करना है। क्या मुझे प्रत्येक निरंतर चर के लिए सरल लॉजिस्टिक प्रतिगमन विश्लेषण के दौरान रैखिकता धारणा की जांच करने की आवश्यकता है? या मैं बस अंतिम कई लॉजिस्टिक प्रतिगमन मॉडल में इसके लिए जांच करूं?

इसके अलावा, मेरी समझ के लिए, हमें मॉडल में प्रवेश करने से पहले गैर-रैखिक निरंतर चर को बदलना होगा। क्या मैं परिवर्तन के बजाय गैर-रैखिक निरंतर चर को वर्गीकृत कर सकता हूं?


1
स्प्लीन को बेहतर बनाने के लिए आपको श्रेणीबद्ध नहीं होना चाहिए !
kjetil b halvorsen

जवाबों:


11

जैसा कि मैंने अपनी पुस्तक रिग्रेशन मॉडलिंग स्ट्रेटेजिज (२०१५-०९ -२ पर उपलब्ध संस्करण, ई-बुक अभी उपलब्ध है) में विस्तार से वर्णन किया है , मॉडलिंग से पहले चर को बदलने की कोशिश की प्रक्रिया समस्याओं से भरी हुई है, सबसे महत्वपूर्ण विकृति में से एक है प्रकार I की त्रुटि और आत्मविश्वास अंतराल। वर्गीकरण से और भी अधिक गंभीर समस्याएं पैदा होती हैं, विशेष रूप से फिट और मनमानी का अभाव।

इस बारे में सोचने के बजाय "फिट की कमी के लिए जाँच करें" समस्या के रूप में, एक मॉडल को निर्दिष्ट करने के बारे में सोचना बेहतर है जो फिट होने की बहुत संभावना है। ऐसा करने का एक तरीका मॉडल के उन हिस्सों को पैरामीटर आवंटित करना है जो मजबूत होने की संभावना रखते हैं और जिसके लिए रैखिकता पहले से ही एक उचित धारणा नहीं है। इस प्रक्रिया में एक प्रभावी नमूना आकार (आपके मामले में घटनाओं की संख्या और गैर-घटनाओं की संख्या के न्यूनतम) की जांच करता है और डेटा की सूचना सामग्री (15 जैसे: 1 घटनाओं का उपयोग करके) इस सीमा तक जटिलता की अनुमति देता है: पैरामीटर नियम अंगूठे का)। एक लचीले एडिटिव पैरामीट्रिक मॉडल को पूर्व-निर्दिष्ट करके एक ही गलत होगा जहां यह महत्वपूर्ण इंटरैक्शन को छोड़ कर मायने रखता है। आम तौर पर बोलना पूर्व-निर्दिष्ट होना चाहिए।

आप यह देख सकते हैं कि क्या औपचारिक परीक्षण (आर rmsपैकेज के साथ आसान बनाया गया ) के साथ मॉडल में गैर-शुद्धता की आवश्यकता थी लेकिन ऐसे शब्दों को हटाने पर जब निरर्थक मैं ऊपर उल्लिखित हीन विकृतियों का निर्माण करता है।

अधिक विवरण http://biostat.mc.vanderbilt.edu/rms से जुड़े पाठ्यक्रम के नोट्स में पाए जा सकते हैं ।


पहले उल्लेख नहीं करने के लिए क्षमा करें, लेकिन मैं R से परिचित नहीं हूं और विश्लेषण के लिए SPSS का उपयोग कर रहा था। प्रदान किए गए समाधान से, क्या इसका मतलब है कि अगर मैं प्रभावी नमूना आकार (15: 1) का उपयोग करता हूं, तो मैं उनकी रैखिकता की जांच किए बिना सभी महत्वपूर्ण कारकों (समीक्षा से) को शामिल कर सकता हूं?
लिन टैन

अविभाज्य लॉजिस्टिक रिग्रेशन विश्लेषण से मैंने अपने मामले में किया था, बीएमआई, बछड़ा परिधि, मध्य-ऊपरी बांह परिधि सभी पोषण स्थिति (पी <0.05) के सरल लॉजिस्टिक प्रतिगमन मॉडल में एक महत्वपूर्ण योगदान दे रहे हैं। लेकिन जब मैं बॉक्स-टिडवेल दृष्टिकोण (प्रत्येक सरल लॉजिस्टिक मॉडल के लिए) का उपयोग करके धारणा की जांच करता हूं तो वे रैखिकता धारणा से नहीं मिले। इसलिए मुझे यकीन नहीं है कि मुझे इन भविष्यवक्ताओं के साथ कई लॉजिस्टिक प्रतिगमन विश्लेषण के लिए आगे बढ़ना चाहिए या नहीं।
लिन टैन

5
अविभाज्य विश्लेषण के आधार पर मॉडल बनाना अमान्य है। आप चरणबद्ध प्रतिगमन को अग्रेषित करने के लिए एक प्रकार का उपयोग कर रहे हैं जो समस्याओं का एक मेजबान का कारण बनता है।
फ्रैंक हार्ले

8

लॉजिस्टिक रिग्रेशन निर्भर और स्वतंत्र चर के बीच एक रैखिक संबंध नहीं मानता है। यह आश्रित चर के लॉग ऑड्स और स्वतंत्र चर के बीच एक रैखिक संबंध मानता है (यह मुख्य रूप से एक स्वतंत्र चर के साथ एक मुद्दा है।) बॉक्स-टिडवेल नामक एक परीक्षण है जिसे आप इसके लिए उपयोग कर सकते हैं। स्टैटा कमांड बॉक्सटिड है। मैं SPSS कमांड नहीं जानता, क्षमा करें।

यह मदद की हो सकती है - http://www.ats.ucla.edu/stat/stata/webbooks/logistic/chapter3/statalog3.htm


लिंक अब टूट गया है
एलेक्सी श्रुब

1

मुझे लगता है कि हमें प्रतिगमन मॉडल में उपयोग करने से पहले निरंतर चर की साजिश करनी चाहिए और रैखिकता की जांच करनी चाहिए। यदि रैखिकता एक उचित धारणा की तरह लगता है, तो मुझे लगता है कि यह अभी भी ज्यादातर मामलों में अंतिम बहुक्रियाशील प्रतिगमन मॉडल में रहेगा, और यदि नहीं, तो मुझे लगता है कि यह मुख्य रूप से इंटरैक्शन प्रभाव के कारण हो सकता है जो आप के लिए सही हो सकते हैं।

हां, गैर-रैखिक निरंतर चर को वर्गीकृत करना एक विकल्प है। इसके साथ समस्याएं यह हैं कि श्रेणियां ज्यादातर मामलों में मनमानी लगती हैं, और श्रेणियों के बीच कट-ऑफ स्कोर में छोटे अंतर के कारण अलग-अलग परिणाम हो सकते हैं (विशेषकर सांख्यिकीय महत्व के बारे में), और, श्रेणियों की संख्या और आपके डेटा के आकार के आधार पर , आप डेटा में बहुत मूल्यवान जानकारी खो सकते हैं।

एक वैकल्पिक दृष्टिकोण एक सामान्यीकृत योज्य मॉडल का उपयोग करना है जो एक प्रतिगमन मॉडल है जिसे लॉजिस्टिक प्रतिगमन के रूप में निर्दिष्ट किया जा सकता है, लेकिन जिसमें आप गैर-रैखिक स्वतंत्र चर को "चिकनी कार्यों" के रूप में शामिल कर सकते हैं। तकनीकी रूप से, यह R में बहुत जटिल नहीं है, लेकिन मैं अन्य सॉफ्टवेयर पैकेज के बारे में नहीं जानता। ये मॉडल आश्रित चर के लिए गैर-रैखिक संबंधों की पहचान करेंगे, लेकिन एक खामी यह हो सकती है कि आपको वर्तमान में अपने आउटपुट में नीट और सुव्यवस्थित संख्या नहीं मिलेगी, बल्कि एक दृश्य वक्र है जो सांख्यिकीय महत्व के लिए परीक्षण किया जाता है। तो यह निर्भर करता है कि आप परिणाम चर पर गैर-रैखिक चर के प्रभाव को बढ़ाने में कितनी रुचि रखते हैं।

अंत में, आप सामान्यीकृत एडिटिव मॉडल का उपयोग कर सकते हैं जैसा कि ऊपर वर्णित है, अपने लॉजिस्टिक रिग्रेशन मॉडल में रैखिकता की मान्यताओं का परीक्षण करने के लिए, कम से कम यदि आप आर का उपयोग करते हैं।

इस पुस्तक पर एक नज़र डालें (आप से बहुत अलग क्षेत्र, और मेरा, लेकिन यह बिल्कुल भी मायने नहीं रखता है): http://www.amazon.com/Effects-Extensions-Ecology-Statistics-Biology/dp/0387874577 / रेफरी = sr_1_1? यानी = UTF8 और QID = १४४०९२८३२८ और एसआर = 8-1 और कीवर्ड = zuur + पारिस्थितिकी


मैं R से परिचित नहीं हूं और विश्लेषण के लिए SPSS का उपयोग कर रहा था। पहले उल्लेख नहीं करने के लिए क्षमा करें। क्या मैं लीनियर धारणा की जांच करने के लिए बॉक्स-टिडवेल दृष्टिकोण (निरंतर चर और अपने स्वयं के प्राकृतिक लॉग के बीच एक इंटरेक्शन शब्द और मॉडल में इंटरैक्शन शब्द जोड़कर) का उपयोग कर सकता हूं?
लिन टैन

1

चूँकि मुझे आपके डेटा का पता नहीं है, इसलिए मुझे पता नहीं है कि उन तीन चर - मूल चर, इसके प्राकृतिक लॉग और एक संवादात्मक शब्द का संयोजन - एक समस्या होगी। हालांकि, मुझे पता है कि अतीत में जब मैंने तीन शब्दों के संयोजन पर विचार किया था तो मैं अक्सर मापता हूं कि मैं क्या माप रहा हूं। आपको जो कुछ भी आप माप रहे हैं उस पर एक अच्छा हैंडल होना चाहिए या आपको अपने निष्कर्षों को समझाने में परेशानी होगी। उम्मीद है की वो मदद करदे!

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.