लीनियर रिग्रेशन और लॉजिस्टिक रिग्रेशन में क्या अंतर है?


122

लीनियर रिग्रेशन और लॉजिस्टिक रिग्रेशन में क्या अंतर है?

आप प्रत्येक का उपयोग कब करेंगे?


28
रैखिक प्रतिगमन मॉडल में आश्रित चर को निरंतर माना जाता है, जबकि लॉजिस्टिक प्रतिगमन में यह श्रेणीबद्ध है, अर्थात असतत है। आवेदन में, पूर्व का उपयोग प्रतिगमन सेटिंग्स में किया जाता है जबकि बाद का उपयोग द्विआधारी वर्गीकरण या बहु-श्रेणी वर्गीकरण (जहां इसे बहुराष्ट्रीय उपस्कर प्रतिगमन कहा जाता है) के लिए किया जाता है। y
पारदी

यद्यपि एक अलग संदर्भ में लिखा गया है, यह आपको यहां मेरे उत्तर को पढ़ने में मदद कर सकता है: लॉगिट और प्रोबेट मॉडल के बीच अंतर , जिसमें लॉजिस्टिक प्रतिगमन में क्या हो रहा है, इसके बारे में बहुत सारी जानकारी शामिल है जो आपको इन बेहतर को समझने में मदद कर सकती है।
गंग

2
पिछले सभी उत्तर सही हैं, लेकिन ऐसे कारण हैं कि आप एक रेखीय प्रतिगमन मॉडल का पक्ष ले सकते हैं, जब आपका परिणाम एक द्वंद्वात्मकता हो। मैंने इन कारणों के बारे में यहाँ लिखा है: सांख्यिकीयखिड़कियाँ
logistic

जवाबों:


111

रेखीय प्रतीपगमन सामान्य रेखीय समीकरण का उपयोग करता है जहां एक सतत निर्भर चर और स्वतंत्र चरों है हैं आमतौर पर निरंतर (लेकिन जब रेखीय मॉडल एक टी में प्रयोग किया जाता है यह भी द्विआधारी, जैसे हो सकता है परीक्षण) या अन्य असतत डोमेन। विचरण के लिए एक शब्द है जिसे मॉडल द्वारा समझाया नहीं गया है और आमतौर पर इसे केवल "त्रुटि" कहा जाता है। द्वारा निरूपित व्यक्तिगत निर्भर मान समीकरण को थोड़ा संशोधित करके हल किया जा सकता है:Y=b0+(biXi)+ϵYXiϵYjYj=b0+(biXij)+ϵj

लॉजिस्टिक रिग्रेशन समान मूल सूत्र का उपयोग करते हुए एक और सामान्यीकृत रैखिक मॉडल (जीएलएम) प्रक्रिया है, लेकिन निरंतर बजाय , यह एक श्रेणीबद्ध परिणाम की संभावना के लिए पुन: प्राप्त कर रहा है। सबसे सरल रूप में, इसका मतलब है कि हम केवल एक परिणाम चर और उस चर के दो राज्यों पर विचार कर रहे हैं- या तो 0 या 1।Y

की प्रायिकता का समीकरण इस तरह दिखता है: Y=1

P(Y=1)=11+e(b0+(biXi))

आपके स्वतंत्र चर निरंतर या द्विआधारी हो सकते हैं। प्रतिगमन गुणांक exponentiated जा सकती है, आप की संभावना में बदलाव देने के लिए में परिवर्तन प्रति , यानी, और । को ऑड्स अनुपात, । अंग्रेजी में, आप कह सकते हैं कि में प्रति यूनिट परिवर्तन कारक संभावना बढ़ जाती है ।XibiYXiOdds=P(Y=1)P(Y=0)=P(Y=1)1P(Y=1)ΔOdds=ebiΔOddsOdds(Xi+1)Odds(Xi)Y=1ebiXi

उदाहरण: यदि आप यह देखना चाहते हैं कि बॉडी मास इंडेक्स कैसे रक्त कोलेस्ट्रॉल (एक निरंतर माप) की भविष्यवाणी करता है, तो आप मेरे जवाब के शीर्ष पर वर्णित के रूप में रैखिक प्रतिगमन का उपयोग करेंगे। यदि आप यह देखना चाहते हैं कि बीएमआई एक मधुमेह (एक द्विआधारी निदान) होने की बाधाओं की भविष्यवाणी कैसे करता है, तो आप लॉजिस्टिक प्रतिगमन का उपयोग करेंगे।


1
यह एक अच्छा जवाब लगता है, लेकिन क्या आप बता सकते हैं कि लिए क्या है और - विशेष रूप से - आप उन्हें भीतर क्यों शामिल करते हैं ? (वैसे भी, क्या कहा जा रहा है?)ϵi
व्हिबर

यह मेरे बिल को देखता है कि वह ईई के बजाय यानी लिखने का मतलब है (लैटिन संक्षिप्त नाम है)
माइकल चेरिक

1
लेकिन घातांक के योग में ini नहीं होना चाहिए। ऐसा लगता है कि मॉडल में शोर शब्द को गलती से वहाँ ले जाया गया था। एकमात्र समोच्च bis के ऊपर होना चाहिए जो p covariates के लिए p गुणांक का प्रतिनिधित्व करता है।
माइकल चेरिक ने

9
लिए आपकी अभिव्यक्ति में त्रुटि है । आपके पास न कि एक लॉजिस्टिक रिग्रेशन मॉडल में यादृच्छिकता इस तथ्य से आती है कि ये बर्नौली परीक्षण हैं, न कि सफलता की संभावनाओं में त्रुटि होने से (जो कि कैसे है) आप इसे लिख रहे हैं)। P(Y=1)
P(Y=1)=11+exp{Xβ},
P(Y=1)=11+exp{(Xβ+ε)}
मैक्रो

3
@samthebrand लॉजिस्टिक रिग्रेशन प्रति बाइनरी नहीं है। इसका उपयोग 0 और 1. के बीच की संभावनाओं के माध्यम से द्विआधारी प्रतिक्रिया के साथ डेटा मॉडल करने के लिए किया जा सकता है। बेशर्मी से मेरे ब्लॉग पोस्ट को इस पर प्लग करें जो आपकी उलझन को साफ करना चाहिए।
बेन

34

रैखिक प्रतिगमन का उपयोग निर्भर और स्वतंत्र चर के बीच संबंध स्थापित करने के लिए किया जाता है, जो कि परिणामी आश्रित चर के मामले में स्वतंत्र चर परिवर्तन का अनुमान लगाने में उपयोगी है। उदाहरण के लिए:

रैखिक प्रतिगमन का उपयोग करते हुए, वर्षा (R) और छाता बिक्री (U) के बीच संबंध पाया जाता है - U = LR + 5000

यह समीकरण कहता है कि प्रत्येक 1 मिमी वर्षा के लिए, 5002 छतरियों की मांग है। इसलिए, सरल प्रतिगमन का उपयोग करके, आप अपने चर के मूल्य का अनुमान लगा सकते हैं।

दूसरी ओर लॉजिस्टिक रिग्रेशन का उपयोग किसी घटना की संभावना का पता लगाने के लिए किया जाता है। और यह घटना बाइनरी फॉर्मेट यानी 0 या 1 में कैप्चर की जाती है।

उदाहरण - मैं यह पता लगाना चाहता हूं कि कोई ग्राहक मेरा उत्पाद खरीदेगा या नहीं। इसके लिए, मैं (प्रासंगिक) डेटा पर लॉजिस्टिक रिग्रेशन चलाऊंगा और मेरा आश्रित वेरिएबल बाइनरी वैरिएबल (1 = हाँ; 0 = नहीं) होगा।

ग्राफिकल प्रतिनिधित्व के संदर्भ में, रेखीय प्रतिगमन एक रेखीय लाइन को आउटपुट के रूप में देता है, एक बार मान ग्राफ पर प्लॉट किए जाते हैं। जबकि, लॉजिस्टिक रिग्रेशन एस-आकार की रेखा देता है

मोहित खुराना का संदर्भ


8
पुन: "रैखिक प्रतिगमन का उपयोग डिपेंडेंट और इंडिपेंडेंट वेरिएबल्स के बीच संबंध स्थापित करने के लिए किया जाता है" - यह लॉजिस्टिक रिग्रेशन के बारे में भी सच है - यह सिर्फ इतना है कि निर्भर चर द्विआधारी है।
मैक्रों

3
लॉजिस्टिक रिग्रेशन केवल एक द्विआधारी घटना ( कक्षाएं) की भविष्यवाणी करने के लिए नहीं है । इसे क्लासेस ( 2k
बहुराष्ट्रीय

27

DocBuckets और Pardis द्वारा मतभेदों को सुलझा लिया गया है, लेकिन मैं उनके प्रदर्शन का उल्लेख नहीं करने के लिए एक तरीका जोड़ना चाहता हूं।

रैखिक प्रतिगमन आमतौर पर मॉडल की कम से कम चौकोर त्रुटि को डेटा द्वारा कम करके हल किया जाता है, इसलिए बड़ी त्रुटियों को द्विघात रूप से दंडित किया जाता है। लॉजिस्टिक रिग्रेशन ठीक इसके विपरीत है। लॉजिस्टिक लॉस फंक्शन का उपयोग करने से बड़ी त्रुटियों को एक असंगत रूप से स्थिर करने के लिए दंडित किया जाता है।

एक श्रेणीगत {0,1} परिणामों पर रैखिक प्रतिगमन पर विचार करें कि यह समस्या क्यों है। यदि आपका मॉडल भविष्यवाणी करता है कि परिणाम 38 है जब सत्य 1 है, तो आपने कुछ भी नहीं खोया है। रैखिक प्रतिगमन 38 को कम करने की कोशिश करेगा, लॉजिस्टिक नहीं होगा (जितना)।


तब, जो परिस्थितियाँ / मामले एक लॉजिस्टिक में दंडित होते हैं , अर्थात, हम किन मामलों में एक खराब फिट होंगे?
MSIS

1
बस विपरीत: जब भी फिट से बड़े विचलन वास्तव में खराब परिणाम देते हैं। उदाहरण के लिए, लॉजिस्टिक रिग्रेशन आपको डार्ट बोर्ड पर रखने में अच्छा है, लेकिन एक बुल्सआई को अच्छा नहीं बना सकता है। या, इसी तरह, सोचता है कि बोर्ड की एक नज़दीकी याद अपने पड़ोसी को चिपकाने के समान है।
जे। अब्राहमसन

बहुत बढ़िया जवाब। क्या कोई शोध किया गया था कि इससे मॉडल के प्रदर्शन को कितना नुकसान पहुंचा है? मेरा मतलब है कि अगर लोजिस्टिक रिग्रेशन का इस्तेमाल लॉजिस्टिक रिग्रेशन के बजाय प्रतिक्रिया = {0,1} का अनुमान लगाने के लिए किया गया था।
तगार
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.