लीनियर रिग्रेशन और लॉजिस्टिक रिग्रेशन में क्या अंतर है?
आप प्रत्येक का उपयोग कब करेंगे?
लीनियर रिग्रेशन और लॉजिस्टिक रिग्रेशन में क्या अंतर है?
आप प्रत्येक का उपयोग कब करेंगे?
जवाबों:
रेखीय प्रतीपगमन सामान्य रेखीय समीकरण का उपयोग करता है जहां एक सतत निर्भर चर और स्वतंत्र चरों है हैं आमतौर पर निरंतर (लेकिन जब रेखीय मॉडल एक टी में प्रयोग किया जाता है यह भी द्विआधारी, जैसे हो सकता है परीक्षण) या अन्य असतत डोमेन। विचरण के लिए एक शब्द है जिसे मॉडल द्वारा समझाया नहीं गया है और आमतौर पर इसे केवल "त्रुटि" कहा जाता है। द्वारा निरूपित व्यक्तिगत निर्भर मान समीकरण को थोड़ा संशोधित करके हल किया जा सकता है:
लॉजिस्टिक रिग्रेशन समान मूल सूत्र का उपयोग करते हुए एक और सामान्यीकृत रैखिक मॉडल (जीएलएम) प्रक्रिया है, लेकिन निरंतर बजाय , यह एक श्रेणीबद्ध परिणाम की संभावना के लिए पुन: प्राप्त कर रहा है। सबसे सरल रूप में, इसका मतलब है कि हम केवल एक परिणाम चर और उस चर के दो राज्यों पर विचार कर रहे हैं- या तो 0 या 1।
की प्रायिकता का समीकरण इस तरह दिखता है:
आपके स्वतंत्र चर निरंतर या द्विआधारी हो सकते हैं। प्रतिगमन गुणांक exponentiated जा सकती है, आप की संभावना में बदलाव देने के लिए में परिवर्तन प्रति , यानी, और । को ऑड्स अनुपात, । अंग्रेजी में, आप कह सकते हैं कि में प्रति यूनिट परिवर्तन कारक संभावना बढ़ जाती है ।
उदाहरण: यदि आप यह देखना चाहते हैं कि बॉडी मास इंडेक्स कैसे रक्त कोलेस्ट्रॉल (एक निरंतर माप) की भविष्यवाणी करता है, तो आप मेरे जवाब के शीर्ष पर वर्णित के रूप में रैखिक प्रतिगमन का उपयोग करेंगे। यदि आप यह देखना चाहते हैं कि बीएमआई एक मधुमेह (एक द्विआधारी निदान) होने की बाधाओं की भविष्यवाणी कैसे करता है, तो आप लॉजिस्टिक प्रतिगमन का उपयोग करेंगे।
रैखिक प्रतिगमन का उपयोग निर्भर और स्वतंत्र चर के बीच संबंध स्थापित करने के लिए किया जाता है, जो कि परिणामी आश्रित चर के मामले में स्वतंत्र चर परिवर्तन का अनुमान लगाने में उपयोगी है। उदाहरण के लिए:
रैखिक प्रतिगमन का उपयोग करते हुए, वर्षा (R) और छाता बिक्री (U) के बीच संबंध पाया जाता है - U = LR + 5000
यह समीकरण कहता है कि प्रत्येक 1 मिमी वर्षा के लिए, 5002 छतरियों की मांग है। इसलिए, सरल प्रतिगमन का उपयोग करके, आप अपने चर के मूल्य का अनुमान लगा सकते हैं।
दूसरी ओर लॉजिस्टिक रिग्रेशन का उपयोग किसी घटना की संभावना का पता लगाने के लिए किया जाता है। और यह घटना बाइनरी फॉर्मेट यानी 0 या 1 में कैप्चर की जाती है।
उदाहरण - मैं यह पता लगाना चाहता हूं कि कोई ग्राहक मेरा उत्पाद खरीदेगा या नहीं। इसके लिए, मैं (प्रासंगिक) डेटा पर लॉजिस्टिक रिग्रेशन चलाऊंगा और मेरा आश्रित वेरिएबल बाइनरी वैरिएबल (1 = हाँ; 0 = नहीं) होगा।
ग्राफिकल प्रतिनिधित्व के संदर्भ में, रेखीय प्रतिगमन एक रेखीय लाइन को आउटपुट के रूप में देता है, एक बार मान ग्राफ पर प्लॉट किए जाते हैं। जबकि, लॉजिस्टिक रिग्रेशन एस-आकार की रेखा देता है
मोहित खुराना का संदर्भ
DocBuckets और Pardis द्वारा मतभेदों को सुलझा लिया गया है, लेकिन मैं उनके प्रदर्शन का उल्लेख नहीं करने के लिए एक तरीका जोड़ना चाहता हूं।
रैखिक प्रतिगमन आमतौर पर मॉडल की कम से कम चौकोर त्रुटि को डेटा द्वारा कम करके हल किया जाता है, इसलिए बड़ी त्रुटियों को द्विघात रूप से दंडित किया जाता है। लॉजिस्टिक रिग्रेशन ठीक इसके विपरीत है। लॉजिस्टिक लॉस फंक्शन का उपयोग करने से बड़ी त्रुटियों को एक असंगत रूप से स्थिर करने के लिए दंडित किया जाता है।
एक श्रेणीगत {0,1} परिणामों पर रैखिक प्रतिगमन पर विचार करें कि यह समस्या क्यों है। यदि आपका मॉडल भविष्यवाणी करता है कि परिणाम 38 है जब सत्य 1 है, तो आपने कुछ भी नहीं खोया है। रैखिक प्रतिगमन 38 को कम करने की कोशिश करेगा, लॉजिस्टिक नहीं होगा (जितना)।