लॉजिस्टिक रिग्रेशन एक रैखिक क्लासिफायरियर क्यों है?


49

चूंकि हम इनपुट के रैखिक संयोजन को गैर-रेखीय आउटपुट में बदलने के लिए लॉजिस्टिक फ़ंक्शन का उपयोग कर रहे हैं, इसलिए लॉजिस्टिक रिग्रेशन को रैखिक क्लासिफायरियर कैसे माना जा सकता है?

रेखीय प्रतिगमन छिपी हुई परत के बिना एक तंत्रिका नेटवर्क की तरह है, इसलिए तंत्रिका नेटवर्क को गैर-रैखिक क्लासिफायरियर माना जाता है और लॉजिस्टिक प्रतिगमन रैखिक है?


7
"इनपुट के एक रैखिक संयोजन को एक गैर-रैखिक आउटपुट में बदलना" एक रैखिक क्लासिफायर की परिभाषा का एक मूल हिस्सा है । इस सवाल को दूसरे भाग में कम कर देता है, जो यह दर्शाता है कि न्यूरल नेटवर्क्स को आम तौर पर रैखिक क्लासिफायरियर के रूप में व्यक्त नहीं किया जा सकता है।
whuber

1
: आप इस तथ्य की व्याख्या कैसे करते हैं कि एक लॉजिस्टिक रिग्रेशन मॉडल एक गैर-रेखीय सीमा का उत्पादन करने के लिए बहुपद भविष्यवक्ता चर (जैसे ) ले सकता है? क्या यह अभी भी एक रैखिक क्लासिफायरफ़ाइल है? w1x12+w2x23
stackoverflowuser2010

4
@Stack "रैखिक क्लासिफायरियर" की अवधारणा एक रेखीय मॉडल की अवधारणा के साथ उत्पन्न होती है एक मॉडल में "रेखीयता" कई रूपों पर ले जा सकती है, जैसा कि आँकड़े.स्टैकएक्सचेंज . com / a / 148713 पर वर्णित है । हम स्वीकार करते हैं रैखिक classifiers के विकिपीडिया लक्षण वर्णन है, तो अपने बहुपद उदाहरण के रूप में देखी जा होगा nonlinear दिया "सुविधाओं" के मामले में और लेकिन यह होगा रैखिक सुविधाओं के मामले में और । यह भेद रैखिकता के गुणों के दोहन का एक उपयोगी तरीका प्रदान करता है। x 2x1x2 x 3 2x12x23
whuber

1
मैं अभी भी थोड़ा उलझन में हूं कि सवाल लॉजिस्टिक क्लासिफायरियर लीनियर की निर्णय सीमा है? मैंने कोर्टेरा पर एंड्रयू एनजी मशीन सीखने के पाठ्यक्रम का पालन किया है और उन्होंने निम्नलिखित का उल्लेख किया है: [यहाँ छवि विवरण दर्ज करें ] ( i.stack.imgur.com/gHxfr.png ) इसलिए वास्तव में ऐसा लगता है कि इसका कोई जवाब नहीं है निर्णय सीमा की रैखिकता या गैर-रैखिकता पर निर्भर करता है, जो हेट्टा (एक्स) के रूप में परिभाषित हाइपोथीसिस फ़ंक्शन पर निर्भर करता है जहां एक्स इनपुट है और थीटा हमारी समस्या का चर है। क्या यह आपके लिए समझ में आता है?
ब्रोकेन्सवर्ड

जवाबों:


42

लॉजिस्टिक रिग्रेशन इस अर्थ में रैखिक है कि भविष्यवाणियों को " रूप में लिखा जा सकता है। इस प्रकार, भविष्यवाणी को संदर्भ में लिखा जा सकता है , जो का रैखिक कार्य है । (अधिक सटीक रूप से, अनुमानित लॉग-ऑड्स का रैखिक कार्य है ।)Μ एक्सएक्स

p^=11+eμ^, where μ^=θ^x.
μ^xx

इसके विपरीत, रैखिक कार्य के संदर्भ में तंत्रिका नेटवर्क के आउटपुट को संक्षेप में प्रस्तुत करने का कोई तरीका नहीं है , और इसीलिए तंत्रिका नेटवर्क को गैर-रैखिक कहा जाता है।x

इसके अलावा, लॉजिस्टिक प्रतिगमन के लिए, निर्णय सीमा रैखिक है: यह का समाधान है । तंत्रिका नेटवर्क की निर्णय सीमा सामान्य रूप से रैखिक नहीं है।θx = 0{x:p^=0.5}θ^x=0


2
आप जवाब देते हैं कि मेरे लिए अब तक का सबसे स्पष्ट और सरल है। लेकिन मैं थोड़ा उलझन में हूं। कुछ लोगों का कहना है कि अनुमानित लॉग-ऑड का एक रैखिक कार्य है और अन्य लोग कहते हैं कि यह एक फ़ंक्शन है । इसलिए?! θxθ
जैक ट्वेन

1
फिर आपके स्पष्टीकरण द्वारा भी। क्या हम कह सकते हैं कि तंत्रिका नेटवर्क का पूर्वानुमान पिछली छिपी परत की सक्रियता का एक रैखिक कार्य है?
जैक ट्वैन

2
भविष्यवाणी की गई लॉग-ऑड्स , दोनों और में रैखिक है । लेकिन आमतौर पर हम इस तथ्य में सबसे अधिक रुचि रखते हैं कि लॉग-ऑड में रैखिक है , क्योंकि इसका मतलब है कि निर्णय सीमा अंतरिक्ष में रैखिक है। θ एक्सएक्सएक्सθ^xθ^xxx
स्टीफन दांव

3
मैं परिभाषा का उपयोग कर रहा हूं कि एक क्लासिफायरियर रैखिक है यदि इसकी निर्णय सीमा स्थान में रैखिक है। यह में रैखिक होने की अनुमानित संभावनाओं के समान नहीं है (जो कि तुच्छ मामलों से अलग असंभव होगा, क्योंकि संभाव्यता को 0 और 1 के बीच झूठ होना चाहिए)। एक्सxx
स्टेफन दांव

3
@Pegah मुझे पता है कि यह पुराना है, लेकिन: लॉजिस्टिक रिग्रेशन में एक रैखिक निर्णय सीमा होती है। Ouptut स्वयं रैखिक नहीं है, इसकी उपस्कर। लाइन के किस तरफ एक बिंदु गिरता है इसके आधार पर, कुल आउटपुट क्रमशः (लेकिन कभी नहीं पहुंचेगा) 0 या 1 तक पहुंच जाएगा। और स्टीफन वैग्नर्स के जवाब में जोड़ने के लिए: अंतिम वाक्य पूरी तरह से सही नहीं है, एक तंत्रिका नेटवर्क गैर-रैखिक है जब इसमें गैर-रैखिक सक्रियण या ouput फ़ंक्शन होते हैं। लेकिन यह रैखिक भी हो सकता है (यदि कोई गैर-रेखीय जोड़ा नहीं गया था)।
क्रिस

20

जैसा कि स्टीफन वैगनर नोट करते हैं, लॉजिस्टिक क्लासिफायर के लिए निर्णय सीमा रैखिक है। (क्लासिफायर को इनपुट को रैखिक रूप से अलग करने की आवश्यकता होती है।) मैं इस बात के लिए गणित पर विस्तार करना चाहता था कि यह स्पष्ट नहीं है।

निर्णय सीमा x का समुच्चय है जैसे

11+eθx=0.5

बीजगणित का थोड़ा सा पता चलता है कि यह

1=eθx

और, दोनों पक्षों के प्राकृतिक लॉग को लेते हुए,

0=θx=i=0nθixi

इसलिए निर्णय सीमा रैखिक है।

एक तंत्रिका नेटवर्क के लिए निर्णय सीमा रैखिक नहीं है, क्योंकि तंत्रिका नेटवर्क में सिग्मॉइड फ़ंक्शन की दो परतें हैं : प्रत्येक आउटपुट नोड्स में से एक और प्रत्येक आउटपुट नोड के परिणामों को संयोजित और दहलीज करने के लिए एक अतिरिक्त सिग्मॉइड फ़ंक्शन है।


2
वास्तव में, आप केवल सक्रियण वाली एक परत के साथ एक गैर-रैखिक निर्णय सीमा प्राप्त कर सकते हैं। 2-लेयर फीड-फॉरवर्ड नेटवर्क वाले XOR का मानक उदाहरण देखें।
जेम्स हिर्सचोर्न

5

हमारे पास दो वर्ग हैं, और , तब हम सशर्त संभाव्यता को व्यक्त कर सकते हैं, प्रमेय, हर रूप में व्यक्त किया जाता है ।C0C1

P(C0|x)=P(x|C0)P(C0)P(x)
P(C0|x)=P(x|C0)P(C0)P(x|C0)P(C0)+P(x|C1)P(C1)=11+exp(logP(x|C0)P(x|C1)logP(C0)P(C1))
1+eωx

किन शर्तों के तहत एक लीनियर टर्म के लिए पहला एक्सप्रेशन कम होता है। यदि आप घातीय परिवार (गौ या पोइसोन जैसे घातीय वितरण के लिए एक विहित रूप) पर विचार करते हैं, तो आप एक रैखिक रूप से समाप्त होते हैं,

P(x|Ci)=exp(θixb(θi)a(ϕ)+c(x,ϕ))
logP(x|C0)P(x|C1)=[(θ0θ1)xb(θ0)+b(θ1)]/a(ϕ)

ध्यान दें कि हम मानते हैं कि दोनों वितरण एक ही परिवार के हैं और एक ही फैलाव पैरामीटर हैं। लेकिन, उस धारणा के तहत, लॉजिस्टिक प्रतिगमन घातांक वितरण के पूरे परिवार के लिए संभावनाओं को मॉडल कर सकता है।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.