बस पिछले उत्तरों पर जोड़ना है।
रेखीय प्रतिगमन
का अर्थ किसी दिए गए तत्व X (कहते हैं f (x)) के लिए आउटपुट मान की भविष्यवाणी / अनुमान करने की समस्या को हल करना है। भविष्यवाणी का परिणाम एक विशिष्ट कार्य है जहां मूल्य सकारात्मक या नकारात्मक हो सकते हैं। इस मामले में आपके पास आम तौर पर बहुत सारे उदाहरणों के साथ एक इनपुट डेटासेट होता है और उनमें से प्रत्येक के लिए आउटपुट मूल्य। लक्ष्य इस डेटा सेट के लिए एक मॉडल को फिट करने में सक्षम होना है ताकि आप नए अलग / कभी नहीं देखे गए तत्वों के लिए उस आउटपुट का अनुमान लगा सकें। निम्नलिखित बिंदुओं के सेट करने के लिए एक पंक्ति को फिट करने का शास्त्रीय उदाहरण है, लेकिन सामान्य रूप से रैखिक प्रतिगमन को अधिक जटिल मॉडल (उच्च बहुपद डिग्री का उपयोग करके) फिट करने के लिए इस्तेमाल किया जा सकता है:
समस्या का समाधान
रैखिक प्रतिगमन को दो अलग-अलग तरीकों से हल किया जा सकता है:
- सामान्य समीकरण (समस्या को हल करने का सीधा तरीका)
- ग्रेडिएंट डिसेंट (Iterative अप्रोच)
रसद प्रतिगमन
का मतलब उन वर्गीकरण समस्याओं को हल करना है जहां एक तत्व दिया गया है जिसे आपको एन श्रेणियों में वर्गीकृत करना होगा। उदाहरण के लिए उदाहरण दिए गए हैं कि इसे स्पैम या नहीं के रूप में वर्गीकृत करने के लिए एक मेल दिया गया है, या किसी वाहन को दिया गया है जो कि वह श्रेणी (कार, ट्रक, वैन, इत्यादि) है। यह मूल रूप से उत्पादन अवरोही मूल्यों का एक सीमित सेट है।
समस्या का समाधान
लॉजिस्टिक रिग्रेशन समस्याओं को केवल ग्रेडिएंट डिसेंट का उपयोग करके हल किया जा सकता है। सामान्य रूप में सूत्रीकरण रेखीय प्रतिगमन के समान है एकमात्र अंतर विभिन्न परिकल्पना फ़ंक्शन का उपयोग है। रैखिक प्रतिगमन में परिकल्पना का रूप है:
h(x) = theta_0 + theta_1*x_1 + theta_2*x_2 ..
जहां थीटा वह मॉडल है जिसे हम फिट करने की कोशिश कर रहे हैं और [1, x_1, x_2, ..] इनपुट वेक्टर है। लॉजिस्टिक रिग्रेशन में परिकल्पना फ़ंक्शन अलग है:
g(x) = 1 / (1 + e^-x)
इस फ़ंक्शन की एक अच्छी संपत्ति है, मूल रूप से यह किसी भी मूल्य को सीमा [0,1] के लिए मैप करता है जो कि क्लासिसैटिन के दौरान प्रसार को संभालने के लिए उपयुक्त है। उदाहरण के लिए बाइनरी वर्गीकरण जी (एक्स) के मामले में सकारात्मक वर्ग से संबंधित होने की संभावना के रूप में व्याख्या की जा सकती है। इस मामले में आम तौर पर आपके पास अलग-अलग वर्ग होते हैं जो एक निर्णय सीमा से अलग होते हैं जो मूल रूप से एक वक्र होता है जो विभिन्न वर्गों के बीच अलगाव का फैसला करता है। निम्नलिखित दो वर्गों में अलग किए गए डेटासेट का एक उदाहरण है।