आपके दो डेटा सेटों की संपत्ति रैखिक पृथक्करण की है , बस, कि एक पंक्ति है जो उन्हें अलग करती है। मशीन सीखने का एक बड़ा हिस्सा रैखिक क्लासिफायरियर को खोजने के लिए समर्पित है , जो कि आपके द्वारा अलग किए जाने वाले अलगाव को प्रदर्शित करने वाली रेखाएं हैं।
जैसा कि आप लाइनों के बारे में बात कर रहे हैं, मैं मान लूंगा कि आपके बिंदु विमान में हैं। आप क्या करना चाहते हैं मूल्यों है , और , ऐसा है कि सभी बिंदुओं के लिए सेट में , और सभी बिंदुओं के लिए में , । इस प्रकार, असमानता को सेट लिए एक क्लासिफायरियर के रूप में देखा जा सकता है ।डब्ल्यू 2 डब्ल्यू 3 ( एक 1 , एक 2 ) एक डब्ल्यू 1 एक 1 + डब्ल्यू 2 एक 2 ≥ डब्ल्यू 3 ( ख 1 , बी 2 ) बी डब्ल्यू 1 ख 1 + डब्ल्यू 2 ख 2 < डब्ल्यू 3 डब्ल्यू 1 एक्स + डब्ल्यू 2 y ≥ डब्ल्यू 3 एw1w2w3( ए1, ए2)एw1ए1+ w2ए2≥ व3( बी1, बी2)बीw1ख1+ w2ख2< व3w1x+w2y≥w3A
एक इष्टतम रेखा (रैखिक प्रतिगमन, लॉजिस्टिक प्रतिगमन, और इसके बाद) का निर्धारण करने के लिए मशीन लर्निंग एल्गोरिदम का भार है। इन्हें कुछ त्रुटि मीट्रिक के आधार पर मान । फिर आप परीक्षण कर सकते हैं कि क्या सभी बिंदुओं को सही ढंग से वर्गीकृत किया गया है। यही है, चाहे में सभी मान ऊपर के समीकरण को संतुष्ट करते हैं और इसी तरह । ए बीw1,w2,w3AB
जैसा कि आप केवल इस बात में रुचि रखते हैं कि क्या इस तरह की रेखा मौजूद है, आपको मौजूदा तकनीकों का उपयोग करने की आवश्यकता है (हालांकि यह संभवतः सरल होगा)। बस मुफ्त चर संदर्भ में समानता के निम्नलिखित संग्रह को सेट करें ।w1,w2,w3
मैं = 1 , । । , | ए | एक = { ( एक 1 1 , एक 1 2 ) , ... , ( एक | एक | 1 , एक | एक | 2 ) }w1ai1+w2ai2≥w3 प्रत्येक, जहाँ |i=1,..,|A|A={(a11,a12),…,(a|A|1,a|A|2)}
j = 1 , । । , | B | बी = { ( ख 1 1 , बी 1 2 ) , ... , ( ख | बी | 1 , बी | बी | 2 ) }w1bj1+w2bj2<w3 प्रत्येक, जहां |j=1,..,|B|B={(b11,b12),…,(b|B|1,b|B|2)}
यदि ये बाधाएं सुसंगत हैं, तो एक रेखा मौजूद है।