यह दो विशेषताओं ( x 1 , x 2 ) के साथ एक वर्गीकरण मॉडल के मामले में एंड्रयू एनजी द्वारा एमएल पर कौरसेरा कोर्स पर ओवरफिटिंग का एक उदाहरण है , जिसमें सही मान × और over के प्रतीक हैं , और निर्णय सीमा हैं उच्च क्रम बहुपद शब्दों के उपयोग के माध्यम से निर्धारित प्रशिक्षण के अनुरूप।(x1,x2)×∘,
समस्या यह है कि यह समझाने की कोशिश करता है कि इस तथ्य से संबंधित है, हालांकि सीमा निर्णय रेखा (नीले रंग में वक्र रेखा) किसी भी उदाहरण का गलत वर्गीकरण नहीं करती है, प्रशिक्षण सेट से बाहर सामान्यीकरण करने की क्षमता से समझौता किया जाएगा। एंड्रयू एनजी बताते हैं कि नियमितीकरण इस प्रभाव को कम कर सकता है, और मैजेन्टा वक्र को प्रशिक्षण सीमा के निर्णय की सीमा के रूप में कम खींचता है, और सामान्य होने की अधिक संभावना है।
अपने विशिष्ट प्रश्न के संबंध में:
मेरा अंतर्ज्ञान यह है कि नीले / गुलाबी वक्र को वास्तव में इस ग्राफ पर प्लॉट नहीं किया गया है, बल्कि एक प्रतिनिधित्व (सर्कल और एक्स) है जो ग्राफ़ के अगले आयाम (3 जी) में मूल्यों के लिए मैप किया जाता है।
वहाँ दो श्रेणियों, कर रहे हैं: कोई ऊंचाई (तीसरे आयाम) है और ∘ ) , निर्णय लाइन से पता चलता है कि कैसे मॉडल उन्हें अलग किया जाता है और। सरल मॉडल में(×∘),
hθ(x)=g(θ0+θ1x1+θ2x2)
निर्णय सीमा रैखिक होगी।
शायद आपके मन में कुछ इस तरह का उदाहरण है:
5+2x−1.3x2−1.2x2y+1x2y2+3x2y3
हालांकि, ध्यान दें कि परिकल्पना में एक फ़ंक्शन है - आपके प्रारंभिक प्रश्न में लॉजिस्टिक सक्रियण। तो x 1 और x 2 के प्रत्येक मूल्य के लिए बहुपद समारोह का कार्य होता है और "सक्रियण" (अक्सर गैर-रैखिक, जैसे कि ओपी में एक सिग्मोइड फ़ंक्शन में होता है, हालांकि आवश्यक नहीं (उदाहरण के लिए RELU)। एक बंधे हुए आउटपुट के रूप में सिग्मॉइड सक्रियण खुद को एक संभाव्य व्याख्या के लिए उधार देता है: एक वर्गीकरण मॉडल में विचार यह है कि किसी दिए गए सीमा पर आउटपुट को × ( या ∘ ) लेबल किया जाएगा । प्रभावी रूप से, एक निरंतर आउटपुट को बाइनरी में स्केच किया जाएगा ( 1 ,g(⋅)x1x2× (∘). आउटपुट।(1,0)
, वजन (या पैरामीटर) और सक्रियण समारोह के आधार पर प्रत्येक बिंदु सुविधा विमान में किसी भी श्रेणी के लिए मैप किया जाएगा × या ∘ । यह लेबलिंग या सही नहीं हो सकता है हो सकता है: वे सही जब नमूने में अंक द्वारा तैयार किया जाएगा × और ∘ भविष्यवाणी लेबल के लिए ओपी अनुरूप पर तस्वीर में विमान पर। विमान के क्षेत्रों के बीच की सीमाओं लेबल × और उन आसन्न क्षेत्रों लेबल ∘ । वे एक लाइन हो सकता है, या एक से अधिक लाइनों "द्वीप" अलग (खुद के साथ खेलते हुए देखना टोनी Fischetti करके इस ऐप्लिकेशन का हिस्सा(x1,x2)×∘×∘×∘आर ब्लॉगर्स पर इस ब्लॉग प्रविष्टि )।
निर्णय सीमा पर विकिपीडिया में प्रविष्टि पर ध्यान दें :
दो वर्गों के साथ सांख्यिकीय-वर्गीकरण समस्या में, एक निर्णय सीमा या निर्णय सतह एक हाइपरसर्फ है जो अंतर्निहित वेक्टर अंतरिक्ष को दो सेटों में विभाजित करता है, प्रत्येक वर्ग के लिए एक। क्लासिफायर एक वर्ग के निर्णय की सीमा के एक तरफ सभी बिंदुओं को वर्गीकृत करेगा और एक वर्ग के सभी लोगों को दूसरी कक्षा से संबंधित करेगा। एक निर्णय सीमा एक समस्या अंतरिक्ष का क्षेत्र है जिसमें एक क्लासिफायरियर का आउटपुट लेबल अस्पष्ट है।
∈[0,1]),
3
कहाँ पे y1=hθ(x)W(Θ)Θ
कई न्यूरॉन्स के साथ जुड़कर, इन अलग होने वाले हाइपरप्लेन को जोड़ा जा सकता है और उन्हें टोपीदार आकृतियों के साथ जोड़ा जा सकता है:
यह सार्वभौमिक सन्निकटन प्रमेय से जुड़ता है ।