मशीन लर्निंग साहित्य में, प्रायिकता वितरण का प्रतिनिधित्व करने के लिए, सॉफ्टमैक्स फ़ंक्शन का अक्सर उपयोग किया जाता है। क्या इसका कोई कारण है? एक अन्य फ़ंक्शन का उपयोग क्यों नहीं किया जाता है?
मशीन लर्निंग साहित्य में, प्रायिकता वितरण का प्रतिनिधित्व करने के लिए, सॉफ्टमैक्स फ़ंक्शन का अक्सर उपयोग किया जाता है। क्या इसका कोई कारण है? एक अन्य फ़ंक्शन का उपयोग क्यों नहीं किया जाता है?
जवाबों:
अनुकूलन के नजरिए से इसमें विभिन्नता के संदर्भ में कुछ अच्छे गुण हैं। मशीन सीखने की बहुत सारी समस्याओं के लिए यह 1-एन-एन वर्गीकरण के लिए अच्छा है।
गहन शिक्षण के नजरिए से: कोई यह भी तर्क दे सकता है कि सिद्धांत रूप में, शीर्ष पर सॉफ्टमैक्स क्लासिफायर के साथ एक गहरे नेटवर्क का उपयोग करते हुए फीचर स्पेस पर किसी भी एन-क्लास संभावना समारोह का प्रतिनिधित्व कर सकते हैं क्योंकि एमएलपी के पास यूनिवर्सल एप्रिमेंटेशन प्रॉपर्टी है।
सॉफ्टमैक्स भी लॉजिस्टिक सिग्मोइड फ़ंक्शन का एक सामान्यीकरण है और इसलिए यह सिग्मॉइड के गुणों को वहन करता है जैसे कि भेदभाव में आसानी और 0-1 की सीमा में होना। एक लॉजिस्टिक सिग्मोइड फ़ंक्शन का आउटपुट भी 0 और 1 के बीच है और इसलिए स्वाभाविक रूप से प्रायिकता का प्रतिनिधित्व करने के लिए एक उपयुक्त विकल्प है। इसके व्युत्पन्न भी अपने स्वयं के उत्पादन के मामले में exoressed है। हालाँकि, यदि आपके फ़ंक्शन में वेक्टर आउटपुट है, तो आपको आउटपुट वेक्टर पर प्रायिकता वितरण प्राप्त करने के लिए सॉफ्टमैक्स फ़ंक्शन का उपयोग करना होगा। सॉफ्टमैक्स का उपयोग करने के कुछ अन्य फायदे हैं, जो इंडी एआई ने उल्लेख किया है, हालांकि यह जरूरी नहीं है कि सार्वभौमिक स्वीकृति सिद्धांत के साथ कुछ करना है क्योंकि सॉफ्टमैक्स केवल न्यूरल नेटवर्क के लिए उपयोग किया जाने वाला फ़ंक्शन नहीं है।
संदर्भ