सॉफ्टमैक्स फ़ंक्शन का उपयोग संभावनाओं की गणना करने के लिए क्यों किया जाता है, हालांकि हम प्रत्येक मान को वेक्टर के योग से विभाजित कर सकते हैं?


20

एक वेक्टर पर सॉफ्टमैक्स फ़ंक्शन को लागू करने से "संभावनाएं" और और बीच मान उत्पन्न होंगे । 01

लेकिन हम प्रत्येक मान को वेक्टर के योग से विभाजित कर सकते हैं और यह और बीच संभावनाओं और मूल्यों का उत्पादन करेगा ।01

मैं यहाँ पर उत्तर पढ़ता हूं लेकिन यह कहता है कि इसका कारण यह है कि यह भिन्न है, हालांकि दोनों कार्य अलग हैं।


1
मुझे लगता है कि अगर आप पहली बार लॉजिस्टिक रिग्रेशन को देखते हैं तो यह बेहतर है। आपका 'लक्ष्य' नीरस रूपांतरित को (0,1) में बदलना है । यह वही है जो लॉजिस्टिक फ़ंक्शन करता है। ध्यान दें कि वास्तविक रेखा पर कोई संचयी (प्रायिकता) वितरण फ़ंक्शन भी काम करता है - प्रोबेट प्रतिगमन देखें जो सामान्य वितरण फ़ंक्शन का उपयोग करता है। (-,)
seanv507

जवाबों:


36

जब भी आप प्रस्ताव करते हैं, तो तत्वों की राशि शून्य होने पर एक विलक्षणता होती है।

मान लीजिए कि आपका वेक्टर । इस वेक्टर में 0 का योग है, इसलिए विभाजन को परिभाषित नहीं किया गया है। यहां फ़ंक्शन अलग नहीं है।[-1,13,23]

इसके अतिरिक्त, यदि वेक्टर का एक या अधिक तत्व ऋणात्मक है, लेकिन योग गैर-शून्य है, तो आपका परिणाम एक संभावना नहीं है।

मान लीजिए कि आपका वेक्टर । इसमें 1 का योग है, इसलिए अपने फ़ंक्शन के परिणामों को में लागू करें , जो कि संभाव्यता वेक्टर नहीं है क्योंकि इसमें नकारात्मक तत्व हैं, और 1 से अधिक तत्व हैं।[-1,0,2][-1,0,2]

एक व्यापक दृष्टिकोण लेते हुए, हम तीन या अधिक श्रेणीबद्ध परिणामों के मामले में बाइनरी लॉजिस्टिक रिग्रेशन के दृष्टिकोण से सॉफ्टमैक्स फ़ंक्शन के विशिष्ट रूप को प्रेरित कर सकते हैं।

पूर्ण मूल्यों या वर्गों को लेने जैसी चीजें, जैसा कि टिप्पणियों में सुझाया गया है, का मतलब है कि और में समान पूर्वानुमानित संभावना है; इसका मतलब है कि मॉडल की पहचान नहीं की गई है । इसके विपरीत, सभी वास्तविक लिए एकरस और सकारात्मक है , इसलिए सॉफ्टमैक्स परिणाम (1) एक प्रायिकता सदिश और (2) बहुराष्ट्रीय उपस्कर मॉडल की पहचान की जाती है।-एक्सएक्सexp ( x ) xexp(एक्स)एक्स


बहुत बहुत धन्यवाद। हम निरपेक्ष मूल्यों के योग से विभाजित करके दोनों मुद्दों को हल कर सकते हैं, है ना?
फ्लोयड

2
यदि आप मेरे दोनों उदाहरणों के पूर्ण मूल्यों को जोड़ते हैं और फिर उस योग से विभाजित करते हैं तो क्या होगा?
साइकोरैक्स का कहना है कि मोनिका जूल

वास्तव में धन्यवाद। मुझे ये अब मिला। लेकिन हम इस अंक को अंश के निरपेक्ष मान या शायद वेक्टर में प्रत्येक मान के लिए गणना करके हल कर सकते हैं । मैं जिद्दी होने की कोशिश नहीं कर रहा हूं, मुझे सिर्फ यह अजीब लगता है कि लोगों ने एक जटिल कार्य का आविष्कार किया, हालांकि संभावनाओं की गणना करने के लिए सरल हैं। मैं गणित का एक बहुत नहीं जानते तो शायद वहाँ अन्य गणितीय गुण हैंएक्समैं2/रोंयू(एक्स2)
फ्लोयड

8
[0,0,0]

8
एक्समैं2/Σजेएक्सजे2|एक्समैं|/Σजे|एक्सजे|exp(एक्स)

4

सॉफ्टमैक्स के दो घटक हैं:

  1. घटकों को e ^ x में बदलें। यह तंत्रिका नेटवर्क को साधारण संभावनाओं के बजाय लघुगणकीय संभावनाओं के साथ काम करने की अनुमति देता है। यह संभावनाओं को गुणा करने के सामान्य ऑपरेशन को बदल देता है, जो कि तंत्रिका नेटवर्क के रैखिक बीजगणित आधारित संरचना के लिए कहीं अधिक स्वाभाविक है।

  2. 1 को उनकी राशि को सामान्य करें, क्योंकि हमें कुल संभावना की आवश्यकता है।

इसका एक महत्वपूर्ण परिणाम यह है कि बेयस प्रमेय ऐसे नेटवर्क के लिए बहुत स्वाभाविक है, क्योंकि यह संभावनाओं का सिर्फ गुणन है जो हर द्वारा सामान्यीकृत है।

सॉफ्टमैक्स सक्रियण के साथ एकल परत नेटवर्क का तुच्छ मामला लॉजिस्टिक प्रतिगमन के बराबर है।

दो घटक सॉफ्टमैक्स का विशेष मामला सिग्मॉइड सक्रियण के बराबर है, जो इस प्रकार लोकप्रिय है जब केवल दो वर्ग होते हैं। मल्टी क्लास वर्गीकरण में सॉफ्टमैक्स का उपयोग तब किया जाता है जब कक्षाएं परस्पर अनन्य होती हैं और यदि वे स्वतंत्र हैं तो घटक-वार सिग्मॉइड का उपयोग किया जाता है।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.