सॉफ्टमैक्स फ़ंक्शन, जिसे आमतौर पर न्यूरल नेटवर्क में वास्तविक संख्याओं को संभावनाओं में परिवर्तित करने के लिए उपयोग किया जाता है, बोल्ट्जमन वितरण के समान ही फ़ंक्शन है, थर्मोडायनेमिक्स में दिए गए टी पर थर्मल संतुलन में कणों के संयोजन के लिए ऊर्जा पर संभाव्यता वितरण।
मैं कुछ स्पष्ट विषम कारणों को देख सकता हूं कि यह व्यावहारिक क्यों है:
- कोई फर्क नहीं पड़ता कि इनपुट मान नकारात्मक हैं, सॉफ्टमैक्स सकारात्मक मानों को आउटपुट करता है जो एक योग है।
- यह हमेशा अलग-अलग होता है, जो बैकप्रॉपैजेशन के लिए आसान है।
- इसका एक 'टेम्परेचर' पैरामीटर होता है जो बताता है कि नेटवर्क कितने छोटे मूल्यों की ओर होना चाहिए (जब T बहुत बड़ा हो, सभी परिणाम समान रूप से होने की संभावना हो, जब बहुत छोटा हो, केवल सबसे बड़ा इनपुट वाला मान चयनित हो)।
क्या बोल्ट्ज़मन फ़ंक्शन केवल व्यावहारिक कारणों से सॉफ्टमैक्स के रूप में उपयोग किया जाता है, या क्या थर्मोडायनामिक्स / सांख्यिकीय भौतिकी से गहरा संबंध है?