आमतौर पर न्यूरल नेटवर्क्स का उपयोग पूर्ण संभावना घनत्व को मॉडल करने के लिए नहीं किया जाता है। उनका ध्यान सिर्फ वितरण का मतलब (या एक निर्दिष्ट स्थिति में एक गैर-रेखीय कार्य) को मॉडल करना है। फिर भी न्यूरल नेटवर्क्स के माध्यम से पूरी संभावना घनत्वों को मॉडल करना बहुत संभव है।
एक आसान तरीका यह करने के लिए उदाहरण के लिए है के लिए एक गाऊसी मामले नेटवर्क का एक और उत्पादन से एक उत्पादन और विचरण से मतलब फेंकना और फिर कम से कम है समारोह के हिस्से के रूप सामान्य चुकता त्रुटि के बजाय प्रशिक्षण प्रक्रिया। यह एक तंत्रिका नेटवर्क के लिए अधिकतम संभावना प्रक्रिया है।−logN(y|x;μ,σ)
आप इस नेटवर्क हर आप एक प्लग ट्रेन एक बार एक इनपुट के रूप मूल्य यह आप दे देंगे μ और σ , तो आप पूरे त्रिक प्लग कर सकते हैं y , μ , σ घनत्व के च ( y | एक्स ) ~ एन ( μ , σ ) आप की तरह किसी भी y के लिए घनत्व मूल्य प्राप्त करने के लिए । इस स्तर पर आप वास्तविक डोमेन हानि फ़ंक्शन के आधार पर किस y मान का उपयोग कर सकते हैं । एक बात का ध्यान रखें कि μ के लिए आउटपुट सक्रियण अप्रतिबंधित होना चाहिए ताकि आप उत्सर्जन कर सकें -xμσy,μ,σf(y|x)∼N(μ,σ)yyμ के लिए + inf जबकि σ एक सकारात्मक केवल सक्रियण होना चाहिए।−inf+infσ
सामान्य तौर पर, जब तक कि यह एक नियतात्मक कार्य नहीं है, जिसके बाद हम हैं, तंत्रिका नेटवर्क में उपयोग किए जाने वाले मानक चुकता प्रशिक्षण बहुत समान प्रक्रिया है जो मैंने ऊपर वर्णित की है। हुड एक के तहत वितरण परोक्ष के बारे में ध्यान रखने वाली बिना माना जाता है σ और अगर आप ध्यान से जांच - एल ओ जी एन ( y | x ; μ , σ ) आप वर्ग घटाने के लिए एक अभिव्यक्ति (देता है नुकसान गाऊसी अधिकतम संभावना अनुमानक का कार्य )। इस परिदृश्य में, हालांकि, एक के बजायGaussianσ−logN(y|x;μ,σ)yअपनी पसंद के हिसाब से जब आप नया एक्स मान देते हैं तो हर बार उत्सर्जक के साथ अटक जाते हैं ।μx
वर्गीकरण के लिए उत्पादन एक हो जाएगा एक के बजाय वितरण जी एक यू एस एस मैं एक n है, जो उत्सर्जन करने के लिए एक एकल पैरामीटर है। जैसा कि अन्य उत्तर में निर्दिष्ट है कि यह पैरामीटर 0 और 1 के बीच है ताकि आउटपुट सक्रियण तदनुसार हो। यह एक लॉजिस्टिक फ़ंक्शन या कुछ और हो सकता है जो समान उद्देश्य को प्राप्त करता है।BernoulliGaussian01
एक अधिक परिष्कृत दृष्टिकोण बिशप का मिक्सचर डेंसिटी नेटवर्क है। आप इसके बारे में अक्सर संदर्भित पेपर में यहां पढ़ सकते हैं:
https://publications.aston.ac.uk/373/1/NCRG_94_004.pdf