मैं तंत्रिका नेटवर्क (एएनएन) का उपयोग करके एक जटिल प्रणाली के परिणाम की भविष्यवाणी करने की कोशिश कर रहा हूं। परिणाम (निर्भर) मान 0 और 10,000 के बीच होते हैं। अलग-अलग इनपुट वैरिएबल की अलग-अलग रेंज होती हैं। सभी चर में लगभग सामान्य वितरण होते हैं।
मैं प्रशिक्षण से पहले डेटा को स्केल करने के लिए विभिन्न विकल्पों पर विचार करता हूं। एक विकल्प इनपुट (स्वतंत्र) और आउटपुट (आश्रित) चर को स्केल करने के लिए है, प्रत्येक संस्करण के औसत और मानक विचलन मूल्यों का उपयोग करके संचयी वितरण फ़ंक्शन की गणना करके [0, 1] । इस पद्धति के साथ समस्या यह है कि अगर मैं आउटपुट पर सिग्मॉइड सक्रियण फ़ंक्शन का उपयोग करता हूं, तो मैं अत्यधिक डेटा को याद करूंगा, विशेष रूप से वे जो प्रशिक्षण सेट में नहीं दिखते हैं।
एक अन्य विकल्प एक z- स्कोर का उपयोग करना है। उस स्थिति में मेरे पास चरम डेटा समस्या नहीं है; हालाँकि, मैं उत्पादन में एक रैखिक सक्रियण समारोह तक ही सीमित हूँ।
एएनएन के उपयोग के साथ अन्य स्वीकृत सामान्यीकरण तकनीकें क्या हैं? मैंने इस विषय पर समीक्षाओं की तलाश करने की कोशिश की, लेकिन कुछ भी उपयोगी खोजने में विफल रहा।