लागत के साथ न केवल संसाधन जुड़ाव के संबंध पर विचार करना बुद्धिमान है, बल्कि संसाधन सगाई की लागत पर वापसी भी है। विशिष्ट चुनौती यह है कि वे रिटर्न लगभग हमेशा संचयी या विलंबित होते हैं। संचय का एक मामला तब होता है जब संसाधन एक प्रक्रिया का निरंतर ट्यूनिंग या सुधार होता है जिसकी अनुपस्थिति राजस्व की पीढ़ी को धीमा कर देती है। देरी का एक मामला यह है कि जब अनुसंधान संसाधन समय की अवधि के लिए राजस्व प्रभाव के बिना खर्च करते हैं, लेकिन राजस्व उत्पन्न होता है जो अनुसंधान शुरू करता है तो उत्पादक परिणाम वितरित किए गए परिणामों की कुल लागत से काफी बड़ा कारक हो सकता है।
कारण व्यय डेटा अपने आप में दुर्भावनापूर्ण नेटवर्क सीखने का कारण बन सकता है, क्योंकि एक नेटवर्क जिसे कम करने के लिए प्रशिक्षित किया जाता है, उदाहरण के लिए, विपणन व्यय उन्हें शून्य कर देगा। यह आमतौर पर व्यापार की तह तक घटती बिक्री की प्रवृत्ति का कारण होगा। प्रशिक्षण की जानकारी में रिटर्न को शामिल किए बिना, कोई उपयोगी शिक्षण नहीं हो सकता है।
एक मूल एमएलपी (मल्टी-लेयर परसेप्ट्रॉन) डेटा की अस्थायी विशेषताओं, संचय और देरी के पहलुओं को नहीं सीखेगा। आपको एक स्टेटफुल नेटवर्क की आवश्यकता होगी। इस तरह के सीखने के लिए सबसे लगातार सफल नेटवर्क प्रकार इस लेखन के रूप में LSTM (दीर्घकालिक अल्पकालिक मेमोरी) नेटवर्क प्रकार या इसके व्युत्पन्न वेरिएंट में से एक है। प्रस्तावित संसाधन संलग्नक (पूरी तरह से विस्तृत बजटीय योजना) के किसी भी अनुक्रम के लिए व्यावसायिक परिणामों की भविष्यवाणी करने के लिए नेटवर्क को प्रशिक्षित करने के लिए व्यय डेटा के साथ राजस्व और संतुलन डेटा का उपयोग किया जाना चाहिए।
नुकसान फ़ंक्शन को मध्यम और दीर्घकालिक वित्तीय उद्देश्यों के साथ ठीक तरह से शब्द संतुलन करना चाहिए। नकारात्मक उपलब्ध नकदी को नुकसान के कार्य में एक स्पष्ट वृद्धि का उत्पादन करना चाहिए ताकि इस तरह के जोखिम से प्रतिष्ठा और क्रेडिट की लागत से बचा जा सके।
आपके डेटा के कौन से कॉलम में निवेश पर रिटर्न के साथ मजबूत सहसंबंध हैं, अग्रिम में निर्धारित करना मुश्किल है। आप उन स्तंभों को तुरंत बाहर कर सकते हैं जो निम्न मानदंडों में से किसी एक के अनुरूप हैं।
- हमेशा खाली
- अन्य स्थिरांक, वे जो हर पंक्ति के लिए समान मूल्य रखते हैं
- जिन्हें हमेशा अन्य स्तंभों से लिया जा सकता है
डेटा को अन्य तरीकों से कम किया जा सकता है
- सरल तरीकों से रुझानों को चिह्नित करके डेटा का पूरी तरह से वर्णन करना
- प्रत्येक स्ट्रिंग को एक संख्या बताकर 100% सटीकता के साथ लंबे तारों को निर्दिष्ट करने के लिए सूचकांकों का उपयोग करना
- दबाव
- अन्यथा डेटा में अतिरेक को कम करना
RBM (प्रतिबंधित बोल्ट्ज़मन मशीनें) डेटा से सुविधाएँ निकाल सकती हैं और PCAs कम सूचना सामग्री कॉलम को रोशन कर सकते हैं, लेकिन राजस्व के साथ उनके सहसंबंध के संदर्भ में स्तंभों के महत्व को इन उपकरणों का उनके मूल रूप में उपयोग करके पहचान नहीं की जाएगी।