मैं अपने संगठन में किए गए पूर्वानुमान के लिए सहायता के रूप में एक इंटरैक्टिव पूर्वानुमान उपकरण (अजगर में) का निर्माण कर रहा हूं। आज तक पूर्वानुमान प्रक्रिया काफी हद तक मानव चालित रही है, जिसमें पूर्वानुमान लगाने वाले अपने प्राकृतिक तंत्रिका नेटवर्क में डेटा को आत्मसात करते हैं और भविष्यवाणियां करने के लिए अपने सीखा आंत महसूस का उपयोग करते हैं। एक दीर्घकालिक पूर्वानुमान सत्यापन और भविष्य कहनेवाला मॉडलिंग अध्ययन से मैंने जो पाया है, उससे आप उम्मीद कर सकते हैं; अलग-अलग पूर्वानुमान अलग-अलग पूर्वाग्रहों को प्रदर्शित करते हैं, कुछ भविष्यवक्ताओं के प्रभाव अतिरंजित प्रतीत होते हैं और अन्य महत्वपूर्ण लोगों को नजरअंदाज किया जाता है और सामान्य तौर पर पूर्वानुमान प्रदर्शन अपेक्षाकृत सरल अनुभवजन्य मॉडल की तुलना में औसत दर्जे का होता है।
पूर्वानुमान मैन्युअल होते रहेंगे, लेकिन मैं भविष्यवाणियों के सापेक्ष प्रभावों का बेहतर मात्राकरण के साथ पूर्वानुमान प्रदान करने के लिए एक उपयोगी उपकरण बनाने की कोशिश कर रहा हूं। मौसमी प्रभावों जैसे महत्वपूर्ण प्रभाव भी हैं जिन्हें अक्सर अनदेखा किया जाता है कि मैं उपयोगकर्ता को हाइलाइट करने के लिए उपकरण चाहूंगा। मैं कुछ अधिक 'अनुभवी' पूर्वानुमानकर्ताओं (जिनमें से कई को आंकड़ों का बहुत कम औपचारिक ज्ञान है) से मॉडलिंग की प्रक्रिया के बारे में प्रतिक्रिया और संदेह की डिग्री की उम्मीद कर रहा हूं, इसलिए संचार कम से कम उतना ही महत्वपूर्ण है और मॉडल प्रदर्शन खुद के संदर्भ में पूर्वानुमान सटीकता में एक औसत दर्जे का सुधार प्राप्त करना।
जिन मॉडल का मैं विकास कर रहा हूं उनमें एक मजबूत ऑटो-रिग्रेसिव कंपोनेंट है, जो कई बार उन घटनाओं से काफी संशोधित होता है, जो गैर-ईवेंट के दौरान, शून्य के करीब, कुछ भविष्यवाणियों में मापा मूल्यों के रूप में दिखाई देते हैं। यह पूर्वानुमान वाले मानसिक मॉडल का उपयोग करता है। प्रमुख भाग यह प्रदर्शित करने में सक्षम हो रहा है कि किसी भी पूर्वानुमान के लिए ऑटो रिग्रेसिव मूल्य से दूर की भविष्यवाणी को चलाने में कौन सा 'ईवेंट' माप सबसे प्रभावशाली है। मैं इस तरह से प्रक्रिया की इमेजिंग करता हूं; फोरकास्टर ने अपना सर्वश्रेष्ठ अनुमान लगाया है, मॉडल एक अलग सुझाव देता है और फोरकास्टर पूछता है कि क्यों। मॉडल कुछ इस तरह से उत्तर देता है "यहां देखें, इस भविष्यवक्ता का मान समर में पूर्वानुमान मूल्य को बढ़ाता है। यदि यह सर्दी थी, तो यह दूसरे तरीके से आगे बढ़ेगा। मुझे पता है कि ये अन्य माप हैं।
अब, कल्पना कीजिए कि मॉडल एक सरल रेखीय प्रतिगमन था। मॉडल के सह-कुशल द्वारा मूल्य को गुणा करके और साधारण बार चार्ट के रूप में प्रदर्शित करके घटना आधारित भविष्यवक्ताओं के सापेक्ष 'प्रभाव' को प्रदर्शित करने की कल्पना की जा सकती है। विभिन्न भविष्यवाणियों से सभी बार एआर मान से कुल विचलन तक जोड़ते हैं, और यह स्पष्ट रूप से उन लोगों को दिखाता है जो इस उदाहरण में, एक मजबूत प्रभाव रखते हैं।
समस्या यह है कि पूर्वानुमान होने की प्रक्रिया भविष्यवाणियों में उच्च-रैखिकता का एक उच्च स्तर प्रदर्शित करती है, या कम से कम, मुझे ब्लैक-बॉक्स गैर-रैखिक मशीन लर्निंग एल्गोरिदम (यादृच्छिक वन और जीबीएम) के साथ जीएलएम की तुलना में बहुत अधिक सफलता मिली है। यह डेटा-सेट। आदर्श रूप में मैं उपयोगकर्ता अनुभव को बदलने के बिना 'हूड के तहत काम कर रहे मॉडल को मूल रूप से बदलने में सक्षम होना चाहूंगा, इसलिए मुझे कुछ सामान्य तरीके से कुछ एल्गोरिदम विशिष्ट दृष्टिकोण का उपयोग किए बिना अलग-अलग मापों के महत्व को प्रदर्शित करने के कुछ सामान्य तरीके की आवश्यकता है। मेरा वर्तमान दृष्टिकोण एक भविष्यवक्ता को छोड़कर सभी मानों को शून्य पर सेट करके प्रभावों को अर्ध-रेखीय करना होगा, पूर्वानुमानित विचलन को रिकॉर्ड करना और फिर सभी भविष्यवक्ताओं के लिए दोहराना, उपरोक्त बार चार्ट में परिणाम प्रदर्शित करना। मजबूत गैर-रैखिकता की उपस्थिति में, यह इतनी अच्छी तरह से काम नहीं कर सकता है।