मान लीजिए, मेरे पास Jan'05 से दिसम्बर 11 तक फैले 20.000 मासिक समय की श्रृंखला है। इनमें से प्रत्येक एक अलग उत्पाद के लिए वैश्विक बिक्री डेटा का प्रतिनिधित्व करते हैं। क्या होगा अगर, उनमें से हर एक के लिए पूर्वानुमान पूर्वानुमान के बजाय, मैं केवल कुछ उत्पादों पर ध्यान केंद्रित करना चाहता था जो "वास्तव में बात करते हैं"?
मैं कुल वार्षिक राजस्व द्वारा उन उत्पादों को रैंक कर सकता हूं और शास्त्रीय पारेतो का उपयोग करके सूची को ट्रिम कर सकता हूं। फिर भी यह मुझे लगता है कि, हालांकि वे नीचे की रेखा में ज्यादा योगदान नहीं देते हैं, कुछ उत्पादों को पूर्वानुमान करना इतना आसान है कि उन्हें छोड़ना खराब न्याय होगा। एक उत्पाद जो पिछले 10 वर्षों से प्रत्येक महीने 50 डॉलर मूल्य पर बेचा जाता है, वह ज्यादा आवाज नहीं कर सकता है, लेकिन भविष्य की बिक्री के बारे में भविष्यवाणियों को उत्पन्न करने के लिए बहुत कम प्रयास की आवश्यकता होती है जो कि मैं भी कर सकता हूं।
तो मान लें कि मैं अपने उत्पादों को चार श्रेणियों में विभाजित करता हूं: उच्च राजस्व / पूर्वानुमान के लिए आसान - कम राजस्व / पूर्वानुमान के लिए आसान - उच्च राजस्व / पूर्वानुमान के लिए कठिन - कम राजस्व / पूर्वानुमान के लिए कठिन।
मुझे लगता है कि चौथे समूह से संबंधित केवल उन श्रृंखलाओं को पीछे छोड़ना उचित होगा। लेकिन मैं वास्तव में "पूर्वानुमानशीलता" का मूल्यांकन कैसे कर सकता हूं?
भिन्नता का गुणांक एक अच्छा प्रारंभिक बिंदु जैसा लगता है (मुझे कुछ समय पहले इसके बारे में कुछ कागज देखकर भी याद है)। लेकिन क्या होगा अगर मेरी टाइम सीरीज़ सीज़निटी / लेवल शिफ्ट्स / कैलेंडर इफेक्ट्स / स्ट्रॉन्ग ट्रेंड्स का प्रदर्शन करें?
मुझे लगता है कि मुझे अपने मूल्यांकन को केवल यादृच्छिक घटक की परिवर्तनशीलता पर आधारित करना चाहिए, न कि "कच्चे" डेटा में से एक। या क्या मैं कुछ न कुछ भूल रहा हूं?
क्या किसी ने पहले भी इसी तरह की समस्या पर ठोकर खाई है? आप लोग इसके बारे में कैसे जायेंगे?
हमेशा की तरह, किसी भी मदद की बहुत सराहना की है!