मैं किसी उत्पाद की कुल बिक्री की भविष्यवाणी करने के लिए एक मॉडल विकसित करने पर काम कर रहा हूं। मेरे पास लगभग डेढ़ साल का बुकिंग डेटा है, इसलिए मैं एक मानक समय श्रृंखला विश्लेषण कर सकता था। हालांकि, मेरे पास प्रत्येक 'अवसर' (संभावित बिक्री) के बारे में बहुत सारे आंकड़े हैं जो या तो बंद थे या खो गए थे। 'अवसर' एक पाइपलाइन के चरणों के साथ आगे बढ़ते हैं जब तक कि वे बंद या खो नहीं जाते हैं; उनके पास संभावित खरीदार, बिक्री व्यक्ति, इंटरैक्शन इतिहास, उद्योग, बुकिंग के अनुमानित आकार आदि के बारे में डेटा भी है।
मेरा लक्ष्य अंततः कुल बुकिंग की भविष्यवाणी करना है, लेकिन मैं वर्तमान 'अवसरों' के बारे में इस जानकारी के लिए सभी को ध्यान में रखना चाहता हूं जो बुकिंग के सही 'मूल कारण' हैं।
एक विचार मेरे पास दो अलग-अलग मॉडल का क्रमिक रूप से उपयोग करने के लिए है:
एक मॉडल बनाने के लिए ऐतिहासिक 'अवसरों' का उपयोग करें जो एक व्यक्ति के 'अवसर' से उत्पन्न होने वाली बुकिंग की भविष्यवाणी करता है (मैं शायद इस कदम के लिए यादृच्छिक जंगलों या यहां तक कि सादे पुराने रैखिक प्रतिगमन का उपयोग करूंगा)।
वर्तमान में पाइपलाइन में सभी 'अवसरों' की अनुमानित बुकिंग की भविष्यवाणी करने के लिए 1 से मॉडल का उपयोग करें, फिर उन अनुमानों को योग करें जो महीने के आधार पर प्रत्येक 'अवसर' का निर्माण किया गया था।
मासिक ऐतिहासिक समय श्रृंखला डेटा के 1.5 वर्षों का उपयोग करके और उस महीने में बनाए गए सभी 'अवसरों' के लिए कुल बुकिंग की भविष्यवाणी (1 से मॉडल का उपयोग करके) का उपयोग करते हुए एक समय श्रृंखला मॉडल (संभवतः ARIMA?) का उपयोग करें।
दी गई है कि वास्तविक बुकिंग में परिवर्तित होने वाले अवसरों में एक अंतराल होगा, लेकिन समय श्रृंखला मॉडल को अंतराल से निपटने में सक्षम होना चाहिए।
यह कैसा लगता है? मैंने टाइम सीरीज़ पर बहुत सी रीडिंग की है और बिक्री की भविष्यवाणी की है, और मैं जो बता सकता हूं, वह कुछ अनोखा तरीका है। इसलिए मैं वास्तव में किसी भी प्रतिक्रिया की सराहना करता हूँ!