मैं एक संतुलन स्कोर की भविष्यवाणी करने की कोशिश करता हूं और कई अलग-अलग प्रतिगमन विधियों की कोशिश करता हूं। एक बात जिस पर मैंने गौर किया है वह यह है कि अनुमानित मूल्यों से लगता है कि यह किसी प्रकार की ऊपरी सीमा है। यही है, वास्तविक संतुलन में है, लेकिन मेरी भविष्यवाणियां शीर्ष पर हैं । निम्नलिखित कथानक वास्तविक बनाम अनुमानित भविष्यवाणी (रैखिक प्रतिगमन के साथ अनुमानित) दिखाता है:
और यहाँ एक ही डेटा के दो वितरण प्लॉट हैं:
चूँकि मेरे भविष्यवक्ता बहुत तिरछे हैं (पावर लॉ वितरण के साथ उपयोगकर्ता डेटा), मैंने एक बॉक्स-कॉक्स परिवर्तन लागू किया, जो परिणामों को निम्न में बदलता है:
हालांकि यह भविष्यवाणियों के वितरण को बदलता है, फिर भी ऊपरी सीमा है। तो मेरे सवाल हैं:
- भविष्यवाणी परिणामों में इस तरह के ऊपरी सीमा के संभावित कारण क्या हैं?
- मैं वास्तविक मूल्यों के वितरण के अनुरूप भविष्यवाणियों को कैसे ठीक कर सकता हूं?
बोनस: चूंकि बॉक्स-कॉक्स परिवर्तन के बाद वितरण ट्रांसफॉर्मेड भविष्यवाणियों के वितरण का पालन करता है, क्या यह संभव है कि यह सीधे जुड़ा हुआ है? यदि हां, तो क्या मैं वास्तविक मूल्यों में वितरण को फिट करने के लिए एक परिवर्तन कर सकता हूं?
संपादित करें: मैंने 5 भविष्यवक्ताओं के साथ एक सरल रैखिक प्रतिगमन का उपयोग किया।