मैं कई अलग-अलग मॉडलों का मूल्यांकन करना चाहता हूं जो मासिक स्तर पर व्यवहार की भविष्यवाणी प्रदान करते हैं। डेटा संतुलित है, और 100,000 और 12. परिणाम किसी दिए गए महीने में एक संगीत कार्यक्रम में भाग ले रहा है, इसलिए यह किसी भी महीने में ~ 80% लोगों के लिए शून्य है, लेकिन भारी उपयोगकर्ताओं की एक लंबी सही पूंछ है। जिन पूर्वानुमानों के बारे में मुझे नहीं लगता है, वे परिणाम की प्रकृति का सम्मान करते हैं: भिन्नात्मक संगीत प्रचलित हैं।
मैं मॉडल के बारे में कुछ नहीं जानता। मैं केवल प्रति माह प्रत्येक व्यक्ति के लिए 6 अलग-अलग ब्लैक-बॉक्स भविष्यवाणियों । मेरे पास डेटा का एक अतिरिक्त वर्ष है जो मॉडल बिल्डरों के पास अनुमान के लिए नहीं था (हालांकि कॉन्सर्ट-गोअर एक समान रहते हैं), और मैं गेज करना चाहूंगा जहां प्रत्येक अच्छा प्रदर्शन करता है (सटीकता और परिशुद्धता के मामले में)। उदाहरण के लिए, क्या कोई मॉडल अक्सर कंसर्ट करने वालों के लिए अच्छी तरह से भविष्यवाणी करता है, लेकिन सोफे आलू के लिए असफल हो जाता है? क्या जनवरी के लिए भविष्यवाणी दिसंबर के लिए भविष्यवाणी से बेहतर है? वैकल्पिक रूप से, यह जानना अच्छा होगा कि भविष्यवाणियां मुझे वास्तविक के संदर्भ में लोगों को सही ढंग से रैंक करने की अनुमति देती हैं, भले ही सटीक परिमाण पर भरोसा नहीं किया जा सकता हो।
मेरा पहला विचार पूर्वानुमान और समय की डमी पर वास्तविक के एक निश्चित प्रभाव प्रतिगमन को चलाने और प्रत्येक मॉडल के लिए आरएमएसई या को देखना था । लेकिन यह इस सवाल का जवाब नहीं देता है कि प्रत्येक मॉडल कहां अच्छा करता है या यदि अंतर महत्वपूर्ण हैं (जब तक कि मैं आरएमएसई बूटस्ट्रैप न करूं)। परिणाम का वितरण भी मुझे इस दृष्टिकोण से चिंतित करता है।
मेरा दूसरा विचार परिणाम को 0, 1-3 और 3+ में बिन करना था, और भ्रम मैट्रिक्स की गणना करना था, लेकिन यह समय आयाम की अनदेखी करता है, जब तक कि मैं इनमें से 12 नहीं बनाता। यह भी बहुत मोटे है।
मुझे concord
टीजे स्टीचेन और एनजे कॉक्स द्वारा स्टैटा कमांड के बारे में पता है - जिसके पास by()
विकल्प है, लेकिन इसके लिए डेटा को वार्षिक योग में ढहाने की आवश्यकता होगी। यह अन्य उपयोगी आंकड़ों के बीच विश्वास अंतराल के साथ लिन के कॉनकॉर्डेंस सहसंबंध सूचकांक की गणना करता है । CCC -1 से 1 तक, 1 पर सही समझौते के साथ है।
वहाँ भी है Harrell ( R. Newson द्वारा के माध्यम से गणना
), जो विकल्प है, लेकिन मुझे यकीन नहीं है कि मुझे पैनल डेटा से निपटने की अनुमति होगी। इससे आपको आत्मविश्वास अंतराल मिलता है। एक निरंतर परिणाम के लिए आरएआरएल वक्र (एयूसी) के तहत हरेल का क्षेत्र सामान्यीकरण है। यह उन सभी जोड़ियों का अनुपात है, जिन्हें इस तरह का आदेश दिया जा सकता है कि उच्च भविष्यवाणी वाले विषय का वास्तव में उच्च परिणाम होता है। तो यादृच्छिक भविष्यवाणियों के लिए पूरी तरह से भेदभाव करने वाले मॉडल के लिए। हरेल की पुस्तक देखें , पृष्ठ ४ ९ ३somersd
cluster
आप इस समस्या से कैसे निपटेंगे? क्या आप MAPE जैसे आँकड़ों की गणना करने का सुझाव देंगे जो पूर्वानुमान में आम हैं?
अब तक मिली उपयोगी चीजें:
- लिन के कॉनकॉर्डेंस सहसंबंध गुणांक के दोहराया माप संस्करण पर स्लाइड करता है