हॉकी खिलाड़ियों द्वारा किए गए कुल कैरियर के लक्ष्यों की भविष्यवाणी करते समय एक पोइसन प्रतिगमन में एक ऑफसेट का उपयोग करना है या नहीं


10

मुझे एक सवाल है कि घरघराहट से संबंधित है या एक ऑफसेट का उपयोग नहीं करना है। एक बहुत ही आसान मॉडल मान लें, जहाँ आप हॉकी में लक्ष्यों की कुल (संख्या) का वर्णन करना चाहते हैं। तो आपके पास लक्ष्य हैं, खेले जाने वाले खेल की संख्या और एक डमी चर "स्ट्राइकर" जो 1 के बराबर है यदि खिलाड़ी स्ट्राइकर है और 0 अन्यथा। तो निम्नलिखित में से कौन सा मॉडल सही ढंग से निर्दिष्ट है?

  1. गोल = खेल + स्ट्राइकर, या

  2. लक्ष्यों = ऑफसेट (खेल) + स्ट्राइकर

फिर से, लक्ष्य समग्र लक्ष्य हैं और किसी एकल खिलाड़ी के लिए खेलों की संख्या कुल खेल है। उदाहरण के लिए, एक खिलाड़ी को उठाया जा सकता है जिसके पास 100 खेलों में 50 गोल हों और दूसरे खिलाड़ी के पास 50 खेलों में 20 गोल हों और इसी तरह से अन्य भी हो।

जब मैं लक्ष्यों की संख्या का अनुमान लगाना चाहूंगा तो मुझे क्या करना चाहिए? क्या यहां एक ऑफसेट का उपयोग करना वास्तव में आवश्यक है?

संदर्भ:


आपका आश्रित चर क्या है? क्या यह एक विशिष्ट खिलाड़ी के लिए कैरियर में लक्ष्यों की कुल संख्या है? इसके अलावा, क्या कोई कारण है कि आप प्रति गेम औसत लक्ष्य की भविष्यवाणी नहीं करना चाहते हैं?
जेरोमे एंग्लीम

हाँ, यह लक्ष्यों की कुल संख्या है! नहीं, मेरे पास हर खेल के लिए डेटा नहीं है। मेरे पास केवल समग्र डेटा है।
मार्कडॉलर

आश्रित चर (संख्या) लक्ष्य है। (ऊपर समीकरण देखें)
मार्कडॉलर

मैंने शीर्षक को थोड़ा छोटा किया है ताकि यह पिछले प्रश्न का डुप्लिकेट न हो। अगर मैं गलत समझा हूँ तो संशोधित करने के लिए स्वतंत्र महसूस करें।
जेरोमे एंग्लीम

जवाबों:


16

एक ऑफसेट मॉडल प्रति गेम लक्ष्य निर्धारित कर रहा है, जैसा कि कोई भी यहां देख सकता है:

log(goals/games) = a+bx

के बराबर है

log(goals) -log(games) = a+bx

के बराबर है

log(goals)= a+bx +log(games)   <-this is an offset model, assumes coef on the last term =1

स्लाइड 35 यहां देखें: http://www.ed.uiuc.edu/courses/EdPsy490AT/lectures/4glm3-ha-online.pdf

यदि आपको लगता है कि + bx खेलों के लिए लक्ष्यों के लॉग अनुपात (दर) से संबंधित है, तो ऑफसेट का उपयोग करें। अगर आपको लगता है कि अधिक जटिल गेम प्रभाव है, तो शायद संचित अनुभव से, नहीं। अधिक चर्चा के लिए, इसे देखें: http://ezinearticles.com/?-Exposure-and-Offset-Variables-in-Poisson-Regression-Models&id=2155811


1

ऑफ़सेट के बारे में आपके प्रश्न को सीधे संबोधित नहीं करने वाले कुछ सरल बिंदु:

  • मुझे इस बात पर ध्यान देना चाहिए कि क्या गोल की संख्या के साथ सहसंबद्ध है या नहीं। कई अभिजात्य लक्ष्य में ऐसे खेल स्कोर करना, जिनके बारे में मैं सोच सकता हूं (जैसे, फुटबॉल, ऑस्ट्रेलियाई नियम फुटबॉल, आदि) मैं यह अनुमान लगाऊंगा कि करियर की लंबी उम्र का संबंध करियर की सफलता से है। और कम से कम गोल स्कोरिंग भूमिका निभाने वाले खिलाड़ियों के लिए, सफलता स्कोर किए गए लक्ष्यों की संख्या से संबंधित है। यदि यह सच है, तो गेम की संख्या दो प्रभावों को पकड़ लेगी। एक मात्र तथ्य से संबंधित होगा कि अधिक खेल खेले जाने का मतलब गोल करने के अधिक अवसर हैं; और दूसरा कौशल-संबंधी प्रभावों को पकड़ लेगा। आप इसका पता लगाने के लिए बनाए गए गेम और औसत लक्ष्यों (जैसे, गोल / गेम की संख्या) के बीच संबंधों की जांच कर सकते हैं। मुझे लगता है कि आपके द्वारा किए गए किसी भी मॉडलिंग के लिए इसके निहितार्थ हैं।
  • मेरी वृत्ति निर्भर चर को खेल के प्रति औसत लक्ष्य में बदलने की है। मुझे एहसास है कि आपके पास अधिक खेल खेलने वालों के लिए खिलाड़ी के कौशल का अधिक सटीक माप होगा, इसलिए शायद यह एक मुद्दा होगा। अपने मॉडल की सटीकता पर निर्भर करता है कि आप क्या चाहते हैं, और खिलाड़ी के परिणामस्वरूप वितरण का मतलब है, आप मानक रैखिक मॉडलिंग तकनीकों पर भरोसा करने में सक्षम हो सकते हैं। लेकिन शायद यह आपके उद्देश्यों के लिए थोड़ा सा भी लागू होता है, और शायद आपके पास स्कोर किए गए कुल लक्ष्यों को मॉडल करने के लिए कारण हैं।

हैलो जेरोमि! आप जो कुछ भी करते हैं वह बिल्कुल सही है। लेकिन एक मॉडल बनाने का कोई तरीका नहीं है जो लक्ष्यों / खेलों को मापता है। तो मैं ऊपर के मॉडल (आश्रित के रूप में लक्ष्य और स्वतंत्र चर के रूप में खेल) के लिए मजबूर हूं। मुझे पता है कि खेलों का कौशल जैसी चीज़ों से संबंध है और मुझे इस समस्या का पता लगाना है (छोड़ी गई चर समस्या और अंतर्जात)। लेकिन फिलहाल मैं सोच रहा हूं कि ऊपर दिए गए दो मॉडलों में से किसका उपयोग किया जाना चाहिए!
मार्कडॉलर
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.