नीचे एक युगल बहुत ही सरल मॉडल हैं। वे दोनों कम से कम एक तरह से कम हैं, लेकिन हो सकता है कि वे निर्माण के लिए कुछ प्रदान करेंगे। दूसरा मॉडल वास्तव में ओपी के परिदृश्य को संबोधित नहीं करता है (नीचे टिप्पणी देखें), लेकिन मैं इसे किसी तरह से मदद करने के मामले में छोड़ रहा हूं।
मॉडल 1 : ब्रैडली-टेरी मॉडल का एक प्रकार
मान लीजिए कि हम मुख्य रूप से यह अनुमान लगाने में रुचि रखते हैं कि क्या एक टीम प्रत्येक टीम के खिलाड़ियों के आधार पर दूसरे को हराएगी। हम बस रिकॉर्ड कर सकते हैं कि क्या टीम 1 खिलाड़ियों साथ टीम 2 को हराती है , प्रत्येक खेल के लिए खिलाड़ियों ( k , ℓ ) के साथ अंतिम स्कोर की अनदेखी कर रही है। निश्चित रूप से, यह कुछ जानकारी को फेंक रहा है, लेकिन कई मामलों में यह अभी भी बहुत सारी जानकारी प्रदान करता है।(i,j)(k,ℓ)
मॉडल फिर
logit(P(Team 1 beats Team 2))=αi+αj−αk−αℓ.
यही है, हमारे पास प्रत्येक खिलाड़ी के लिए "आत्मीयता" पैरामीटर है जो इस बात को प्रभावित करता है कि वह खिलाड़ी अपनी टीम की जीत की संभावना को कितना बेहतर बनाता है। खिलाड़ी की "ताकत" को परिभाषित करें । फिर, इस मॉडल का दावा है कि
पी ( टीम 1 धड़क रहा है टीम 2 ) = एस मैं रों jsi=eαi
P(Team 1 beats Team 2)=sisjsisj+sksℓ.
यहाँ एक बहुत अच्छी समरूपता है जिसमें यह बात मायने नहीं रखती है कि जब तक कि यह भविष्यवाणियों के अनुरूप नहीं होता तब तक कैसे प्रतिक्रिया व्यक्त की जाती है। है, हम भी है
logit(P(Team 2 beats Team 1))=αk+αℓ−αi−αj.
यह आसानी से भविष्यवक्ताओं कि (प्रत्येक खिलाड़ी के लिए एक) संकेतक मूल्य ले रहे हैं के साथ एक रसद प्रतिगमन फिट किया जा सकता है अगर खिलाड़ी मैं , प्रश्न में खेल के लिए पर टीम 1 है - 1 अगर वह पर टीम 2 और है 0+1i−10 वह ऐसा नहीं करता है, तो उस खेल में भाग लें।
इससे हमारे पास खिलाड़ियों की स्वाभाविक रैंकिंग भी है। (या s ) जितना बड़ा होगा, उतना ही बड़ा खिलाड़ी अपनी टीम के जीतने की संभावना को बेहतर बनाता है। इसलिए, हम केवल अपने अनुमानित गुणांक के अनुसार खिलाड़ियों को रैंक कर सकते हैं। (ध्यान दें कि आत्मीयता पैरामीटर केवल एक सामान्य ऑफसेट तक पहचाने जा सकते हैं। इसलिए, मॉडल को पहचान योग्य बनाने के लिए α 1 = 0 को ठीक करना विशिष्ट है ।)αsα1=0
मॉडल 2 : स्वतंत्र स्कोरिंग
नायब : ओपी के सवाल को फिर से खारिज करने पर, यह स्पष्ट है कि नीचे दिए गए मॉडल उसकी स्थापना के लिए अपर्याप्त हैं। विशेष रूप से, ओपी एक ऐसे खेल में रुचि रखता है जो एक टीम या दूसरे द्वारा निर्धारित अंकों के बाद समाप्त होता है। नीचे दिए गए मॉडल उन खेलों के लिए अधिक उपयुक्त हैं जिनकी समय अवधि निश्चित है। ओपी के ढांचे के भीतर बेहतर तरीके से फिट करने के लिए संशोधन किए जा सकते हैं, लेकिन इसे विकसित करने के लिए एक अलग उत्तर की आवश्यकता होगी।
अब हम स्कोर का ट्रैक रखना चाहते हैं। मान लें कि यह एक उचित अनुमान है कि प्रत्येक टीम स्कोर किसी भी अंतराल में स्वतंत्र रूप से एक-दूसरे के अंक को इंगित करता है, जो किसी भी अंतराल अंतराल में स्वतंत्र रूप से स्कोर करता है। फिर प्रत्येक टीम के अंकों की संख्या को पॉइसन यादृच्छिक चर के रूप में मॉडलिंग की जा सकती है।
इस प्रकार, हम एक Poisson GLM को सेट कर सकते हैं जैसे कि किसी विशेष गेम में
खिलाड़ियों की और j से युक्त कुछ टीम का स्कोर लॉग ( μ ) = γ i + γ j हैij
log(μ)=γi+γj
ध्यान दें कि यह मॉडल पूरी तरह से स्कोरिंग पर ध्यान केंद्रित करते हुए, टीमों के बीच वास्तविक मैचअप को अनदेखा करता है।
σi=eγi(i,j)(k,ℓ)
P(Team 1 beats Team 2 in sudden death)=σiσjσiσj+σkσℓ.
हम इस मॉडल से अधिक एक "अपराध" आत्मीयता होने से जटिल बनाने पर विचार हो सकता और "रक्षा" आत्मीयता δ मैं प्रत्येक खिलाड़ी के लिए, इस तरह के हैं कि यदि साथ टीम 1 ( मैं , जेρiδi(i,j)(k,ℓ)
log(μ1)=ρi+ρj−δk−δℓ
log(μ2)=ρk+ρℓ−δi−δj
इस मॉडल में स्कोरिंग अभी भी स्वतंत्र है, लेकिन अब प्रत्येक टीम के खिलाड़ियों के बीच एक बातचीत होती है जो स्कोर को प्रभावित करती है। खिलाड़ियों को उनके आत्मीयता-गुणांक अनुमान के अनुसार भी रैंक किया जा सकता है।
मॉडल 2 (और इसके संस्करण) एक अंतिम स्कोर की भविष्यवाणी के लिए भी अनुमति देते हैं।
एक्सटेंशन्स : दोनों मॉडलों का विस्तार करने के लिए एक उपयोगी तरीका एक आदेश को शामिल करना है जहां सकारात्मक संकेतक "होम" टीम और नकारात्मक संकेतक "दूर" टीम के अनुरूप हैं। मॉडल के लिए एक अवरोधन अवधि में जोड़ना तब "होम-फील्ड लाभ" के रूप में व्याख्या किया जा सकता है। अन्य एक्सटेंशन में मॉडल 1 में संबंधों की संभावना को शामिल करना शामिल हो सकता है (यह वास्तव में मॉडल 2 में पहले से ही एक संभावना है)।
साइड नोट : अमेरिकी कॉलेज फुटबॉल में बाउल चैम्पियनशिप श्रृंखला के लिए उपयोग किए गए कम से कम कम्प्यूटरीकृत चुनाव ( पीटर वोल्फ ) का उपयोग अपनी रैंकिंग बनाने के लिए (मानक) ब्रैडली-टेरी मॉडल का उपयोग करता है।