एलो रेटिंग प्रणाली युग्मित तुलनाओं में एक परिणाम की अपेक्षित और देखी गई संभावना के बीच क्रॉस-एन्ट्रापी लॉस फ़ंक्शन के एक ढाल डिसेंट कम से कम एल्गोरिथम का उपयोग करती है। हम सामान्य हानि कार्यों को लिख सकते हैं
जहाँ योग सभी परिणामों और सभी विरोधियों पर किया जाता है । घटना और की अपेक्षित आवृत्ति की गई आवृत्ति है।p i i i q i
केवल दो संभावित परिणाम (जीत या ढीले) और एक प्रतिद्वंद्वी के मामले में हमारे पास है
यदि खिलाड़ी की रैंकिंग है और खिलाड़ी की रैंकिंग है तो हम रूप में अपेक्षित संभाव्यता का निर्माण कर सकते हैं फिर ग्रेडिएंट वंश अद्यतन नियम का उपयोग करें बताओ मैं π जे जे क्ष मैं = ई π मैं क्षj=ई π j
जहां और खिलाड़ी की जीत की उम्मीद और देखे गए संभावना हैं खिलाड़ी के खिलाफ । यह अद्यतन नियम है।p i i jtwo outcomes
ड्रॉ की उपस्थिति में हम उपरोक्त मॉडल को सामान्य कर सकते हैं और संभाव्यता के साथ तीसरा परिणाम
और हम लॉस फंक्शन का निर्माण कर सकते हैं
जहां क्रमशः की प्रेक्षित संभावना हैं , और और की उम्मीद की संभावना , और । बाद के मामले में अद्यतन नियम होगाq ( w ) , q ( l ) , q ( d )win
loose
draw
win
loose
draw
जहाँ और खिलाड़ी के जीतने की संभावना है और खिलाड़ी विरुद्ध ड्रा करते हैं । और जहां और प्लेयर की जीतने की संभावना और खिलाड़ी खिलाफ आकर्षित होने की संभावना है । यह अद्यतन नियम है।three outcome
सवाल यह है कि एलो रेटिंग प्रणाली two outcomes
ड्रॉ की उपस्थिति में भी अपडेट नियमों का उपयोग क्यों करती है?