एलो रेटिंग प्रणाली युग्मित तुलनाओं में एक परिणाम की अपेक्षित और देखी गई संभावना के बीच क्रॉस-एन्ट्रापी लॉस फ़ंक्शन के एक ढाल डिसेंट कम से कम एल्गोरिथम का उपयोग करती है। हम सामान्य हानि कार्यों को लिख सकते हैं
जहाँ योग सभी परिणामों और सभी विरोधियों पर किया जाता है । घटना और की अपेक्षित आवृत्ति की गई आवृत्ति है।p i i i q i
केवल दो संभावित परिणाम (जीत या ढीले) और एक प्रतिद्वंद्वी के मामले में हमारे पास है
यदि खिलाड़ी की रैंकिंग है और खिलाड़ी की रैंकिंग है तो हम रूप में अपेक्षित संभाव्यता का निर्माण कर सकते हैं फिर ग्रेडिएंट वंश अद्यतन नियम का उपयोग करें बताओ मैं π जे जे क्ष मैं = ई π मैं क्षj=ई π j
जहां और खिलाड़ी की जीत की उम्मीद और देखे गए संभावना हैं खिलाड़ी के खिलाफ । यह अद्यतन नियम है।p i i jtwo outcomes
ड्रॉ की उपस्थिति में हम उपरोक्त मॉडल को सामान्य कर सकते हैं और संभाव्यता के साथ तीसरा परिणाम
और हम लॉस फंक्शन का निर्माण कर सकते हैं
जहां क्रमशः की प्रेक्षित संभावना हैं , और और की उम्मीद की संभावना , और । बाद के मामले में अद्यतन नियम होगाq ( w ) , q ( l ) , q ( d )winloosedrawwinloosedraw
जहाँ और खिलाड़ी के जीतने की संभावना है और खिलाड़ी विरुद्ध ड्रा करते हैं । और जहां और प्लेयर की जीतने की संभावना और खिलाड़ी खिलाफ आकर्षित होने की संभावना है । यह अद्यतन नियम है।three outcome
सवाल यह है कि एलो रेटिंग प्रणाली two outcomesड्रॉ की उपस्थिति में भी अपडेट नियमों का उपयोग क्यों करती है?