क्या रेटिंग मुद्रास्फीति पर बहुत अधिक शोध हुआ है?


24

2012 लंदन शतरंज क्लासिक के कल के दौर में मैग्नस कार्लसन के ड्रॉ ने आश्वासन दिया कि अगली प्रकाशित एफआईडीई रेटिंग सूची में उनकी रेटिंग कास्पारोव के 2851 के पिछले रिकॉर्ड को पार कर जाएगी। मैंने देखा है / भावुक शतरंज के प्रशंसकों ने कार्लसन की रेटिंग उपलब्धि बनाम कैसपर्व की रिश्तेदार खूबियों पर बहस की। बनाम, कहते हैं, फिशर है। स्पष्ट होने के लिए, मैं यहाँ नहीं हूँ।

इस तरह की चर्चाओं का एक महत्वपूर्ण तत्व यह धारणा है कि सामान्य रूप से एलो रेटिंगों में समय के साथ मुद्रास्फीति आई है: क्या आज की तुलना में 20 साल पहले की तुलना में 2700+ ग्रैंडमास्टर्स इतने अधिक हैं, क्योंकि खेल की ताकत में सामान्य वृद्धि, या सिर्फ कुछ के कारण संख्या में समग्र मुद्रास्फीति की प्रवृत्ति? मैं इस बारे में नंगे मतों को सुलझाने की कोशिश भी नहीं कर रहा हूं कि ऐसा है या नहीं। मुझे क्या जानने में दिलचस्पी है:

अनुभवजन्य प्रश्न का उत्तर देने के लिए क्या गंभीर शोध प्रयास किए गए हैं कि क्या खिलाड़ी पूल में समग्र शक्ति में वृद्धि के अलावा कुछ और के कारण एफआईडीई एलो रेटिंग स्वाभाविक रूप से समय के साथ बढ़ी है?

एलो रेटिंग प्रणाली पर विकिपीडिया प्रविष्टि के बारे में कहने के लिए थोड़ा सा है, और शतरंज मेट्रिक्स के जेफ सोनस के एक लेख की ओर भी इशारा करता है । दूसरों के द्वारा काम करने के लिए किसी भी संकेत के अलावा, मैं, एक के लिए, एक जवाब का भी स्वागत करूंगा जो सोनस के मुख्य बिंदुओं का एक स्पष्ट, संक्षिप्त सारांश देता है।


यूएससीएफ रेटिंग में मुद्रास्फीति के बारे में सोचने वाली एक और बात है। वहाँ किया गया है, और समय-समय पर USCF खिलाड़ियों के आतंक के लिए समायोजन करता है। चूंकि USCF और FIDE एक ही प्रणाली का उपयोग करते हैं, मौलिक रूप से, मुझे आश्चर्य होगा कि मुद्रास्फीति USCF को प्रभावित कर सकती है और FIDE को नहीं।
टोनी एननिस

2
सिस्टम समान नहीं हैं, उदाहरण के लिए USCF के पास रेटिंग फ़्लोर हैं जो स्पष्ट रूप से एक मुद्रास्फीति कारक हैं।
रेमकोगर्लिच

जवाबों:


19

मुझे आश्चर्य है कि केन रेगन और गाय हावर्थ द्वारा "आंतरिक आंतरिक रेटिंग" का पेपर अभी तक पोस्ट नहीं किया गया है। यह वही है जो रेटिंग मुद्रास्फीति में गंभीर शोध के लिए कहा जाता है। पीडीएफ

मूल रूप से उन्हें तीन पीरियड (1976-1979, 1991-1994, 2006-2009) से कई रेटिंग रेंज (उदाहरण के लिए दोनों खिलाड़ी 2200 के 10 अंक के भीतर, 2300 के 10 अंक के भीतर, आदि), और खेल के बाहर किए गए प्रकार मिले। टीम मैचों की तरह, एक विसंगति हो सकती है। पेपर पढ़ें, यह पूरी तरह से दिखता है।

फिर उन्होंने खेलों की तुलना व्यवस्थित रूप से Rybka 3 से की।

निष्कर्ष से कुछ वाक्य:

हम यह निष्कर्ष निकालते हैं कि शतरंज के कार्यक्रम और एजेंट फिटिंग द्वारा मापा गया वास्तविक खिलाड़ियों की एलो रेटिंग और चाल विकल्पों की आंतरिक गुणवत्ता के बीच एक सहज संबंध है। इसके अलावा, प्राप्त किए गए अंतिम sfit मान तीनों समयावधियों की संगत प्रविष्टियों के लिए लगभग समान हैं।

मेरे विचार में, यह रेटिंग मुद्रास्फीति के अस्तित्व के खिलाफ काफी ठोस सबूत है।


1
इसे पोस्ट करने के लिए धन्यवाद, मैं भी इसे साझा करने आया था। यह शोध की एकमात्र पंक्ति है जिसने खिलाड़ियों की तुलना एक उद्देश्य मानक से की है। रेटिंग मुद्रास्फीति के लिए मैंने जो भी तर्क देखे हैं, वे व्यक्तिपरक हैं और आम तौर पर उपाख्यान हैं। एक व्यक्तिगत टिप्पणी पर, मुझे नहीं लगता कि मॉर्फी शायद 2300 को अपने खेल की सराहना या अपने कौशल के सापेक्ष अपने प्रतिद्वंद्वियों से दूर ले गई थी।
सैम कोपलैंड

12

मैंने कुछ चारों ओर देखा। आपने शायद इन पृष्ठों को देखा है, लेकिन मैं उन्हें वैसे भी पोस्ट करूंगा:

ए। यह पेज आपको रूचि देगा । इसमें एलो से एक पत्र की फोटोकॉपी शामिल है जो खुद को संभावना बताते हैं:

इस प्रकार समय के साथ रेटिंग का पैमाना तब तक गिर सकता है जब तक कि इसे स्थिर करने के लिए कुछ उपाय नहीं किए जाते।

उन्होंने आगे उल्लेख किया है कि रेटिंग स्केल में कोई एंकर नहीं है, कोई निश्चित बिंदु नहीं है। एक एथलीट से तुलना करें जो एक घंटे में एक दौड़ चलाता है; एक घंटा अब 50 साल पहले के एक घंटे के समान है। समय ऐसा निश्चित बिंदु है।

ख। इसके अलावा, 'महंगाई' के सवाल का जवाब पहले से ही अलग-अलग क्षेत्रों से निकलने वाली उच्च रेटिंग के खुलासे से नहीं मिला है? इस पृष्ठ के "खिलाड़ियों का पूल" इस मुद्दे के लिए एक गठबंधन के लिए देखें। अतिरिक्त समर्थन , हालांकि यह विद्वानों और न ही विशेष रूप से जानकारीपूर्ण नहीं है। "पृथक" के लिए खोजें। यहाँ एक और किस्सा दिखाया गया है जो अलग-थलग आबादी के साथ होता है (और 'शतरंज के खिलाड़ी पागल क्यों होते हैं' के लिए एक और उम्मीदवार!) मैंने इस तथ्य की जाँच नहीं की, लेकिन ऐसा करना आसान होना चाहिए।

सी। एलो विकी लेख मुद्रास्फीति के बारे में बातचीत के रूप में अगर यह एक स्वीकार किए जाते हैं तथ्य है।

घ। यहाँ एक जर्मन लेख मुद्रास्फीति के बारे में है , और अनुवर्ती है । 1986 में उस धूम्रपान बंदूक को देखो!


मैंने पृष्ठ को ए से नहीं देखा था, इसके लिए धन्यवाद। बी। के बारे में, मैं इस बात से अनजान हूँ कि आप जो भी बात कर रहे हैं; क्या आप विस्तार से समझा सकते हैं?
ETD

2
मैं तर्क देता हूं कि वास्तविक एंकर के बिना, इसे सटीक रूप से समायोजित करना असंभव है; अंत में, हम केवल कुछ मनमाने मूल्य की ओर बढ़ते हुए अनैतिक रूप से समायोजन कर रहे हैं।
डैनियल बी

संभवतः। लेकिन एक समान वितरण वक्र प्राप्त करने के लिए रेटिंग समायोजित करना शायद एक अच्छी शुरुआत होगी। उदाहरण के लिए, कुछ साल पहले, USCF ने रेटिंग्स को समायोजित किया, इसलिए औसत क्लब खिलाड़ी 1500 था। मुझे नहीं पता कि क्या वे अभी भी ऐसा करते हैं।
टोनी एननिस

1
@TonyEnnis ज़रूर, और मुझे लगता है कि यह शायद उतना ही अच्छा है जितना कि यह अभी के लिए मिलेगा। विशेष रूप से, मेरा मतलब है: क्या होता है अगर "औसत क्लब खिलाड़ी" आज वास्तव में 50 साल पहले की तुलना में बेहतर है? ऐसा नहीं है कि हम उन्हें अतीत से खिलाड़ियों के खिलाफ खेलने के लिए प्राप्त कर सकते हैं ... इसलिए हम किसी भी तरह से खिलाड़ी की ताकत का आकलन करने और समायोजन करने से बचे हैं। शायद कंप्यूटर प्रोग्राम (एक मानक, निर्धारित प्लेटफॉर्म पर चलने) के साथ, हम कुछ प्रकार के निष्पक्ष, स्थायी एंकर हो सकते हैं। लेकिन यहां तक ​​कि यह भी मुद्दे होंगे, जैसे कि रणनीतियों की खोज जो बेंचमार्क कार्यक्रम के खिलाफ अच्छी तरह से काम करती है, आदि
डैनियल बी

5

पूर्ण शब्दों में, कार्लसन 2012 से अधिक मजबूत खिलाड़ी है।

यदि कार्लसन 2012 में यात्रा करते समय कैसपर्व 1986 के साथ मैच खेलते थे, तो कार्लसन कैस्परोव को हरा देंगे। यह केवल इसलिए है क्योंकि प्रौद्योगिकी-सहायता की तैयारी बहुत अधिक कुशल है, और कार्ल्सन के पास भी सिद्धांत खोलने में एक बढ़त है, क्योंकि उनके पास 1987-2012 का संचित ज्ञान है जो कि कास्परोव के पास नहीं है।

हालांकि, कास्पारोव शायद कार्लसन की तुलना में अधिक मजबूत खिलाड़ी है। अगर हम जून 2000 के लिए FIDE टॉप 100 लिस्ट लेते हैं (सबसे पुराना जो प्राप्त किया जा सकता है), हम देखते हैं कि 2849 एलो के साथ कास्परोव 99 अनुयायियों (एलो दूरी 208 अंक) के लिए 2641 के औसत के साथ प्रतिस्पर्धा करता है जबकि फाइड टॉप 100 में कालसेन दिसंबर 2012 के लिए 2848 एलो के साथ अपने 99 अनुयायियों के लिए 2702 की औसत (146 अंकों की एलो दूरी) के साथ प्रतिस्पर्धा करता है।

एलो अंकों के अंतर के बारे में है, न कि पूर्ण मूल्यों के बारे में (एलो के लिए 100 अंकों के अंतर का मतलब है कि खिलाड़ी ए खिलाड़ी बी से 2 गुना बेहतर है, 200 अंक का मतलब 4 गुना बेहतर है, और इसी तरह। तो उस सूची के साथ, इसका मतलब था। कास्परोव अपने सभी 99 अनुयायियों की तुलना में औसत से 4 गुना अधिक बेहतर था, जबकि कार्लसन शायद अपने 99 अनुयायियों के औसत से केवल 3 गुना बेहतर है।

यदि हम सूची लेते हैं तो कास्पारोव के पास अपने 99 अनुयायियों के साथ अधिकतम दूरी है और कार्लसन के लिए सबसे अच्छी दूरी के साथ तुलना करते हैं, हम यह निर्धारित करने में सक्षम होंगे कि कौन सा खिलाड़ी वास्तव में सबसे बड़ा था, क्योंकि 99 डेटा बिंदुओं के साथ, आउटलेर (एक और प्रतिभा की तरह) इसे कम करें।

मुझे आश्चर्य है कि अगर कार्लसन या कास्परोव वास्तव में परवाह करते हैं कि कौन बेहतर था।


3
कास्पारोव के बारे में आपका तर्क कार्लसन की तुलना में एक मजबूत खिलाड़ी होने के नाते अगले 99 सर्वश्रेष्ठ खिलाड़ियों की तुलना करने पर टिकी हुई है। आप ध्यान दें, सही ढंग से, कि एलो रेटिंग रिश्तेदार हैं, लेकिन आपका तर्क एक दूसरी, अस्थिर धारणा बनाता है, अर्थात् अगले 99 खिलाड़ी आज उसी औसत खेल की ताकत हैं जो कि कास्परोव के अगले दिन के 99 के रूप में है। यदि वह दूसरी धारणा सच नहीं है, तो आप कास्परोव और कार्लसन की तुलना विभिन्न मानकों से कर रहे हैं। आपको उन लोगों का एक पूल खोजने की आवश्यकता है जो आज के कसारोव के दिन के समान हैं। वह पूल शायद आपका औसत शुरुआत है, न कि सुपर-ग्रैंडमास्टर्स।
Thucydides411

4

एलो की प्रणाली के दो घटक थे। एक इतिहास से स्वतंत्र था, दूसरा नहीं था। किसी घटना या समय की अवधि में "प्रदर्शन रेटिंग" बनाने के लिए उनकी प्रणाली में कोई ऐतिहासिक घटक नहीं था; यह केवल निर्दिष्ट समय में प्रदर्शन का एक उपाय था। (मेमोरी मुझे इस बिंदु पर विफल हो जाती है, लेकिन मुझे लगता है कि जब वह FIDE के लिए रेटिंग की गणना कर रहा था तो यही वह तरीका था जो उसने इस्तेमाल किया था।)

हालाँकि, दुनिया भर के संघों द्वारा उपयोग की जाने वाली एलो प्रणाली में एक ऐतिहासिक घटक होता है, उस रेटिंग में एक डेल्टा, पिछले रेटिंग से एक परिवर्तन की गणना करके गणना की जाती है।

ऐतिहासिक रूप से आधारित प्रणाली में अपस्फीति की ओर एक स्वाभाविक प्रवृत्ति है। प्रणाली एक बंद प्रणाली है, जिसमें कोई नया बिंदु नहीं बनाया जाता है। तो नए खिलाड़ी आते हैं, स्थापित खिलाड़ियों से अंक लेते हैं, और फिर उभरते हुए खिलाड़ियों के अगले बैच में वापस उन सभी बिंदुओं को वापस करने से पहले (मृत्यु या सेवानिवृत्ति के माध्यम से) बाहर निकलते हैं।

इसकी भरपाई के लिए कई विचारों की कोशिश की गई है, कुछ दूसरों की तुलना में बेहतर काम कर रहे हैं। 70 के शुरुआती दिनों के USCF में इस व्यावसायिक दबाव में और तेजी लाने के लिए इसे जोड़ दें (बल्कि खौफनाक दृश्य यह था कि खिलाड़ी USCF से एक किताब खरीदेंगे और एक टूर्नामेंट में खेलेंगे, उनकी रेटिंग बढ़ जाएगी, जिससे उन्हें एक और खरीदने के लिए प्रोत्साहित किया जाएगा। पुस्तक, आदि) और मुद्रास्फीति इतिहास में कुछ बिंदुओं पर एक वास्तविक बात थी।

चूंकि एलो की प्रणाली एक सामान्य (घंटी) वक्र पर आधारित थी, इसलिए किसी भी चरम को मापकर मुद्रास्फीति की कोशिश करना और नापसंद करना बकवास है; वास्तविक ताकत या किसी भी प्रकार की मुद्रास्फीति में परिवर्तन की तुलना में खिलाड़ियों की कुल संख्या से चरम सीमा के प्रभावित होने की अधिक संभावना है।


1

मेरे पास एक सरल विचार है। आइए एक शतरंज कंप्यूटर (हार्डवेयर + सॉफ़्टवेयर) लें जो 20 साल पहले मापी गई रेटिंग के साथ अन्य शतरंज कंप्यूटरों के साथ खेलने के दौरान ज्ञात रेटिंग्स के साथ होता है जो उनके पास 20 साल पहले था। चलिए अब मापते हैं कि आज की रेटिंग के साथ आधुनिक शतरंज कंप्यूटरों के साथ खेलने के माध्यम से यह अब (बिल्कुल वही हार्डवेयर और ठीक उसी सॉफ्टवेयर के समान है)। दो मापों का अंतर पिछले 20 वर्षों के लिए रेटिंग मुद्रास्फीति का गठन करेगा। काफी सरल?


यह कम या ज्यादा रेटिंग मुद्रास्फीति परिकलित किया जाएगा कंप्यूटर के लिए , मानव खिलाड़ियों के लिए नहीं। मनुष्य कंप्यूटर की तुलना में अलग-अलग खेलते हैं।
Glorfindel

1

रेगन-हॉवर्थ पेपर के निष्कर्ष को नमक के एक दाने के साथ लिया जाना चाहिए, क्योंकि यह गेम के अन्य कंप्यूटर विश्लेषण को बेहतर नरम और हार्डवेयर पर और अधिक उन्नत गणितीय तरीकों के साथ विरोधाभासी लगता है । वहां वे निष्कर्ष निकालते हैं (तालिका 9 देखें), उदाहरण के लिए, कि 1977 में कारपोव ने 2001 में कास्परोव की तुलना में केवल थोड़ा निचले स्तर पर खेला और 2008 में आनंद (लगभग 47% अंक स्कोर करने की उम्मीद), और वास्तव में 2005 में टोपालोव और पाइनारियोव की तुलना में बेहतर था। 2011. चूँकि Kasparov-2001 Karpov-1977 की तुलना में 150 अंक अधिक है, इसलिए रेटिंग से उसे 70% अंक प्राप्त होने की उम्मीद है। मैं यह नहीं देखता कि इस दावे के साथ कैसे सामंजस्य स्थापित किया जाए कि कोई रेटिंग मुद्रास्फीति नहीं थी।

ध्यान दें कि, प्रश्न में निहित दावे के विपरीत, कोई भी तंत्र नहीं है जिसके द्वारा रेटिंग खिलाड़ी पूल में समग्र ताकत में बदलाव को दर्शाएगी । यह आनुभविक रूप से ऐसा मामला हो सकता है कि 2600 खिलाड़ी की एक विशिष्ट ताकत निश्चित समय अवधि में नहीं बदली है, लेकिन यह ईएलओ प्रणाली के मौलिक गुणों के प्रतिबिंब के बजाय केवल एक संयोग होगा, और निश्चित रूप से सामान्यीकरण नहीं होगा।

यदि हम मुद्रास्फीति को औसतन परिभाषित करते हैं और सिर्फ शीर्ष 100 खिलाड़ियों की औसत रेटिंग को मापते हैं, तो, जैसा कि इस लिंक से देखा जा सकता है , 2012 तक लगातार मुद्रास्फीति थी और तब से कोई मुद्रास्फीति नहीं थी - शीर्ष -100 की औसत रेटिंग दोहित दांव 2700 और पिछले 7 वर्षों के लिए 2705


0

सबसे पहले, आपको परिभाषित करना होगा कि आपको सबसे अच्छे से क्या मतलब है। उदाहरण के लिए, सबसे अच्छा मतलब है कि आप अपने युग के सबसे प्रमुख खिलाड़ी हैं? या इसका मतलब यह है कि आपके खिलाड़ी की गुणवत्ता अन्य सभी खिलाड़ियों से बेहतर है। और अगर गुणवत्ता का मतलब है, तो आप गुणवत्ता को कैसे परिभाषित करते हैं?

पॉल मॉर्फी शायद सबसे प्रमुख खिलाड़ी था। उदाहरण के लिए, जब वह 12 साल का था, तो उसने एक मैच में शीर्ष दस खिलाड़ी (लोएंथल) को 3-0 से हराया। एदो और शतरंज के अनुसार वह शायद 12 साल की उम्र में दुनिया के सबसे बेहतरीन खिलाड़ियों में से एक थे। 21 साल की उम्र में, उन्होंने 5 शीर्ष दस खिलाड़ियों (बर्ड, बार्न्स, बॉडेन, डी रेविरे, और लोवेन्थल) के खिलाफ एक साथ खेला और 3-2 का स्कोर किया।

हालांकि, अधिकांश का तर्क होगा कि प्रभुत्व सबसे खराब संकेतक है कि कौन सबसे अच्छा है। आखिरकार, मॉर्फी को पहला आधुनिक शतरंज खिलाड़ी बताया गया है। उनकी प्रतिस्पर्धा बाद के चैंपियन की तुलना में कमजोर थी।

एक और परिभाषा जिसका उपयोग किया गया है वह है गुणवत्ता का खेल। हालाँकि, इस परिभाषा में भी बहुत समस्याएँ हैं। 1900 के दशक में, कई लोगों ने तर्क दिया कि स्टीनिट्ज़ या लास्कर सभी समय के सर्वश्रेष्ठ खिलाड़ी थे जिन्होंने तर्क दिया कि उनके उद्घाटन और आधुनिक सिद्धांत का ज्ञान उन्हें अतीत के खिलाड़ियों से बेहतर बना देगा। हालांकि, लुईस पॉलसेन ने इस परिकल्पना के खिलाफ कुछ बहुत ही चतुर तर्क दिए। उन्होंने तर्क दिया कि मॉर्फी (जिनके पास एक फोटोग्राफिक मेमोरी थी और 19 साल की उम्र तक लुसाना बार कोड को याद किया गया था) अगर जीवन में वापस लाया जाता है तो एक साल के भीतर उद्घाटन और आधुनिक सिद्धांत सीखेंगे और आधुनिक शतरंज खिलाड़ियों के खिलाफ सफलतापूर्वक प्रतिस्पर्धा करने में सक्षम होंगे।

रेगन का तर्क है कि आधुनिक शतरंज खिलाड़ी जिनके पास शतरंज कंप्यूटरों तक पहुंच है और आधुनिक प्रशिक्षण विधियां अतीत के खिलाड़ियों की तुलना में कंप्यूटर की तरह अधिक खेलती हैं। यह कोई आश्चर्य की बात नहीं है क्योंकि उन्हें कंप्यूटर द्वारा प्रशिक्षित किया गया था लेकिन क्या इसका मतलब यह है कि आधुनिक खिलाड़ी वास्तव में बेहतर हैं? यह सवाल है कि अगर वे आधुनिक कंप्यूटरों तक पहुंच रखते हैं तो फिशर या कैपबेलैंका क्या करेंगे?

इसके अलावा, प्रोफेसर रेगन का विश्लेषण कंप्यूटर मुझे अधूरा मानता है क्योंकि यह सिर्फ कुछ पांच साल की अवधि में शामिल है और विश्लेषण में शामिल खिलाड़ियों का उल्लेख नहीं किया गया है। प्रोफेसरों Matej Guide और Ivan Bratko द्वारा एक अधिक गहन कंप्यूटर विश्लेषण में पाया गया कि वास्तव में Capablanca आधुनिक खिलाड़ियों के साथ एक कंप्यूटर की तरह अधिक खेला जाता है! https://en.chessbase.com/post/computers-choose-who-was-the-strongest-player-। हालांकि, गाइड और ब्राटको ने कहा कि इससे निष्कर्ष निकालने में समस्या है कि कैपबेल्का एक बेहतर खिलाड़ी था। शायद उनकी बल्कि मनमोहक शैली ने कम पदों पर पहुंचा दिया जहाँ उन्हें विस्फोट की संभावना होगी। इसलिए, उसका दोष प्रतिशत कम था लेकिन वह अपने आक्रामक खिलाड़ियों की तुलना में अपने विरोधियों पर कम दबाव डाल रहा था। वास्तव में, कैपबेलैंका के पास अपने समकालीनों की तुलना में एक उच्च ड्रा प्रतिशत था।

इसके विपरीत, एक अत्यधिक सामरिक खिलाड़ी जैसे कि कास्परोव को उनकी खेल शैली से दंडित किया जा सकता है, जो उच्च सामरिक पदों की ओर ले जाने की अधिक संभावना है जहां कंप्यूटर विशेष रूप से अच्छे हैं। वास्तव में, कंप्यूटर सामरिक या विशेष रूप से बंद स्थिति खिलाड़ियों की तुलना में सामरिक खिलाड़ियों के खिलाफ बेहतर प्रदर्शन करते हैं जहां रणनीति कम भूमिका निभाते हैं। इस प्रकार, कंप्यूटर विश्लेषण जो कंप्यूटर की संख्या की त्रुटियों पर निर्भर करता है, वह बंद स्थिति वाले खिलाड़ियों के पक्ष में होने की संभावना है। इसके विपरीत, कास्परोव जैसा आक्रामक खिलाड़ी कुछ अन्य खिलाड़ियों की तुलना में अधिक सामरिक त्रुटियां कर सकता है क्योंकि उसने बहुत ही जटिल पदों की मांग की थी लेकिन उसके प्रतिद्वंद्वी और भी अधिक बना देंगे!

इसलिए, आपको एक त्रुटि भार प्रणाली की आवश्यकता है जो प्रति 100 चालों में त्रुटियों के प्रतिशत की गणना नहीं करती है (जो मूल रूप से रेगन और गाइड और ब्रात्को ने किया था)। इसके बजाय, आपको अपनी त्रुटि दर और आपके विरोधियों की त्रुटि दर के बीच अंतर की गणना करने की आवश्यकता है। आखिरकार, शतरंज अपने प्रतिद्वंद्वी से कम त्रुटियों के बारे में है। अधिक त्रुटियों को प्रेरित करने के लिए अपने प्रतिद्वंद्वी पर दबाव डालना एक अच्छी गुणवत्ता माना जाता है।

हालाँकि, मेरी संशोधित गणना पद्धति एक और समस्या की ओर ले जाती है जो ये कंप्यूटर विश्लेषण आपके प्रतिद्वंद्वी की ताकत पर विचार नहीं करते हैं। उदाहरण के लिए, शायद लार्सन बहुत अधिक शतरंज मेट्रिक्स रेटिंग हासिल करता है क्योंकि उसकी आक्रामक (आशावादी) शैली ने निचले स्तर के खिलाड़ियों पर प्रभुत्व का नेतृत्व किया। हालांकि, उन्हें बराबर रेटिंग वाले खिलाड़ियों के खिलाफ खेलों में परेशानी थी। अन्य खिलाड़ियों ने अक्सर यह तर्क दिया कि वह अन्य उच्च श्रेणी के खिलाड़ियों के खिलाफ खेलने में बहुत आशावादी था। इस समस्या से बचने के लिए, कंप्यूटर त्रुटि जाँच विश्लेषण को केवल मजबूत प्रतियोगियों (उदाहरण के लिए, शीर्ष 10, 20 या 100 खिलाड़ी) के खिलाफ खेल को देखना चाहिए। हालांकि, यह अभी भी समय के साथ मजबूत प्रतिस्पर्धा बढ़ाने की समस्या को हल नहीं करता है।

क्या शतरंज की मेट्रिक्स जैसी रेटिंग को देखते हुए खेल की गुणवत्ता में वृद्धि की समस्या को ठीक किया जा सकता है? दरअसल, मैं ईदो बैक रेटिंग सिस्टम को पसंद करता हूं http://www.edochess.ca/क्योंकि सांख्यिकीय धारणाएं बेहतर हैं। उदाहरण के लिए, शतरंजमेट्रिक्स मानता है कि खिलाड़ी की चोटी की रेटिंग तब होती है जब वे 40 साल के होते हैं। मुझे संदेह है कि सभी के लिए यह सच है और कई खिलाड़ी उस उम्र से पहले शतरंज छोड़ देते हैं या उनका खेल कुछ वर्षों के लिए केवल शीर्ष पायदान पर था (जैसे, हैरी नेल्सन पिल्सबरी, चाउरसेक, फिशर, मोर्फी, रुबिनस्टीन, फाइन)। दुर्भाग्य से, ईदो केवल खिलाड़ियों की रेटिंग की तुलना 1811 से 1920 तक करता है। ईदो के अनुसार, कैपबेलैंका और मोर्फी को इस युग के दो सर्वोच्च खिलाड़ी माना जाता है। शतरंजमेट्रिक्स के अनुसार, कैपबेलैंका और लास्कर दो सर्वश्रेष्ठ खिलाड़ी थे (मॉर्फी भी शीर्ष दस में जगह नहीं बनाती है।) शतरंजमेट्रिक्स, ज़ुकर्टोर्ट, स्टीनिट्ज़, टार्शच, लास्कर, पॉस्बरी, मैक्रोज़ी, मार्शल, जैनोस्की, चॉर्जिन, शेलेन्चर, ब्लैकबर्न के अनुसार। डुरस, टीचमैन, न्यूमैन, विडमर, गन्सबर्ग, रुबिनस्टीन और बर्न मोर्फी से बेहतर थे।

यदि नवाचार समय के साथ एक विशिष्ट शतरंज युग के भीतर प्रभुत्व की ओर जाता है और समय के साथ नया करना मुश्किल हो जाता है क्योंकि प्रतियोगिता की ताकत बढ़ जाती है तो आप शीर्ष 30 खिलाड़ियों के मैच रिकॉर्ड को देखकर सही प्रभुत्व नहीं माप सकते। यही है, पिछले चैंपियन के मुकाबले मैग्नस कार्लसन के लिए अपने विरोधियों पर हावी होना बहुत कठिन है। यदि आप पीछे की रेटिंग को देखते हैं तो यह देखना आसान है कि समय के साथ शीर्ष खिलाड़ियों की रेटिंग के बीच अंतर कम हो गया है। इसलिए मेरा मानना ​​है कि एक ईदो प्रकार सांख्यिकीय मॉडल जो समय के साथ हावी होने की कठिनाई को ध्यान में रखता है, जो पहले की कोशिश की गई तुलना में बेहतर दृष्टिकोण होगा। उदाहरण के लिए, फिशर अपने युग के लिए एक बहुत प्रभावी खिलाड़ी था क्योंकि उसने लगातार 20 मैच जीते थे। इस विजयी लकीर की तुलना में कास्परोव या कारपोव सबसे लंबे समय तक जीतने वाली लकीर क्या थे? सीरवान के अनुसार, उनकी सबसे लंबी जीत की लकीरें सात खेल थे।

बेशक, मैं यह दावा नहीं कर रहा हूं कि जीतने वाली धारियाँ एक अच्छी मीट्रिक हैं। मैं सिर्फ यह तर्क दे रहा हूं कि रेटिंग या अन्य शीर्ष खिलाड़ियों के खिलाफ व्यक्तिगत मैचों में प्रभुत्व एक उपयोगी मीट्रिक है जिसे वर्तमान रेटिंग सिस्टम में स्पष्ट रूप से ध्यान में नहीं लिया जाता है।

तो मेरा सपना विश्लेषण यह है कि आप एक डेटाबेस के आधार पर ईदो रेटिंग का उपयोग करते हैं जिसमें केवल प्रत्येक पांच वर्ष की अवधि के शीर्ष 20 या 30 खिलाड़ी शामिल हैं। इस विश्लेषण को पूरा करने के बाद आप अपने परिणाम को एक प्रभुत्व कारक द्वारा फिर से लोड करते हैं। यही है, अधिक हाल के खिलाड़ियों को एक बोनस फैक्टर मिलता है, जिसकी गणना समय के साथ हावी होने की कठिनाई के अनुमान से की जाती है (समय के साथ शीर्ष 30 खिलाड़ियों के बीच रेटिंग असमानता में कमी)। इसके बाद, आप इस विश्लेषण को मान्य करेंगे कि शतरंज के परिकलित खिलाड़ियों के प्रतिशत की तुलना करें कि उनके विरोधियों ने अपने स्वयं के भूलों को शून्य कर दिया। यदि यह उपरोक्त को अमान्य करता है, तो आपको कंप्यूटर त्रुटि जांच विश्लेषण के अनुसार फिर से वजन करने की आवश्यकता है यदि यह दिखाता है कि हाल के शीर्ष खिलाड़ियों के लिए मेरे प्रभुत्व कारक को ध्यान में रखने के बाद भी अधिक सटीक रूप से खेलने की प्रवृत्ति है।

मेरा अनुमान है कि यह मेरी आँख पर आधारित है, यह है कि कास्परोव बहुत अच्छा करेंगे। लेकिन यह सिर्फ एक अनुमान है।


2
यह प्रश्न का उत्तर देने के लिए प्रकट नहीं होता है।
हर्ब वोल्फ

मेरा कहना है कि जब तक आप शतरंज की क्षमता को परिभाषित नहीं करते हैं, तब तक आप रेटिंग मुद्रास्फीति के बारे में सवाल का जवाब नहीं दे सकते। मैंने रेटिंग मुद्रास्फीति के लिए समायोजित करने के प्रयास या समय के साथ शतरंज चैंपियन की क्षमताओं में भिन्नता है यह निर्धारित करने का प्रयास करते हुए अनुसंधान की समीक्षा की (जो रेटिंग मुद्रास्फीति के बारे में सब कुछ है)। मेरा मानना ​​है कि समस्या यह है कि शोधकर्ताओं ने वास्तव में शतरंज की क्षमता के बारे में उनकी धारणाओं की पहचान नहीं की है। मेरी राय में, शतरंज की क्षमता को परिभाषित किए बिना, आप इस सवाल का जवाब नहीं दे सकते हैं कि शतरंज की क्षमता समय के साथ बदलती है या रेटिंग मुद्रास्फीति के बारे में कुछ भी कहती है।
टॉडएम
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.