टूर्नामेंट खत्म!
टूर्नामेंट अब खत्म हो गया है! अंतिम सिमुलेशन रात के दौरान की कुल चलाया गया था, खेल। विजेता अपने बॉट OptFor2X के साथ क्रिश्चियन सिवर्स है । क्रिश्चियन सिवर्स भी रेबेल के साथ दूसरे स्थान को सुरक्षित करने में कामयाब रहे । बधाई हो! नीचे आप टूर्नामेंट के लिए आधिकारिक उच्च स्कोर सूची देख सकते हैं।
यदि आप अभी भी गेम खेलना चाहते हैं, तो नीचे दिए गए नियंत्रक का उपयोग करने के लिए, और अपना गेम बनाने के लिए इसमें कोड का उपयोग करने के लिए आपका स्वागत है।
मुझे पासा का खेल खेलने के लिए आमंत्रित किया गया था, जिसके बारे में मैंने कभी नहीं सुना था। नियम सरल थे, फिर भी मुझे लगता है कि यह कोठारी चुनौती के लिए एकदम सही होगा।
नियम
खेल की शुरुआत
डाई टेबल के चारों ओर जाती है, और हर बार जब आपकी बारी होती है, तो आप जितनी बार चाहें उतनी बार थ्रो फेंकते हैं। हालांकि, आपको इसे कम से कम एक बार फेंकना होगा। आप अपने राउंड के लिए सभी थ्रो के योग का ट्रैक रखते हैं। यदि आप रोकना चुनते हैं, तो राउंड के लिए स्कोर आपके कुल स्कोर में जोड़ा जाता है।
तो आप कभी भी मरना बंद क्यों नहीं करेंगे? क्योंकि अगर आपको 6 मिलते हैं, तो पूरे दौर के लिए आपका स्कोर शून्य हो जाता है, और मर जाता है। इस प्रकार, प्रारंभिक लक्ष्य अपने स्कोर को जल्द से जल्द बढ़ाना है।
विजेता कौन है?
जब टेबल के चारों ओर पहला खिलाड़ी 40 अंक या उससे अधिक तक पहुंच जाता है, तो अंतिम दौर शुरू होता है। एक बार अंतिम दौर शुरू हो जाने के बाद, अंतिम दौर की शुरुआत करने वाले व्यक्ति को छोड़कर सभी को एक और मोड़ मिलता है।
अंतिम राउंड के नियम किसी अन्य राउंड के लिए समान हैं। आप फेंकने या रोकने के लिए चुनते हैं। हालाँकि, आप जानते हैं कि आपके पास जीतने का कोई मौका नहीं है यदि आपको अंतिम राउंड पर अपने से अधिक अंक नहीं मिलते हैं। लेकिन अगर आप बहुत दूर जा रहे हैं, तो आपको 6 मिल सकते हैं।
हालांकि, ध्यान में रखने के लिए एक और नियम है। यदि आपका वर्तमान कुल स्कोर (आपका पिछला स्कोर + राउंड के लिए आपका वर्तमान स्कोर) 40 या अधिक है, और आपने 6 स्कोर किया है , तो आपका कुल स्कोर 0. पर सेट होता है। इसका मतलब है कि आपको सभी शुरू करना होगा। यदि आप एक 6 मारा जब आपके वर्तमान कुल स्कोर 40 या अधिक है, तो खेल सामान्य रूप से जारी है, सिवाय इसके कि अब आप अंतिम स्थान पर हैं। जब आपका कुल स्कोर रीसेट हो जाता है तो अंतिम दौर शुरू नहीं होता है। आप अभी भी राउंड जीत सकते हैं, लेकिन यह अधिक चुनौतीपूर्ण हो जाता है।
आखिरी राउंड खत्म होने के बाद विजेता सबसे अधिक अंक वाला खिलाड़ी होता है। यदि दो या अधिक खिलाड़ी एक ही स्कोर साझा करते हैं, तो वे सभी विजेता के रूप में गिने जाएंगे।
एक अतिरिक्त नियम यह है कि खेल अधिकतम 200 राउंड के लिए जारी रहता है। यह उन मामलों को रोकने के लिए है जहां कई बॉट मूल रूप से फेंकते रहते हैं जब तक कि वे अपने वर्तमान स्कोर पर बने रहने के लिए 6 से टकराते हैं। एक बार 199 वां राउंड बीत जाने के बाद, last_round
इसे सही पर सेट किया जाता है और एक और राउंड खेला जाता है। यदि खेल 200 राउंड में जाता है, तो बॉट (या बॉट) उच्चतम स्कोर के साथ विजेता होता है, भले ही उनके पास 40 अंक या अधिक न हों।
संक्षिप्त
- प्रत्येक राउंड आप तब तक मरते रहते हैं जब तक कि आप रुकना नहीं चुनते या आपको 6 नहीं मिलते
- आपको एक बार मरना होगा (यदि आपका पहला फेंक 6 है, तो आपका दौर तुरंत समाप्त हो जाएगा)
- यदि आपको एक 6 मिलता है, तो आपका वर्तमान स्कोर 0 पर सेट होता है (आपका कुल स्कोर नहीं)
- आप प्रत्येक दौर के बाद अपने वर्तमान स्कोर को अपने कुल स्कोर में जोड़ते हैं
- जब एक बॉट अपनी बारी समाप्त करता है, जिसके परिणामस्वरूप कम से कम 40 का कुल स्कोर होता है, तो बाकी सभी को अंतिम बारी मिलती है
- अपने वर्तमान कुल स्कोर है, तो और आप एक 6 मिलता है, अपने कुल स्कोर 0 पर सेट है और अपने दौर खत्म हो गया है
- अंतिम दौर ट्रिगर नहीं होता है जब ऊपर होता है
- अंतिम राउंड के बाद उच्चतम कुल स्कोर वाला व्यक्ति विजेता है
- यदि कई विजेता हैं, तो सभी को विजेता के रूप में गिना जाएगा
- खेल अधिकतम 200 राउंड तक रहता है
अंकों का स्पष्टीकरण
- कुल स्कोर: वह अंक जो आपने पिछले राउंड से बचाया है
- वर्तमान स्कोर: वर्तमान दौर के लिए स्कोर
- वर्तमान कुल स्कोर: ऊपर दिए गए दो अंकों का योग
आप कैसे भाग लेते हैं
इस KotH चुनौती में भाग लेने के लिए, आपको एक Python क्लास लिखना चाहिए जो इनहेरिट करता है Bot
। आपको फ़ंक्शन को लागू करना चाहिए make_throw(self, scores, last_round)
:। उस फ़ंक्शन को एक बार बुलाया जाएगा जब आपकी बारी होगी, और आपका पहला फेंक 6. नहीं था yield True
। फेंकने के लिए, आपको रखना चाहिए । फेंकने से रोकने के लिए, आपको चाहिए yield False
। प्रत्येक थ्रो के बाद, पेरेंट फंक्शन update_state
कहा जाता है। इस प्रकार, आपके पास चर का उपयोग करके वर्तमान दौर के लिए अपने फेंकता तक पहुंच है self.current_throws
। आप भी अपने खुद के सूचकांक का उपयोग कर सकते हैं self.index
। इस प्रकार, अपने स्वयं के कुल स्कोर को देखने के लिए आप उपयोग करेंगे scores[self.index]
। तुम भी end_score
इस खेल के लिए उपयोग करके पहुँच सकता हैself.end_score
कर सकते हैं, लेकिन आप सुरक्षित रूप से मान सकते हैं कि इस चुनौती के लिए यह 40 होगा।
आपको अपनी कक्षा के अंदर सहायक कार्य करने की अनुमति है। Bot
यदि आप अधिक वर्ग गुण जोड़ना चाहते हैं, तो आप मूल वर्ग में मौजूद फ़ंक्शन को भी ओवरराइड कर सकते हैं। आपको पैदावार को छोड़कर True
या किसी भी तरह से खेल की स्थिति को संशोधित करने की अनुमति नहीं है False
।
आप इस पोस्ट से प्रेरणा लेने के लिए स्वतंत्र हैं, और उन दो बॉट्स में से किसी को भी कॉपी कर सकते हैं जिन्हें मैंने यहाँ शामिल किया है। हालांकि, मुझे डर है कि वे विशेष रूप से प्रभावी नहीं हैं ...
अन्य भाषाओं की अनुमति देने पर
सैंडबॉक्स और उन्नीसवीं बाइट पर, हमने अन्य भाषाओं में प्रस्तुतियाँ देने की चर्चा की है। इस तरह के कार्यान्वयन के बारे में पढ़ने, और दोनों पक्षों से तर्क सुनने के बाद, मैंने इस चुनौती को केवल पायथन तक सीमित रखने का फैसला किया है। यह दो कारकों के कारण है: कई भाषाओं का समर्थन करने के लिए आवश्यक समय, और इस चुनौती की यादृच्छिकता को स्थिरता तक पहुंचने के लिए अधिक संख्या में पुनरावृत्तियों की आवश्यकता होती है। मुझे उम्मीद है कि आप अभी भी भाग लेंगे, और यदि आप इस चुनौती के लिए कुछ पायथन सीखना चाहते हैं, तो मैं चैट में उपलब्ध होने की कोशिश करूंगा।
आपके पास किसी भी प्रश्न के लिए, आप इस चुनौती के लिए चैट रूम में लिख सकते हैं । वहाँ मिलते हैं!
नियम
- सबोटेज की अनुमति है, और प्रोत्साहित किया। यानी दूसरे खिलाड़ियों के खिलाफ तोड़फोड़
- नियंत्रक, रन-टाइम या अन्य सबमिशन के साथ छेड़छाड़ करने का कोई भी प्रयास अयोग्य होगा। सभी प्रस्तुतियाँ केवल उन इनपुट और भंडारण के साथ काम करना चाहिए जो उन्हें दिए गए हैं।
- कोई भी बॉट जो अपना निर्णय लेने के लिए 500MB से अधिक मेमोरी का उपयोग करता है, उसे अयोग्य घोषित किया जाएगा (यदि आपको उस मेमोरी की आवश्यकता है जिसे आपको अपनी पसंद पर पुनर्विचार करना चाहिए)
- एक बॉट को मौजूदा एक के रूप में सटीक एक ही रणनीति को लागू नहीं करना चाहिए, जानबूझकर या गलती से।
- आपको चुनौती के समय में अपने बॉट को अपडेट करने की अनुमति है। हालाँकि, आप एक और बॉट भी पोस्ट कर सकते हैं यदि आपका दृष्टिकोण अलग है।
उदाहरण
class GoToTenBot(Bot):
def make_throw(self, scores, last_round):
while sum(self.current_throws) < 10:
yield True
yield False
यह बॉट तब तक चलता रहेगा, जब तक कि राउंड के लिए कम से कम 10 का स्कोर न हो, या यह एक 6 फेंकता है। ध्यान दें कि आपको फेंकने को संभालने के लिए किसी तर्क की आवश्यकता नहीं है। 6. यह भी ध्यान दें कि यदि आपका पहला फेंक 6 है, make_throw
है कभी नहीं कहा जाता है, क्योंकि आपका दौर तुरंत खत्म हो गया है।
उन लोगों के लिए जो पाइथन के लिए नए हैं (और yield
अवधारणा के लिए नए हैं ), लेकिन यह इसे देना चाहते हैं, yield
कीवर्ड कुछ तरीकों से वापसी के समान है, लेकिन अन्य तरीकों से अलग है। आप यहां अवधारणा के बारे में पढ़ सकते हैं । मूल रूप से, एक बार जब आप yield
, आपका कार्य बंद हो जाएगा, और आपके द्वारा yield
संपादित मूल्य नियंत्रक को वापस भेज दिया जाएगा। वहां, नियंत्रक अपने तर्क को संभालता है जब तक कि आपके बॉट के लिए एक और निर्णय लेने का समय नहीं है। फिर नियंत्रक आपको पासा फेंकता है, और आपका make_throw
कार्य सही तरीके से निष्पादित करना जारी रखेगा जहां पहले बंद कर दिया गया था, मूल रूप से पिछले yield
बयान के बाद लाइन पर ।
इस तरह, खेल नियंत्रक प्रत्येक पासा फेंक के लिए एक अलग बॉट फ़ंक्शन कॉल की आवश्यकता के बिना राज्य को अपडेट कर सकता है।
विशिष्टता
आप किसी भी उपलब्ध पाइथन लाइब्रेरी का उपयोग कर सकते हैं pip
। यह सुनिश्चित करने के लिए कि मैं एक अच्छा औसत प्राप्त करने में सक्षम हूं, आपके पास प्रति चक्कर में 100 मिलीसेकंड समय सीमा है। अगर आपकी पटकथा इससे कहीं तेज होती, तो मुझे बहुत खुशी होती, ताकि मैं और दौर चला सकूं।
मूल्यांकन
विजेता को खोजने के लिए, मैं सभी बॉट ले जाऊंगा और उन्हें 8 के यादृच्छिक समूहों में चलाऊंगा। यदि 8 से कम कक्षाएं जमा की जाती हैं, तो मैं उन्हें प्रत्येक दौर में सभी बॉट्स से बचने के लिए 4 के यादृच्छिक समूहों में चलाऊंगा। मैं लगभग 8 घंटे के लिए सिमुलेशन चलाऊंगा, और विजेता सबसे अधिक जीत प्रतिशत के साथ बॉट होगा। मैं 2019 की शुरुआत में अंतिम सिमुलेशन शुरू करूंगा, जिससे आप सभी क्रिसमस को अपने बॉट्स को कोड कर सकेंगे! प्रारंभिक अंतिम तारीख 4 जनवरी है, लेकिन अगर यह बहुत कम समय है तो मैं इसे बाद की तारीख में बदल सकता हूं।
तब तक, मैं 30-60 मिनट के CPU समय और स्कोर बोर्ड को अपडेट करके एक दैनिक सिमुलेशन बनाने की कोशिश करूंगा। यह आधिकारिक स्कोर नहीं होगा, लेकिन यह देखने के लिए एक मार्गदर्शिका के रूप में काम करेगा कि कौन से बॉट सर्वश्रेष्ठ प्रदर्शन करते हैं। हालाँकि, क्रिसमस आने के साथ, मुझे आशा है कि आप समझ सकते हैं कि मैं हर समय उपलब्ध नहीं रहूँगा। मैं सिमुलेशन चलाने और चुनौती से संबंधित किसी भी सवाल का जवाब देने की पूरी कोशिश करूंगा।
इसे स्वयं परखें
यदि आप अपने स्वयं के सिमुलेशन चलाना चाहते हैं, तो दो उदाहरण बॉट सहित सिमुलेशन चलाने वाले नियंत्रक का पूर्ण कोड यहां है।
नियंत्रक
यहाँ इस चुनौती के लिए अद्यतन नियंत्रक है। यह ANSI आउटपुट, मल्टी-थ्रेडिंग का समर्थन करता है, और AKroell के लिए अतिरिक्त आँकड़े एकत्र करता है ! जब मैं कंट्रोलर में बदलाव करता हूं, तो डाक्यूमेंट पूरा होने के बाद मैं पोस्ट अपडेट कर दूंगा।
बीएमओ के लिए धन्यवाद , नियंत्रक अब -d
ध्वज का उपयोग करके इस पोस्ट से सभी बॉट डाउनलोड करने में सक्षम है । इस संस्करण में अन्य कार्यक्षमता अपरिवर्तित है। यह सुनिश्चित करना चाहिए कि आपके सभी नवीनतम परिवर्तन जल्द से जल्द नकली हैं!
#!/usr/bin/env python3
import re
import json
import math
import random
import requests
import sys
import time
from numpy import cumsum
from collections import defaultdict
from html import unescape
from lxml import html
from multiprocessing import Pool
from os import path, rename, remove
from sys import stderr
from time import strftime
# If you want to see what each bot decides, set this to true
# Should only be used with one thread and one game
DEBUG = False
# If your terminal supports ANSI, try setting this to true
ANSI = False
# File to keep base class and own bots
OWN_FILE = 'forty_game_bots.py'
# File where to store the downloaded bots
AUTO_FILE = 'auto_bots.py'
# If you want to use up all your quota & re-download all bots
DOWNLOAD = False
# If you want to ignore a specific user's bots (eg. your own bots): add to list
IGNORE = []
# The API-request to get all the bots
URL = "https://api.stackexchange.com/2.2/questions/177765/answers?page=%s&pagesize=100&order=desc&sort=creation&site=codegolf&filter=!bLf7Wx_BfZlJ7X"
def print_str(x, y, string):
print("\033["+str(y)+";"+str(x)+"H"+string, end = "", flush = True)
class bcolors:
WHITE = '\033[0m'
GREEN = '\033[92m'
BLUE = '\033[94m'
YELLOW = '\033[93m'
RED = '\033[91m'
ENDC = '\033[0m'
# Class for handling the game logic and relaying information to the bots
class Controller:
def __init__(self, bots_per_game, games, bots, thread_id):
"""Initiates all fields relevant to the simulation
Keyword arguments:
bots_per_game -- the number of bots that should be included in a game
games -- the number of games that should be simulated
bots -- a list of all available bot classes
"""
self.bots_per_game = bots_per_game
self.games = games
self.bots = bots
self.number_of_bots = len(self.bots)
self.wins = defaultdict(int)
self.played_games = defaultdict(int)
self.bot_timings = defaultdict(float)
# self.wins = {bot.__name__: 0 for bot in self.bots}
# self.played_games = {bot.__name__: 0 for bot in self.bots}
self.end_score = 40
self.thread_id = thread_id
self.max_rounds = 200
self.timed_out_games = 0
self.tied_games = 0
self.total_rounds = 0
self.highest_round = 0
#max, avg, avg_win, throws, success, rounds
self.highscore = defaultdict(lambda:[0, 0, 0, 0, 0, 0])
self.winning_scores = defaultdict(int)
# self.highscore = {bot.__name__: [0, 0, 0] for bot in self.bots}
# Returns a fair dice throw
def throw_die(self):
return random.randint(1,6)
# Print the current game number without newline
def print_progress(self, progress):
length = 50
filled = int(progress*length)
fill = "="*filled
space = " "*(length-filled)
perc = int(100*progress)
if ANSI:
col = [
bcolors.RED,
bcolors.YELLOW,
bcolors.WHITE,
bcolors.BLUE,
bcolors.GREEN
][int(progress*4)]
end = bcolors.ENDC
print_str(5, 8 + self.thread_id,
"\t%s[%s%s] %3d%%%s" % (col, fill, space, perc, end)
)
else:
print(
"\r\t[%s%s] %3d%%" % (fill, space, perc),
flush = True,
end = ""
)
# Handles selecting bots for each game, and counting how many times
# each bot has participated in a game
def simulate_games(self):
for game in range(self.games):
if self.games > 100:
if game % (self.games // 100) == 0 and not DEBUG:
if self.thread_id == 0 or ANSI:
progress = (game+1) / self.games
self.print_progress(progress)
game_bot_indices = random.sample(
range(self.number_of_bots),
self.bots_per_game
)
game_bots = [None for _ in range(self.bots_per_game)]
for i, bot_index in enumerate(game_bot_indices):
self.played_games[self.bots[bot_index].__name__] += 1
game_bots[i] = self.bots[bot_index](i, self.end_score)
self.play(game_bots)
if not DEBUG and (ANSI or self.thread_id == 0):
self.print_progress(1)
self.collect_results()
def play(self, game_bots):
"""Simulates a single game between the bots present in game_bots
Keyword arguments:
game_bots -- A list of instantiated bot objects for the game
"""
last_round = False
last_round_initiator = -1
round_number = 0
game_scores = [0 for _ in range(self.bots_per_game)]
# continue until one bot has reached end_score points
while not last_round:
for index, bot in enumerate(game_bots):
t0 = time.clock()
self.single_bot(index, bot, game_scores, last_round)
t1 = time.clock()
self.bot_timings[bot.__class__.__name__] += t1-t0
if game_scores[index] >= self.end_score and not last_round:
last_round = True
last_round_initiator = index
round_number += 1
# maximum of 200 rounds per game
if round_number > self.max_rounds - 1:
last_round = True
self.timed_out_games += 1
# this ensures that everyone gets their last turn
last_round_initiator = self.bots_per_game
# make sure that all bots get their last round
for index, bot in enumerate(game_bots[:last_round_initiator]):
t0 = time.clock()
self.single_bot(index, bot, game_scores, last_round)
t1 = time.clock()
self.bot_timings[bot.__class__.__name__] += t1-t0
# calculate which bots have the highest score
max_score = max(game_scores)
nr_of_winners = 0
for i in range(self.bots_per_game):
bot_name = game_bots[i].__class__.__name__
# average score per bot
self.highscore[bot_name][1] += game_scores[i]
if self.highscore[bot_name][0] < game_scores[i]:
# maximum score per bot
self.highscore[bot_name][0] = game_scores[i]
if game_scores[i] == max_score:
# average winning score per bot
self.highscore[bot_name][2] += game_scores[i]
nr_of_winners += 1
self.wins[bot_name] += 1
if nr_of_winners > 1:
self.tied_games += 1
self.total_rounds += round_number
self.highest_round = max(self.highest_round, round_number)
self.winning_scores[max_score] += 1
def single_bot(self, index, bot, game_scores, last_round):
"""Simulates a single round for one bot
Keyword arguments:
index -- The player index of the bot (e.g. 0 if the bot goes first)
bot -- The bot object about to be simulated
game_scores -- A list of ints containing the scores of all players
last_round -- Boolean describing whether it is currently the last round
"""
current_throws = [self.throw_die()]
if current_throws[-1] != 6:
bot.update_state(current_throws[:])
for throw in bot.make_throw(game_scores[:], last_round):
# send the last die cast to the bot
if not throw:
break
current_throws.append(self.throw_die())
if current_throws[-1] == 6:
break
bot.update_state(current_throws[:])
if current_throws[-1] == 6:
# reset total score if running total is above end_score
if game_scores[index] + sum(current_throws) - 6 >= self.end_score:
game_scores[index] = 0
else:
# add to total score if no 6 is cast
game_scores[index] += sum(current_throws)
if DEBUG:
desc = "%d: Bot %24s plays %40s with " + \
"scores %30s and last round == %5s"
print(desc % (index, bot.__class__.__name__,
current_throws, game_scores, last_round))
bot_name = bot.__class__.__name__
# average throws per round
self.highscore[bot_name][3] += len(current_throws)
# average success rate per round
self.highscore[bot_name][4] += int(current_throws[-1] != 6)
# total number of rounds
self.highscore[bot_name][5] += 1
# Collects all stats for the thread, so they can be summed up later
def collect_results(self):
self.bot_stats = {
bot.__name__: [
self.wins[bot.__name__],
self.played_games[bot.__name__],
self.highscore[bot.__name__]
]
for bot in self.bots}
#
def print_results(total_bot_stats, total_game_stats, elapsed_time):
"""Print the high score after the simulation
Keyword arguments:
total_bot_stats -- A list containing the winning stats for each thread
total_game_stats -- A list containing controller stats for each thread
elapsed_time -- The number of seconds that it took to run the simulation
"""
# Find the name of each bot, the number of wins, the number
# of played games, and the win percentage
wins = defaultdict(int)
played_games = defaultdict(int)
highscores = defaultdict(lambda: [0, 0, 0, 0, 0, 0])
bots = set()
timed_out_games = sum(s[0] for s in total_game_stats)
tied_games = sum(s[1] for s in total_game_stats)
total_games = sum(s[2] for s in total_game_stats)
total_rounds = sum(s[4] for s in total_game_stats)
highest_round = max(s[5] for s in total_game_stats)
average_rounds = total_rounds / total_games
winning_scores = defaultdict(int)
bot_timings = defaultdict(float)
for stats in total_game_stats:
for score, count in stats[6].items():
winning_scores[score] += count
percentiles = calculate_percentiles(winning_scores, total_games)
for thread in total_bot_stats:
for bot, stats in thread.items():
wins[bot] += stats[0]
played_games[bot] += stats[1]
highscores[bot][0] = max(highscores[bot][0], stats[2][0])
for i in range(1, 6):
highscores[bot][i] += stats[2][i]
bots.add(bot)
for bot in bots:
bot_timings[bot] += sum(s[3][bot] for s in total_game_stats)
bot_stats = [[bot, wins[bot], played_games[bot], 0] for bot in bots]
for i, bot in enumerate(bot_stats):
bot[3] = 100 * bot[1] / bot[2] if bot[2] > 0 else 0
bot_stats[i] = tuple(bot)
# Sort the bots by their winning percentage
sorted_scores = sorted(bot_stats, key=lambda x: x[3], reverse=True)
# Find the longest class name for any bot
max_len = max([len(b[0]) for b in bot_stats])
# Print the highscore list
if ANSI:
print_str(0, 9 + threads, "")
else:
print("\n")
sim_msg = "\tSimulation or %d games between %d bots " + \
"completed in %.1f seconds"
print(sim_msg % (total_games, len(bots), elapsed_time))
print("\tEach game lasted for an average of %.2f rounds" % average_rounds)
print("\t%d games were tied between two or more bots" % tied_games)
print("\t%d games ran until the round limit, highest round was %d\n"
% (timed_out_games, highest_round))
print_bot_stats(sorted_scores, max_len, highscores)
print_score_percentiles(percentiles)
print_time_stats(bot_timings, max_len)
def calculate_percentiles(winning_scores, total_games):
percentile_bins = 10000
percentiles = [0 for _ in range(percentile_bins)]
sorted_keys = list(sorted(winning_scores.keys()))
sorted_values = [winning_scores[key] for key in sorted_keys]
cumsum_values = list(cumsum(sorted_values))
i = 0
for perc in range(percentile_bins):
while cumsum_values[i] < total_games * (perc+1) / percentile_bins:
i += 1
percentiles[perc] = sorted_keys[i]
return percentiles
def print_score_percentiles(percentiles):
n = len(percentiles)
show = [.5, .75, .9, .95, .99, .999, .9999]
print("\t+----------+-----+")
print("\t|Percentile|Score|")
print("\t+----------+-----+")
for p in show:
print("\t|%10.2f|%5d|" % (100*p, percentiles[int(p*n)]))
print("\t+----------+-----+")
print()
def print_bot_stats(sorted_scores, max_len, highscores):
"""Print the stats for the bots
Keyword arguments:
sorted_scores -- A list containing the bots in sorted order
max_len -- The maximum name length for all bots
highscores -- A dict with additional stats for each bot
"""
delimiter_format = "\t+%s%s+%s+%s+%s+%s+%s+%s+%s+%s+"
delimiter_args = ("-"*(max_len), "", "-"*4, "-"*8,
"-"*8, "-"*6, "-"*6, "-"*7, "-"*6, "-"*8)
delimiter_str = delimiter_format % delimiter_args
print(delimiter_str)
print("\t|%s%s|%4s|%8s|%8s|%6s|%6s|%7s|%6s|%8s|"
% ("Bot", " "*(max_len-3), "Win%", "Wins",
"Played", "Max", "Avg", "Avg win", "Throws", "Success%"))
print(delimiter_str)
for bot, wins, played, score in sorted_scores:
highscore = highscores[bot]
bot_max_score = highscore[0]
bot_avg_score = highscore[1] / played
bot_avg_win_score = highscore[2] / max(1, wins)
bot_avg_throws = highscore[3] / highscore[5]
bot_success_rate = 100 * highscore[4] / highscore[5]
space_fill = " "*(max_len-len(bot))
format_str = "\t|%s%s|%4.1f|%8d|%8d|%6d|%6.2f|%7.2f|%6.2f|%8.2f|"
format_arguments = (bot, space_fill, score, wins,
played, bot_max_score, bot_avg_score,
bot_avg_win_score, bot_avg_throws, bot_success_rate)
print(format_str % format_arguments)
print(delimiter_str)
print()
def print_time_stats(bot_timings, max_len):
"""Print the execution time for all bots
Keyword arguments:
bot_timings -- A dict containing information about timings for each bot
max_len -- The maximum name length for all bots
"""
total_time = sum(bot_timings.values())
sorted_times = sorted(bot_timings.items(),
key=lambda x: x[1], reverse = True)
delimiter_format = "\t+%s+%s+%s+"
delimiter_args = ("-"*(max_len), "-"*7, "-"*5)
delimiter_str = delimiter_format % delimiter_args
print(delimiter_str)
print("\t|%s%s|%7s|%5s|" % ("Bot", " "*(max_len-3), "Time", "Time%"))
print(delimiter_str)
for bot, bot_time in sorted_times:
space_fill = " "*(max_len-len(bot))
perc = 100 * bot_time / total_time
print("\t|%s%s|%7.2f|%5.1f|" % (bot, space_fill, bot_time, perc))
print(delimiter_str)
print()
def run_simulation(thread_id, bots_per_game, games_per_thread, bots):
"""Used by multithreading to run the simulation in parallel
Keyword arguments:
thread_id -- A unique identifier for each thread, starting at 0
bots_per_game -- How many bots should participate in each game
games_per_thread -- The number of games to be simulated
bots -- A list of all bot classes available
"""
try:
controller = Controller(bots_per_game,
games_per_thread, bots, thread_id)
controller.simulate_games()
controller_stats = (
controller.timed_out_games,
controller.tied_games,
controller.games,
controller.bot_timings,
controller.total_rounds,
controller.highest_round,
controller.winning_scores
)
return (controller.bot_stats, controller_stats)
except KeyboardInterrupt:
return {}
# Prints the help for the script
def print_help():
print("\nThis is the controller for the PPCG KotH challenge " + \
"'A game of dice, but avoid number 6'")
print("For any question, send a message to maxb\n")
print("Usage: python %s [OPTIONS]" % sys.argv[0])
print("\n -n\t\tthe number of games to simluate")
print(" -b\t\tthe number of bots per round")
print(" -t\t\tthe number of threads")
print(" -d\t--download\tdownload all bots from codegolf.SE")
print(" -A\t--ansi\trun in ANSI mode, with prettier printing")
print(" -D\t--debug\trun in debug mode. Sets to 1 thread, 1 game")
print(" -h\t--help\tshow this help\n")
# Make a stack-API request for the n-th page
def req(n):
req = requests.get(URL % n)
req.raise_for_status()
return req.json()
# Pull all the answers via the stack-API
def get_answers():
n = 1
api_ans = req(n)
answers = api_ans['items']
while api_ans['has_more']:
n += 1
if api_ans['quota_remaining']:
api_ans = req(n)
answers += api_ans['items']
else:
break
m, r = api_ans['quota_max'], api_ans['quota_remaining']
if 0.1 * m > r:
print(" > [WARN]: only %s/%s API-requests remaining!" % (r,m), file=stderr)
return answers
def download_players():
players = {}
for ans in get_answers():
name = unescape(ans['owner']['display_name'])
bots = []
root = html.fromstring('<body>%s</body>' % ans['body'])
for el in root.findall('.//code'):
code = el.text
if re.search(r'^class \w+\(\w*Bot\):.*$', code, flags=re.MULTILINE):
bots.append(code)
if not bots:
print(" > [WARN] user '%s': couldn't locate any bots" % name, file=stderr)
elif name in players:
players[name] += bots
else:
players[name] = bots
return players
# Download all bots from codegolf.stackexchange.com
def download_bots():
print('pulling bots from the interwebs..', file=stderr)
try:
players = download_players()
except Exception as ex:
print('FAILED: (%s)' % ex, file=stderr)
exit(1)
if path.isfile(AUTO_FILE):
print(' > move: %s -> %s.old' % (AUTO_FILE,AUTO_FILE), file=stderr)
if path.exists('%s.old' % AUTO_FILE):
remove('%s.old' % AUTO_FILE)
rename(AUTO_FILE, '%s.old' % AUTO_FILE)
print(' > writing players to %s' % AUTO_FILE, file=stderr)
f = open(AUTO_FILE, 'w+', encoding='utf8')
f.write('# -*- coding: utf-8 -*- \n')
f.write('# Bots downloaded from https://codegolf.stackexchange.com/questions/177765 @ %s\n\n' % strftime('%F %H:%M:%S'))
with open(OWN_FILE, 'r') as bfile:
f.write(bfile.read()+'\n\n\n# Auto-pulled bots:\n\n')
for usr in players:
if usr not in IGNORE:
for bot in players[usr]:
f.write('# User: %s\n' % usr)
f.write(bot+'\n\n')
f.close()
print('OK: pulled %s bots' % sum(len(bs) for bs in players.values()))
if __name__ == "__main__":
games = 10000
bots_per_game = 8
threads = 4
for i, arg in enumerate(sys.argv):
if arg == "-n" and len(sys.argv) > i+1 and sys.argv[i+1].isdigit():
games = int(sys.argv[i+1])
if arg == "-b" and len(sys.argv) > i+1 and sys.argv[i+1].isdigit():
bots_per_game = int(sys.argv[i+1])
if arg == "-t" and len(sys.argv) > i+1 and sys.argv[i+1].isdigit():
threads = int(sys.argv[i+1])
if arg == "-d" or arg == "--download":
DOWNLOAD = True
if arg == "-A" or arg == "--ansi":
ANSI = True
if arg == "-D" or arg == "--debug":
DEBUG = True
if arg == "-h" or arg == "--help":
print_help()
quit()
if ANSI:
print(chr(27) + "[2J", flush = True)
print_str(1,3,"")
else:
print()
if DOWNLOAD:
download_bots()
exit() # Before running other's code, you might want to inspect it..
if path.isfile(AUTO_FILE):
exec('from %s import *' % AUTO_FILE[:-3])
else:
exec('from %s import *' % OWN_FILE[:-3])
bots = get_all_bots()
if bots_per_game > len(bots):
bots_per_game = len(bots)
if bots_per_game < 2:
print("\tAt least 2 bots per game is needed")
bots_per_game = 2
if games <= 0:
print("\tAt least 1 game is needed")
games = 1
if threads <= 0:
print("\tAt least 1 thread is needed")
threads = 1
if DEBUG:
print("\tRunning in debug mode, with 1 thread and 1 game")
threads = 1
games = 1
games_per_thread = math.ceil(games / threads)
print("\tStarting simulation with %d bots" % len(bots))
sim_str = "\tSimulating %d games with %d bots per game"
print(sim_str % (games, bots_per_game))
print("\tRunning simulation on %d threads" % threads)
if len(sys.argv) == 1:
print("\tFor help running the script, use the -h flag")
print()
with Pool(threads) as pool:
t0 = time.time()
results = pool.starmap(
run_simulation,
[(i, bots_per_game, games_per_thread, bots) for i in range(threads)]
)
t1 = time.time()
if not DEBUG:
total_bot_stats = [r[0] for r in results]
total_game_stats = [r[1] for r in results]
print_results(total_bot_stats, total_game_stats, t1-t0)
यदि आप इस चुनौती के लिए मूल नियंत्रक तक पहुँच चाहते हैं, तो यह संपादन इतिहास में उपलब्ध है। नए नियंत्रक में गेम चलाने के लिए सटीक तर्क है, केवल अंतर प्रदर्शन, स्टेट कलेक्शन और प्रीटीयर प्रिंटिंग है।
बॉट
मेरी मशीन पर, बॉट फ़ाइल में रखे जाते हैं forty_game_bots.py
। यदि आप फ़ाइल के लिए किसी अन्य नाम का उपयोग करते हैं, तो आपको import
नियंत्रक के शीर्ष पर कथन को अपडेट करना होगा ।
import sys, inspect
import random
import numpy as np
# Returns a list of all bot classes which inherit from the Bot class
def get_all_bots():
return Bot.__subclasses__()
# The parent class for all bots
class Bot:
def __init__(self, index, end_score):
self.index = index
self.end_score = end_score
def update_state(self, current_throws):
self.current_throws = current_throws
def make_throw(self, scores, last_round):
yield False
class ThrowTwiceBot(Bot):
def make_throw(self, scores, last_round):
yield True
yield False
class GoToTenBot(Bot):
def make_throw(self, scores, last_round):
while sum(self.current_throws) < 10:
yield True
yield False
अनुकरण चल रहा है
सिमुलेशन चलाने के लिए, दो अलग-अलग फ़ाइलों के ऊपर पोस्ट किए गए दोनों कोड स्निपेट्स को सहेजें। मैंने उन्हें forty_game_controller.py
और के रूप में बचाया है forty_game_bots.py
। तो आप बस का उपयोग करें python forty_game_controller.py
याpython3 forty_game_controller.py
अपने पाइथन विन्यास पर निर्भर करते हैं। यदि आप अपने सिमुलेशन को आगे कॉन्फ़िगर करना चाहते हैं, या यदि आप चाहते हैं तो कोड के साथ छेड़छाड़ करने की कोशिश करें।
खेल आँकड़े
यदि आप एक बॉट बना रहे हैं जिसका उद्देश्य अन्य बॉट्स को ध्यान में रखते हुए एक निश्चित स्कोर के लिए है, तो ये जीतने वाले स्कोर प्रतिशत हैं:
+----------+-----+
|Percentile|Score|
+----------+-----+
| 50.00| 44|
| 75.00| 48|
| 90.00| 51|
| 95.00| 54|
| 99.00| 58|
| 99.90| 67|
| 99.99| 126|
+----------+-----+
उच्च स्कोर
जैसे ही अधिक उत्तर पोस्ट किए जाते हैं, मैं इस सूची को अपडेट रखने का प्रयास करूंगा। सूची की सामग्री हमेशा नवीनतम सिमुलेशन से होगी। बॉट्स ThrowTwiceBot
औरGoToTenBot
ऊपर कोड से बॉट हैं, और संदर्भ के रूप में उपयोग किया जाता है। मैंने 10 ^ 8 गेम के साथ एक सिमुलेशन किया, जिसमें लगभग 1 घंटे का समय लगा। तब मैंने देखा कि 10 ^ 7 गेम के साथ मेरे रनों की तुलना में खेल स्थिरता तक पहुंच गया। हालाँकि, लोग अभी भी बॉट्स पोस्ट कर रहे हैं, मैं तब तक कोई सिमुलेशन नहीं करूंगा जब तक कि प्रतिक्रियाओं की आवृत्ति कम न हो जाए।
मैं सभी नए बॉट्स जोड़ने और आपके द्वारा मौजूदा बॉट्स में किए गए किसी भी बदलाव को जोड़ने का प्रयास करता हूं। यदि ऐसा लगता है कि मैंने आपके बॉट या आपके द्वारा किए गए किसी भी नए बदलाव को याद किया है, तो चैट में लिखें और मैं अगले सिमुलेशन में आपके नवीनतम संस्करण को सुनिश्चित करूंगा।
अब हमारे पास AKroell के लिए प्रत्येक बॉट के लिए अधिक आँकड़े हैं ! तीन नए कॉलमों में सभी खेलों में अधिकतम स्कोर, प्रति गेम औसत स्कोर और प्रत्येक बॉट के लिए जीतने पर औसत स्कोर शामिल हैं।
जैसा कि टिप्पणियों में बताया गया है, गेम लॉजिक के साथ एक मुद्दा था जिसने बॉट्स बनाए जो कि गेम के भीतर एक उच्च सूचकांक था, कुछ मामलों में एक अतिरिक्त दौर प्राप्त करता है। इसे अब ठीक कर दिया गया है, और नीचे दिए गए स्कोर इसे दर्शाते हैं
Simulation or 300000000 games between 49 bots completed in 35628.7 seconds
Each game lasted for an average of 3.73 rounds
29127662 games were tied between two or more bots
0 games ran until the round limit, highest round was 22
+-----------------------+----+--------+--------+------+------+-------+------+--------+
|Bot |Win%| Wins| Played| Max| Avg|Avg win|Throws|Success%|
+-----------------------+----+--------+--------+------+------+-------+------+--------+
|OptFor2X |21.6|10583693|48967616| 99| 20.49| 44.37| 4.02| 33.09|
|Rebel |20.7|10151261|48977862| 104| 21.36| 44.25| 3.90| 35.05|
|Hesitate |20.3| 9940220|48970815| 105| 21.42| 44.23| 3.89| 35.11|
|EnsureLead |20.3| 9929074|48992362| 101| 20.43| 44.16| 4.50| 25.05|
|StepBot |20.2| 9901186|48978938| 96| 20.42| 43.47| 4.56| 24.06|
|BinaryBot |20.1| 9840684|48981088| 115| 21.01| 44.48| 3.85| 35.92|
|Roll6Timesv2 |20.1| 9831713|48982301| 101| 20.83| 43.53| 4.37| 27.15|
|AggressiveStalker |19.9| 9767637|48979790| 110| 20.46| 44.86| 3.90| 35.04|
|FooBot |19.9| 9740900|48980477| 100| 22.03| 43.79| 3.91| 34.79|
|QuotaBot |19.9| 9726944|48980023| 101| 19.96| 44.95| 4.50| 25.03|
|BePrepared |19.8| 9715461|48978569| 112| 18.68| 47.58| 4.30| 28.31|
|AdaptiveRoller |19.7| 9659023|48982819| 107| 20.70| 43.27| 4.51| 24.81|
|GoTo20Bot |19.6| 9597515|48973425| 108| 21.15| 43.24| 4.44| 25.98|
|Gladiolen |19.5| 9550368|48970506| 107| 20.16| 45.31| 3.91| 34.81|
|LastRound |19.4| 9509645|48988860| 100| 20.45| 43.50| 4.20| 29.98|
|BrainBot |19.4| 9500957|48985984| 105| 19.26| 45.56| 4.46| 25.71|
|GoTo20orBestBot |19.4| 9487725|48975944| 104| 20.98| 44.09| 4.46| 25.73|
|Stalker |19.4| 9485631|48969437| 103| 20.20| 45.34| 3.80| 36.62|
|ClunkyChicken |19.1| 9354294|48972986| 112| 21.14| 45.44| 3.57| 40.48|
|FortyTeen |18.8| 9185135|48980498| 107| 20.90| 46.77| 3.88| 35.32|
|Crush |18.6| 9115418|48985778| 96| 14.82| 43.08| 5.15| 14.15|
|Chaser |18.6| 9109636|48986188| 107| 19.52| 45.62| 4.06| 32.39|
|MatchLeaderBot |16.6| 8122985|48979024| 104| 18.61| 45.00| 3.20| 46.70|
|Ro |16.5| 8063156|48972140| 108| 13.74| 48.24| 5.07| 15.44|
|TakeFive |16.1| 7906552|48994992| 100| 19.38| 44.68| 3.36| 43.96|
|RollForLuckBot |16.1| 7901601|48983545| 109| 17.30| 50.54| 4.72| 21.30|
|Alpha |15.5| 7584770|48985795| 104| 17.45| 46.64| 4.04| 32.67|
|GoHomeBot |15.1| 7418649|48974928| 44| 13.23| 41.41| 5.49| 8.52|
|LeadBy5Bot |15.0| 7354458|48987017| 110| 17.15| 46.95| 4.13| 31.16|
|NotTooFarBehindBot |15.0| 7338828|48965720| 115| 17.75| 45.03| 2.99| 50.23|
|GoToSeventeenRollTenBot|14.1| 6900832|48976440| 104| 10.26| 49.25| 5.68| 5.42|
|LizduadacBot |14.0| 6833125|48978161| 96| 9.67| 51.35| 5.72| 4.68|
|TleilaxuBot |13.5| 6603853|48985292| 137| 15.25| 45.05| 4.27| 28.80|
|BringMyOwn_dice |12.0| 5870328|48974969| 44| 21.27| 41.47| 4.24| 29.30|
|SafetyNet |11.4| 5600688|48987015| 98| 15.81| 45.03| 2.41| 59.84|
|WhereFourArtThouChicken|10.5| 5157324|48976428| 64| 22.38| 47.39| 3.59| 40.19|
|ExpectationsBot | 9.0| 4416154|48976485| 44| 24.40| 41.55| 3.58| 40.41|
|OneStepAheadBot | 8.4| 4132031|48975605| 50| 18.24| 46.02| 3.20| 46.59|
|GoBigEarly | 6.6| 3218181|48991348| 49| 20.77| 42.95| 3.90| 35.05|
|OneInFiveBot | 5.8| 2826326|48974364| 155| 17.26| 49.72| 3.00| 50.00|
|ThrowThriceBot | 4.1| 1994569|48984367| 54| 21.70| 44.55| 2.53| 57.88|
|FutureBot | 4.0| 1978660|48985814| 50| 17.93| 45.17| 2.36| 60.70|
|GamblersFallacy | 1.3| 621945|48986528| 44| 22.52| 41.46| 2.82| 53.07|
|FlipCoinRollDice | 0.7| 345385|48972339| 87| 15.29| 44.55| 1.61| 73.17|
|BlessRNG | 0.2| 73506|48974185| 49| 14.54| 42.72| 1.42| 76.39|
|StopBot | 0.0| 1353|48984828| 44| 10.92| 41.57| 1.00| 83.33|
|CooperativeSwarmBot | 0.0| 991|48970284| 44| 10.13| 41.51| 1.36| 77.30|
|PointsAreForNerdsBot | 0.0| 0|48986508| 0| 0.00| 0.00| 6.00| 0.00|
|SlowStart | 0.0| 0|48973613| 35| 5.22| 0.00| 3.16| 47.39|
+-----------------------+----+--------+--------+------+------+-------+------+--------+
निम्नलिखित बॉट्स ( Rebel
नियमों को छोड़ कर ) बनाए जाते हैं, और निर्माता आधिकारिक टूर्नामेंट में भाग नहीं लेने के लिए सहमत हुए हैं। हालांकि, मुझे अभी भी लगता है कि उनके विचार रचनात्मक हैं, और वे एक सम्माननीय उल्लेख के पात्र हैं। रिबेल भी इस सूची में है क्योंकि यह तोड़फोड़ से बचने के लिए एक चतुर रणनीति का उपयोग करता है, और वास्तव में खेलने में तोड़फोड़ करने वाले बॉट के साथ बेहतर प्रदर्शन करता है।
बॉट्स NeoBot
और KwisatzHaderach
नियमों का पालन करता है, लेकिन यादृच्छिक जनरेटर की भविष्यवाणी करके एक खामियों का उपयोग करता है। चूंकि ये बॉट अनुकरण करने के लिए बहुत सारे संसाधन लेते हैं, इसलिए मैंने कम गेम वाले सिमुलेशन से इसके आँकड़े जोड़े हैं। बॉट HarkonnenBot
अन्य सभी बॉट्स को अक्षम करके जीत हासिल करता है, जो नियमों के सख्त खिलाफ है।
Simulation or 300000 games between 52 bots completed in 66.2 seconds
Each game lasted for an average of 4.82 rounds
20709 games were tied between two or more bots
0 games ran until the round limit, highest round was 31
+-----------------------+----+--------+--------+------+------+-------+------+--------+
|Bot |Win%| Wins| Played| Max| Avg|Avg win|Throws|Success%|
+-----------------------+----+--------+--------+------+------+-------+------+--------+
|KwisatzHaderach |80.4| 36986| 46015| 214| 58.19| 64.89| 11.90| 42.09|
|HarkonnenBot |76.0| 35152| 46264| 44| 34.04| 41.34| 1.00| 83.20|
|NeoBot |39.0| 17980| 46143| 214| 37.82| 59.55| 5.44| 50.21|
|Rebel |26.8| 12410| 46306| 92| 20.82| 43.39| 3.80| 35.84|
+-----------------------+----+--------+--------+------+------+-------+------+--------+
+----------+-----+
|Percentile|Score|
+----------+-----+
| 50.00| 45|
| 75.00| 50|
| 90.00| 59|
| 95.00| 70|
| 99.00| 97|
| 99.90| 138|
| 99.99| 214|
+----------+-----+