सी, औसत 500+ 1500 1750 अंक
यह संस्करण 2 पर एक अपेक्षाकृत मामूली सुधार है (पिछले संस्करणों पर नोटों के लिए नीचे देखें)। इसके दो भाग हैं। पहला: पूल से बेतरतीब ढंग से बोर्डों का चयन करने के बजाय, कार्यक्रम अब पूल में प्रत्येक बोर्ड पर पुनरावृत्ति करता है, पूल के शीर्ष पर लौटने और दोहराने से पहले प्रत्येक को बारी-बारी से उपयोग करता है। (चूंकि यह पुनरावृत्ति होते समय पूल को संशोधित किया जा रहा है, फिर भी ऐसे बोर्ड होंगे जो एक पंक्ति में दो बार चुने जाते हैं, या इससे भी बदतर होते हैं, लेकिन यह एक गंभीर चिंता का विषय नहीं है।) दूसरा बदलाव यह है कि अब जब पूल बदलता है तो कार्यक्रम पर नज़र रखता है। , और यदि प्रोग्राम पूल की सामग्री में सुधार किए बिना बहुत लंबा चला जाता है, तो यह निर्धारित करता है कि खोज "रुक गई" है, पूल को खाली करता है, और एक नई खोज के साथ शुरू होता है। यह तब तक जारी रहता है जब तक कि दो मिनट का समय न हो जाए।
मैंने शुरू में सोचा था कि मैं 1500-पॉइंट रेंज से आगे निकलने के लिए किसी प्रकार की अनुमानी खोज को नियोजित करूँगा। @ 4527-बिंदु बोर्ड के बारे में मेलमोकब की टिप्पणी ने मुझे यह अनुमान लगाया कि सुधार के लिए बहुत जगह थी। हालाँकि, हम अपेक्षाकृत छोटे शब्द सूची का उपयोग कर रहे हैं। 4527-पॉइंट बोर्ड YAWL का उपयोग करके स्कोरिंग किया गया था, जो कि वहां से सबसे अधिक समावेशी शब्द सूची है - यह आधिकारिक यूएस स्क्रैबल शब्दसूची से भी बड़ा है। इसे ध्यान में रखते हुए, मैंने उन बोर्डों की फिर से जांच की जिन्हें मेरे कार्यक्रम ने पाया था और देखा कि 1700 या उससे ऊपर के बोर्डों का एक सीमित सेट प्रतीत होता है। उदाहरण के लिए, मेरे पास कई रन थे जिन्होंने 1726 स्कोरिंग बोर्ड की खोज की थी, लेकिन यह हमेशा वही सटीक बोर्ड था जो पाया गया था (घुमाव और प्रतिबिंबों की अनदेखी)।
एक अन्य परीक्षण के रूप में, मैंने YAWL का उपयोग करते हुए शब्दकोश के रूप में अपना कार्यक्रम चलाया, और इसमें लगभग एक दर्जन रनों के बाद 4527 अंक वाला बोर्ड मिला। यह देखते हुए, मैं यह अनुमान लगा रहा हूं कि मेरा कार्यक्रम पहले से ही खोज स्थान की ऊपरी सीमा पर है, और इसलिए मैं जिस पुनर्लेखन की योजना बना रहा था वह बहुत कम लाभ के लिए अतिरिक्त जटिलता का परिचय देगा।
यहाँ पाँच उच्चतम स्कोरिंग बोर्डों की मेरी सूची है जो मेरे कार्यक्रम ने english.0
शब्द सूची का उपयोग करके पाया है :
1735 : D C L P E I A E R N T R S E G S
1738 : B E L S R A D G T I N E S E R S
1747 : D C L P E I A E N T R D G S E R
1766 : M P L S S A I E N T R N D E S G
1772: G R E P T N A L E S I T D R E S
मेरा मानना है कि 1772 "grep बोर्ड" (जैसा कि मैंने इसे कॉल करने के लिए लिया है), 531 शब्दों के साथ, इस वर्डलिस्ट के साथ उच्चतम स्कोरिंग बोर्ड संभव है। मेरे कार्यक्रम के दो मिनट के 50% से अधिक रन इस बोर्ड के साथ समाप्त होते हैं। मैंने अपना कार्यक्रम रात भर चला दिया है, बिना कुछ बेहतर पाए। इसलिए यदि कोई उच्च स्कोरिंग बोर्ड है, तो संभवत: इसमें कुछ पहलू होंगे जो कार्यक्रम की खोज तकनीक को हरा देते हैं। एक बोर्ड जिसमें लेआउट में हर संभव छोटे बदलाव से कुल स्कोर में भारी गिरावट होती है, उदाहरण के लिए, मेरे कार्यक्रम द्वारा कभी भी खोज नहीं की जा सकती है। मेरा कूबड़ यह है कि इस तरह के बोर्ड के अस्तित्व में आने की संभावना बहुत कम है।
#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <ctype.h>
#include <time.h>
#define WORDLISTFILE "./english.0"
#define XSIZE 4
#define YSIZE 4
#define BOARDSIZE (XSIZE * YSIZE)
#define DIEFACES 6
#define WORDBUFSIZE 256
#define MAXPOOLSIZE 32
#define STALLPOINT 64
#define RUNTIME 120
/* Generate a random int from 0 to N-1.
*/
#define random(N) ((int)(((double)(N) * rand()) / (RAND_MAX + 1.0)))
static char const dice[BOARDSIZE][DIEFACES] = {
"aaeegn", "elrtty", "aoottw", "abbjoo",
"ehrtvw", "cimotu", "distty", "eiosst",
"delrvy", "achops", "himnqu", "eeinsu",
"eeghnw", "affkps", "hlnnrz", "deilrx"
};
/* The dictionary is represented in memory as a tree. The tree is
* represented by its arcs; the nodes are implicit. All of the arcs
* emanating from a single node are stored as a linked list in
* alphabetical order.
*/
typedef struct {
int letter:8; /* the letter this arc is labelled with */
int arc:24; /* the node this arc points to (i.e. its first arc) */
int next:24; /* the next sibling arc emanating from this node */
int final:1; /* true if this arc is the end of a valid word */
} treearc;
/* Each of the slots that make up the playing board is represented
* by the die it contains.
*/
typedef struct {
unsigned char die; /* which die is in this slot */
unsigned char face; /* which face of the die is showing */
} slot;
/* The following information defines a game.
*/
typedef struct {
slot board[BOARDSIZE]; /* the contents of the board */
int score; /* how many points the board is worth */
} game;
/* The wordlist is stored as a binary search tree.
*/
typedef struct {
int item: 24; /* the identifier of a word in the list */
int left: 16; /* the branch with smaller identifiers */
int right: 16; /* the branch with larger identifiers */
} listnode;
/* The dictionary.
*/
static treearc *dictionary;
static int heapalloc;
static int heapsize;
/* Every slot's immediate neighbors.
*/
static int neighbors[BOARDSIZE][9];
/* The wordlist, used while scoring a board.
*/
static listnode *wordlist;
static int listalloc;
static int listsize;
static int xcursor;
/* The game that is currently being examined.
*/
static game G;
/* The highest-scoring game seen so far.
*/
static game bestgame;
/* Variables to time the program and display stats.
*/
static time_t start;
static int boardcount;
static int allscores;
/* The pool contains the N highest-scoring games seen so far.
*/
static game pool[MAXPOOLSIZE];
static int poolsize;
static int cutoffscore;
static int stallcounter;
/* Some buffers shared by recursive functions.
*/
static char wordbuf[WORDBUFSIZE];
static char gridbuf[BOARDSIZE];
/*
* The dictionary is stored as a tree. It is created during
* initialization and remains unmodified afterwards. When moving
* through the tree, the program tracks the arc that points to the
* current node. (The first arc in the heap is a dummy that points to
* the root node, which otherwise would have no arc.)
*/
static void initdictionary(void)
{
heapalloc = 256;
dictionary = malloc(256 * sizeof *dictionary);
heapsize = 1;
dictionary->arc = 0;
dictionary->letter = 0;
dictionary->next = 0;
dictionary->final = 0;
}
static int addarc(int arc, char ch)
{
int prev, a;
prev = arc;
a = dictionary[arc].arc;
for (;;) {
if (dictionary[a].letter == ch)
return a;
if (!dictionary[a].letter || dictionary[a].letter > ch)
break;
prev = a;
a = dictionary[a].next;
}
if (heapsize >= heapalloc) {
heapalloc *= 2;
dictionary = realloc(dictionary, heapalloc * sizeof *dictionary);
}
a = heapsize++;
dictionary[a].letter = ch;
dictionary[a].final = 0;
dictionary[a].arc = 0;
if (prev == arc) {
dictionary[a].next = dictionary[prev].arc;
dictionary[prev].arc = a;
} else {
dictionary[a].next = dictionary[prev].next;
dictionary[prev].next = a;
}
return a;
}
static int validateword(char *word)
{
int i;
for (i = 0 ; word[i] != '\0' && word[i] != '\n' ; ++i)
if (word[i] < 'a' || word[i] > 'z')
return 0;
if (word[i] == '\n')
word[i] = '\0';
if (i < 3)
return 0;
for ( ; *word ; ++word, --i) {
if (*word == 'q') {
if (word[1] != 'u')
return 0;
memmove(word + 1, word + 2, --i);
}
}
return 1;
}
static void createdictionary(char const *filename)
{
FILE *fp;
int arc, i;
initdictionary();
fp = fopen(filename, "r");
while (fgets(wordbuf, sizeof wordbuf, fp)) {
if (!validateword(wordbuf))
continue;
arc = 0;
for (i = 0 ; wordbuf[i] ; ++i)
arc = addarc(arc, wordbuf[i]);
dictionary[arc].final = 1;
}
fclose(fp);
}
/*
* The wordlist is stored as a binary search tree. It is only added
* to, searched, and erased. Instead of storing the actual word, it
* only retains the word's final arc in the dictionary. Thus, the
* dictionary needs to be walked in order to print out the wordlist.
*/
static void initwordlist(void)
{
listalloc = 16;
wordlist = malloc(listalloc * sizeof *wordlist);
listsize = 0;
}
static int iswordinlist(int word)
{
int node, n;
n = 0;
for (;;) {
node = n;
if (wordlist[node].item == word)
return 1;
if (wordlist[node].item > word)
n = wordlist[node].left;
else
n = wordlist[node].right;
if (!n)
return 0;
}
}
static int insertword(int word)
{
int node, n;
if (!listsize) {
wordlist->item = word;
wordlist->left = 0;
wordlist->right = 0;
++listsize;
return 1;
}
n = 0;
for (;;) {
node = n;
if (wordlist[node].item == word)
return 0;
if (wordlist[node].item > word)
n = wordlist[node].left;
else
n = wordlist[node].right;
if (!n)
break;
}
if (listsize >= listalloc) {
listalloc *= 2;
wordlist = realloc(wordlist, listalloc * sizeof *wordlist);
}
n = listsize++;
wordlist[n].item = word;
wordlist[n].left = 0;
wordlist[n].right = 0;
if (wordlist[node].item > word)
wordlist[node].left = n;
else
wordlist[node].right = n;
return 1;
}
static void clearwordlist(void)
{
listsize = 0;
G.score = 0;
}
static void scoreword(char const *word)
{
int const scoring[] = { 0, 0, 0, 1, 1, 2, 3, 5 };
int n, u;
for (n = u = 0 ; word[n] ; ++n)
if (word[n] == 'q')
++u;
n += u;
G.score += n > 7 ? 11 : scoring[n];
}
static void addwordtolist(char const *word, int id)
{
if (insertword(id))
scoreword(word);
}
static void _printwords(int arc, int len)
{
int a;
while (arc) {
a = len + 1;
wordbuf[len] = dictionary[arc].letter;
if (wordbuf[len] == 'q')
wordbuf[a++] = 'u';
if (dictionary[arc].final) {
if (iswordinlist(arc)) {
wordbuf[a] = '\0';
if (xcursor == 4) {
printf("%s\n", wordbuf);
xcursor = 0;
} else {
printf("%-16s", wordbuf);
++xcursor;
}
}
}
_printwords(dictionary[arc].arc, a);
arc = dictionary[arc].next;
}
}
static void printwordlist(void)
{
xcursor = 0;
_printwords(1, 0);
if (xcursor)
putchar('\n');
}
/*
* The board is stored as an array of oriented dice. To score a game,
* the program looks at each slot on the board in turn, and tries to
* find a path along the dictionary tree that matches the letters on
* adjacent dice.
*/
static void initneighbors(void)
{
int i, j, n;
for (i = 0 ; i < BOARDSIZE ; ++i) {
n = 0;
for (j = 0 ; j < BOARDSIZE ; ++j)
if (i != j && abs(i / XSIZE - j / XSIZE) <= 1
&& abs(i % XSIZE - j % XSIZE) <= 1)
neighbors[i][n++] = j;
neighbors[i][n] = -1;
}
}
static void printboard(void)
{
int i;
for (i = 0 ; i < BOARDSIZE ; ++i) {
printf(" %c", toupper(dice[G.board[i].die][G.board[i].face]));
if (i % XSIZE == XSIZE - 1)
putchar('\n');
}
}
static void _findwords(int pos, int arc, int len)
{
int ch, i, p;
for (;;) {
ch = dictionary[arc].letter;
if (ch == gridbuf[pos])
break;
if (ch > gridbuf[pos] || !dictionary[arc].next)
return;
arc = dictionary[arc].next;
}
wordbuf[len++] = ch;
if (dictionary[arc].final) {
wordbuf[len] = '\0';
addwordtolist(wordbuf, arc);
}
gridbuf[pos] = '.';
for (i = 0 ; (p = neighbors[pos][i]) >= 0 ; ++i)
if (gridbuf[p] != '.')
_findwords(p, dictionary[arc].arc, len);
gridbuf[pos] = ch;
}
static void findwordsingrid(void)
{
int i;
clearwordlist();
for (i = 0 ; i < BOARDSIZE ; ++i)
gridbuf[i] = dice[G.board[i].die][G.board[i].face];
for (i = 0 ; i < BOARDSIZE ; ++i)
_findwords(i, 1, 0);
}
static void shuffleboard(void)
{
int die[BOARDSIZE];
int i, n;
for (i = 0 ; i < BOARDSIZE ; ++i)
die[i] = i;
for (i = BOARDSIZE ; i-- ; ) {
n = random(i);
G.board[i].die = die[n];
G.board[i].face = random(DIEFACES);
die[n] = die[i];
}
}
/*
* The pool contains the N highest-scoring games found so far. (This
* would typically be done using a priority queue, but it represents
* far too little of the runtime. Brute force is just as good and
* simpler.) Note that the pool will only ever contain one board with
* a particular score: This is a cheap way to discourage the pool from
* filling up with almost-identical high-scoring boards.
*/
static void addgametopool(void)
{
int i;
if (G.score < cutoffscore)
return;
for (i = 0 ; i < poolsize ; ++i) {
if (G.score == pool[i].score) {
pool[i] = G;
return;
}
if (G.score > pool[i].score)
break;
}
if (poolsize < MAXPOOLSIZE)
++poolsize;
if (i < poolsize) {
memmove(pool + i + 1, pool + i, (poolsize - i - 1) * sizeof *pool);
pool[i] = G;
}
cutoffscore = pool[poolsize - 1].score;
stallcounter = 0;
}
static void selectpoolmember(int n)
{
G = pool[n];
}
static void emptypool(void)
{
poolsize = 0;
cutoffscore = 0;
stallcounter = 0;
}
/*
* The program examines as many boards as it can in the given time,
* and retains the one with the highest score. If the program is out
* of time, then it reports the best-seen game and immediately exits.
*/
static void report(void)
{
findwordsingrid();
printboard();
printwordlist();
printf("score = %d\n", G.score);
fprintf(stderr, "// score: %d points (%d words)\n", G.score, listsize);
fprintf(stderr, "// %d boards examined\n", boardcount);
fprintf(stderr, "// avg score: %.1f\n", (double)allscores / boardcount);
fprintf(stderr, "// runtime: %ld s\n", time(0) - start);
}
static void scoreboard(void)
{
findwordsingrid();
++boardcount;
allscores += G.score;
addgametopool();
if (bestgame.score < G.score) {
bestgame = G;
fprintf(stderr, "// %ld s: board %d scoring %d\n",
time(0) - start, boardcount, G.score);
}
if (time(0) - start >= RUNTIME) {
G = bestgame;
report();
exit(0);
}
}
static void restartpool(void)
{
emptypool();
while (poolsize < MAXPOOLSIZE) {
shuffleboard();
scoreboard();
}
}
/*
* Making small modifications to a board.
*/
static void turndie(void)
{
int i, j;
i = random(BOARDSIZE);
j = random(DIEFACES - 1) + 1;
G.board[i].face = (G.board[i].face + j) % DIEFACES;
}
static void swapdice(void)
{
slot t;
int p, q;
p = random(BOARDSIZE);
q = random(BOARDSIZE - 1);
if (q >= p)
++q;
t = G.board[p];
G.board[p] = G.board[q];
G.board[q] = t;
}
/*
*
*/
int main(void)
{
int i;
start = time(0);
srand((unsigned int)start);
createdictionary(WORDLISTFILE);
initwordlist();
initneighbors();
restartpool();
for (;;) {
for (i = 0 ; i < poolsize ; ++i) {
selectpoolmember(i);
turndie();
scoreboard();
selectpoolmember(i);
swapdice();
scoreboard();
}
++stallcounter;
if (stallcounter >= STALLPOINT) {
fprintf(stderr, "// stalled; restarting search\n");
restartpool();
}
}
return 0;
}
संस्करण 2 के लिए नोट्स (9 जून)
यहां मेरे कोड के प्रारंभिक संस्करण को जंपिंग-ऑफ बिंदु के रूप में उपयोग करने का एक तरीका है। इस संस्करण में परिवर्तन 100 से कम लाइनों से मिलकर होते हैं, लेकिन औसत गेम स्कोर को तीन गुना करते हैं।
इस संस्करण में, कार्यक्रम उम्मीदवारों का एक "पूल" बनाए रखता है, जिसमें एन उच्चतम स्कोरिंग बोर्ड शामिल हैं जो कार्यक्रम अब तक उत्पन्न हुआ है। जब भी कोई नया बोर्ड उत्पन्न होता है, तो उसे पूल में जोड़ा जाता है और पूल में सबसे कम स्कोर करने वाले बोर्ड को हटा दिया जाता है (जो बहुत अच्छा बोर्ड हो सकता है जो अभी जोड़ा गया था, यदि उसका स्कोर पहले से ही कम है तो)। पूल शुरू में बेतरतीब ढंग से उत्पन्न बोर्डों से भरा होता है, जिसके बाद यह कार्यक्रम के चलने के दौरान एक निरंतर आकार रखता है।
कार्यक्रम के मुख्य लूप में पूल से एक यादृच्छिक बोर्ड का चयन करना और इसे बदलना, इस नए बोर्ड के स्कोर का निर्धारण करना और फिर इसे पूल में डालना (यदि यह पर्याप्त स्कोर है)। इस शैली में कार्यक्रम लगातार उच्च स्कोरिंग बोर्डों को परिष्कृत कर रहा है। मुख्य गतिविधि स्टेप वाइज, वृद्धिशील सुधार करना है, लेकिन पूल का आकार भी प्रोग्राम को बहु-चरण सुधार खोजने की अनुमति देता है जो अस्थायी रूप से बोर्ड के स्कोर को बदतर बना सकता है इससे पहले कि वह इसे बेहतर बना सके।
आमतौर पर यह कार्यक्रम जल्दी से जल्दी एक अच्छा स्थानीय अधिकतम पाता है, जिसके बाद संभवत: कोई भी बेहतर अधिकतम पाया जाना बहुत दूर है। और इसलिए एक बार फिर से कार्यक्रम को 10 सेकंड से अधिक समय तक चलाने का कोई मतलब नहीं है। जैसे कि इस स्थिति का पता लगाने और उम्मीदवारों के एक नए पूल के साथ नए सिरे से खोज शुरू करने से इसमें सुधार हो सकता है। हालाँकि, यह केवल मामूली वृद्धि होगी। एक उचित अनुमानी खोज तकनीक संभवतः अन्वेषण की बेहतर आय होगी।
(साइड नोट: मैंने देखा कि यह संस्करण लगभग 5k बोर्ड / सेकंड उत्पन्न कर रहा था। चूंकि पहले संस्करण में आमतौर पर 20k बोर्ड / सेकंड थे, मैं शुरू में चिंतित था। प्रोफाइलिंग पर, हालांकि, मुझे पता चला कि अतिरिक्त समय शब्दसूची को प्रबंधित करने में बिताया गया था। दूसरे शब्दों में, यह पूरी तरह से कार्यक्रम के कारण प्रति बोर्ड इतने अधिक शब्द खोज रहा था। इसके प्रकाश में, मैंने वर्डलिस्ट को प्रबंधित करने के लिए कोड को बदलने पर विचार किया, लेकिन यह देखते हुए कि यह कार्यक्रम अपने आवंटित 120 सेकंड में से केवल 10 का उपयोग कर रहा है, जैसे एक अनुकूलन बहुत समय से पहले होगा।)
संस्करण 1 (2 जून) के लिए नोट्स
यह एक बहुत ही सरल उपाय है। यह सब यह यादृच्छिक बोर्ड उत्पन्न करता है, और फिर 10 सेकंड के बाद यह उच्चतम स्कोर के साथ एक आउटपुट करता है। (मैं 10 सेकंड के लिए चूक गया क्योंकि समस्या विनिर्देश द्वारा अनुमत अतिरिक्त 110 सेकंड में आमतौर पर अंतिम समाधान में सुधार नहीं होता है जो पर्याप्त प्रतीक्षा के लायक है।) तो यह बहुत गूंगा है। हालांकि, अधिक बुद्धिमान खोज के लिए एक अच्छा शुरुआती बिंदु बनाने के लिए सभी बुनियादी ढांचे हैं, और अगर कोई भी समय सीमा से पहले इसका उपयोग करना चाहता है, तो मैं उन्हें ऐसा करने के लिए प्रोत्साहित करता हूं।
एक पेड़ की संरचना में शब्दकोश को पढ़कर कार्यक्रम शुरू होता है। (यह फ़ॉर्म उतना अनुकूलित नहीं है जितना कि यह हो सकता है, लेकिन यह इन उद्देश्यों के लिए पर्याप्त से अधिक है।) कुछ अन्य बुनियादी आरंभीकरण के बाद, यह फिर बोर्ड बनाना और उन्हें स्कोर करना शुरू कर देता है। मेरी मशीन पर कार्यक्रम प्रति सेकंड लगभग 20k बोर्डों की जांच करता है, और लगभग 200k बोर्डों के बाद यादृच्छिक दृष्टिकोण सूखने लगता है।
चूंकि किसी भी समय केवल एक बोर्ड का मूल्यांकन किया जा रहा है, स्कोरिंग डेटा वैश्विक चर में संग्रहीत किया जाता है। यह मुझे निरंतर डेटा की मात्रा को कम करने की अनुमति देता है जिसे पुनरावर्ती कार्यों के तर्क के रूप में पारित किया जाना है। (मुझे यकीन है कि यह कुछ लोगों को पित्ती देगा, और उनसे मैं माफी माँगता हूँ।) शब्दसूची बाइनरी सर्च ट्री के रूप में संग्रहीत है। पाया गया प्रत्येक शब्द को शब्दसूची में देखा जाना चाहिए, ताकि डुप्लिकेट शब्द दो बार गिने न जाएं। शब्दसूची की आवश्यकता केवल वाष्पीकरण प्रक्रिया के दौरान होती है, हालांकि, स्कोर मिलने के बाद इसे छोड़ दिया जाता है। इस प्रकार, कार्यक्रम के अंत में, चुने हुए बोर्ड को फिर से पूरा किया जाना चाहिए, ताकि वर्डलिस्ट को प्रिंट किया जा सके।
मजेदार तथ्य: बेतरतीब ढंग से उत्पन्न बोगल बोर्ड के लिए औसत स्कोर, जैसा english.0
कि 61.7 अंक है।
4527
(1414
कुल शब्द), यहां पाया गया: ai.stanford.edu/~chuongdo/boggle/index.html