Fix parser.c line endings
[xboard.git] / parser.c
1 // New PGN parser by by HGM. I was dissatisfied with the old flex-generated parser for several reasons:
2 // 1) It required flex to build
3 // 2) It was not possible to use variant-dependent syntax, which gave trouble for '+' as Sogi promoChar vs check symbol
4 // 3) It could not handle double-digit rank numbers
5 // 4) It could not handle PSN moves, with (alpha rank and file digit)
6 // 5) Having more than 12 ranks would require extension of the rules anyway
7 // 6) It was cumbersome to maintain, which much code duplication that had to be kept in sync when changing something
8 // 7) It needed special handling for packaging, because we wanted to include parser.c for people who had no flex
9 // 8) It was quite large because of the table-driven flex algorithm.
10 // This new parser suffers from none of that. It might even accomodate traditional Xiangqi notation at some future time.
11
12 #include "config.h"
13 #include <stdio.h>
14 #include <ctype.h>
15 #include <string.h>
16 #include "common.h"
17 #include "backend.h"
18 #include "frontend.h"
19 #include "parser.h"
20 #include "moves.h"
21
22
23 extern Board    boards[MAX_MOVES];
24 extern int      PosFlags(int nr);
25 int             yyboardindex;
26 int             yyskipmoves = FALSE;
27 char            currentMoveString[4096]; // a bit ridiculous size?
28 char *yy_text;
29
30 #define PARSEBUFSIZE 10000
31
32 static FILE *inputFile;
33 static char *inPtr, *parsePtr, *parseStart;
34 static char inputBuf[PARSEBUFSIZE];
35 static char yytext[PARSEBUFSIZE];
36 static char fromString = 0, lastChar = '\n';
37
38 #define NOTHING 0
39 #define NUMERIC 1
40 #define ALPHABETIC 2
41 #define BADNUMBER (-2000000000)
42
43 int ReadLine()
44 {   // Read one line from the input file, and append to the buffer
45     char c, *start = inPtr;
46     if(fromString) return 0; // parsing string, so the end is a hard end
47     if(!inputFile) return 0;
48     while((c = fgetc(inputFile)) != EOF) {
49         *inPtr++ = c;
50         if(c == '\n') { *inPtr = NULLCHAR; return 1; }
51         if(inPtr - inputBuf > PARSEBUFSIZE-2) inPtr--; //prevent crash on overflow
52     }
53     if(inPtr == start) return 0;
54     *inPtr++ = '\n', *inPtr = NULLCHAR; // repair missing linefeed at EOF
55     return 1;
56 }
57
58 int Scan(char c, char **p)
59 {   // line-spanning skip to mentioned character or EOF
60     do {
61         while(**p) if(*(*p)++ == c) return 0;
62     } while(ReadLine());
63     // no closing bracket; force match for entire rest of file.
64     return 1;
65 }
66
67 int SkipWhite(char **p)
68 {   // skip spaces tabs and newlines; return 1 if anything was skipped
69     char *start = *p;
70     do{
71         while(**p == ' ' || **p == '\t' || **p == '\n' || **p == '\r') (*p)++;
72     } while(**p == NULLCHAR && ReadLine()); // continue as long as ReadLine reads something
73     return *p != start;
74 }
75
76 int Match(char *pattern, char **ptr)
77 {
78     char *p = pattern, *s = *ptr;
79     while(*p && (*p == *s++ || s[-1] == '\r' && *p--)) p++;
80     if(*p == 0) {
81         *ptr = s;
82         return 1;
83     }
84     return 0; // no match, no ptr update
85 }
86
87 int Word(char *pattern, char **p)
88 {
89     if(Match(pattern, p)) return 1;
90     if(*pattern >= 'a' && *pattern <= 'z' && *pattern - **p == 'a' - 'A') { // capitalized
91         (*p)++;
92         if(Match(pattern + 1, p)) return 1;
93         (*p)--;
94     }
95     return 0;
96 }
97
98 int Verb(char *pattern, char **p)
99 {
100     int res = Word(pattern, p);
101     if(res && !Match("s", p)) Match("ed", p); // eat conjugation suffix, if any
102     return res;
103 }
104
105
106 int Number(char **p)
107 {
108     int val = 0;
109     if(**p < '0' || **p > '9') return BADNUMBER;
110     while(**p >= '0' && **p <= '9') {
111         val = 10*val + *(*p)++ - '0';
112     }
113     return val;
114 }
115
116 int RdTime(char c, char **p)
117 {
118     char *start = ++(*p), *sec; // increment *p, as it was pointing to the opening ( or {
119     if(Number(p) == BADNUMBER) return 0;
120     sec = *p;
121     if(Match(":", p) && Number(p) != BADNUMBER && *p - sec == 3) { // well formed
122         sec = *p;
123         if(Match(".", p) && Number(p) != BADNUMBER && *(*p)++ == c) return 1; // well-formed fraction
124         *p = sec;
125         if(*(*p)++ == c) return 1; // matching bracket without fraction
126     }
127     *p = start; // failure
128     return 0;
129 }
130
131 char PromoSuffix(char **p)
132 {
133     char *start = *p;
134     if(**p == 'e' && (Match("ep", p) || Match("e.p.", p))) { *p = start; return NULLCHAR; } // non-compliant e.p. suffix is no promoChar!
135     if(**p == '+' && gameInfo.variant == VariantShogi) { (*p)++; return '+'; } 
136     if(**p == '=') (*p)++; //optional =
137     if(**p == '(' && (*p)[2] == ')' && isalpha( (*p)[1] )) { (*p) += 3; return (*p)[-2]; }
138     if(isalpha(**p)) return *(*p)++;
139     if(*p != start) return '='; // must be the optional =
140     return NULLCHAR; // no suffix detected
141 }
142
143 int NextUnit(char **p)
144 {       // Main parser routine
145         int coord[4], n, result, piece, i;
146         char type[4], promoted, separator, slash, *oldp, *commentEnd, c;
147         int wom = WhiteOnMove(yyboardindex);
148
149         // ********* try white first, because it is so common **************************
150         if(**p == ' ' || **p == '\n' || **p == '\t') { parseStart = (*p)++; return Nothing; }
151
152
153         if(**p == NULLCHAR) { // make sure there is something to parse
154             if(fromString) return 0; // we are parsing string, so the end is really the end
155             *p = inPtr = inputBuf;
156             if(!ReadLine()) return 0; // EOF
157         }
158         parseStart = oldp = *p; // remember where we begin
159
160         // Next we do some common symbols where the first character commits us to things that cannot possibly be a move
161         // (but not {} comments, as those force time-consuming matching of PGN results immediately after it)
162
163         // ********* PGN tags ******************************************
164         if(**p == '[') {
165             oldp = ++(*p);
166             if(Match("--", p)) { // "[--" could be start of position diagram
167                 if(!Scan(']', p) && (*p)[-3] == '-' && (*p)[-2] == '-') return PositionDiagram; 
168                 *p = oldp;
169             }
170             SkipWhite(p);
171             if(isdigit(**p) || isalpha(**p)) {
172                 do (*p)++; while(isdigit(**p) || isalpha(**p) || **p == '+' ||
173                                 **p == '-' || **p == '=' || **p == '_' || **p == '#');
174                 SkipWhite(p);
175                 if(*(*p)++ == '"') {
176                     while(**p != '\n' && (*(*p)++ != '"'|| (*p)[-2] == '\\')); // look for unescaped quote
177                     if((*p)[-1] !='"') { *p = oldp; Scan(']', p); return Comment; } // string closing delimiter missing
178                     SkipWhite(p); if(*(*p)++ == ']') return PGNTag;
179                 }
180             }
181             Scan(']', p); return Comment;
182         }
183
184
185         // ********* variations (nesting) ******************************
186         if(**p =='(') {
187             if(RdTime(')', p)) return ElapsedTime;
188             return Open;
189         }
190         if(**p ==')') { (*p)++; return Close; }
191         if(**p == ';') { while(**p != '\n') (*p)++; return Comment; }
192
193
194         // ********* attempt to recognize a SAN move in the leading non-blank text *****
195         piece = separator = promoted = slash = n = 0;
196         for(i=0; i<4; i++) coord[i] = -1, type[i] = NOTHING;
197         if(**p == '+') (*p)++, promoted++;
198         if(**p >= 'A' && **p <= 'Z') {
199              piece = *(*p)++; // Note we could test for 2-byte non-ascii names here
200              if(**p == '/') slash = *(*p)++;
201         }
202         while(n < 4) {
203             if(**p >= 'a' && **p < 'x') coord[n] = *(*p)++ - 'a', type[n++] = ALPHABETIC;
204             else if((i = Number(p)) != BADNUMBER) coord[n] = i, type[n++] = NUMERIC;
205             else break;
206             if(n == 2 && type[0] == type[1]) { // if two identical types, the opposite type in between must have been missing
207                 type[2] = type[1]; coord[2] = coord[1];
208                 type[1] = NOTHING; coord[1] = -1; n++;
209             }
210         }
211         // we always get here, and might have read a +, a piece, and upto 4 potential coordinates
212         if(n <= 2) { // could be from-square or disambiguator, when -:xX follow, or drop with @ directly after piece, but also to-square
213              if(**p == '-' || **p == ':' || **p == 'x' || **p == 'X' || // these cannot be move suffix, so to-square must follow
214                  (**p == '@' || **p == '*') && n == 0 && !promoted && piece) { // P@ must also be followed by to-square
215                 separator = *(*p)++;
216                 if(n == 1) coord[1] = coord[0]; // must be disambiguator, but we do not know which yet
217                 n = 2;
218                 while(n < 4) { // attempt to read to-square
219                     if(**p >= 'a' && **p < 'x') coord[n] = *(*p)++ - 'a', type[n++] = ALPHABETIC;
220                     else if((i = Number(p)) != BADNUMBER) coord[n] = i, type[n++] = NUMERIC;
221                     else break;
222                 }
223             } else if((**p == '+' || **p == '=') && n == 1 && piece && type[0] == NUMERIC) { // can be traditional Xiangqi notation
224                 separator = *(*p)++;
225                 n = 2;
226                 if((i = Number(p)) != BADNUMBER) coord[n] = i, type[n++] = NUMERIC;
227             } else if(n == 2) { // only one square mentioned, must be to-square
228                 while(n < 4) { coord[n] = coord[n-2], type[n] = type[n-2], coord[n-2] = -1, type[n-2] = NOTHING; n++; }
229             }
230         } else if(n == 3 && type[1] != NOTHING) { // must be hyphenless disambiguator + to-square
231             for(i=3; i>0; i--) coord[i] = coord[i-1], type[i] = type[i-1]; // move to-square to where it belongs
232             type[1] = NOTHING; // disambiguator goes in first two positions
233             n = 4;
234         }
235 if(appData.debugMode)fprintf(debugFP, "trial %d,%d,%d,%d  type %d%d%d%d\n", coord[0], coord[1], coord[2], coord[3], type[0], type[1], type[2], type[3]);
236         // we always get here; move must be completely read now, with to-square coord(s) at end
237         if(n == 3) { // incomplete to-square. Could be Xiangqi traditional, or stuff like fxg
238             if(piece && type[1] == NOTHING && type[0] == NUMERIC && type[2] == NUMERIC && 
239                 (separator == '+' || separator == '=' || separator == '-')) {
240                      // Xiangqi traditional
241
242                 return ImpossibleMove; // for now treat as invalid
243             }
244             // fxg stuff, but also things like 0-0, 0-1 and 1-0
245             if(!piece && type[1] == NOTHING && type[0] == ALPHABETIC && type[2] == ALPHABETIC
246                  && (coord[0] != 14 || coord[2] != 14) /* reserve oo for castling! */ ) {
247                 piece = 'P'; n = 4; // kludge alert: fake full to-square
248             }
249         }
250         if(n == 4 && type[2] != type[3] && // we have a valid to-square (kludge: type[3] can be NOTHING on fxg type move)
251                      (piece || !promoted) && // promoted indicator only valid on named piece type
252                      (type[2] == ALPHABETIC || gameInfo.variant == VariantShogi)) { // in Shogi also allow alphabetic rank
253             DisambiguateClosure cl;
254             int fromX, fromY, toX, toY;
255
256             if(slash && (!piece || type[1] == NOTHING)) goto badMove; // slash after piece only in ICS long format
257             if (yyskipmoves) return (int) AmbiguousMove; /* not disambiguated */
258
259             if(type[2] == NUMERIC) { // alpha-rank
260                 coord[2] = BOARD_RGHT - BOARD_LEFT - coord[2];
261                 coord[3] = BOARD_HEIGHT - coord[3];
262                 if(coord[0] >= 0) coord[0] = BOARD_RGHT - BOARD_LEFT - coord[0];
263                 if(coord[1] >= 0) coord[1] = BOARD_HEIGHT - coord[1];
264             }
265             toX = cl.ftIn = (currentMoveString[2] = coord[2] + 'a') - AAA;
266             toY = cl.rtIn = (currentMoveString[3] = coord[3] + '0') - ONE;
267             if(type[3] == NOTHING) cl.rtIn = -1; // for fxg type moves ask for toY disambiguation
268             else if(toY >= BOARD_HEIGHT || toY < 0)   return ImpossibleMove; // vert off-board to-square
269             if(toX < BOARD_LEFT || toX >= BOARD_RGHT) return ImpossibleMove;
270             if(piece) {
271                 cl.pieceIn = CharToPiece(wom ? piece : ToLower(piece));
272                 if(cl.pieceIn == EmptySquare) return ImpossibleMove; // non-existent piece
273                 if(promoted) cl.pieceIn = (ChessSquare) (PROMOTED cl.pieceIn);
274             } else cl.pieceIn = EmptySquare;
275             if(separator == '@' || separator == '*') { // drop move. We only get here without from-square or promoted piece
276                 fromY = DROP_RANK; fromX = cl.pieceIn;
277                 currentMoveString[0] = piece;
278                 currentMoveString[1] = '@';
279                 return LegalityTest(boards[yyboardindex], PosFlags(yyboardindex)&~F_MANDATORY_CAPTURE, fromY, fromX, toY, toX, NULLCHAR);
280             }
281             if(type[1] == NOTHING && type[0] != NOTHING) { // there is a disambiguator
282                 if(type[0] != type[2]) coord[0] = -1, type[1] = type[0], type[0] = NOTHING; // it was a rank-disambiguator
283             }
284             if(  type[1] != type[2] && // means fromY is of opposite type as ToX, or NOTHING
285                 (type[0] == NOTHING || type[0] == type[2]) ) { // well formed
286
287                 fromX = (currentMoveString[0] = coord[0] + 'a') - AAA;
288                 fromY = (currentMoveString[1] = coord[1] + '0') - ONE;
289                 currentMoveString[4] = cl.promoCharIn = PromoSuffix(p);
290                 currentMoveString[5] = NULLCHAR;
291                 if(type[0] != NOTHING && type[1] != NOTHING && type[3] != NOTHING) { // fully specified.
292                     // Note that Disambiguate does not work for illegal moves, but flags them as impossible
293                     if(piece) { // check if correct piece indicated
294                         ChessSquare realPiece = boards[yyboardindex][fromY][fromX];
295                         if(PieceToChar(realPiece) == '~') realPiece = (ChessSquare) (DEMOTED realPiece);
296                         if(!(appData.icsActive && PieceToChar(realPiece) == '+') && // trust ICS if it moves promoted pieces
297                            piece && realPiece != cl.pieceIn) return ImpossibleMove;
298                     }
299                     result = LegalityTest(boards[yyboardindex], PosFlags(yyboardindex), fromY, fromX, toY, toX, cl.promoCharIn);
300                     if (currentMoveString[4] == NULLCHAR) { // suppy missing mandatory promotion character
301                       if(result == WhitePromotion  || result == BlackPromotion) {
302                         switch(gameInfo.variant) {
303                           case VariantCourier:
304                           case VariantShatranj: currentMoveString[4] = PieceToChar(BlackFerz); break;
305                           case VariantGreat:    currentMoveString[4] = PieceToChar(BlackMan); break;
306                           case VariantShogi:    currentMoveString[4] = '+'; break;
307                           default:              currentMoveString[4] = PieceToChar(BlackQueen);
308                         }
309                       } else if(result == WhiteNonPromotion  || result == BlackNonPromotion) {
310                                                 currentMoveString[4] = '=';
311                       }
312                     } else if(appData.testLegality && gameInfo.variant != VariantSChess && // strip off unnecessary and false promo characters
313                        !(result == WhitePromotion  || result == BlackPromotion ||
314                          result == WhiteNonPromotion || result == BlackNonPromotion)) currentMoveString[4] = NULLCHAR;
315                     return result;
316                 } else if(cl.pieceIn == EmptySquare) cl.pieceIn = wom ? WhitePawn : BlackPawn;
317                 cl.ffIn = type[0] == NOTHING ? -1 : coord[0] + 'a' - AAA;
318                 cl.rfIn = type[1] == NOTHING ? -1 : coord[1] + '0' - ONE;
319
320                 Disambiguate(boards[yyboardindex], PosFlags(yyboardindex), &cl);
321
322                 if(cl.kind == ImpossibleMove && !piece && type[1] == NOTHING // fxg5 type
323                         && toY == (wom ? 4 : 3)) { // could be improperly written e.p.
324                     cl.rtIn += wom ? 1 : -1; // shift target square to e.p. square
325                     Disambiguate(boards[yyboardindex], PosFlags(yyboardindex), &cl);
326                     if((cl.kind != WhiteCapturesEnPassant && cl.kind != BlackCapturesEnPassant))
327                         return ImpossibleMove; // nice try, but no cigar
328                 }
329
330                 currentMoveString[0] = cl.ff + AAA;
331                 currentMoveString[1] = cl.rf + ONE;
332                 currentMoveString[3] = cl.rt + ONE;
333                 currentMoveString[4] = cl.promoChar;
334
335                 if((cl.kind == WhiteCapturesEnPassant || cl.kind == BlackCapturesEnPassant) && (Match("ep", p) || Match("e.p.", p)));
336
337                 return (int) cl.kind;
338             }
339         }
340 badMove:// we failed to find algebraic move
341
342
343         // ********* SAN Castings *************************************
344         *p = oldp;
345         if(**p == 'O' || **p == 'o' || **p == '0') {
346             int castlingType = 0;
347             if(Match("O-O-O", p) || Match("o-o-o", p) || Match("0-0-0", p) || 
348                Match("OOO", p) || Match("ooo", p) || Match("000", p)) castlingType = 2;
349             else if(Match("O-O", p) || Match("o-o", p) || Match("0-0", p) ||
350                     Match("OO", p) || Match("oo", p) || Match("00", p)) castlingType = 1;
351             if(castlingType) { //code from old parser, collapsed for both castling types, and streamlined a bit
352                 int rf, ff, rt, ft; ChessSquare king;
353
354                 if (yyskipmoves) return (int) AmbiguousMove; /* not disambiguated */
355
356                 if (wom) {
357                     rf = 0;
358                     rt = 0;
359                     king = WhiteKing;
360                 } else {
361                     rf = BOARD_HEIGHT-1;
362                     rt = BOARD_HEIGHT-1;
363                     king = BlackKing;
364                 }
365                 ff = (BOARD_WIDTH-1)>>1; // this would be d-file
366                 if (boards[yyboardindex][rf][ff] == king) {
367                     /* ICS wild castling */
368                     ft = castlingType == 1 ? BOARD_LEFT+1 : BOARD_RGHT-3;
369                 } else {
370                     ff = BOARD_WIDTH>>1; // e-file
371                     ft = castlingType == 1 ? BOARD_RGHT-2 : BOARD_LEFT+2;
372                 }
373                 if(PosFlags(0) & F_FRC_TYPE_CASTLING) {
374                     if (wom) {
375                         ff = initialRights[2];
376                         ft = initialRights[castlingType-1];
377                     } else {
378                         ff = initialRights[5];
379                         ft = initialRights[castlingType+2];
380                     }
381                     if (appData.debugMode) fprintf(debugFP, "Parser FRC (type=%d) %d %d\n", castlingType, ff, ft);
382                     if(ff == NoRights || ft == NoRights) return ImpossibleMove;
383                 }
384                 sprintf(currentMoveString, "%c%c%c%c",ff+AAA,rf+ONE,ft+AAA,rt+ONE);
385                 if (appData.debugMode) fprintf(debugFP, "(%d-type) castling %d %d\n", castlingType, ff, ft);
386
387                 return (int) LegalityTest(boards[yyboardindex],
388                               PosFlags(yyboardindex)&~F_MANDATORY_CAPTURE, // [HGM] losers: e.p.!
389                               rf, ff, rt, ft, NULLCHAR);
390             }
391         }
392
393
394         // ********* Comments and result messages **********************
395         *p = oldp; commentEnd = NULL; result = 0;
396         if(**p == '{') {
397             if(RdTime('}', p)) return ElapsedTime;
398             if(lastChar == '\n' && Match("--------------\n", p)) {
399                 char *q;
400                 i = Scan ('}', p); q = *p - 16;
401                 if(Match("\n--------------}\n", &q)) return PositionDiagram;
402             } else i = Scan('}', p);
403             commentEnd = *p; if(i) return Comment; // return comment that runs to EOF immediately
404         }
405         if(commentEnd) SkipWhite(p);
406         if(Match("*", p)) result = GameUnfinished;
407         else if(**p == '0') {
408             if( Match("0-1", p) || Match("0/1", p) || Match("0:1", p) ||
409                 Match("0 - 1", p) || Match("0 / 1", p) || Match("0 : 1", p)) result = BlackWins;
410         } else if(**p == '1') {
411             if( Match("1-0", p) || Match("1/0", p) || Match("1:0", p) ||
412                 Match("1 - 0", p) || Match("1 / 0", p) || Match("1 : 0", p)) result = WhiteWins;
413             else if(Match("1/2 - 1/2", p) || Match("1/2:1/2", p) || Match("1/2 : 1/2", p) || Match("1 / 2 - 1 / 2", p) ||
414                     Match("1 / 2 : 1 / 2", p) || Match("1/2", p) || Match("1 / 2", p)) result = GameIsDrawn;
415         }
416         if(result) {
417             if(Match(" (", p) && !Scan(')', p) || Match(" {", p) && !Scan('}', p)) { // there is a comment after the PGN result!
418                 if(commentEnd) { *p = commentEnd; return Comment; } // so comment before it is normal comment; return that first
419             }
420             return result; // this returns a possible preceeding comment as result details
421         }
422         if(commentEnd) { *p = commentEnd; return Comment; } // there was no PGN result following, so return as normal comment
423
424
425         // ********* Move numbers (after castlings or PGN results!) ***********
426         if((i = Number(p)) != BADNUMBER) { // a single number was read as part of our attempt to read a move
427             char *numEnd = *p;
428             if(**p == '.') (*p)++; SkipWhite(p);
429             if(**p == '+' || isalpha(**p) || gameInfo.variant == VariantShogi && *p != numEnd && isdigit(**p)) {
430                 *p = numEnd;
431                 return i == 1 ? MoveNumberOne : Nothing;
432             }
433             *p = numEnd; return Nothing;
434         }
435
436
437         // ********* non-compliant game-result indicators *********************
438         if(Match("+-+", p) || Word("stalemate", p)) return GameIsDrawn;
439         if(Match("++", p) || Verb("resign", p) || (Word("check", p) || 1) && Word("mate", p) )
440             return (wom ? BlackWins : WhiteWins);
441         c = ToUpper(**p);
442         if(Word("w", p) && (Match("hite", p) || 1) || Word("b", p) && (Match("lack", p) || 1) ) {
443             if(**p != ' ') return Nothing;
444             ++*p;
445             if(Verb("disconnect", p)) return GameUnfinished;
446             if(Verb("resign", p) || Verb("forfeit", p) || Word("mated", p) || Word("lost", p) || Word("loses", p))
447                 return (c == 'W' ? BlackWins : WhiteWins);
448             if(Word("mates", p) || Word("wins", p) || Word("won", p))
449                 return (c != 'W' ? BlackWins : WhiteWins);
450             return Nothing;
451         }
452         if(Word("draw", p)) {
453             if(**p == 'n') (*p)++;
454             if(**p != ' ') return GameIsDrawn;
455             oldp = ++*p;
456             if(Word("agreed", p)) return GameIsDrawn;
457             if(Match("by ", p) && (Word("repetition", p) || Word("agreement", p)) ) return GameIsDrawn;
458             *p = oldp;
459             if(*(*p)++ == '(') {
460                 while(**p != '\n') if(*(*p)++ == ')') break;
461                 if((*p)[-1] == ')')  return GameIsDrawn;
462             }
463             *p = oldp - 1; return GameIsDrawn;
464         }
465
466
467         // ********* Numeric annotation glyph **********************************
468         if(**p == '$') { (*p)++; if(Number(p) != BADNUMBER) return NAG; return Nothing; }
469
470
471         // ********** by now we are getting down to the silly stuff ************
472         if(Word("gnu", p) || Match("GNU", p)) {
473             if(**p == ' ') (*p)++;
474             if(Word("chess", p) || Match("CHESS", p)) {
475                 char *q;
476                 if((q = strstr(*p, "game")) || (q = strstr(*p, "GAME")) || (q = strstr(*p, "Game"))) {
477                     (*p) = q + 4; return GNUChessGame;
478                 }
479             }
480             return Nothing;
481         }
482         if(lastChar == '\n' && (Match("# ", p) || Match("; ", p) || Match("% ", p))) {
483             while(**p != '\n' && **p != ' ') (*p)++;
484             if(**p == ' ' && (Match(" game file", p) || Match(" position file", p))) {
485                 while(**p != '\n') (*p)++; // skip to EOLN
486                 return XBoardGame;
487             }
488             *p = oldp; // we might need to re-match the skipped stuff
489         }
490
491
492         // ********* Efficient skipping of (mostly) alphabetic chatter **********
493         while(isdigit(**p) || isalpha(**p) || **p == '-') (*p)++;
494         if(*p != oldp) {
495             if(**p == '\'') {
496                 while(isdigit(**p) || isalpha(**p) || **p == '-' || **p == '\'') (*p)++;
497                 return Nothing; // random word
498             }
499             if(lastChar == '\n' && Match(": ", p)) { // mail header, skip indented lines
500                 do {
501                     while(**p != '\n') (*p)++;
502                     if(!ReadLine()) return Nothing; // append next line if not EOF
503                 } while(Match("\n ", p) || Match("\n\t", p));
504             }
505             return Nothing;
506         }
507
508
509         // ********* Could not match to anything. Return offending character ****
510         (*p)++;
511         return Nothing;
512 }
513
514 /*
515     Return offset of next pattern in the current file.
516 */
517 int yyoffset()
518 {
519     return ftell(inputFile) - (inPtr - parsePtr); // subtract what is read but not yet parsed
520 }
521
522 void yynewfile (FILE *f)
523 {   // prepare parse buffer for reading file
524     inputFile = f;
525     inPtr = parsePtr = inputBuf;
526     fromString = 0;
527     lastChar = '\n';
528     *inPtr = NULLCHAR; // make sure we will start by reading a line
529 }
530
531 void yynewstr P((char *s))
532 {
533     parsePtr = s;
534     inputFile = NULL;
535     fromString = 1;
536 }
537
538 int yylex()
539 {   // this replaces the flex-generated parser
540     int result = NextUnit(&parsePtr);
541     char *p = parseStart, *q = yytext;
542     while(p < parsePtr) *q++ = *p++; // copy the matched text to yytext[]
543     *q = NULLCHAR;
544     lastChar = q[-1];
545     return result;
546 }
547
548 int Myylex()
549 {   // [HGM] wrapper for yylex, which treats nesting of parentheses
550     int symbol, nestingLevel = 0, i=0;
551     char *p;
552     static char buf[256*MSG_SIZ];
553     buf[0] = NULLCHAR;
554     do { // eat away anything not at level 0
555         symbol = yylex();
556         if(symbol == Open) nestingLevel++;
557         if(nestingLevel) { // save all parsed text between (and including) the ()
558             for(p=yytext; *p && i<256*MSG_SIZ-2;) buf[i++] = *p++;
559             buf[i] = NULLCHAR;
560         }
561         if(symbol == 0) break; // ran into EOF
562         if(symbol == Close) symbol = Comment, nestingLevel--;
563     } while(nestingLevel || symbol == Nothing);
564     yy_text = buf[0] ? buf : (char*)yytext;
565     return symbol;
566 }
567
568 ChessMove yylexstr(int boardIndex, char *s, char *buf, int buflen)
569 {
570     ChessMove ret;
571     char *savPP = parsePtr;
572     fromString = 1;
573     yyboardindex = boardIndex;
574     parsePtr = s;
575     ret = (ChessMove) Myylex();
576     strncpy(buf, yy_text, buflen-1);
577     buf[buflen-1] = NULLCHAR;
578     parsePtr = savPP;
579     fromString = 0;
580     return ret;
581 }