]> Pileus Git - ~andy/fetchmail/blob - uid.c
a4164b442c96cf442ae11f4d2a068cacfa69430f
[~andy/fetchmail] / uid.c
1 /**
2  * \file uid.c -- UIDL handling for POP3 servers without LAST
3  *
4  * For license terms, see the file COPYING in this directory.
5  */
6
7 #include "config.h"
8
9 #include <sys/stat.h>
10 #include <errno.h>
11 #include <stdio.h>
12 #include <limits.h>
13 #if defined(STDC_HEADERS)
14 #include <stdlib.h>
15 #include <string.h>
16 #endif
17 #if defined(HAVE_UNISTD_H)
18 #include <unistd.h>
19 #endif
20
21 #include "fetchmail.h"
22 #include "i18n.h"
23
24 /*
25  * Machinery for handling UID lists live here.  This is mainly to support
26  * RFC1725/RFC1939-conformant POP3 servers without a LAST command, but may also
27  * be useful for making the IMAP4 querying logic UID-oriented, if a future
28  * revision of IMAP forces me to.
29  *
30  * These functions are also used by the rest of the code to maintain
31  * string lists.
32  *
33  * Here's the theory:
34  *
35  * At start of a query, we have a (possibly empty) list of UIDs to be
36  * considered seen in `oldsaved'.  These are messages that were left in
37  * the mailbox and *not deleted* on previous queries (we don't need to
38  * remember the UIDs of deleted messages because ... well, they're gone!)
39  * This list is initially set up by initialize_saved_list() from the
40  * .fetchids file.
41  *
42  * Early in the query, during the execution of the protocol-specific
43  * getrange code, the driver expects that the host's `newsaved' member
44  * will be filled with a list of UIDs and message numbers representing
45  * the mailbox state.  If this list is empty, the server did
46  * not respond to the request for a UID listing.
47  *
48  * Each time a message is fetched, we can check its UID against the
49  * `oldsaved' list to see if it is old.
50  *
51  * Each time a message-id is seen, we mark it with MARK_SEEN.
52  *
53  * Each time a message is deleted, we mark its id UID_DELETED in the
54  * `newsaved' member.  When we want to assert that an expunge has been
55  * done on the server, we call expunge_uid() to register that all
56  * deleted messages are gone by marking them UID_EXPUNGED.
57  *
58  * At the end of the query, the `newsaved' member becomes the
59  * `oldsaved' list.  The old `oldsaved' list is freed.
60  *
61  * At the end of the fetchmail run, seen and non-EXPUNGED members of all
62  * current `oldsaved' lists are flushed out to the .fetchids file to
63  * be picked up by the next run.  If there are no un-expunged
64  * messages, the file is deleted.
65  *
66  * One disadvantage of UIDL is that all the UIDs have to be downloaded
67  * before a search for new messages can be done. Typically, new messages
68  * are appended to mailboxes. Hence, downloading all UIDs just to download
69  * a few new mails is a waste of bandwidth. If new messages are always at
70  * the end of the mailbox, fast UIDL will decrease the time required to
71  * download new mails.
72  *
73  * During fast UIDL, the UIDs of all messages are not downloaded! The first
74  * unseen message is searched for by using a binary search on UIDs. UIDs
75  * after the first unseen message are downloaded as and when needed.
76  *
77  * The advantages of fast UIDL are (this is noticeable only when the
78  * mailbox has too many mails):
79  *
80  * - There is no need to download the UIDs of all mails right at the start.
81  * - There is no need to save all the UIDs in memory separately in
82  * `newsaved' list.
83  * - There is no need to download the UIDs of seen mail (except for the
84  * first binary search).
85  * - The first new mail is downloaded considerably faster.
86  *
87  * The disadvantages are:
88  *
89  * - Since all UIDs are not downloaded, it is not possible to swap old and
90  * new list. The current state of the mailbox is essentially a merged state
91  * of old and new mails.
92  * - If an intermediate mail has been temporarily refused (say, due to 4xx
93  * code from the smtp server), this mail may not get downloaded.
94  * - If 'flush' is used, such intermediate mails will also get deleted.
95  *
96  * The first two disadvantages can be overcome by doing a linear search
97  * once in a while (say, every 10th poll). Also, with flush, fast UIDL
98  * should be disabled.
99  *
100  * Note: some comparisons (those used for DNS address lists) are caseblind!
101  */
102
103 int dofastuidl = 0;
104
105 /* UIDs associated with un-queried hosts */
106 static struct idlist *scratchlist;
107
108 #ifdef POP3_ENABLE
109 void initialize_saved_lists(struct query *hostlist, const char *idfile)
110 /* read file of saved IDs and attach to each host */
111 {
112     struct stat statbuf;
113     FILE        *tmpfp;
114     struct query *ctl;
115
116     /* make sure lists are initially empty */
117     for (ctl = hostlist; ctl; ctl = ctl->next) {
118         ctl->skipped = (struct idlist *)NULL;
119         ctl->oldsaved = (struct idlist *)NULL;
120         ctl->newsaved = (struct idlist *)NULL;
121         ctl->oldsavedend = &ctl->oldsaved;
122     }
123
124     errno = 0;
125
126     /*
127      * Croak if the uidl directory does not exist.
128      * This probably means an NFS mount failed and we can't
129      * see a uidl file that ought to be there.
130      * Question: is this a portable check? It's not clear
131      * that all implementations of lstat() will return ENOTDIR
132      * rather than plain ENOENT in this case...
133      */
134     if (lstat(idfile, &statbuf) < 0) {
135         if (errno == ENOTDIR)
136         {
137             report(stderr, "lstat: %s: %s\n", idfile, strerror(errno));
138             exit(PS_IOERR);
139         }
140     }
141
142     /* let's get stored message UIDs from previous queries */
143     if ((tmpfp = fopen(idfile, "r")) != (FILE *)NULL)
144     {
145         char buf[POPBUFSIZE+1];
146         char *host = NULL;      /* pacify -Wall */
147         char *user;
148         char *id;
149         char *atsign;   /* temp pointer used in parsing user and host */
150         char *delimp1;
151         char saveddelim1;
152         char *delimp2;
153         char saveddelim2 = '\0';        /* pacify -Wall */
154
155         while (fgets(buf, POPBUFSIZE, tmpfp) != (char *)NULL)
156         {
157             /*
158              * At this point, we assume the bug has two fields -- a user@host 
159              * part, and an ID part. Either field may contain spurious @ signs.
160              * The previous version of this code presumed one could split at 
161              * the rightmost '@'.  This is not correct, as InterMail puts an 
162              * '@' in the UIDL.
163              */
164           
165             /* first, skip leading spaces */
166             user = buf + strspn(buf, " \t");
167
168             /*
169              * First, we split the buf into a userhost part and an id
170              * part ... but id doesn't necessarily start with a '<',
171              * espescially if the POP server returns an X-UIDL header
172              * instead of a Message-ID, as GMX's (www.gmx.net) POP3
173              * StreamProxy V1.0 does.
174              *
175              * this is one other trick. The userhost part 
176              * may contain ' ' in the user part, at least in
177              * the lotus notes case.
178              * So we start looking for the '@' after which the
179              * host will follow with the ' ' seperator finaly id.
180              *
181              * XXX FIXME: There is a case this code cannot handle:
182              * the user name cannot have blanks after a '@'.
183              */
184             if ((delimp1 = strchr(user, '@')) != NULL &&
185                 (id = strchr(delimp1,' ')) != NULL)
186             {
187                 for (delimp1 = id; delimp1 >= user; delimp1--)
188                     if ((*delimp1 != ' ') && (*delimp1 != '\t'))
189                         break;
190
191                 /* 
192                  * It should be safe to assume that id starts after
193                  * the " " - after all, we're writing the " "
194                  * ourselves in write_saved_lists() :-)
195                  */
196                 id = id + strspn(id, " ");
197
198                 delimp1++; /* but what if there is only white space ?!? */
199                 /* we have at least one @, else we are not in this branch */
200                 saveddelim1 = *delimp1;         /* save char after token */
201                 *delimp1 = '\0';                /* delimit token with \0 */
202
203                 /* now remove trailing white space chars from id */
204                 if ((delimp2 = strpbrk(id, " \t\n")) != NULL ) {
205                     saveddelim2 = *delimp2;
206                     *delimp2 = '\0';
207                 }
208
209                 atsign = strrchr(user, '@');
210                 /* we have at least one @, else we are not in this branch */
211                 *atsign = '\0';
212                 host = atsign + 1;
213
214                 /* find proper list and save it */
215                 for (ctl = hostlist; ctl; ctl = ctl->next) {
216                     if (strcasecmp(host, ctl->server.queryname) == 0
217                             && strcasecmp(user, ctl->remotename) == 0) {
218                         save_str(&ctl->oldsaved, id, UID_SEEN);
219                         break;
220                     }
221                 }
222                 /* 
223                  * If it's not in a host we're querying,
224                  * save it anyway.  Otherwise we'd lose UIDL
225                  * information any time we queried an explicit
226                  * subset of hosts.
227                  */
228                 if (ctl == (struct query *)NULL) {
229                     /* restore string */
230                     *delimp1 = saveddelim1;
231                     *atsign = '@';
232                     if (delimp2 != NULL) {
233                         *delimp2 = saveddelim2;
234                     }
235                     save_str(&scratchlist, buf, UID_SEEN);
236                 }
237             }
238         }
239         fclose(tmpfp);  /* not checking should be safe, mode was "r" */
240     }
241
242     if (outlevel >= O_DEBUG)
243     {
244         struct idlist   *idp;
245         int uidlcount = 0;
246
247         for (ctl = hostlist; ctl; ctl = ctl->next)
248             if (ctl->server.uidl)
249             {
250                 report_build(stdout, GT_("Old UID list from %s:"), 
251                              ctl->server.pollname);
252                 for (idp = ctl->oldsaved; idp; idp = idp->next)
253                     report_build(stdout, " %s", idp->id);
254                 if (!idp)
255                     report_build(stdout, GT_(" <empty>"));
256                 report_complete(stdout, "\n");
257                 uidlcount++;
258             }
259
260         if (uidlcount)
261         {
262             report_build(stdout, GT_("Scratch list of UIDs:"));
263             for (idp = scratchlist; idp; idp = idp->next)
264                 report_build(stdout, " %s", idp->id);
265             if (!idp)
266                 report_build(stdout, GT_(" <empty>"));
267             report_complete(stdout, "\n");
268         }
269     }
270 }
271 #endif /* POP3_ENABLE */
272
273 /* return a pointer to the last element of the list to help the quick,
274  * constant-time addition to the list, NOTE: this function does not dup
275  * the string, the caller must do that. */
276 /*@shared@*/ static struct idlist **save_str_quick(/*@shared@*/ struct idlist **idl,
277                                /*@only@*/ char *str, flag status)
278 /* save a number/UID pair on the given UID list */
279 {
280     struct idlist **end;
281
282     /* do it nonrecursively so the list is in the right order */
283     for (end = idl; *end; end = &(*end)->next)
284         continue;
285
286     *end = (struct idlist *)xmalloc(sizeof(struct idlist));
287     (*end)->id = str;
288     (*end)->val.status.mark = status;
289     (*end)->val.status.num = 0;
290     (*end)->next = NULL;
291
292     return end;
293 }
294
295 /* return the end list element for direct modification */
296 struct idlist *save_str(struct idlist **idl, const char *str, flag st)
297 {
298     return *save_str_quick(idl, str ? xstrdup(str) : NULL, st);
299 }
300
301 void free_str_list(struct idlist **idl)
302 /* free the given UID list */
303 {
304     struct idlist *i = *idl;
305
306     while(i) {
307         struct idlist *t = i->next;
308         free(i->id);
309         free(i);
310         i = t;
311     }
312     *idl = 0;
313 }
314
315 void save_str_pair(struct idlist **idl, const char *str1, const char *str2)
316 /* save an ID pair on the given list */
317 {
318     struct idlist **end;
319
320     /* do it nonrecursively so the list is in the right order */
321     for (end = idl; *end; end = &(*end)->next)
322         continue;
323
324     *end = (struct idlist *)xmalloc(sizeof(struct idlist));
325     (*end)->id = str1 ? xstrdup(str1) : (char *)NULL;
326     if (str2)
327         (*end)->val.id2 = xstrdup(str2);
328     else
329         (*end)->val.id2 = (char *)NULL;
330     (*end)->next = (struct idlist *)NULL;
331 }
332
333 #ifdef __UNUSED__
334 void free_str_pair_list(struct idlist **idl)
335 /* free the given ID pair list */
336 {
337     if (*idl == (struct idlist *)NULL)
338         return;
339
340     free_idpair_list(&(*idl)->next);
341     free ((*idl)->id);
342     free ((*idl)->val.id2);
343     free(*idl);
344     *idl = (struct idlist *)NULL;
345 }
346 #endif
347
348 struct idlist *str_in_list(struct idlist **idl, const char *str, const flag caseblind)
349 /* is a given ID in the given list? (comparison may be caseblind) */
350 {
351     struct idlist *walk;
352     if (caseblind) {
353         for( walk = *idl; walk; walk = walk->next )
354             if( strcasecmp( str, walk->id) == 0 )
355                 return walk;
356     } else {
357         for( walk = *idl; walk; walk = walk->next )
358             if( strcmp( str, walk->id) == 0 )
359                 return walk;
360     }
361     return NULL;
362 }
363
364 /** return the position of first occurrence of \a str in \a idl */
365 int str_nr_in_list(struct idlist **idl, const char *str)
366 {
367     int nr;
368     struct idlist *walk;
369
370     if (!str)
371         return -1;
372     for (walk = *idl, nr = 0; walk; nr ++, walk = walk->next)
373         if (strcmp(str, walk->id) == 0)
374             return nr;
375     return -1;
376 }
377
378 int str_nr_last_in_list( struct idlist **idl, const char *str)
379 /* return the last position of str in idl */
380 {
381     int nr, ret = -1;
382     struct idlist *walk;
383     if ( !str )
384         return -1;
385     for( walk = *idl, nr = 0; walk; nr ++, walk = walk->next )
386         if( strcmp( str, walk->id) == 0 )
387             ret = nr;
388     return ret;
389 }
390
391 void str_set_mark( struct idlist **idl, const char *str, const flag val)
392 /* update the mark on an of an id to given value */
393 {
394     int nr;
395     struct idlist *walk;
396     if (!str)
397         return;
398     for(walk = *idl, nr = 0; walk; nr ++, walk = walk->next)
399         if (strcmp(str, walk->id) == 0)
400             walk->val.status.mark = val;
401 }
402
403 int count_list( struct idlist **idl)
404 /* count the number of elements in the list */
405 {
406   if( !*idl )
407     return 0;
408   return 1 + count_list( &(*idl)->next );
409 }
410
411 /*@null@*/ char *str_from_nr_list(struct idlist **idl, long number)
412 /* return the number'th string in idl */
413 {
414     if( !*idl  || number < 0)
415         return 0;
416     if( number == 0 )
417         return (*idl)->id;
418     return str_from_nr_list(&(*idl)->next, number-1);
419 }
420
421
422 char *str_find(struct idlist **idl, long number)
423 /* return the id of the given number in the given list. */
424 {
425     if (*idl == (struct idlist *) 0)
426         return((char *) 0);
427     else if (number == (*idl)->val.status.num)
428         return((*idl)->id);
429     else
430         return(str_find(&(*idl)->next, number));
431 }
432
433 struct idlist *id_find(struct idlist **idl, long number)
434 /* return the id of the given number in the given list. */
435 {
436     struct idlist       *idp;
437     for (idp = *idl; idp; idp = idp->next)
438         if (idp->val.status.num == number)
439             return(idp);
440     return(0);
441 }
442
443 char *idpair_find(struct idlist **idl, const char *id)
444 /* return the id of the given id in the given list (caseblind comparison) */
445 {
446     if (*idl == (struct idlist *) 0)
447         return((char *) 0);
448     else if (strcasecmp(id, (*idl)->id) == 0)
449         return((*idl)->val.id2 ? (*idl)->val.id2 : (*idl)->id);
450     else
451         return(idpair_find(&(*idl)->next, id));
452 }
453
454 int delete_str(struct idlist **idl, long num)
455 /* delete given message from given list */
456 {
457     struct idlist       *idp;
458
459     for (idp = *idl; idp; idp = idp->next)
460         if (idp->val.status.num == num)
461         {
462             idp->val.status.mark = UID_DELETED;
463             return(1);
464         }
465     return(0);
466 }
467
468 struct idlist *copy_str_list(struct idlist *idl)
469 /* copy the given UID list */
470 {
471     struct idlist *newnode ;
472
473     if (idl == (struct idlist *)NULL)
474         return(NULL);
475     else
476     {
477         newnode = (struct idlist *)xmalloc(sizeof(struct idlist));
478         memcpy(newnode, idl, sizeof(struct idlist));
479         newnode->next = copy_str_list(idl->next);
480         return(newnode);
481     }
482 }
483
484 void append_str_list(struct idlist **idl, struct idlist **nidl)
485 /* append nidl to idl (does not copy *) */
486 {
487     if ((*nidl) == (struct idlist *)NULL || *nidl == *idl)
488         return;
489     else if ((*idl) == (struct idlist *)NULL)
490         *idl = *nidl;
491     else if ((*idl)->next == (struct idlist *)NULL)
492         (*idl)->next = *nidl;
493     else if ((*idl)->next != *nidl)
494         append_str_list(&(*idl)->next, nidl);
495 }
496
497 #ifdef POP3_ENABLE
498 void expunge_uids(struct query *ctl)
499 /* assert that all UIDs marked deleted have actually been expunged */
500 {
501     struct idlist *idl;
502
503     for (idl = dofastuidl ? ctl->oldsaved : ctl->newsaved; idl; idl = idl->next)
504         if (idl->val.status.mark == UID_DELETED)
505             idl->val.status.mark = UID_EXPUNGED;
506 }
507
508 void uid_swap_lists(struct query *ctl) 
509 /* finish a query */
510 {
511     /* debugging code */
512     if (ctl->server.uidl && outlevel >= O_DEBUG)
513     {
514         struct idlist *idp;
515
516         if (dofastuidl)
517             report_build(stdout, GT_("Merged UID list from %s:"), ctl->server.pollname);
518         else
519             report_build(stdout, GT_("New UID list from %s:"), ctl->server.pollname);
520         for (idp = dofastuidl ? ctl->oldsaved : ctl->newsaved; idp; idp = idp->next)
521             report_build(stdout, " %s = %d", idp->id, idp->val.status.mark);
522         if (!idp)
523             report_build(stdout, GT_(" <empty>"));
524         report_complete(stdout, "\n");
525     }
526
527     /*
528      * Don't swap UID lists unless we've actually seen UIDLs.
529      * This is necessary in order to keep UIDL information
530      * from being heedlessly deleted later on.
531      *
532      * Older versions of fetchmail did
533      *
534      *     free_str_list(&scratchlist);
535      *
536      * after swap.  This was wrong; we need to preserve the UIDL information
537      * from unqueried hosts.  Unfortunately, not doing this means that
538      * under some circumstances UIDLs can end up being stored forever --
539      * specifically, if a user description is removed from .fetchmailrc
540      * with UIDLs from that account in .fetchids, there is no way for
541      * them to ever get garbage-collected.
542      */
543     if (ctl->newsaved)
544     {
545         /* old state of mailbox may now be irrelevant */
546         struct idlist *temp = ctl->oldsaved;
547         if (outlevel >= O_DEBUG)
548             report(stdout, GT_("swapping UID lists\n"));
549         ctl->oldsaved = ctl->newsaved;
550         ctl->newsaved = (struct idlist *) NULL;
551         free_str_list(&temp);
552     }
553     /* in fast uidl, there is no need to swap lists: the old state of
554      * mailbox cannot be discarded! */
555     else if (outlevel >= O_DEBUG && !dofastuidl)
556         report(stdout, GT_("not swapping UID lists, no UIDs seen this query\n"));
557 }
558
559 void uid_discard_new_list(struct query *ctl)
560 /* finish a query which had errors */
561 {
562     /* debugging code */
563     if (ctl->server.uidl && outlevel >= O_DEBUG)
564     {
565         struct idlist *idp;
566
567         /* this is now a merged list! the mails which were seen in this
568          * poll are marked here. */
569         report_build(stdout, GT_("Merged UID list from %s:"), ctl->server.pollname);
570         for (idp = ctl->oldsaved; idp; idp = idp->next)
571             report_build(stdout, " %s = %d", idp->id, idp->val.status.mark);
572         if (!idp)
573             report_build(stdout, GT_(" <empty>"));
574         report_complete(stdout, "\n");
575     }
576
577     if (ctl->newsaved)
578     {
579         /* new state of mailbox is not reliable */
580         if (outlevel >= O_DEBUG)
581             report(stdout, GT_("discarding new UID list\n"));
582         free_str_list(&ctl->newsaved);
583         ctl->newsaved = (struct idlist *) NULL;
584     }
585 }
586
587 void uid_reset_num(struct query *ctl)
588 /* reset the number associated with each id */
589 {
590     struct idlist *idp;
591     for (idp = ctl->oldsaved; idp; idp = idp->next)
592         idp->val.status.num = 0;
593 }
594
595 void write_saved_lists(struct query *hostlist, const char *idfile)
596 /* perform end-of-run write of seen-messages list */
597 {
598     long        idcount;
599     FILE        *tmpfp;
600     struct query *ctl;
601     struct idlist *idp;
602
603     /* if all lists are empty, nuke the file */
604     idcount = 0;
605     for (ctl = hostlist; ctl; ctl = ctl->next) {
606         for (idp = ctl->oldsaved; idp; idp = idp->next)
607             if (idp->val.status.mark == UID_SEEN
608                     || idp->val.status.mark == UID_DELETED)
609                 idcount++;
610     }
611
612     /* either nuke the file or write updated last-seen IDs */
613     if (!idcount && !scratchlist)
614     {
615         if (outlevel >= O_DEBUG) {
616             if (access(idfile, F_OK) == 0)
617                     report(stdout, GT_("Deleting fetchids file.\n"));
618         }
619         if (unlink(idfile) && errno != ENOENT)
620             report(stderr, GT_("Error deleting %s: %s\n"), idfile, strerror(errno));
621     } else {
622         char *newnam = xmalloc(strlen(idfile) + 2);
623         strcpy(newnam, idfile);
624         strcat(newnam, "_");
625         if (outlevel >= O_DEBUG)
626             report(stdout, GT_("Writing fetchids file.\n"));
627         (void)unlink(newnam); /* remove file/link first */
628         if ((tmpfp = fopen(newnam, "w")) != (FILE *)NULL) {
629             int errflg;
630             for (ctl = hostlist; ctl; ctl = ctl->next) {
631                 for (idp = ctl->oldsaved; idp; idp = idp->next)
632                     if (idp->val.status.mark == UID_SEEN
633                                 || idp->val.status.mark == UID_DELETED)
634                         fprintf(tmpfp, "%s@%s %s\n", 
635                             ctl->remotename, ctl->server.queryname, idp->id);
636             }
637             for (idp = scratchlist; idp; idp = idp->next)
638                 fputs(idp->id, tmpfp);
639             fflush(tmpfp);
640             errflg = ferror(tmpfp);
641             fclose(tmpfp);
642             /* if we could write successfully, move into place;
643              * otherwise, drop */
644             if (errflg) {
645                 report(stderr, GT_("Error writing to fetchids file %s, old file left in place.\n"), newnam);
646                 unlink(newnam);
647             } else {
648                 if (rename(newnam, idfile)) {
649                     report(stderr, GT_("Cannot rename fetchids file %s to %s: %s\n"), newnam, idfile, strerror(errno));
650                 }
651             }
652         } else {
653             report(stderr, GT_("Cannot open fetchids file %s for writing: %s\n"), newnam, strerror(errno));
654         }
655         free(newnam);
656     }
657 }
658 #endif /* POP3_ENABLE */
659
660 /* uid.c ends here */