]> Pileus Git - ~andy/fetchmail/blob - uid.c
Merge branch 'legacy_63'
[~andy/fetchmail] / uid.c
1 /**
2  * \file uid.c
3  * UID list handling (currently, only for POP3)
4  *
5  * For license terms, see the file COPYING in this directory.
6  *
7  * Machinery for handling UID lists live here.  This is currently used
8  * by POP3, but may also be useful for making the IMAP4 querying logic
9  * UID-oriented.
10  *
11  * These functions are also used by the rest of the code to maintain
12  * string lists.
13  *
14  * Here's the theory:
15  *
16  * At start of a query, we have a (possibly empty) list of UIDs to be
17  * considered seen in `oldsaved'.  These are messages that were left in
18  * the mailbox and *not deleted* on previous queries (we don't need to
19  * remember the UIDs of deleted messages because ... well, they're gone!)
20  * This list is initially set up by initialize_saved_list() from the
21  * .fetchids file.
22  *
23  * Early in the query, during the execution of the protocol-specific
24  * getrange code, the driver expects that the host's `newsaved' member
25  * will be filled with a list of UIDs and message numbers representing
26  * the mailbox state.  If this list is empty, the server did
27  * not respond to the request for a UID listing.
28  *
29  * Each time a message is fetched, we can check its UID against the
30  * `oldsaved' list to see if it is old.
31  *
32  * Each time a message-id is seen, we mark it with MARK_SEEN.
33  *
34  * Each time a message is deleted, we mark its id UID_DELETED in the
35  * `newsaved' member.  When we want to assert that an expunge has been
36  * done on the server, we call expunge_uid() to register that all
37  * deleted messages are gone by marking them UID_EXPUNGED.
38  *
39  * At the end of the query, the `newsaved' member becomes the
40  * `oldsaved' list.  The old `oldsaved' list is freed.
41  *
42  * At the end of the fetchmail run, seen and non-EXPUNGED members of all
43  * current `oldsaved' lists are flushed out to the .fetchids file to
44  * be picked up by the next run.  If there are no un-expunged
45  * messages, the file is deleted.
46  *
47  * One disadvantage of UIDL is that all the UIDs have to be downloaded
48  * before a search for new messages can be done. Typically, new messages
49  * are appended to mailboxes. Hence, downloading all UIDs just to download
50  * a few new mails is a waste of bandwidth. If new messages are always at
51  * the end of the mailbox, fast UIDL will decrease the time required to
52  * download new mails.
53  *
54  * During fast UIDL, the UIDs of all messages are not downloaded! The first
55  * unseen message is searched for by using a binary search on UIDs. UIDs
56  * after the first unseen message are downloaded as and when needed.
57  *
58  * The advantages of fast UIDL are (this is noticeable only when the
59  * mailbox has too many mails):
60  *
61  * - There is no need to download the UIDs of all mails right at the start.
62  * - There is no need to save all the UIDs in memory separately in
63  * `newsaved' list.
64  * - There is no need to download the UIDs of seen mail (except for the
65  * first binary search).
66  * - The first new mail is downloaded considerably faster.
67  *
68  * The disadvantages are:
69  *
70  * - Since all UIDs are not downloaded, it is not possible to swap old and
71  * new list. The current state of the mailbox is essentially a merged state
72  * of old and new mails.
73  * - If an intermediate mail has been temporarily refused (say, due to 4xx
74  * code from the smtp server), this mail may not get downloaded.
75  * - If 'flush' is used, such intermediate mails will also get deleted.
76  *
77  * The first two disadvantages can be overcome by doing a linear search
78  * once in a while (say, every 10th poll). Also, with flush, fast UIDL
79  * should be disabled.
80  *
81  * Note: some comparisons (those used for DNS address lists) are caseblind!
82  */
83
84 #include "config.h"
85
86 #include <sys/stat.h>
87 #include <errno.h>
88 #include <stdio.h>
89 #include <limits.h>
90 #include <stdlib.h>
91 #include <string.h>
92 #include <unistd.h>
93
94 #include "fetchmail.h"
95 #include "gettext.h"
96 #include "sdump.h"
97
98 int dofastuidl = 0;
99
100 #ifdef POP3_ENABLE
101 /** UIDs associated with un-queried hosts */
102 static struct idlist *scratchlist;
103
104 static int dump_saved_uid(struct uid_db_record *rec, void *unused)
105 {
106     char *t;
107
108     (void)unused;
109
110     t = sdump(rec->id, rec->id_len);
111     report_build(stdout, " %s", t);
112     free(t);
113
114     return 0;
115 }
116
117 /** Read saved IDs from \a idfile and attach to each host in \a hostlist. */
118 void initialize_saved_lists(struct query *hostlist, const char *idfile)
119 {
120     struct stat statbuf;
121     FILE        *tmpfp;
122     struct query *ctl;
123
124     /* make sure lists are initially empty */
125     for (ctl = hostlist; ctl; ctl = ctl->next) {
126         ctl->skipped = (struct idlist *)NULL;
127
128         init_uid_db(&ctl->oldsaved);
129         init_uid_db(&ctl->newsaved);
130     }
131
132     errno = 0;
133
134     /*
135      * Croak if the uidl directory does not exist.
136      * This probably means an NFS mount failed and we can't
137      * see a uidl file that ought to be there.
138      * Question: is this a portable check? It's not clear
139      * that all implementations of lstat() will return ENOTDIR
140      * rather than plain ENOENT in this case...
141      */
142     if (lstat(idfile, &statbuf) < 0) {
143         if (errno == ENOTDIR)
144         {
145             report(stderr, "lstat: %s: %s\n", idfile, strerror(errno));
146             exit(PS_IOERR);
147         }
148     }
149
150     /* let's get stored message UIDs from previous queries */
151     if ((tmpfp = fopen(idfile, "r")) != (FILE *)NULL)
152     {
153         char buf[POPBUFSIZE+1];
154         char *host = NULL;      /* pacify -Wall */
155         char *user;
156         char *id;
157         char *atsign;   /* temp pointer used in parsing user and host */
158         char *delimp1;
159         char saveddelim1;
160         char *delimp2;
161         char saveddelim2 = '\0';        /* pacify -Wall */
162
163         while (fgets(buf, POPBUFSIZE, tmpfp) != (char *)NULL)
164         {
165             /*
166              * At this point, we assume the bug has two fields -- a user@host
167              * part, and an ID part. Either field may contain spurious @ signs.
168              * The previous version of this code presumed one could split at
169              * the rightmost '@'.  This is not correct, as InterMail puts an
170              * '@' in the UIDL.
171              */
172
173             /* first, skip leading spaces */
174             user = buf + strspn(buf, " \t");
175
176             /*
177              * First, we split the buf into a userhost part and an id
178              * part ... but id doesn't necessarily start with a '<',
179              * espescially if the POP server returns an X-UIDL header
180              * instead of a Message-ID, as GMX's (www.gmx.net) POP3
181              * StreamProxy V1.0 does.
182              *
183              * this is one other trick. The userhost part
184              * may contain ' ' in the user part, at least in
185              * the lotus notes case.
186              * So we start looking for the '@' after which the
187              * host will follow with the ' ' separator with the id.
188              *
189              * XXX FIXME: There is a case this code cannot handle:
190              * the user name cannot have blanks after a '@'.
191              */
192             if ((delimp1 = strchr(user, '@')) != NULL &&
193                 (id = strchr(delimp1,' ')) != NULL)
194             {
195                 for (delimp1 = id; delimp1 >= user; delimp1--)
196                     if ((*delimp1 != ' ') && (*delimp1 != '\t'))
197                         break;
198
199                 /*
200                  * It should be safe to assume that id starts after
201                  * the " " - after all, we're writing the " "
202                  * ourselves in write_saved_lists() :-)
203                  */
204                 id = id + strspn(id, " ");
205
206                 delimp1++; /* but what if there is only white space ?!? */
207                 /* we have at least one @, else we are not in this branch */
208                 saveddelim1 = *delimp1;         /* save char after token */
209                 *delimp1 = '\0';                /* delimit token with \0 */
210
211                 /* now remove trailing white space chars from id */
212                 if ((delimp2 = strpbrk(id, " \t\n")) != NULL ) {
213                     saveddelim2 = *delimp2;
214                     *delimp2 = '\0';
215                 }
216
217                 atsign = strrchr(user, '@');
218                 /* we have at least one @, else we are not in this branch */
219                 *atsign = '\0';
220                 host = atsign + 1;
221
222                 /* find uidl db and save it */
223                 for (ctl = hostlist; ctl; ctl = ctl->next) {
224                     if (strcasecmp(host, ctl->server.queryname) == 0
225                             && strcasecmp(user, ctl->remotename) == 0) {
226                         uid_db_insert(&ctl->oldsaved, id, UID_SEEN);
227                         break;
228                     }
229                 }
230                 /*
231                  * If it's not in a host we're querying,
232                  * save it anyway.  Otherwise we'd lose UIDL
233                  * information any time we queried an explicit
234                  * subset of hosts.
235                  */
236                 if (ctl == (struct query *)NULL) {
237                     /* restore string */
238                     *delimp1 = saveddelim1;
239                     *atsign = '@';
240                     if (delimp2 != NULL) {
241                         *delimp2 = saveddelim2;
242                     }
243                     save_str(&scratchlist, buf, UID_SEEN);
244                 }
245             }
246         }
247         fclose(tmpfp);  /* not checking should be safe, mode was "r" */
248     }
249
250     if (outlevel >= O_DEBUG)
251     {
252         struct idlist   *idp;
253
254         for (ctl = hostlist; ctl; ctl = ctl->next)
255             {
256                 report_build(stdout, GT_("Old UID list from %s:"),
257                              ctl->server.pollname);
258
259                 if (!uid_db_n_records(&ctl->oldsaved))
260                     report_build(stdout, GT_(" <empty>"));
261                 else
262                     traverse_uid_db(&ctl->oldsaved, dump_saved_uid, NULL);
263
264                 report_complete(stdout, "\n");
265             }
266
267         report_build(stdout, GT_("Scratch list of UIDs:"));
268         if (!scratchlist)
269                 report_build(stdout, GT_(" <empty>"));
270         else for (idp = scratchlist; idp; idp = idp->next) {
271                 char *t = sdump(idp->id, strlen(idp->id)-1);
272                 report_build(stdout, " %s\n", t);
273                 free(t);
274         }
275         report_complete(stdout, "\n");
276     }
277 }
278
279 static int mark_as_expunged_if(struct uid_db_record *rec, void *unused)
280 {
281     (void)unused;
282
283     if (rec->status == UID_DELETED) rec->status = UID_EXPUNGED;
284     return 0;
285 }
286
287 /** Assert that all UIDs marked deleted in query \a ctl have actually been
288 expunged. */
289 void expunge_uids(struct query *ctl)
290 {
291     traverse_uid_db(dofastuidl ? &ctl->oldsaved : &ctl->newsaved,
292                      mark_as_expunged_if, NULL);
293 }
294
295 static const char *str_uidmark(int mark)
296 {
297         static char buf[20];
298
299         switch(mark) {
300                 case UID_UNSEEN:
301                         return "UNSEEN";
302                 case UID_SEEN:
303                         return "SEEN";
304                 case UID_EXPUNGED:
305                         return "EXPUNGED";
306                 case UID_DELETED:
307                         return "DELETED";
308                 default:
309                         if (snprintf(buf, sizeof(buf), "MARK=%d", mark) < 0)
310                                 return "ERROR";
311                         else
312                                 return buf;
313         }
314 }
315
316 static int dump_uid_db_record(struct uid_db_record *rec, void *arg)
317 {
318         unsigned *n_recs;
319         char *t;
320
321         n_recs = (unsigned int *)arg;
322         --*n_recs;
323
324         t = sdump(rec->id, rec->id_len);
325         report_build(stdout, " %s = %s%s", t, str_uidmark(rec->status), *n_recs ? "," : "");
326         free(t);
327
328         return 0;
329 }
330
331 static void dump_uid_db(struct uid_db *db)
332 {
333         unsigned n_recs;
334
335         n_recs = uid_db_n_records(db);
336         if (!n_recs) {
337                 report_build(stdout, GT_(" <empty>"));
338                 return;
339         }
340
341         traverse_uid_db(db, dump_uid_db_record, &n_recs);
342 }
343
344 /** Finish a successful query */
345 void uid_swap_lists(struct query *ctl)
346 {
347     /* debugging code */
348     if (outlevel >= O_DEBUG)
349     {
350         if (dofastuidl) {
351             report_build(stdout, GT_("Merged UID list from %s:"), ctl->server.pollname);
352             dump_uid_db(&ctl->oldsaved);
353         } else {
354             report_build(stdout, GT_("New UID list from %s:"), ctl->server.pollname);
355             dump_uid_db(&ctl->newsaved);
356         }
357         report_complete(stdout, "\n");
358     }
359
360     /*
361      * Don't swap UID lists unless we've actually seen UIDLs.
362      * This is necessary in order to keep UIDL information
363      * from being heedlessly deleted later on.
364      *
365      * Older versions of fetchmail did
366      *
367      *     free_str_list(&scratchlist);
368      *
369      * after swap.  This was wrong; we need to preserve the UIDL information
370      * from unqueried hosts.  Unfortunately, not doing this means that
371      * under some circumstances UIDLs can end up being stored forever --
372      * specifically, if a user description is removed from .fetchmailrc
373      * with UIDLs from that account in .fetchids, there is no way for
374      * them to ever get garbage-collected.
375      */
376     if (uid_db_n_records(&ctl->newsaved))
377     {
378         swap_uid_db_data(&ctl->newsaved, &ctl->oldsaved);
379         clear_uid_db(&ctl->newsaved);
380     }
381     /* in fast uidl, there is no need to swap lists: the old state of
382      * mailbox cannot be discarded! */
383     else if (outlevel >= O_DEBUG && !dofastuidl)
384         report(stdout, GT_("not swapping UID lists, no UIDs seen this query\n"));
385 }
386
387 /** Finish a query which had errors */
388 void uid_discard_new_list(struct query *ctl)
389 {
390     /* debugging code */
391     if (outlevel >= O_DEBUG)
392     {
393         /* this is now a merged list! the mails which were seen in this
394          * poll are marked here. */
395         report_build(stdout, GT_("Merged UID list from %s:"), ctl->server.pollname);
396         dump_uid_db(&ctl->oldsaved);
397         report_complete(stdout, "\n");
398     }
399
400     if (uid_db_n_records(&ctl->newsaved))
401     {
402         /* new state of mailbox is not reliable */
403         if (outlevel >= O_DEBUG)
404             report(stdout, GT_("discarding new UID list\n"));
405         clear_uid_db(&ctl->newsaved);
406     }
407 }
408
409 /** Reset the number associated with each id */
410 void uid_reset_num(struct query *ctl)
411 {
412     reset_uid_db_nums(&ctl->oldsaved);
413 }
414
415 /** Write list of seen messages, at end of run. */
416 static int count_seen_deleted(struct uid_db_record *rec, void *arg)
417 {
418     if (rec->status == UID_SEEN || rec->status == UID_DELETED)
419         ++*(long *)arg;
420     return 0;
421 }
422
423 struct write_saved_info {
424     struct query *ctl;
425     FILE *fp;
426 };
427
428 static int write_uid_db_record(struct uid_db_record *rec, void *arg)
429 {
430     struct write_saved_info *info;
431     int rc;
432
433     if (!(rec->status == UID_SEEN || rec->status == UID_DELETED))
434         return 0;
435
436     info = (struct write_saved_info *)arg;
437     rc = fprintf(info->fp, "%s@%s %s\n",
438                  info->ctl->remotename, info->ctl->server.queryname,
439                  rec->id);
440     return rc < 0 ? -1 : 0;
441 }
442
443 /** Write new list of UIDs (state) to \a idfile. */
444 void write_saved_lists(struct query *hostlist, const char *idfile)
445 {
446     long        idcount;
447     FILE        *tmpfp;
448     struct query *ctl;
449     struct idlist *idp;
450
451     /* if all lists are empty, nuke the file */
452     idcount = 0;
453     for (ctl = hostlist; ctl; ctl = ctl->next)
454         traverse_uid_db(&ctl->oldsaved, count_seen_deleted, &idcount);
455
456     /* either nuke the file or write updated last-seen IDs */
457     if (!idcount && !scratchlist)
458     {
459         if (outlevel >= O_DEBUG) {
460             if (access(idfile, F_OK) == 0)
461                     report(stdout, GT_("Deleting fetchids file.\n"));
462         }
463         if (unlink(idfile) && errno != ENOENT)
464             report(stderr, GT_("Error deleting %s: %s\n"), idfile, strerror(errno));
465     } else {
466         char *newnam = (char *)xmalloc(strlen(idfile) + 2);
467         strcpy(newnam, idfile);
468         strcat(newnam, "_");
469         if (outlevel >= O_DEBUG)
470             report(stdout, GT_("Writing fetchids file.\n"));
471         (void)unlink(newnam); /* remove file/link first */
472         if ((tmpfp = fopen(newnam, "w")) != (FILE *)NULL) {
473             struct write_saved_info info;
474             int errflg = 0;
475
476             info.fp = tmpfp;
477
478             for (ctl = hostlist; ctl; ctl = ctl->next) {
479                 info.ctl = ctl;
480
481                 if (traverse_uid_db(&ctl->oldsaved, write_uid_db_record, &info) < 0) {
482                     int e = errno;
483                     report(stderr, GT_("Write error on fetchids file %s: %s\n"), newnam, strerror(e));
484                     errflg = 1;
485                     goto bailout;
486                 }
487             }
488
489             for (idp = scratchlist; idp; idp = idp->next)
490                 if (EOF == fputs(idp->id, tmpfp)) {
491                             int e = errno;
492                             report(stderr, GT_("Write error on fetchids file %s: %s\n"), newnam, strerror(e));
493                             errflg = 1;
494                             goto bailout;
495                 }
496
497 bailout:
498             (void)fflush(tmpfp); /* return code ignored, we check ferror instead */
499             errflg |= ferror(tmpfp);
500             errflg |= fclose(tmpfp);
501             /* if we could write successfully, move into place;
502              * otherwise, drop */
503             if (errflg) {
504                 report(stderr, GT_("Error writing to fetchids file %s, old file left in place.\n"), newnam);
505                 unlink(newnam);
506             } else {
507                 if (rename(newnam, idfile)) {
508                     report(stderr, GT_("Cannot rename fetchids file %s to %s: %s\n"), newnam, idfile, strerror(errno));
509                 }
510             }
511         } else {
512             report(stderr, GT_("Cannot open fetchids file %s for writing: %s\n"), newnam, strerror(errno));
513         }
514         free(newnam);
515     }
516 }
517 #endif /* POP3_ENABLE */
518
519 /* uid.c ends here */