]> Pileus Git - ~andy/linux/blob - kernel/time/timekeeping.c
time: Clean up stray newlines
[~andy/linux] / kernel / time / timekeeping.c
1 /*
2  *  linux/kernel/time/timekeeping.c
3  *
4  *  Kernel timekeeping code and accessor functions
5  *
6  *  This code was moved from linux/kernel/timer.c.
7  *  Please see that file for copyright and history logs.
8  *
9  */
10
11 #include <linux/module.h>
12 #include <linux/interrupt.h>
13 #include <linux/percpu.h>
14 #include <linux/init.h>
15 #include <linux/mm.h>
16 #include <linux/sched.h>
17 #include <linux/syscore_ops.h>
18 #include <linux/clocksource.h>
19 #include <linux/jiffies.h>
20 #include <linux/time.h>
21 #include <linux/tick.h>
22 #include <linux/stop_machine.h>
23
24 /* Structure holding internal timekeeping values. */
25 struct timekeeper {
26         /* Current clocksource used for timekeeping. */
27         struct clocksource      *clock;
28         /* NTP adjusted clock multiplier */
29         u32                     mult;
30         /* The shift value of the current clocksource. */
31         u32                     shift;
32         /* Number of clock cycles in one NTP interval. */
33         cycle_t                 cycle_interval;
34         /* Number of clock shifted nano seconds in one NTP interval. */
35         u64                     xtime_interval;
36         /* shifted nano seconds left over when rounding cycle_interval */
37         s64                     xtime_remainder;
38         /* Raw nano seconds accumulated per NTP interval. */
39         u32                     raw_interval;
40
41         /* Current CLOCK_REALTIME time in seconds */
42         u64                     xtime_sec;
43         /* Clock shifted nano seconds */
44         u64                     xtime_nsec;
45
46         /* Difference between accumulated time and NTP time in ntp
47          * shifted nano seconds. */
48         s64                     ntp_error;
49         /* Shift conversion between clock shifted nano seconds and
50          * ntp shifted nano seconds. */
51         u32                     ntp_error_shift;
52
53         /*
54          * wall_to_monotonic is what we need to add to xtime (or xtime corrected
55          * for sub jiffie times) to get to monotonic time.  Monotonic is pegged
56          * at zero at system boot time, so wall_to_monotonic will be negative,
57          * however, we will ALWAYS keep the tv_nsec part positive so we can use
58          * the usual normalization.
59          *
60          * wall_to_monotonic is moved after resume from suspend for the
61          * monotonic time not to jump. We need to add total_sleep_time to
62          * wall_to_monotonic to get the real boot based time offset.
63          *
64          * - wall_to_monotonic is no longer the boot time, getboottime must be
65          * used instead.
66          */
67         struct timespec         wall_to_monotonic;
68         /* time spent in suspend */
69         struct timespec         total_sleep_time;
70         /* The raw monotonic time for the CLOCK_MONOTONIC_RAW posix clock. */
71         struct timespec         raw_time;
72         /* Offset clock monotonic -> clock realtime */
73         ktime_t                 offs_real;
74         /* Offset clock monotonic -> clock boottime */
75         ktime_t                 offs_boot;
76         /* Seqlock for all timekeeper values */
77         seqlock_t               lock;
78 };
79
80 static struct timekeeper timekeeper;
81
82 /*
83  * This read-write spinlock protects us from races in SMP while
84  * playing with xtime.
85  */
86 __cacheline_aligned_in_smp DEFINE_SEQLOCK(xtime_lock);
87
88 /* flag for if timekeeping is suspended */
89 int __read_mostly timekeeping_suspended;
90
91 static inline void tk_normalize_xtime(struct timekeeper *tk)
92 {
93         while (tk->xtime_nsec >= ((u64)NSEC_PER_SEC << tk->shift)) {
94                 tk->xtime_nsec -= (u64)NSEC_PER_SEC << tk->shift;
95                 tk->xtime_sec++;
96         }
97 }
98
99 static struct timespec tk_xtime(struct timekeeper *tk)
100 {
101         struct timespec ts;
102
103         ts.tv_sec = tk->xtime_sec;
104         ts.tv_nsec = (long)(tk->xtime_nsec >> tk->shift);
105         return ts;
106 }
107
108 static void tk_set_xtime(struct timekeeper *tk, const struct timespec *ts)
109 {
110         tk->xtime_sec = ts->tv_sec;
111         tk->xtime_nsec = (u64)ts->tv_nsec << tk->shift;
112 }
113
114 static void tk_xtime_add(struct timekeeper *tk, const struct timespec *ts)
115 {
116         tk->xtime_sec += ts->tv_sec;
117         tk->xtime_nsec += (u64)ts->tv_nsec << tk->shift;
118 }
119
120 /**
121  * timekeeper_setup_internals - Set up internals to use clocksource clock.
122  *
123  * @clock:              Pointer to clocksource.
124  *
125  * Calculates a fixed cycle/nsec interval for a given clocksource/adjustment
126  * pair and interval request.
127  *
128  * Unless you're the timekeeping code, you should not be using this!
129  */
130 static void tk_setup_internals(struct timekeeper *tk, struct clocksource *clock)
131 {
132         cycle_t interval;
133         u64 tmp, ntpinterval;
134         struct clocksource *old_clock;
135
136         old_clock = tk->clock;
137         tk->clock = clock;
138         clock->cycle_last = clock->read(clock);
139
140         /* Do the ns -> cycle conversion first, using original mult */
141         tmp = NTP_INTERVAL_LENGTH;
142         tmp <<= clock->shift;
143         ntpinterval = tmp;
144         tmp += clock->mult/2;
145         do_div(tmp, clock->mult);
146         if (tmp == 0)
147                 tmp = 1;
148
149         interval = (cycle_t) tmp;
150         tk->cycle_interval = interval;
151
152         /* Go back from cycles -> shifted ns */
153         tk->xtime_interval = (u64) interval * clock->mult;
154         tk->xtime_remainder = ntpinterval - tk->xtime_interval;
155         tk->raw_interval =
156                 ((u64) interval * clock->mult) >> clock->shift;
157
158          /* if changing clocks, convert xtime_nsec shift units */
159         if (old_clock) {
160                 int shift_change = clock->shift - old_clock->shift;
161                 if (shift_change < 0)
162                         tk->xtime_nsec >>= -shift_change;
163                 else
164                         tk->xtime_nsec <<= shift_change;
165         }
166         tk->shift = clock->shift;
167
168         tk->ntp_error = 0;
169         tk->ntp_error_shift = NTP_SCALE_SHIFT - clock->shift;
170
171         /*
172          * The timekeeper keeps its own mult values for the currently
173          * active clocksource. These value will be adjusted via NTP
174          * to counteract clock drifting.
175          */
176         tk->mult = clock->mult;
177 }
178
179 /* Timekeeper helper functions. */
180 static inline s64 timekeeping_get_ns(struct timekeeper *tk)
181 {
182         cycle_t cycle_now, cycle_delta;
183         struct clocksource *clock;
184         s64 nsec;
185
186         /* read clocksource: */
187         clock = tk->clock;
188         cycle_now = clock->read(clock);
189
190         /* calculate the delta since the last update_wall_time: */
191         cycle_delta = (cycle_now - clock->cycle_last) & clock->mask;
192
193         nsec = cycle_delta * tk->mult + tk->xtime_nsec;
194         nsec >>= tk->shift;
195
196         /* If arch requires, add in gettimeoffset() */
197         return nsec + arch_gettimeoffset();
198 }
199
200 static inline s64 timekeeping_get_ns_raw(struct timekeeper *tk)
201 {
202         cycle_t cycle_now, cycle_delta;
203         struct clocksource *clock;
204         s64 nsec;
205
206         /* read clocksource: */
207         clock = tk->clock;
208         cycle_now = clock->read(clock);
209
210         /* calculate the delta since the last update_wall_time: */
211         cycle_delta = (cycle_now - clock->cycle_last) & clock->mask;
212
213         /* convert delta to nanoseconds. */
214         nsec = clocksource_cyc2ns(cycle_delta, clock->mult, clock->shift);
215
216         /* If arch requires, add in gettimeoffset() */
217         return nsec + arch_gettimeoffset();
218 }
219
220 static void update_rt_offset(struct timekeeper *tk)
221 {
222         struct timespec tmp, *wtm = &tk->wall_to_monotonic;
223
224         set_normalized_timespec(&tmp, -wtm->tv_sec, -wtm->tv_nsec);
225         tk->offs_real = timespec_to_ktime(tmp);
226 }
227
228 /* must hold write on timekeeper.lock */
229 static void timekeeping_update(struct timekeeper *tk, bool clearntp)
230 {
231         struct timespec xt;
232
233         if (clearntp) {
234                 tk->ntp_error = 0;
235                 ntp_clear();
236         }
237         update_rt_offset(tk);
238         xt = tk_xtime(tk);
239         update_vsyscall(&xt, &tk->wall_to_monotonic, tk->clock, tk->mult);
240 }
241
242 /**
243  * timekeeping_forward_now - update clock to the current time
244  *
245  * Forward the current clock to update its state since the last call to
246  * update_wall_time(). This is useful before significant clock changes,
247  * as it avoids having to deal with this time offset explicitly.
248  */
249 static void timekeeping_forward_now(struct timekeeper *tk)
250 {
251         cycle_t cycle_now, cycle_delta;
252         struct clocksource *clock;
253         s64 nsec;
254
255         clock = tk->clock;
256         cycle_now = clock->read(clock);
257         cycle_delta = (cycle_now - clock->cycle_last) & clock->mask;
258         clock->cycle_last = cycle_now;
259
260         tk->xtime_nsec += cycle_delta * tk->mult;
261
262         /* If arch requires, add in gettimeoffset() */
263         tk->xtime_nsec += arch_gettimeoffset() << tk->shift;
264
265         tk_normalize_xtime(tk);
266
267         nsec = clocksource_cyc2ns(cycle_delta, clock->mult, clock->shift);
268         timespec_add_ns(&tk->raw_time, nsec);
269 }
270
271 /**
272  * getnstimeofday - Returns the time of day in a timespec
273  * @ts:         pointer to the timespec to be set
274  *
275  * Returns the time of day in a timespec.
276  */
277 void getnstimeofday(struct timespec *ts)
278 {
279         unsigned long seq;
280         s64 nsecs = 0;
281
282         WARN_ON(timekeeping_suspended);
283
284         do {
285                 seq = read_seqbegin(&timekeeper.lock);
286
287                 ts->tv_sec = timekeeper.xtime_sec;
288                 ts->tv_nsec = timekeeping_get_ns(&timekeeper);
289
290         } while (read_seqretry(&timekeeper.lock, seq));
291
292         timespec_add_ns(ts, nsecs);
293 }
294 EXPORT_SYMBOL(getnstimeofday);
295
296 ktime_t ktime_get(void)
297 {
298         unsigned int seq;
299         s64 secs, nsecs;
300
301         WARN_ON(timekeeping_suspended);
302
303         do {
304                 seq = read_seqbegin(&timekeeper.lock);
305                 secs = timekeeper.xtime_sec +
306                                 timekeeper.wall_to_monotonic.tv_sec;
307                 nsecs = timekeeping_get_ns(&timekeeper) +
308                                 timekeeper.wall_to_monotonic.tv_nsec;
309
310         } while (read_seqretry(&timekeeper.lock, seq));
311         /*
312          * Use ktime_set/ktime_add_ns to create a proper ktime on
313          * 32-bit architectures without CONFIG_KTIME_SCALAR.
314          */
315         return ktime_add_ns(ktime_set(secs, 0), nsecs);
316 }
317 EXPORT_SYMBOL_GPL(ktime_get);
318
319 /**
320  * ktime_get_ts - get the monotonic clock in timespec format
321  * @ts:         pointer to timespec variable
322  *
323  * The function calculates the monotonic clock from the realtime
324  * clock and the wall_to_monotonic offset and stores the result
325  * in normalized timespec format in the variable pointed to by @ts.
326  */
327 void ktime_get_ts(struct timespec *ts)
328 {
329         struct timespec tomono;
330         unsigned int seq;
331
332         WARN_ON(timekeeping_suspended);
333
334         do {
335                 seq = read_seqbegin(&timekeeper.lock);
336                 ts->tv_sec = timekeeper.xtime_sec;
337                 ts->tv_nsec = timekeeping_get_ns(&timekeeper);
338                 tomono = timekeeper.wall_to_monotonic;
339
340         } while (read_seqretry(&timekeeper.lock, seq));
341
342         set_normalized_timespec(ts, ts->tv_sec + tomono.tv_sec,
343                                 ts->tv_nsec + tomono.tv_nsec);
344 }
345 EXPORT_SYMBOL_GPL(ktime_get_ts);
346
347 #ifdef CONFIG_NTP_PPS
348
349 /**
350  * getnstime_raw_and_real - get day and raw monotonic time in timespec format
351  * @ts_raw:     pointer to the timespec to be set to raw monotonic time
352  * @ts_real:    pointer to the timespec to be set to the time of day
353  *
354  * This function reads both the time of day and raw monotonic time at the
355  * same time atomically and stores the resulting timestamps in timespec
356  * format.
357  */
358 void getnstime_raw_and_real(struct timespec *ts_raw, struct timespec *ts_real)
359 {
360         unsigned long seq;
361         s64 nsecs_raw, nsecs_real;
362
363         WARN_ON_ONCE(timekeeping_suspended);
364
365         do {
366                 seq = read_seqbegin(&timekeeper.lock);
367
368                 *ts_raw = timekeeper.raw_time;
369                 ts_real->tv_sec = timekeeper.xtime_sec;
370                 ts_real->tv_nsec = 0;
371
372                 nsecs_raw = timekeeping_get_ns_raw(&timekeeper);
373                 nsecs_real = timekeeping_get_ns(&timekeeper);
374
375         } while (read_seqretry(&timekeeper.lock, seq));
376
377         timespec_add_ns(ts_raw, nsecs_raw);
378         timespec_add_ns(ts_real, nsecs_real);
379 }
380 EXPORT_SYMBOL(getnstime_raw_and_real);
381
382 #endif /* CONFIG_NTP_PPS */
383
384 /**
385  * do_gettimeofday - Returns the time of day in a timeval
386  * @tv:         pointer to the timeval to be set
387  *
388  * NOTE: Users should be converted to using getnstimeofday()
389  */
390 void do_gettimeofday(struct timeval *tv)
391 {
392         struct timespec now;
393
394         getnstimeofday(&now);
395         tv->tv_sec = now.tv_sec;
396         tv->tv_usec = now.tv_nsec/1000;
397 }
398 EXPORT_SYMBOL(do_gettimeofday);
399
400 /**
401  * do_settimeofday - Sets the time of day
402  * @tv:         pointer to the timespec variable containing the new time
403  *
404  * Sets the time of day to the new time and update NTP and notify hrtimers
405  */
406 int do_settimeofday(const struct timespec *tv)
407 {
408         struct timespec ts_delta, xt;
409         unsigned long flags;
410
411         if ((unsigned long)tv->tv_nsec >= NSEC_PER_SEC)
412                 return -EINVAL;
413
414         write_seqlock_irqsave(&timekeeper.lock, flags);
415
416         timekeeping_forward_now(&timekeeper);
417
418         xt = tk_xtime(&timekeeper);
419         ts_delta.tv_sec = tv->tv_sec - xt.tv_sec;
420         ts_delta.tv_nsec = tv->tv_nsec - xt.tv_nsec;
421
422         timekeeper.wall_to_monotonic =
423                         timespec_sub(timekeeper.wall_to_monotonic, ts_delta);
424
425         tk_set_xtime(&timekeeper, tv);
426
427         timekeeping_update(&timekeeper, true);
428
429         write_sequnlock_irqrestore(&timekeeper.lock, flags);
430
431         /* signal hrtimers about time change */
432         clock_was_set();
433
434         return 0;
435 }
436 EXPORT_SYMBOL(do_settimeofday);
437
438 /**
439  * timekeeping_inject_offset - Adds or subtracts from the current time.
440  * @tv:         pointer to the timespec variable containing the offset
441  *
442  * Adds or subtracts an offset value from the current time.
443  */
444 int timekeeping_inject_offset(struct timespec *ts)
445 {
446         unsigned long flags;
447
448         if ((unsigned long)ts->tv_nsec >= NSEC_PER_SEC)
449                 return -EINVAL;
450
451         write_seqlock_irqsave(&timekeeper.lock, flags);
452
453         timekeeping_forward_now(&timekeeper);
454
455
456         tk_xtime_add(&timekeeper, ts);
457         timekeeper.wall_to_monotonic =
458                                 timespec_sub(timekeeper.wall_to_monotonic, *ts);
459
460         timekeeping_update(&timekeeper, true);
461
462         write_sequnlock_irqrestore(&timekeeper.lock, flags);
463
464         /* signal hrtimers about time change */
465         clock_was_set();
466
467         return 0;
468 }
469 EXPORT_SYMBOL(timekeeping_inject_offset);
470
471 /**
472  * change_clocksource - Swaps clocksources if a new one is available
473  *
474  * Accumulates current time interval and initializes new clocksource
475  */
476 static int change_clocksource(void *data)
477 {
478         struct clocksource *new, *old;
479         unsigned long flags;
480
481         new = (struct clocksource *) data;
482
483         write_seqlock_irqsave(&timekeeper.lock, flags);
484
485         timekeeping_forward_now(&timekeeper);
486         if (!new->enable || new->enable(new) == 0) {
487                 old = timekeeper.clock;
488                 tk_setup_internals(&timekeeper, new);
489                 if (old->disable)
490                         old->disable(old);
491         }
492         timekeeping_update(&timekeeper, true);
493
494         write_sequnlock_irqrestore(&timekeeper.lock, flags);
495
496         return 0;
497 }
498
499 /**
500  * timekeeping_notify - Install a new clock source
501  * @clock:              pointer to the clock source
502  *
503  * This function is called from clocksource.c after a new, better clock
504  * source has been registered. The caller holds the clocksource_mutex.
505  */
506 void timekeeping_notify(struct clocksource *clock)
507 {
508         if (timekeeper.clock == clock)
509                 return;
510         stop_machine(change_clocksource, clock, NULL);
511         tick_clock_notify();
512 }
513
514 /**
515  * ktime_get_real - get the real (wall-) time in ktime_t format
516  *
517  * returns the time in ktime_t format
518  */
519 ktime_t ktime_get_real(void)
520 {
521         struct timespec now;
522
523         getnstimeofday(&now);
524
525         return timespec_to_ktime(now);
526 }
527 EXPORT_SYMBOL_GPL(ktime_get_real);
528
529 /**
530  * getrawmonotonic - Returns the raw monotonic time in a timespec
531  * @ts:         pointer to the timespec to be set
532  *
533  * Returns the raw monotonic time (completely un-modified by ntp)
534  */
535 void getrawmonotonic(struct timespec *ts)
536 {
537         unsigned long seq;
538         s64 nsecs;
539
540         do {
541                 seq = read_seqbegin(&timekeeper.lock);
542                 nsecs = timekeeping_get_ns_raw(&timekeeper);
543                 *ts = timekeeper.raw_time;
544
545         } while (read_seqretry(&timekeeper.lock, seq));
546
547         timespec_add_ns(ts, nsecs);
548 }
549 EXPORT_SYMBOL(getrawmonotonic);
550
551 /**
552  * timekeeping_valid_for_hres - Check if timekeeping is suitable for hres
553  */
554 int timekeeping_valid_for_hres(void)
555 {
556         unsigned long seq;
557         int ret;
558
559         do {
560                 seq = read_seqbegin(&timekeeper.lock);
561
562                 ret = timekeeper.clock->flags & CLOCK_SOURCE_VALID_FOR_HRES;
563
564         } while (read_seqretry(&timekeeper.lock, seq));
565
566         return ret;
567 }
568
569 /**
570  * timekeeping_max_deferment - Returns max time the clocksource can be deferred
571  */
572 u64 timekeeping_max_deferment(void)
573 {
574         unsigned long seq;
575         u64 ret;
576
577         do {
578                 seq = read_seqbegin(&timekeeper.lock);
579
580                 ret = timekeeper.clock->max_idle_ns;
581
582         } while (read_seqretry(&timekeeper.lock, seq));
583
584         return ret;
585 }
586
587 /**
588  * read_persistent_clock -  Return time from the persistent clock.
589  *
590  * Weak dummy function for arches that do not yet support it.
591  * Reads the time from the battery backed persistent clock.
592  * Returns a timespec with tv_sec=0 and tv_nsec=0 if unsupported.
593  *
594  *  XXX - Do be sure to remove it once all arches implement it.
595  */
596 void __attribute__((weak)) read_persistent_clock(struct timespec *ts)
597 {
598         ts->tv_sec = 0;
599         ts->tv_nsec = 0;
600 }
601
602 /**
603  * read_boot_clock -  Return time of the system start.
604  *
605  * Weak dummy function for arches that do not yet support it.
606  * Function to read the exact time the system has been started.
607  * Returns a timespec with tv_sec=0 and tv_nsec=0 if unsupported.
608  *
609  *  XXX - Do be sure to remove it once all arches implement it.
610  */
611 void __attribute__((weak)) read_boot_clock(struct timespec *ts)
612 {
613         ts->tv_sec = 0;
614         ts->tv_nsec = 0;
615 }
616
617 /*
618  * timekeeping_init - Initializes the clocksource and common timekeeping values
619  */
620 void __init timekeeping_init(void)
621 {
622         struct clocksource *clock;
623         unsigned long flags;
624         struct timespec now, boot;
625
626         read_persistent_clock(&now);
627         read_boot_clock(&boot);
628
629         seqlock_init(&timekeeper.lock);
630
631         ntp_init();
632
633         write_seqlock_irqsave(&timekeeper.lock, flags);
634         clock = clocksource_default_clock();
635         if (clock->enable)
636                 clock->enable(clock);
637         tk_setup_internals(&timekeeper, clock);
638
639         tk_set_xtime(&timekeeper, &now);
640         timekeeper.raw_time.tv_sec = 0;
641         timekeeper.raw_time.tv_nsec = 0;
642         if (boot.tv_sec == 0 && boot.tv_nsec == 0)
643                 boot = tk_xtime(&timekeeper);
644
645         set_normalized_timespec(&timekeeper.wall_to_monotonic,
646                                 -boot.tv_sec, -boot.tv_nsec);
647         update_rt_offset(&timekeeper);
648         timekeeper.total_sleep_time.tv_sec = 0;
649         timekeeper.total_sleep_time.tv_nsec = 0;
650         write_sequnlock_irqrestore(&timekeeper.lock, flags);
651 }
652
653 /* time in seconds when suspend began */
654 static struct timespec timekeeping_suspend_time;
655
656 static void update_sleep_time(struct timespec t)
657 {
658         timekeeper.total_sleep_time = t;
659         timekeeper.offs_boot = timespec_to_ktime(t);
660 }
661
662 /**
663  * __timekeeping_inject_sleeptime - Internal function to add sleep interval
664  * @delta: pointer to a timespec delta value
665  *
666  * Takes a timespec offset measuring a suspend interval and properly
667  * adds the sleep offset to the timekeeping variables.
668  */
669 static void __timekeeping_inject_sleeptime(struct timekeeper *tk,
670                                                         struct timespec *delta)
671 {
672         if (!timespec_valid(delta)) {
673                 printk(KERN_WARNING "__timekeeping_inject_sleeptime: Invalid "
674                                         "sleep delta value!\n");
675                 return;
676         }
677
678         tk_xtime_add(tk, delta);
679         tk->wall_to_monotonic = timespec_sub(tk->wall_to_monotonic, *delta);
680         update_sleep_time(timespec_add(tk->total_sleep_time, *delta));
681 }
682
683 /**
684  * timekeeping_inject_sleeptime - Adds suspend interval to timeekeeping values
685  * @delta: pointer to a timespec delta value
686  *
687  * This hook is for architectures that cannot support read_persistent_clock
688  * because their RTC/persistent clock is only accessible when irqs are enabled.
689  *
690  * This function should only be called by rtc_resume(), and allows
691  * a suspend offset to be injected into the timekeeping values.
692  */
693 void timekeeping_inject_sleeptime(struct timespec *delta)
694 {
695         unsigned long flags;
696         struct timespec ts;
697
698         /* Make sure we don't set the clock twice */
699         read_persistent_clock(&ts);
700         if (!(ts.tv_sec == 0 && ts.tv_nsec == 0))
701                 return;
702
703         write_seqlock_irqsave(&timekeeper.lock, flags);
704
705         timekeeping_forward_now(&timekeeper);
706
707         __timekeeping_inject_sleeptime(&timekeeper, delta);
708
709         timekeeping_update(&timekeeper, true);
710
711         write_sequnlock_irqrestore(&timekeeper.lock, flags);
712
713         /* signal hrtimers about time change */
714         clock_was_set();
715 }
716
717 /**
718  * timekeeping_resume - Resumes the generic timekeeping subsystem.
719  *
720  * This is for the generic clocksource timekeeping.
721  * xtime/wall_to_monotonic/jiffies/etc are
722  * still managed by arch specific suspend/resume code.
723  */
724 static void timekeeping_resume(void)
725 {
726         unsigned long flags;
727         struct timespec ts;
728
729         read_persistent_clock(&ts);
730
731         clocksource_resume();
732
733         write_seqlock_irqsave(&timekeeper.lock, flags);
734
735         if (timespec_compare(&ts, &timekeeping_suspend_time) > 0) {
736                 ts = timespec_sub(ts, timekeeping_suspend_time);
737                 __timekeeping_inject_sleeptime(&timekeeper, &ts);
738         }
739         /* re-base the last cycle value */
740         timekeeper.clock->cycle_last = timekeeper.clock->read(timekeeper.clock);
741         timekeeper.ntp_error = 0;
742         timekeeping_suspended = 0;
743         timekeeping_update(&timekeeper, false);
744         write_sequnlock_irqrestore(&timekeeper.lock, flags);
745
746         touch_softlockup_watchdog();
747
748         clockevents_notify(CLOCK_EVT_NOTIFY_RESUME, NULL);
749
750         /* Resume hrtimers */
751         hrtimers_resume();
752 }
753
754 static int timekeeping_suspend(void)
755 {
756         unsigned long flags;
757         struct timespec         delta, delta_delta;
758         static struct timespec  old_delta;
759
760         read_persistent_clock(&timekeeping_suspend_time);
761
762         write_seqlock_irqsave(&timekeeper.lock, flags);
763         timekeeping_forward_now(&timekeeper);
764         timekeeping_suspended = 1;
765
766         /*
767          * To avoid drift caused by repeated suspend/resumes,
768          * which each can add ~1 second drift error,
769          * try to compensate so the difference in system time
770          * and persistent_clock time stays close to constant.
771          */
772         delta = timespec_sub(tk_xtime(&timekeeper), timekeeping_suspend_time);
773         delta_delta = timespec_sub(delta, old_delta);
774         if (abs(delta_delta.tv_sec)  >= 2) {
775                 /*
776                  * if delta_delta is too large, assume time correction
777                  * has occured and set old_delta to the current delta.
778                  */
779                 old_delta = delta;
780         } else {
781                 /* Otherwise try to adjust old_system to compensate */
782                 timekeeping_suspend_time =
783                         timespec_add(timekeeping_suspend_time, delta_delta);
784         }
785         write_sequnlock_irqrestore(&timekeeper.lock, flags);
786
787         clockevents_notify(CLOCK_EVT_NOTIFY_SUSPEND, NULL);
788         clocksource_suspend();
789
790         return 0;
791 }
792
793 /* sysfs resume/suspend bits for timekeeping */
794 static struct syscore_ops timekeeping_syscore_ops = {
795         .resume         = timekeeping_resume,
796         .suspend        = timekeeping_suspend,
797 };
798
799 static int __init timekeeping_init_ops(void)
800 {
801         register_syscore_ops(&timekeeping_syscore_ops);
802         return 0;
803 }
804
805 device_initcall(timekeeping_init_ops);
806
807 /*
808  * If the error is already larger, we look ahead even further
809  * to compensate for late or lost adjustments.
810  */
811 static __always_inline int timekeeping_bigadjust(struct timekeeper *tk,
812                                                  s64 error, s64 *interval,
813                                                  s64 *offset)
814 {
815         s64 tick_error, i;
816         u32 look_ahead, adj;
817         s32 error2, mult;
818
819         /*
820          * Use the current error value to determine how much to look ahead.
821          * The larger the error the slower we adjust for it to avoid problems
822          * with losing too many ticks, otherwise we would overadjust and
823          * produce an even larger error.  The smaller the adjustment the
824          * faster we try to adjust for it, as lost ticks can do less harm
825          * here.  This is tuned so that an error of about 1 msec is adjusted
826          * within about 1 sec (or 2^20 nsec in 2^SHIFT_HZ ticks).
827          */
828         error2 = tk->ntp_error >> (NTP_SCALE_SHIFT + 22 - 2 * SHIFT_HZ);
829         error2 = abs(error2);
830         for (look_ahead = 0; error2 > 0; look_ahead++)
831                 error2 >>= 2;
832
833         /*
834          * Now calculate the error in (1 << look_ahead) ticks, but first
835          * remove the single look ahead already included in the error.
836          */
837         tick_error = ntp_tick_length() >> (tk->ntp_error_shift + 1);
838         tick_error -= tk->xtime_interval >> 1;
839         error = ((error - tick_error) >> look_ahead) + tick_error;
840
841         /* Finally calculate the adjustment shift value.  */
842         i = *interval;
843         mult = 1;
844         if (error < 0) {
845                 error = -error;
846                 *interval = -*interval;
847                 *offset = -*offset;
848                 mult = -1;
849         }
850         for (adj = 0; error > i; adj++)
851                 error >>= 1;
852
853         *interval <<= adj;
854         *offset <<= adj;
855         return mult << adj;
856 }
857
858 /*
859  * Adjust the multiplier to reduce the error value,
860  * this is optimized for the most common adjustments of -1,0,1,
861  * for other values we can do a bit more work.
862  */
863 static void timekeeping_adjust(struct timekeeper *tk, s64 offset)
864 {
865         s64 error, interval = tk->cycle_interval;
866         int adj;
867
868         /*
869          * The point of this is to check if the error is greater than half
870          * an interval.
871          *
872          * First we shift it down from NTP_SHIFT to clocksource->shifted nsecs.
873          *
874          * Note we subtract one in the shift, so that error is really error*2.
875          * This "saves" dividing(shifting) interval twice, but keeps the
876          * (error > interval) comparison as still measuring if error is
877          * larger than half an interval.
878          *
879          * Note: It does not "save" on aggravation when reading the code.
880          */
881         error = tk->ntp_error >> (tk->ntp_error_shift - 1);
882         if (error > interval) {
883                 /*
884                  * We now divide error by 4(via shift), which checks if
885                  * the error is greater than twice the interval.
886                  * If it is greater, we need a bigadjust, if its smaller,
887                  * we can adjust by 1.
888                  */
889                 error >>= 2;
890                 /*
891                  * XXX - In update_wall_time, we round up to the next
892                  * nanosecond, and store the amount rounded up into
893                  * the error. This causes the likely below to be unlikely.
894                  *
895                  * The proper fix is to avoid rounding up by using
896                  * the high precision timekeeper.xtime_nsec instead of
897                  * xtime.tv_nsec everywhere. Fixing this will take some
898                  * time.
899                  */
900                 if (likely(error <= interval))
901                         adj = 1;
902                 else
903                         adj = timekeeping_bigadjust(tk, error, &interval,
904                                                         &offset);
905         } else if (error < -interval) {
906                 /* See comment above, this is just switched for the negative */
907                 error >>= 2;
908                 if (likely(error >= -interval)) {
909                         adj = -1;
910                         interval = -interval;
911                         offset = -offset;
912                 } else
913                         adj = timekeeping_bigadjust(tk, error, &interval,
914                                                         &offset);
915         } else
916                 return;
917
918         if (unlikely(tk->clock->maxadj &&
919                 (tk->mult + adj > tk->clock->mult + tk->clock->maxadj))) {
920                 printk_once(KERN_WARNING
921                         "Adjusting %s more than 11%% (%ld vs %ld)\n",
922                         tk->clock->name, (long)tk->mult + adj,
923                         (long)tk->clock->mult + tk->clock->maxadj);
924         }
925         /*
926          * So the following can be confusing.
927          *
928          * To keep things simple, lets assume adj == 1 for now.
929          *
930          * When adj != 1, remember that the interval and offset values
931          * have been appropriately scaled so the math is the same.
932          *
933          * The basic idea here is that we're increasing the multiplier
934          * by one, this causes the xtime_interval to be incremented by
935          * one cycle_interval. This is because:
936          *      xtime_interval = cycle_interval * mult
937          * So if mult is being incremented by one:
938          *      xtime_interval = cycle_interval * (mult + 1)
939          * Its the same as:
940          *      xtime_interval = (cycle_interval * mult) + cycle_interval
941          * Which can be shortened to:
942          *      xtime_interval += cycle_interval
943          *
944          * So offset stores the non-accumulated cycles. Thus the current
945          * time (in shifted nanoseconds) is:
946          *      now = (offset * adj) + xtime_nsec
947          * Now, even though we're adjusting the clock frequency, we have
948          * to keep time consistent. In other words, we can't jump back
949          * in time, and we also want to avoid jumping forward in time.
950          *
951          * So given the same offset value, we need the time to be the same
952          * both before and after the freq adjustment.
953          *      now = (offset * adj_1) + xtime_nsec_1
954          *      now = (offset * adj_2) + xtime_nsec_2
955          * So:
956          *      (offset * adj_1) + xtime_nsec_1 =
957          *              (offset * adj_2) + xtime_nsec_2
958          * And we know:
959          *      adj_2 = adj_1 + 1
960          * So:
961          *      (offset * adj_1) + xtime_nsec_1 =
962          *              (offset * (adj_1+1)) + xtime_nsec_2
963          *      (offset * adj_1) + xtime_nsec_1 =
964          *              (offset * adj_1) + offset + xtime_nsec_2
965          * Canceling the sides:
966          *      xtime_nsec_1 = offset + xtime_nsec_2
967          * Which gives us:
968          *      xtime_nsec_2 = xtime_nsec_1 - offset
969          * Which simplfies to:
970          *      xtime_nsec -= offset
971          *
972          * XXX - TODO: Doc ntp_error calculation.
973          */
974         tk->mult += adj;
975         tk->xtime_interval += interval;
976         tk->xtime_nsec -= offset;
977         tk->ntp_error -= (interval - offset) << tk->ntp_error_shift;
978
979         /*
980          * It may be possible that when we entered this function, xtime_nsec
981          * was very small.  Further, if we're slightly speeding the clocksource
982          * in the code above, its possible the required corrective factor to
983          * xtime_nsec could cause it to underflow.
984          *
985          * Now, since we already accumulated the second, cannot simply roll
986          * the accumulated second back, since the NTP subsystem has been
987          * notified via second_overflow. So instead we push xtime_nsec forward
988          * by the amount we underflowed, and add that amount into the error.
989          *
990          * We'll correct this error next time through this function, when
991          * xtime_nsec is not as small.
992          */
993         if (unlikely((s64)tk->xtime_nsec < 0)) {
994                 s64 neg = -(s64)tk->xtime_nsec;
995                 tk->xtime_nsec = 0;
996                 tk->ntp_error += neg << tk->ntp_error_shift;
997         }
998
999 }
1000
1001 /**
1002  * accumulate_nsecs_to_secs - Accumulates nsecs into secs
1003  *
1004  * Helper function that accumulates a the nsecs greater then a second
1005  * from the xtime_nsec field to the xtime_secs field.
1006  * It also calls into the NTP code to handle leapsecond processing.
1007  *
1008  */
1009 static inline void accumulate_nsecs_to_secs(struct timekeeper *tk)
1010 {
1011         u64 nsecps = (u64)NSEC_PER_SEC << tk->shift;
1012
1013         while (tk->xtime_nsec >= nsecps) {
1014                 int leap;
1015
1016                 tk->xtime_nsec -= nsecps;
1017                 tk->xtime_sec++;
1018
1019                 /* Figure out if its a leap sec and apply if needed */
1020                 leap = second_overflow(tk->xtime_sec);
1021                 tk->xtime_sec += leap;
1022                 tk->wall_to_monotonic.tv_sec -= leap;
1023                 if (leap)
1024                         clock_was_set_delayed();
1025
1026         }
1027 }
1028
1029 /**
1030  * logarithmic_accumulation - shifted accumulation of cycles
1031  *
1032  * This functions accumulates a shifted interval of cycles into
1033  * into a shifted interval nanoseconds. Allows for O(log) accumulation
1034  * loop.
1035  *
1036  * Returns the unconsumed cycles.
1037  */
1038 static cycle_t logarithmic_accumulation(struct timekeeper *tk, cycle_t offset,
1039                                                 u32 shift)
1040 {
1041         u64 raw_nsecs;
1042
1043         /* If the offset is smaller then a shifted interval, do nothing */
1044         if (offset < tk->cycle_interval<<shift)
1045                 return offset;
1046
1047         /* Accumulate one shifted interval */
1048         offset -= tk->cycle_interval << shift;
1049         tk->clock->cycle_last += tk->cycle_interval << shift;
1050
1051         tk->xtime_nsec += tk->xtime_interval << shift;
1052         accumulate_nsecs_to_secs(tk);
1053
1054         /* Accumulate raw time */
1055         raw_nsecs = tk->raw_interval << shift;
1056         raw_nsecs += tk->raw_time.tv_nsec;
1057         if (raw_nsecs >= NSEC_PER_SEC) {
1058                 u64 raw_secs = raw_nsecs;
1059                 raw_nsecs = do_div(raw_secs, NSEC_PER_SEC);
1060                 tk->raw_time.tv_sec += raw_secs;
1061         }
1062         tk->raw_time.tv_nsec = raw_nsecs;
1063
1064         /* Accumulate error between NTP and clock interval */
1065         tk->ntp_error += ntp_tick_length() << shift;
1066         tk->ntp_error -= (tk->xtime_interval + tk->xtime_remainder) <<
1067                                                 (tk->ntp_error_shift + shift);
1068
1069         return offset;
1070 }
1071
1072 /**
1073  * update_wall_time - Uses the current clocksource to increment the wall time
1074  *
1075  */
1076 static void update_wall_time(void)
1077 {
1078         struct clocksource *clock;
1079         cycle_t offset;
1080         int shift = 0, maxshift;
1081         unsigned long flags;
1082         s64 remainder;
1083
1084         write_seqlock_irqsave(&timekeeper.lock, flags);
1085
1086         /* Make sure we're fully resumed: */
1087         if (unlikely(timekeeping_suspended))
1088                 goto out;
1089
1090         clock = timekeeper.clock;
1091
1092 #ifdef CONFIG_ARCH_USES_GETTIMEOFFSET
1093         offset = timekeeper.cycle_interval;
1094 #else
1095         offset = (clock->read(clock) - clock->cycle_last) & clock->mask;
1096 #endif
1097
1098         /*
1099          * With NO_HZ we may have to accumulate many cycle_intervals
1100          * (think "ticks") worth of time at once. To do this efficiently,
1101          * we calculate the largest doubling multiple of cycle_intervals
1102          * that is smaller than the offset.  We then accumulate that
1103          * chunk in one go, and then try to consume the next smaller
1104          * doubled multiple.
1105          */
1106         shift = ilog2(offset) - ilog2(timekeeper.cycle_interval);
1107         shift = max(0, shift);
1108         /* Bound shift to one less than what overflows tick_length */
1109         maxshift = (64 - (ilog2(ntp_tick_length())+1)) - 1;
1110         shift = min(shift, maxshift);
1111         while (offset >= timekeeper.cycle_interval) {
1112                 offset = logarithmic_accumulation(&timekeeper, offset, shift);
1113                 if(offset < timekeeper.cycle_interval<<shift)
1114                         shift--;
1115         }
1116
1117         /* correct the clock when NTP error is too big */
1118         timekeeping_adjust(&timekeeper, offset);
1119
1120
1121         /*
1122         * Store only full nanoseconds into xtime_nsec after rounding
1123         * it up and add the remainder to the error difference.
1124         * XXX - This is necessary to avoid small 1ns inconsistnecies caused
1125         * by truncating the remainder in vsyscalls. However, it causes
1126         * additional work to be done in timekeeping_adjust(). Once
1127         * the vsyscall implementations are converted to use xtime_nsec
1128         * (shifted nanoseconds), this can be killed.
1129         */
1130         remainder = timekeeper.xtime_nsec & ((1 << timekeeper.shift) - 1);
1131         timekeeper.xtime_nsec -= remainder;
1132         timekeeper.xtime_nsec += 1 << timekeeper.shift;
1133         timekeeper.ntp_error += remainder << timekeeper.ntp_error_shift;
1134
1135         /*
1136          * Finally, make sure that after the rounding
1137          * xtime_nsec isn't larger than NSEC_PER_SEC
1138          */
1139         accumulate_nsecs_to_secs(&timekeeper);
1140
1141         timekeeping_update(&timekeeper, false);
1142
1143 out:
1144         write_sequnlock_irqrestore(&timekeeper.lock, flags);
1145
1146 }
1147
1148 /**
1149  * getboottime - Return the real time of system boot.
1150  * @ts:         pointer to the timespec to be set
1151  *
1152  * Returns the wall-time of boot in a timespec.
1153  *
1154  * This is based on the wall_to_monotonic offset and the total suspend
1155  * time. Calls to settimeofday will affect the value returned (which
1156  * basically means that however wrong your real time clock is at boot time,
1157  * you get the right time here).
1158  */
1159 void getboottime(struct timespec *ts)
1160 {
1161         struct timespec boottime = {
1162                 .tv_sec = timekeeper.wall_to_monotonic.tv_sec +
1163                                 timekeeper.total_sleep_time.tv_sec,
1164                 .tv_nsec = timekeeper.wall_to_monotonic.tv_nsec +
1165                                 timekeeper.total_sleep_time.tv_nsec
1166         };
1167
1168         set_normalized_timespec(ts, -boottime.tv_sec, -boottime.tv_nsec);
1169 }
1170 EXPORT_SYMBOL_GPL(getboottime);
1171
1172 /**
1173  * get_monotonic_boottime - Returns monotonic time since boot
1174  * @ts:         pointer to the timespec to be set
1175  *
1176  * Returns the monotonic time since boot in a timespec.
1177  *
1178  * This is similar to CLOCK_MONTONIC/ktime_get_ts, but also
1179  * includes the time spent in suspend.
1180  */
1181 void get_monotonic_boottime(struct timespec *ts)
1182 {
1183         struct timespec tomono, sleep;
1184         unsigned int seq;
1185
1186         WARN_ON(timekeeping_suspended);
1187
1188         do {
1189                 seq = read_seqbegin(&timekeeper.lock);
1190                 ts->tv_sec = timekeeper.xtime_sec;
1191                 ts->tv_nsec = timekeeping_get_ns(&timekeeper);
1192                 tomono = timekeeper.wall_to_monotonic;
1193                 sleep = timekeeper.total_sleep_time;
1194
1195         } while (read_seqretry(&timekeeper.lock, seq));
1196
1197         set_normalized_timespec(ts, ts->tv_sec + tomono.tv_sec + sleep.tv_sec,
1198                         ts->tv_nsec + tomono.tv_nsec + sleep.tv_nsec);
1199 }
1200 EXPORT_SYMBOL_GPL(get_monotonic_boottime);
1201
1202 /**
1203  * ktime_get_boottime - Returns monotonic time since boot in a ktime
1204  *
1205  * Returns the monotonic time since boot in a ktime
1206  *
1207  * This is similar to CLOCK_MONTONIC/ktime_get, but also
1208  * includes the time spent in suspend.
1209  */
1210 ktime_t ktime_get_boottime(void)
1211 {
1212         struct timespec ts;
1213
1214         get_monotonic_boottime(&ts);
1215         return timespec_to_ktime(ts);
1216 }
1217 EXPORT_SYMBOL_GPL(ktime_get_boottime);
1218
1219 /**
1220  * monotonic_to_bootbased - Convert the monotonic time to boot based.
1221  * @ts:         pointer to the timespec to be converted
1222  */
1223 void monotonic_to_bootbased(struct timespec *ts)
1224 {
1225         *ts = timespec_add(*ts, timekeeper.total_sleep_time);
1226 }
1227 EXPORT_SYMBOL_GPL(monotonic_to_bootbased);
1228
1229 unsigned long get_seconds(void)
1230 {
1231         return timekeeper.xtime_sec;
1232 }
1233 EXPORT_SYMBOL(get_seconds);
1234
1235 struct timespec __current_kernel_time(void)
1236 {
1237         return tk_xtime(&timekeeper);
1238 }
1239
1240 struct timespec current_kernel_time(void)
1241 {
1242         struct timespec now;
1243         unsigned long seq;
1244
1245         do {
1246                 seq = read_seqbegin(&timekeeper.lock);
1247
1248                 now = tk_xtime(&timekeeper);
1249         } while (read_seqretry(&timekeeper.lock, seq));
1250
1251         return now;
1252 }
1253 EXPORT_SYMBOL(current_kernel_time);
1254
1255 struct timespec get_monotonic_coarse(void)
1256 {
1257         struct timespec now, mono;
1258         unsigned long seq;
1259
1260         do {
1261                 seq = read_seqbegin(&timekeeper.lock);
1262
1263                 now = tk_xtime(&timekeeper);
1264                 mono = timekeeper.wall_to_monotonic;
1265         } while (read_seqretry(&timekeeper.lock, seq));
1266
1267         set_normalized_timespec(&now, now.tv_sec + mono.tv_sec,
1268                                 now.tv_nsec + mono.tv_nsec);
1269         return now;
1270 }
1271
1272 /*
1273  * The 64-bit jiffies value is not atomic - you MUST NOT read it
1274  * without sampling the sequence number in xtime_lock.
1275  * jiffies is defined in the linker script...
1276  */
1277 void do_timer(unsigned long ticks)
1278 {
1279         jiffies_64 += ticks;
1280         update_wall_time();
1281         calc_global_load(ticks);
1282 }
1283
1284 /**
1285  * get_xtime_and_monotonic_and_sleep_offset() - get xtime, wall_to_monotonic,
1286  *    and sleep offsets.
1287  * @xtim:       pointer to timespec to be set with xtime
1288  * @wtom:       pointer to timespec to be set with wall_to_monotonic
1289  * @sleep:      pointer to timespec to be set with time in suspend
1290  */
1291 void get_xtime_and_monotonic_and_sleep_offset(struct timespec *xtim,
1292                                 struct timespec *wtom, struct timespec *sleep)
1293 {
1294         unsigned long seq;
1295
1296         do {
1297                 seq = read_seqbegin(&timekeeper.lock);
1298                 *xtim = tk_xtime(&timekeeper);
1299                 *wtom = timekeeper.wall_to_monotonic;
1300                 *sleep = timekeeper.total_sleep_time;
1301         } while (read_seqretry(&timekeeper.lock, seq));
1302 }
1303
1304 #ifdef CONFIG_HIGH_RES_TIMERS
1305 /**
1306  * ktime_get_update_offsets - hrtimer helper
1307  * @offs_real:  pointer to storage for monotonic -> realtime offset
1308  * @offs_boot:  pointer to storage for monotonic -> boottime offset
1309  *
1310  * Returns current monotonic time and updates the offsets
1311  * Called from hrtimer_interupt() or retrigger_next_event()
1312  */
1313 ktime_t ktime_get_update_offsets(ktime_t *offs_real, ktime_t *offs_boot)
1314 {
1315         ktime_t now;
1316         unsigned int seq;
1317         u64 secs, nsecs;
1318
1319         do {
1320                 seq = read_seqbegin(&timekeeper.lock);
1321
1322                 secs = timekeeper.xtime_sec;
1323                 nsecs = timekeeping_get_ns(&timekeeper);
1324
1325                 *offs_real = timekeeper.offs_real;
1326                 *offs_boot = timekeeper.offs_boot;
1327         } while (read_seqretry(&timekeeper.lock, seq));
1328
1329         now = ktime_add_ns(ktime_set(secs, 0), nsecs);
1330         now = ktime_sub(now, *offs_real);
1331         return now;
1332 }
1333 #endif
1334
1335 /**
1336  * ktime_get_monotonic_offset() - get wall_to_monotonic in ktime_t format
1337  */
1338 ktime_t ktime_get_monotonic_offset(void)
1339 {
1340         unsigned long seq;
1341         struct timespec wtom;
1342
1343         do {
1344                 seq = read_seqbegin(&timekeeper.lock);
1345                 wtom = timekeeper.wall_to_monotonic;
1346         } while (read_seqretry(&timekeeper.lock, seq));
1347
1348         return timespec_to_ktime(wtom);
1349 }
1350 EXPORT_SYMBOL_GPL(ktime_get_monotonic_offset);
1351
1352 /**
1353  * xtime_update() - advances the timekeeping infrastructure
1354  * @ticks:      number of ticks, that have elapsed since the last call.
1355  *
1356  * Must be called with interrupts disabled.
1357  */
1358 void xtime_update(unsigned long ticks)
1359 {
1360         write_seqlock(&xtime_lock);
1361         do_timer(ticks);
1362         write_sequnlock(&xtime_lock);
1363 }