]> Pileus Git - ~andy/linux/blob - kernel/audit.c
audit: add audit_backlog_wait_time configuration option
[~andy/linux] / kernel / audit.c
1 /* audit.c -- Auditing support
2  * Gateway between the kernel (e.g., selinux) and the user-space audit daemon.
3  * System-call specific features have moved to auditsc.c
4  *
5  * Copyright 2003-2007 Red Hat Inc., Durham, North Carolina.
6  * All Rights Reserved.
7  *
8  * This program is free software; you can redistribute it and/or modify
9  * it under the terms of the GNU General Public License as published by
10  * the Free Software Foundation; either version 2 of the License, or
11  * (at your option) any later version.
12  *
13  * This program is distributed in the hope that it will be useful,
14  * but WITHOUT ANY WARRANTY; without even the implied warranty of
15  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
16  * GNU General Public License for more details.
17  *
18  * You should have received a copy of the GNU General Public License
19  * along with this program; if not, write to the Free Software
20  * Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA  02111-1307  USA
21  *
22  * Written by Rickard E. (Rik) Faith <faith@redhat.com>
23  *
24  * Goals: 1) Integrate fully with Security Modules.
25  *        2) Minimal run-time overhead:
26  *           a) Minimal when syscall auditing is disabled (audit_enable=0).
27  *           b) Small when syscall auditing is enabled and no audit record
28  *              is generated (defer as much work as possible to record
29  *              generation time):
30  *              i) context is allocated,
31  *              ii) names from getname are stored without a copy, and
32  *              iii) inode information stored from path_lookup.
33  *        3) Ability to disable syscall auditing at boot time (audit=0).
34  *        4) Usable by other parts of the kernel (if audit_log* is called,
35  *           then a syscall record will be generated automatically for the
36  *           current syscall).
37  *        5) Netlink interface to user-space.
38  *        6) Support low-overhead kernel-based filtering to minimize the
39  *           information that must be passed to user-space.
40  *
41  * Example user-space utilities: http://people.redhat.com/sgrubb/audit/
42  */
43
44 #include <linux/init.h>
45 #include <asm/types.h>
46 #include <linux/atomic.h>
47 #include <linux/mm.h>
48 #include <linux/export.h>
49 #include <linux/slab.h>
50 #include <linux/err.h>
51 #include <linux/kthread.h>
52 #include <linux/kernel.h>
53 #include <linux/syscalls.h>
54
55 #include <linux/audit.h>
56
57 #include <net/sock.h>
58 #include <net/netlink.h>
59 #include <linux/skbuff.h>
60 #ifdef CONFIG_SECURITY
61 #include <linux/security.h>
62 #endif
63 #include <linux/freezer.h>
64 #include <linux/tty.h>
65 #include <linux/pid_namespace.h>
66 #include <net/netns/generic.h>
67
68 #include "audit.h"
69
70 /* No auditing will take place until audit_initialized == AUDIT_INITIALIZED.
71  * (Initialization happens after skb_init is called.) */
72 #define AUDIT_DISABLED          -1
73 #define AUDIT_UNINITIALIZED     0
74 #define AUDIT_INITIALIZED       1
75 static int      audit_initialized;
76
77 #define AUDIT_OFF       0
78 #define AUDIT_ON        1
79 #define AUDIT_LOCKED    2
80 int             audit_enabled;
81 int             audit_ever_enabled;
82
83 EXPORT_SYMBOL_GPL(audit_enabled);
84
85 /* Default state when kernel boots without any parameters. */
86 static int      audit_default;
87
88 /* If auditing cannot proceed, audit_failure selects what happens. */
89 static int      audit_failure = AUDIT_FAIL_PRINTK;
90
91 /*
92  * If audit records are to be written to the netlink socket, audit_pid
93  * contains the pid of the auditd process and audit_nlk_portid contains
94  * the portid to use to send netlink messages to that process.
95  */
96 int             audit_pid;
97 static __u32    audit_nlk_portid;
98
99 /* If audit_rate_limit is non-zero, limit the rate of sending audit records
100  * to that number per second.  This prevents DoS attacks, but results in
101  * audit records being dropped. */
102 static int      audit_rate_limit;
103
104 /* Number of outstanding audit_buffers allowed. */
105 static int      audit_backlog_limit = 64;
106 #define AUDIT_BACKLOG_WAIT_TIME (60 * HZ)
107 static int      audit_backlog_wait_time = AUDIT_BACKLOG_WAIT_TIME;
108 static int      audit_backlog_wait_overflow = 0;
109
110 /* The identity of the user shutting down the audit system. */
111 kuid_t          audit_sig_uid = INVALID_UID;
112 pid_t           audit_sig_pid = -1;
113 u32             audit_sig_sid = 0;
114
115 /* Records can be lost in several ways:
116    0) [suppressed in audit_alloc]
117    1) out of memory in audit_log_start [kmalloc of struct audit_buffer]
118    2) out of memory in audit_log_move [alloc_skb]
119    3) suppressed due to audit_rate_limit
120    4) suppressed due to audit_backlog_limit
121 */
122 static atomic_t    audit_lost = ATOMIC_INIT(0);
123
124 /* The netlink socket. */
125 static struct sock *audit_sock;
126 int audit_net_id;
127
128 /* Hash for inode-based rules */
129 struct list_head audit_inode_hash[AUDIT_INODE_BUCKETS];
130
131 /* The audit_freelist is a list of pre-allocated audit buffers (if more
132  * than AUDIT_MAXFREE are in use, the audit buffer is freed instead of
133  * being placed on the freelist). */
134 static DEFINE_SPINLOCK(audit_freelist_lock);
135 static int         audit_freelist_count;
136 static LIST_HEAD(audit_freelist);
137
138 static struct sk_buff_head audit_skb_queue;
139 /* queue of skbs to send to auditd when/if it comes back */
140 static struct sk_buff_head audit_skb_hold_queue;
141 static struct task_struct *kauditd_task;
142 static DECLARE_WAIT_QUEUE_HEAD(kauditd_wait);
143 static DECLARE_WAIT_QUEUE_HEAD(audit_backlog_wait);
144
145 static struct audit_features af = {.vers = AUDIT_FEATURE_VERSION,
146                                    .mask = -1,
147                                    .features = 0,
148                                    .lock = 0,};
149
150 static char *audit_feature_names[2] = {
151         "only_unset_loginuid",
152         "loginuid_immutable",
153 };
154
155
156 /* Serialize requests from userspace. */
157 DEFINE_MUTEX(audit_cmd_mutex);
158
159 /* AUDIT_BUFSIZ is the size of the temporary buffer used for formatting
160  * audit records.  Since printk uses a 1024 byte buffer, this buffer
161  * should be at least that large. */
162 #define AUDIT_BUFSIZ 1024
163
164 /* AUDIT_MAXFREE is the number of empty audit_buffers we keep on the
165  * audit_freelist.  Doing so eliminates many kmalloc/kfree calls. */
166 #define AUDIT_MAXFREE  (2*NR_CPUS)
167
168 /* The audit_buffer is used when formatting an audit record.  The caller
169  * locks briefly to get the record off the freelist or to allocate the
170  * buffer, and locks briefly to send the buffer to the netlink layer or
171  * to place it on a transmit queue.  Multiple audit_buffers can be in
172  * use simultaneously. */
173 struct audit_buffer {
174         struct list_head     list;
175         struct sk_buff       *skb;      /* formatted skb ready to send */
176         struct audit_context *ctx;      /* NULL or associated context */
177         gfp_t                gfp_mask;
178 };
179
180 struct audit_reply {
181         __u32 portid;
182         pid_t pid;
183         struct sk_buff *skb;
184 };
185
186 static void audit_set_portid(struct audit_buffer *ab, __u32 portid)
187 {
188         if (ab) {
189                 struct nlmsghdr *nlh = nlmsg_hdr(ab->skb);
190                 nlh->nlmsg_pid = portid;
191         }
192 }
193
194 void audit_panic(const char *message)
195 {
196         switch (audit_failure)
197         {
198         case AUDIT_FAIL_SILENT:
199                 break;
200         case AUDIT_FAIL_PRINTK:
201                 if (printk_ratelimit())
202                         printk(KERN_ERR "audit: %s\n", message);
203                 break;
204         case AUDIT_FAIL_PANIC:
205                 /* test audit_pid since printk is always losey, why bother? */
206                 if (audit_pid)
207                         panic("audit: %s\n", message);
208                 break;
209         }
210 }
211
212 static inline int audit_rate_check(void)
213 {
214         static unsigned long    last_check = 0;
215         static int              messages   = 0;
216         static DEFINE_SPINLOCK(lock);
217         unsigned long           flags;
218         unsigned long           now;
219         unsigned long           elapsed;
220         int                     retval     = 0;
221
222         if (!audit_rate_limit) return 1;
223
224         spin_lock_irqsave(&lock, flags);
225         if (++messages < audit_rate_limit) {
226                 retval = 1;
227         } else {
228                 now     = jiffies;
229                 elapsed = now - last_check;
230                 if (elapsed > HZ) {
231                         last_check = now;
232                         messages   = 0;
233                         retval     = 1;
234                 }
235         }
236         spin_unlock_irqrestore(&lock, flags);
237
238         return retval;
239 }
240
241 /**
242  * audit_log_lost - conditionally log lost audit message event
243  * @message: the message stating reason for lost audit message
244  *
245  * Emit at least 1 message per second, even if audit_rate_check is
246  * throttling.
247  * Always increment the lost messages counter.
248 */
249 void audit_log_lost(const char *message)
250 {
251         static unsigned long    last_msg = 0;
252         static DEFINE_SPINLOCK(lock);
253         unsigned long           flags;
254         unsigned long           now;
255         int                     print;
256
257         atomic_inc(&audit_lost);
258
259         print = (audit_failure == AUDIT_FAIL_PANIC || !audit_rate_limit);
260
261         if (!print) {
262                 spin_lock_irqsave(&lock, flags);
263                 now = jiffies;
264                 if (now - last_msg > HZ) {
265                         print = 1;
266                         last_msg = now;
267                 }
268                 spin_unlock_irqrestore(&lock, flags);
269         }
270
271         if (print) {
272                 if (printk_ratelimit())
273                         printk(KERN_WARNING
274                                 "audit: audit_lost=%d audit_rate_limit=%d "
275                                 "audit_backlog_limit=%d\n",
276                                 atomic_read(&audit_lost),
277                                 audit_rate_limit,
278                                 audit_backlog_limit);
279                 audit_panic(message);
280         }
281 }
282
283 static int audit_log_config_change(char *function_name, int new, int old,
284                                    int allow_changes)
285 {
286         struct audit_buffer *ab;
287         int rc = 0;
288
289         ab = audit_log_start(NULL, GFP_KERNEL, AUDIT_CONFIG_CHANGE);
290         if (unlikely(!ab))
291                 return rc;
292         audit_log_format(ab, "%s=%d old=%d", function_name, new, old);
293         audit_log_session_info(ab);
294         rc = audit_log_task_context(ab);
295         if (rc)
296                 allow_changes = 0; /* Something weird, deny request */
297         audit_log_format(ab, " res=%d", allow_changes);
298         audit_log_end(ab);
299         return rc;
300 }
301
302 static int audit_do_config_change(char *function_name, int *to_change, int new)
303 {
304         int allow_changes, rc = 0, old = *to_change;
305
306         /* check if we are locked */
307         if (audit_enabled == AUDIT_LOCKED)
308                 allow_changes = 0;
309         else
310                 allow_changes = 1;
311
312         if (audit_enabled != AUDIT_OFF) {
313                 rc = audit_log_config_change(function_name, new, old, allow_changes);
314                 if (rc)
315                         allow_changes = 0;
316         }
317
318         /* If we are allowed, make the change */
319         if (allow_changes == 1)
320                 *to_change = new;
321         /* Not allowed, update reason */
322         else if (rc == 0)
323                 rc = -EPERM;
324         return rc;
325 }
326
327 static int audit_set_rate_limit(int limit)
328 {
329         return audit_do_config_change("audit_rate_limit", &audit_rate_limit, limit);
330 }
331
332 static int audit_set_backlog_limit(int limit)
333 {
334         return audit_do_config_change("audit_backlog_limit", &audit_backlog_limit, limit);
335 }
336
337 static int audit_set_backlog_wait_time(int timeout)
338 {
339         return audit_do_config_change("audit_backlog_wait_time",
340                                       &audit_backlog_wait_time, timeout);
341 }
342
343 static int audit_set_enabled(int state)
344 {
345         int rc;
346         if (state < AUDIT_OFF || state > AUDIT_LOCKED)
347                 return -EINVAL;
348
349         rc =  audit_do_config_change("audit_enabled", &audit_enabled, state);
350         if (!rc)
351                 audit_ever_enabled |= !!state;
352
353         return rc;
354 }
355
356 static int audit_set_failure(int state)
357 {
358         if (state != AUDIT_FAIL_SILENT
359             && state != AUDIT_FAIL_PRINTK
360             && state != AUDIT_FAIL_PANIC)
361                 return -EINVAL;
362
363         return audit_do_config_change("audit_failure", &audit_failure, state);
364 }
365
366 /*
367  * Queue skbs to be sent to auditd when/if it comes back.  These skbs should
368  * already have been sent via prink/syslog and so if these messages are dropped
369  * it is not a huge concern since we already passed the audit_log_lost()
370  * notification and stuff.  This is just nice to get audit messages during
371  * boot before auditd is running or messages generated while auditd is stopped.
372  * This only holds messages is audit_default is set, aka booting with audit=1
373  * or building your kernel that way.
374  */
375 static void audit_hold_skb(struct sk_buff *skb)
376 {
377         if (audit_default &&
378             skb_queue_len(&audit_skb_hold_queue) < audit_backlog_limit)
379                 skb_queue_tail(&audit_skb_hold_queue, skb);
380         else
381                 kfree_skb(skb);
382 }
383
384 /*
385  * For one reason or another this nlh isn't getting delivered to the userspace
386  * audit daemon, just send it to printk.
387  */
388 static void audit_printk_skb(struct sk_buff *skb)
389 {
390         struct nlmsghdr *nlh = nlmsg_hdr(skb);
391         char *data = nlmsg_data(nlh);
392
393         if (nlh->nlmsg_type != AUDIT_EOE) {
394                 if (printk_ratelimit())
395                         printk(KERN_NOTICE "type=%d %s\n", nlh->nlmsg_type, data);
396                 else
397                         audit_log_lost("printk limit exceeded\n");
398         }
399
400         audit_hold_skb(skb);
401 }
402
403 static void kauditd_send_skb(struct sk_buff *skb)
404 {
405         int err;
406         /* take a reference in case we can't send it and we want to hold it */
407         skb_get(skb);
408         err = netlink_unicast(audit_sock, skb, audit_nlk_portid, 0);
409         if (err < 0) {
410                 BUG_ON(err != -ECONNREFUSED); /* Shouldn't happen */
411                 printk(KERN_ERR "audit: *NO* daemon at audit_pid=%d\n", audit_pid);
412                 audit_log_lost("auditd disappeared\n");
413                 audit_pid = 0;
414                 audit_sock = NULL;
415                 /* we might get lucky and get this in the next auditd */
416                 audit_hold_skb(skb);
417         } else
418                 /* drop the extra reference if sent ok */
419                 consume_skb(skb);
420 }
421
422 /*
423  * flush_hold_queue - empty the hold queue if auditd appears
424  *
425  * If auditd just started, drain the queue of messages already
426  * sent to syslog/printk.  Remember loss here is ok.  We already
427  * called audit_log_lost() if it didn't go out normally.  so the
428  * race between the skb_dequeue and the next check for audit_pid
429  * doesn't matter.
430  *
431  * If you ever find kauditd to be too slow we can get a perf win
432  * by doing our own locking and keeping better track if there
433  * are messages in this queue.  I don't see the need now, but
434  * in 5 years when I want to play with this again I'll see this
435  * note and still have no friggin idea what i'm thinking today.
436  */
437 static void flush_hold_queue(void)
438 {
439         struct sk_buff *skb;
440
441         if (!audit_default || !audit_pid)
442                 return;
443
444         skb = skb_dequeue(&audit_skb_hold_queue);
445         if (likely(!skb))
446                 return;
447
448         while (skb && audit_pid) {
449                 kauditd_send_skb(skb);
450                 skb = skb_dequeue(&audit_skb_hold_queue);
451         }
452
453         /*
454          * if auditd just disappeared but we
455          * dequeued an skb we need to drop ref
456          */
457         if (skb)
458                 consume_skb(skb);
459 }
460
461 static int kauditd_thread(void *dummy)
462 {
463         set_freezable();
464         while (!kthread_should_stop()) {
465                 struct sk_buff *skb;
466                 DECLARE_WAITQUEUE(wait, current);
467
468                 flush_hold_queue();
469
470                 skb = skb_dequeue(&audit_skb_queue);
471
472                 if (skb) {
473                         if (skb_queue_len(&audit_skb_queue) <= audit_backlog_limit)
474                                 wake_up(&audit_backlog_wait);
475                         if (audit_pid)
476                                 kauditd_send_skb(skb);
477                         else
478                                 audit_printk_skb(skb);
479                         continue;
480                 }
481                 set_current_state(TASK_INTERRUPTIBLE);
482                 add_wait_queue(&kauditd_wait, &wait);
483
484                 if (!skb_queue_len(&audit_skb_queue)) {
485                         try_to_freeze();
486                         schedule();
487                 }
488
489                 __set_current_state(TASK_RUNNING);
490                 remove_wait_queue(&kauditd_wait, &wait);
491         }
492         return 0;
493 }
494
495 int audit_send_list(void *_dest)
496 {
497         struct audit_netlink_list *dest = _dest;
498         struct sk_buff *skb;
499         struct net *net = get_net_ns_by_pid(dest->pid);
500         struct audit_net *aunet = net_generic(net, audit_net_id);
501
502         /* wait for parent to finish and send an ACK */
503         mutex_lock(&audit_cmd_mutex);
504         mutex_unlock(&audit_cmd_mutex);
505
506         while ((skb = __skb_dequeue(&dest->q)) != NULL)
507                 netlink_unicast(aunet->nlsk, skb, dest->portid, 0);
508
509         kfree(dest);
510
511         return 0;
512 }
513
514 struct sk_buff *audit_make_reply(__u32 portid, int seq, int type, int done,
515                                  int multi, const void *payload, int size)
516 {
517         struct sk_buff  *skb;
518         struct nlmsghdr *nlh;
519         void            *data;
520         int             flags = multi ? NLM_F_MULTI : 0;
521         int             t     = done  ? NLMSG_DONE  : type;
522
523         skb = nlmsg_new(size, GFP_KERNEL);
524         if (!skb)
525                 return NULL;
526
527         nlh     = nlmsg_put(skb, portid, seq, t, size, flags);
528         if (!nlh)
529                 goto out_kfree_skb;
530         data = nlmsg_data(nlh);
531         memcpy(data, payload, size);
532         return skb;
533
534 out_kfree_skb:
535         kfree_skb(skb);
536         return NULL;
537 }
538
539 static int audit_send_reply_thread(void *arg)
540 {
541         struct audit_reply *reply = (struct audit_reply *)arg;
542         struct net *net = get_net_ns_by_pid(reply->pid);
543         struct audit_net *aunet = net_generic(net, audit_net_id);
544
545         mutex_lock(&audit_cmd_mutex);
546         mutex_unlock(&audit_cmd_mutex);
547
548         /* Ignore failure. It'll only happen if the sender goes away,
549            because our timeout is set to infinite. */
550         netlink_unicast(aunet->nlsk , reply->skb, reply->portid, 0);
551         kfree(reply);
552         return 0;
553 }
554 /**
555  * audit_send_reply - send an audit reply message via netlink
556  * @portid: netlink port to which to send reply
557  * @seq: sequence number
558  * @type: audit message type
559  * @done: done (last) flag
560  * @multi: multi-part message flag
561  * @payload: payload data
562  * @size: payload size
563  *
564  * Allocates an skb, builds the netlink message, and sends it to the port id.
565  * No failure notifications.
566  */
567 static void audit_send_reply(__u32 portid, int seq, int type, int done,
568                              int multi, const void *payload, int size)
569 {
570         struct sk_buff *skb;
571         struct task_struct *tsk;
572         struct audit_reply *reply = kmalloc(sizeof(struct audit_reply),
573                                             GFP_KERNEL);
574
575         if (!reply)
576                 return;
577
578         skb = audit_make_reply(portid, seq, type, done, multi, payload, size);
579         if (!skb)
580                 goto out;
581
582         reply->portid = portid;
583         reply->pid = task_pid_vnr(current);
584         reply->skb = skb;
585
586         tsk = kthread_run(audit_send_reply_thread, reply, "audit_send_reply");
587         if (!IS_ERR(tsk))
588                 return;
589         kfree_skb(skb);
590 out:
591         kfree(reply);
592 }
593
594 /*
595  * Check for appropriate CAP_AUDIT_ capabilities on incoming audit
596  * control messages.
597  */
598 static int audit_netlink_ok(struct sk_buff *skb, u16 msg_type)
599 {
600         int err = 0;
601
602         /* Only support the initial namespaces for now. */
603         if ((current_user_ns() != &init_user_ns) ||
604             (task_active_pid_ns(current) != &init_pid_ns))
605                 return -EPERM;
606
607         switch (msg_type) {
608         case AUDIT_LIST:
609         case AUDIT_ADD:
610         case AUDIT_DEL:
611                 return -EOPNOTSUPP;
612         case AUDIT_GET:
613         case AUDIT_SET:
614         case AUDIT_GET_FEATURE:
615         case AUDIT_SET_FEATURE:
616         case AUDIT_LIST_RULES:
617         case AUDIT_ADD_RULE:
618         case AUDIT_DEL_RULE:
619         case AUDIT_SIGNAL_INFO:
620         case AUDIT_TTY_GET:
621         case AUDIT_TTY_SET:
622         case AUDIT_TRIM:
623         case AUDIT_MAKE_EQUIV:
624                 if (!capable(CAP_AUDIT_CONTROL))
625                         err = -EPERM;
626                 break;
627         case AUDIT_USER:
628         case AUDIT_FIRST_USER_MSG ... AUDIT_LAST_USER_MSG:
629         case AUDIT_FIRST_USER_MSG2 ... AUDIT_LAST_USER_MSG2:
630                 if (!capable(CAP_AUDIT_WRITE))
631                         err = -EPERM;
632                 break;
633         default:  /* bad msg */
634                 err = -EINVAL;
635         }
636
637         return err;
638 }
639
640 static int audit_log_common_recv_msg(struct audit_buffer **ab, u16 msg_type)
641 {
642         int rc = 0;
643         uid_t uid = from_kuid(&init_user_ns, current_uid());
644
645         if (!audit_enabled && msg_type != AUDIT_USER_AVC) {
646                 *ab = NULL;
647                 return rc;
648         }
649
650         *ab = audit_log_start(NULL, GFP_KERNEL, msg_type);
651         if (unlikely(!*ab))
652                 return rc;
653         audit_log_format(*ab, "pid=%d uid=%u", task_tgid_vnr(current), uid);
654         audit_log_session_info(*ab);
655         audit_log_task_context(*ab);
656
657         return rc;
658 }
659
660 int is_audit_feature_set(int i)
661 {
662         return af.features & AUDIT_FEATURE_TO_MASK(i);
663 }
664
665
666 static int audit_get_feature(struct sk_buff *skb)
667 {
668         u32 seq;
669
670         seq = nlmsg_hdr(skb)->nlmsg_seq;
671
672         audit_send_reply(NETLINK_CB(skb).portid, seq, AUDIT_GET, 0, 0,
673                          &af, sizeof(af));
674
675         return 0;
676 }
677
678 static void audit_log_feature_change(int which, u32 old_feature, u32 new_feature,
679                                      u32 old_lock, u32 new_lock, int res)
680 {
681         struct audit_buffer *ab;
682
683         ab = audit_log_start(NULL, GFP_KERNEL, AUDIT_FEATURE_CHANGE);
684         audit_log_format(ab, "feature=%s new=%d old=%d old_lock=%d new_lock=%d res=%d",
685                          audit_feature_names[which], !!old_feature, !!new_feature,
686                          !!old_lock, !!new_lock, res);
687         audit_log_end(ab);
688 }
689
690 static int audit_set_feature(struct sk_buff *skb)
691 {
692         struct audit_features *uaf;
693         int i;
694
695         BUILD_BUG_ON(AUDIT_LAST_FEATURE + 1 > sizeof(audit_feature_names)/sizeof(audit_feature_names[0]));
696         uaf = nlmsg_data(nlmsg_hdr(skb));
697
698         /* if there is ever a version 2 we should handle that here */
699
700         for (i = 0; i <= AUDIT_LAST_FEATURE; i++) {
701                 u32 feature = AUDIT_FEATURE_TO_MASK(i);
702                 u32 old_feature, new_feature, old_lock, new_lock;
703
704                 /* if we are not changing this feature, move along */
705                 if (!(feature & uaf->mask))
706                         continue;
707
708                 old_feature = af.features & feature;
709                 new_feature = uaf->features & feature;
710                 new_lock = (uaf->lock | af.lock) & feature;
711                 old_lock = af.lock & feature;
712
713                 /* are we changing a locked feature? */
714                 if ((af.lock & feature) && (new_feature != old_feature)) {
715                         audit_log_feature_change(i, old_feature, new_feature,
716                                                  old_lock, new_lock, 0);
717                         return -EPERM;
718                 }
719         }
720         /* nothing invalid, do the changes */
721         for (i = 0; i <= AUDIT_LAST_FEATURE; i++) {
722                 u32 feature = AUDIT_FEATURE_TO_MASK(i);
723                 u32 old_feature, new_feature, old_lock, new_lock;
724
725                 /* if we are not changing this feature, move along */
726                 if (!(feature & uaf->mask))
727                         continue;
728
729                 old_feature = af.features & feature;
730                 new_feature = uaf->features & feature;
731                 old_lock = af.lock & feature;
732                 new_lock = (uaf->lock | af.lock) & feature;
733
734                 if (new_feature != old_feature)
735                         audit_log_feature_change(i, old_feature, new_feature,
736                                                  old_lock, new_lock, 1);
737
738                 if (new_feature)
739                         af.features |= feature;
740                 else
741                         af.features &= ~feature;
742                 af.lock |= new_lock;
743         }
744
745         return 0;
746 }
747
748 static int audit_receive_msg(struct sk_buff *skb, struct nlmsghdr *nlh)
749 {
750         u32                     seq;
751         void                    *data;
752         int                     err;
753         struct audit_buffer     *ab;
754         u16                     msg_type = nlh->nlmsg_type;
755         struct audit_sig_info   *sig_data;
756         char                    *ctx = NULL;
757         u32                     len;
758
759         err = audit_netlink_ok(skb, msg_type);
760         if (err)
761                 return err;
762
763         /* As soon as there's any sign of userspace auditd,
764          * start kauditd to talk to it */
765         if (!kauditd_task) {
766                 kauditd_task = kthread_run(kauditd_thread, NULL, "kauditd");
767                 if (IS_ERR(kauditd_task)) {
768                         err = PTR_ERR(kauditd_task);
769                         kauditd_task = NULL;
770                         return err;
771                 }
772         }
773         seq  = nlh->nlmsg_seq;
774         data = nlmsg_data(nlh);
775
776         switch (msg_type) {
777         case AUDIT_GET: {
778                 struct audit_status     s;
779                 memset(&s, 0, sizeof(s));
780                 s.enabled               = audit_enabled;
781                 s.failure               = audit_failure;
782                 s.pid                   = audit_pid;
783                 s.rate_limit            = audit_rate_limit;
784                 s.backlog_limit         = audit_backlog_limit;
785                 s.lost                  = atomic_read(&audit_lost);
786                 s.backlog               = skb_queue_len(&audit_skb_queue);
787                 s.version               = 2;
788                 s.backlog_wait_time     = audit_backlog_wait_time;
789                 audit_send_reply(NETLINK_CB(skb).portid, seq, AUDIT_GET, 0, 0,
790                                  &s, sizeof(s));
791                 break;
792         }
793         case AUDIT_SET: {
794                 struct audit_status     s;
795                 memset(&s, 0, sizeof(s));
796                 /* guard against past and future API changes */
797                 memcpy(&s, data, min_t(size_t, sizeof(s), nlmsg_len(nlh)));
798                 if (s.mask & AUDIT_STATUS_ENABLED) {
799                         err = audit_set_enabled(s.enabled);
800                         if (err < 0)
801                                 return err;
802                 }
803                 if (s.mask & AUDIT_STATUS_FAILURE) {
804                         err = audit_set_failure(s.failure);
805                         if (err < 0)
806                                 return err;
807                 }
808                 if (s.mask & AUDIT_STATUS_PID) {
809                         int new_pid = s.pid;
810
811                         if (audit_enabled != AUDIT_OFF)
812                                 audit_log_config_change("audit_pid", new_pid, audit_pid, 1);
813                         audit_pid = new_pid;
814                         audit_nlk_portid = NETLINK_CB(skb).portid;
815                         audit_sock = NETLINK_CB(skb).sk;
816                 }
817                 if (s.mask & AUDIT_STATUS_RATE_LIMIT) {
818                         err = audit_set_rate_limit(s.rate_limit);
819                         if (err < 0)
820                                 return err;
821                 }
822                 if (s.mask & AUDIT_STATUS_BACKLOG_LIMIT) {
823                         err = audit_set_backlog_limit(s.backlog_limit);
824                         if (err < 0)
825                                 return err;
826                 }
827                 switch (s.version) {
828                 /* add future vers # cases immediately below and allow
829                  * to fall through */
830                 case 2:
831                         if (s.mask & AUDIT_STATUS_BACKLOG_WAIT_TIME) {
832                                 if (sizeof(s) > (size_t)nlh->nlmsg_len)
833                                         return -EINVAL;
834                                 if (s.backlog_wait_time < 0 ||
835                                     s.backlog_wait_time > 10*AUDIT_BACKLOG_WAIT_TIME)
836                                         return -EINVAL;
837                                 err = audit_set_backlog_wait_time(s.backlog_wait_time);
838                                 if (err < 0)
839                                         return err;
840                         }
841                 default:
842                         break;
843                 }
844                 break;
845         }
846         case AUDIT_GET_FEATURE:
847                 err = audit_get_feature(skb);
848                 if (err)
849                         return err;
850                 break;
851         case AUDIT_SET_FEATURE:
852                 err = audit_set_feature(skb);
853                 if (err)
854                         return err;
855                 break;
856         case AUDIT_USER:
857         case AUDIT_FIRST_USER_MSG ... AUDIT_LAST_USER_MSG:
858         case AUDIT_FIRST_USER_MSG2 ... AUDIT_LAST_USER_MSG2:
859                 if (!audit_enabled && msg_type != AUDIT_USER_AVC)
860                         return 0;
861
862                 err = audit_filter_user(msg_type);
863                 if (err == 1) {
864                         err = 0;
865                         if (msg_type == AUDIT_USER_TTY) {
866                                 err = tty_audit_push_current();
867                                 if (err)
868                                         break;
869                         }
870                         audit_log_common_recv_msg(&ab, msg_type);
871                         if (msg_type != AUDIT_USER_TTY)
872                                 audit_log_format(ab, " msg='%.*s'",
873                                                  AUDIT_MESSAGE_TEXT_MAX,
874                                                  (char *)data);
875                         else {
876                                 int size;
877
878                                 audit_log_format(ab, " data=");
879                                 size = nlmsg_len(nlh);
880                                 if (size > 0 &&
881                                     ((unsigned char *)data)[size - 1] == '\0')
882                                         size--;
883                                 audit_log_n_untrustedstring(ab, data, size);
884                         }
885                         audit_set_portid(ab, NETLINK_CB(skb).portid);
886                         audit_log_end(ab);
887                 }
888                 break;
889         case AUDIT_ADD_RULE:
890         case AUDIT_DEL_RULE:
891                 if (nlmsg_len(nlh) < sizeof(struct audit_rule_data))
892                         return -EINVAL;
893                 if (audit_enabled == AUDIT_LOCKED) {
894                         audit_log_common_recv_msg(&ab, AUDIT_CONFIG_CHANGE);
895                         audit_log_format(ab, " audit_enabled=%d res=0", audit_enabled);
896                         audit_log_end(ab);
897                         return -EPERM;
898                 }
899                 /* fallthrough */
900         case AUDIT_LIST_RULES:
901                 err = audit_receive_filter(msg_type, NETLINK_CB(skb).portid,
902                                            seq, data, nlmsg_len(nlh));
903                 break;
904         case AUDIT_TRIM:
905                 audit_trim_trees();
906                 audit_log_common_recv_msg(&ab, AUDIT_CONFIG_CHANGE);
907                 audit_log_format(ab, " op=trim res=1");
908                 audit_log_end(ab);
909                 break;
910         case AUDIT_MAKE_EQUIV: {
911                 void *bufp = data;
912                 u32 sizes[2];
913                 size_t msglen = nlmsg_len(nlh);
914                 char *old, *new;
915
916                 err = -EINVAL;
917                 if (msglen < 2 * sizeof(u32))
918                         break;
919                 memcpy(sizes, bufp, 2 * sizeof(u32));
920                 bufp += 2 * sizeof(u32);
921                 msglen -= 2 * sizeof(u32);
922                 old = audit_unpack_string(&bufp, &msglen, sizes[0]);
923                 if (IS_ERR(old)) {
924                         err = PTR_ERR(old);
925                         break;
926                 }
927                 new = audit_unpack_string(&bufp, &msglen, sizes[1]);
928                 if (IS_ERR(new)) {
929                         err = PTR_ERR(new);
930                         kfree(old);
931                         break;
932                 }
933                 /* OK, here comes... */
934                 err = audit_tag_tree(old, new);
935
936                 audit_log_common_recv_msg(&ab, AUDIT_CONFIG_CHANGE);
937
938                 audit_log_format(ab, " op=make_equiv old=");
939                 audit_log_untrustedstring(ab, old);
940                 audit_log_format(ab, " new=");
941                 audit_log_untrustedstring(ab, new);
942                 audit_log_format(ab, " res=%d", !err);
943                 audit_log_end(ab);
944                 kfree(old);
945                 kfree(new);
946                 break;
947         }
948         case AUDIT_SIGNAL_INFO:
949                 len = 0;
950                 if (audit_sig_sid) {
951                         err = security_secid_to_secctx(audit_sig_sid, &ctx, &len);
952                         if (err)
953                                 return err;
954                 }
955                 sig_data = kmalloc(sizeof(*sig_data) + len, GFP_KERNEL);
956                 if (!sig_data) {
957                         if (audit_sig_sid)
958                                 security_release_secctx(ctx, len);
959                         return -ENOMEM;
960                 }
961                 sig_data->uid = from_kuid(&init_user_ns, audit_sig_uid);
962                 sig_data->pid = audit_sig_pid;
963                 if (audit_sig_sid) {
964                         memcpy(sig_data->ctx, ctx, len);
965                         security_release_secctx(ctx, len);
966                 }
967                 audit_send_reply(NETLINK_CB(skb).portid, seq, AUDIT_SIGNAL_INFO,
968                                 0, 0, sig_data, sizeof(*sig_data) + len);
969                 kfree(sig_data);
970                 break;
971         case AUDIT_TTY_GET: {
972                 struct audit_tty_status s;
973                 struct task_struct *tsk = current;
974
975                 spin_lock(&tsk->sighand->siglock);
976                 s.enabled = tsk->signal->audit_tty;
977                 s.log_passwd = tsk->signal->audit_tty_log_passwd;
978                 spin_unlock(&tsk->sighand->siglock);
979
980                 audit_send_reply(NETLINK_CB(skb).portid, seq,
981                                  AUDIT_TTY_GET, 0, 0, &s, sizeof(s));
982                 break;
983         }
984         case AUDIT_TTY_SET: {
985                 struct audit_tty_status s;
986                 struct task_struct *tsk = current;
987
988                 memset(&s, 0, sizeof(s));
989                 /* guard against past and future API changes */
990                 memcpy(&s, data, min_t(size_t, sizeof(s), nlmsg_len(nlh)));
991                 if ((s.enabled != 0 && s.enabled != 1) ||
992                     (s.log_passwd != 0 && s.log_passwd != 1))
993                         return -EINVAL;
994
995                 spin_lock(&tsk->sighand->siglock);
996                 tsk->signal->audit_tty = s.enabled;
997                 tsk->signal->audit_tty_log_passwd = s.log_passwd;
998                 spin_unlock(&tsk->sighand->siglock);
999                 break;
1000         }
1001         default:
1002                 err = -EINVAL;
1003                 break;
1004         }
1005
1006         return err < 0 ? err : 0;
1007 }
1008
1009 /*
1010  * Get message from skb.  Each message is processed by audit_receive_msg.
1011  * Malformed skbs with wrong length are discarded silently.
1012  */
1013 static void audit_receive_skb(struct sk_buff *skb)
1014 {
1015         struct nlmsghdr *nlh;
1016         /*
1017          * len MUST be signed for nlmsg_next to be able to dec it below 0
1018          * if the nlmsg_len was not aligned
1019          */
1020         int len;
1021         int err;
1022
1023         nlh = nlmsg_hdr(skb);
1024         len = skb->len;
1025
1026         while (nlmsg_ok(nlh, len)) {
1027                 err = audit_receive_msg(skb, nlh);
1028                 /* if err or if this message says it wants a response */
1029                 if (err || (nlh->nlmsg_flags & NLM_F_ACK))
1030                         netlink_ack(skb, nlh, err);
1031
1032                 nlh = nlmsg_next(nlh, &len);
1033         }
1034 }
1035
1036 /* Receive messages from netlink socket. */
1037 static void audit_receive(struct sk_buff  *skb)
1038 {
1039         mutex_lock(&audit_cmd_mutex);
1040         audit_receive_skb(skb);
1041         mutex_unlock(&audit_cmd_mutex);
1042 }
1043
1044 static int __net_init audit_net_init(struct net *net)
1045 {
1046         struct netlink_kernel_cfg cfg = {
1047                 .input  = audit_receive,
1048         };
1049
1050         struct audit_net *aunet = net_generic(net, audit_net_id);
1051
1052         pr_info("audit: initializing netlink socket in namespace\n");
1053
1054         aunet->nlsk = netlink_kernel_create(net, NETLINK_AUDIT, &cfg);
1055         if (aunet->nlsk == NULL)
1056                 return -ENOMEM;
1057         if (!aunet->nlsk)
1058                 audit_panic("cannot initialize netlink socket in namespace");
1059         else
1060                 aunet->nlsk->sk_sndtimeo = MAX_SCHEDULE_TIMEOUT;
1061         return 0;
1062 }
1063
1064 static void __net_exit audit_net_exit(struct net *net)
1065 {
1066         struct audit_net *aunet = net_generic(net, audit_net_id);
1067         struct sock *sock = aunet->nlsk;
1068         if (sock == audit_sock) {
1069                 audit_pid = 0;
1070                 audit_sock = NULL;
1071         }
1072
1073         rcu_assign_pointer(aunet->nlsk, NULL);
1074         synchronize_net();
1075         netlink_kernel_release(sock);
1076 }
1077
1078 static struct pernet_operations __net_initdata audit_net_ops = {
1079         .init = audit_net_init,
1080         .exit = audit_net_exit,
1081         .id = &audit_net_id,
1082         .size = sizeof(struct audit_net),
1083 };
1084
1085 /* Initialize audit support at boot time. */
1086 static int __init audit_init(void)
1087 {
1088         int i;
1089
1090         if (audit_initialized == AUDIT_DISABLED)
1091                 return 0;
1092
1093         pr_info("audit: initializing netlink subsys (%s)\n",
1094                audit_default ? "enabled" : "disabled");
1095         register_pernet_subsys(&audit_net_ops);
1096
1097         skb_queue_head_init(&audit_skb_queue);
1098         skb_queue_head_init(&audit_skb_hold_queue);
1099         audit_initialized = AUDIT_INITIALIZED;
1100         audit_enabled = audit_default;
1101         audit_ever_enabled |= !!audit_default;
1102
1103         audit_log(NULL, GFP_KERNEL, AUDIT_KERNEL, "initialized");
1104
1105         for (i = 0; i < AUDIT_INODE_BUCKETS; i++)
1106                 INIT_LIST_HEAD(&audit_inode_hash[i]);
1107
1108         return 0;
1109 }
1110 __initcall(audit_init);
1111
1112 /* Process kernel command-line parameter at boot time.  audit=0 or audit=1. */
1113 static int __init audit_enable(char *str)
1114 {
1115         audit_default = !!simple_strtol(str, NULL, 0);
1116         if (!audit_default)
1117                 audit_initialized = AUDIT_DISABLED;
1118
1119         printk(KERN_INFO "audit: %s", audit_default ? "enabled" : "disabled");
1120
1121         if (audit_initialized == AUDIT_INITIALIZED) {
1122                 audit_enabled = audit_default;
1123                 audit_ever_enabled |= !!audit_default;
1124         } else if (audit_initialized == AUDIT_UNINITIALIZED) {
1125                 printk(" (after initialization)");
1126         } else {
1127                 printk(" (until reboot)");
1128         }
1129         printk("\n");
1130
1131         return 1;
1132 }
1133 __setup("audit=", audit_enable);
1134
1135 /* Process kernel command-line parameter at boot time.
1136  * audit_backlog_limit=<n> */
1137 static int __init audit_backlog_limit_set(char *str)
1138 {
1139         long int audit_backlog_limit_arg;
1140         pr_info("audit_backlog_limit: ");
1141         if (kstrtol(str, 0, &audit_backlog_limit_arg)) {
1142                 printk("using default of %d, unable to parse %s\n",
1143                        audit_backlog_limit, str);
1144                 return 1;
1145         }
1146         if (audit_backlog_limit_arg >= 0)
1147                 audit_backlog_limit = (int)audit_backlog_limit_arg;
1148         printk("%d\n", audit_backlog_limit);
1149
1150         return 1;
1151 }
1152 __setup("audit_backlog_limit=", audit_backlog_limit_set);
1153
1154 static void audit_buffer_free(struct audit_buffer *ab)
1155 {
1156         unsigned long flags;
1157
1158         if (!ab)
1159                 return;
1160
1161         if (ab->skb)
1162                 kfree_skb(ab->skb);
1163
1164         spin_lock_irqsave(&audit_freelist_lock, flags);
1165         if (audit_freelist_count > AUDIT_MAXFREE)
1166                 kfree(ab);
1167         else {
1168                 audit_freelist_count++;
1169                 list_add(&ab->list, &audit_freelist);
1170         }
1171         spin_unlock_irqrestore(&audit_freelist_lock, flags);
1172 }
1173
1174 static struct audit_buffer * audit_buffer_alloc(struct audit_context *ctx,
1175                                                 gfp_t gfp_mask, int type)
1176 {
1177         unsigned long flags;
1178         struct audit_buffer *ab = NULL;
1179         struct nlmsghdr *nlh;
1180
1181         spin_lock_irqsave(&audit_freelist_lock, flags);
1182         if (!list_empty(&audit_freelist)) {
1183                 ab = list_entry(audit_freelist.next,
1184                                 struct audit_buffer, list);
1185                 list_del(&ab->list);
1186                 --audit_freelist_count;
1187         }
1188         spin_unlock_irqrestore(&audit_freelist_lock, flags);
1189
1190         if (!ab) {
1191                 ab = kmalloc(sizeof(*ab), gfp_mask);
1192                 if (!ab)
1193                         goto err;
1194         }
1195
1196         ab->ctx = ctx;
1197         ab->gfp_mask = gfp_mask;
1198
1199         ab->skb = nlmsg_new(AUDIT_BUFSIZ, gfp_mask);
1200         if (!ab->skb)
1201                 goto err;
1202
1203         nlh = nlmsg_put(ab->skb, 0, 0, type, 0, 0);
1204         if (!nlh)
1205                 goto out_kfree_skb;
1206
1207         return ab;
1208
1209 out_kfree_skb:
1210         kfree_skb(ab->skb);
1211         ab->skb = NULL;
1212 err:
1213         audit_buffer_free(ab);
1214         return NULL;
1215 }
1216
1217 /**
1218  * audit_serial - compute a serial number for the audit record
1219  *
1220  * Compute a serial number for the audit record.  Audit records are
1221  * written to user-space as soon as they are generated, so a complete
1222  * audit record may be written in several pieces.  The timestamp of the
1223  * record and this serial number are used by the user-space tools to
1224  * determine which pieces belong to the same audit record.  The
1225  * (timestamp,serial) tuple is unique for each syscall and is live from
1226  * syscall entry to syscall exit.
1227  *
1228  * NOTE: Another possibility is to store the formatted records off the
1229  * audit context (for those records that have a context), and emit them
1230  * all at syscall exit.  However, this could delay the reporting of
1231  * significant errors until syscall exit (or never, if the system
1232  * halts).
1233  */
1234 unsigned int audit_serial(void)
1235 {
1236         static DEFINE_SPINLOCK(serial_lock);
1237         static unsigned int serial = 0;
1238
1239         unsigned long flags;
1240         unsigned int ret;
1241
1242         spin_lock_irqsave(&serial_lock, flags);
1243         do {
1244                 ret = ++serial;
1245         } while (unlikely(!ret));
1246         spin_unlock_irqrestore(&serial_lock, flags);
1247
1248         return ret;
1249 }
1250
1251 static inline void audit_get_stamp(struct audit_context *ctx,
1252                                    struct timespec *t, unsigned int *serial)
1253 {
1254         if (!ctx || !auditsc_get_stamp(ctx, t, serial)) {
1255                 *t = CURRENT_TIME;
1256                 *serial = audit_serial();
1257         }
1258 }
1259
1260 /*
1261  * Wait for auditd to drain the queue a little
1262  */
1263 static unsigned long wait_for_auditd(unsigned long sleep_time)
1264 {
1265         unsigned long timeout = sleep_time;
1266         DECLARE_WAITQUEUE(wait, current);
1267         set_current_state(TASK_UNINTERRUPTIBLE);
1268         add_wait_queue_exclusive(&audit_backlog_wait, &wait);
1269
1270         if (audit_backlog_limit &&
1271             skb_queue_len(&audit_skb_queue) > audit_backlog_limit)
1272                 timeout = schedule_timeout(sleep_time);
1273
1274         __set_current_state(TASK_RUNNING);
1275         remove_wait_queue(&audit_backlog_wait, &wait);
1276
1277         return timeout;
1278 }
1279
1280 /**
1281  * audit_log_start - obtain an audit buffer
1282  * @ctx: audit_context (may be NULL)
1283  * @gfp_mask: type of allocation
1284  * @type: audit message type
1285  *
1286  * Returns audit_buffer pointer on success or NULL on error.
1287  *
1288  * Obtain an audit buffer.  This routine does locking to obtain the
1289  * audit buffer, but then no locking is required for calls to
1290  * audit_log_*format.  If the task (ctx) is a task that is currently in a
1291  * syscall, then the syscall is marked as auditable and an audit record
1292  * will be written at syscall exit.  If there is no associated task, then
1293  * task context (ctx) should be NULL.
1294  */
1295 struct audit_buffer *audit_log_start(struct audit_context *ctx, gfp_t gfp_mask,
1296                                      int type)
1297 {
1298         struct audit_buffer     *ab     = NULL;
1299         struct timespec         t;
1300         unsigned int            uninitialized_var(serial);
1301         int reserve;
1302         unsigned long timeout_start = jiffies;
1303
1304         if (audit_initialized != AUDIT_INITIALIZED)
1305                 return NULL;
1306
1307         if (unlikely(audit_filter_type(type)))
1308                 return NULL;
1309
1310         if (gfp_mask & __GFP_WAIT)
1311                 reserve = 0;
1312         else
1313                 reserve = 5; /* Allow atomic callers to go up to five
1314                                 entries over the normal backlog limit */
1315
1316         while (audit_backlog_limit
1317                && skb_queue_len(&audit_skb_queue) > audit_backlog_limit + reserve) {
1318                 if (gfp_mask & __GFP_WAIT && audit_backlog_wait_time) {
1319                         unsigned long sleep_time;
1320
1321                         sleep_time = timeout_start + audit_backlog_wait_time -
1322                                         jiffies;
1323                         if ((long)sleep_time > 0) {
1324                                 sleep_time = wait_for_auditd(sleep_time);
1325                                 if ((long)sleep_time > 0)
1326                                         continue;
1327                         }
1328                 }
1329                 if (audit_rate_check() && printk_ratelimit())
1330                         printk(KERN_WARNING
1331                                "audit: audit_backlog=%d > "
1332                                "audit_backlog_limit=%d\n",
1333                                skb_queue_len(&audit_skb_queue),
1334                                audit_backlog_limit);
1335                 audit_log_lost("backlog limit exceeded");
1336                 audit_backlog_wait_time = audit_backlog_wait_overflow;
1337                 wake_up(&audit_backlog_wait);
1338                 return NULL;
1339         }
1340
1341         audit_backlog_wait_time = AUDIT_BACKLOG_WAIT_TIME;
1342
1343         ab = audit_buffer_alloc(ctx, gfp_mask, type);
1344         if (!ab) {
1345                 audit_log_lost("out of memory in audit_log_start");
1346                 return NULL;
1347         }
1348
1349         audit_get_stamp(ab->ctx, &t, &serial);
1350
1351         audit_log_format(ab, "audit(%lu.%03lu:%u): ",
1352                          t.tv_sec, t.tv_nsec/1000000, serial);
1353         return ab;
1354 }
1355
1356 /**
1357  * audit_expand - expand skb in the audit buffer
1358  * @ab: audit_buffer
1359  * @extra: space to add at tail of the skb
1360  *
1361  * Returns 0 (no space) on failed expansion, or available space if
1362  * successful.
1363  */
1364 static inline int audit_expand(struct audit_buffer *ab, int extra)
1365 {
1366         struct sk_buff *skb = ab->skb;
1367         int oldtail = skb_tailroom(skb);
1368         int ret = pskb_expand_head(skb, 0, extra, ab->gfp_mask);
1369         int newtail = skb_tailroom(skb);
1370
1371         if (ret < 0) {
1372                 audit_log_lost("out of memory in audit_expand");
1373                 return 0;
1374         }
1375
1376         skb->truesize += newtail - oldtail;
1377         return newtail;
1378 }
1379
1380 /*
1381  * Format an audit message into the audit buffer.  If there isn't enough
1382  * room in the audit buffer, more room will be allocated and vsnprint
1383  * will be called a second time.  Currently, we assume that a printk
1384  * can't format message larger than 1024 bytes, so we don't either.
1385  */
1386 static void audit_log_vformat(struct audit_buffer *ab, const char *fmt,
1387                               va_list args)
1388 {
1389         int len, avail;
1390         struct sk_buff *skb;
1391         va_list args2;
1392
1393         if (!ab)
1394                 return;
1395
1396         BUG_ON(!ab->skb);
1397         skb = ab->skb;
1398         avail = skb_tailroom(skb);
1399         if (avail == 0) {
1400                 avail = audit_expand(ab, AUDIT_BUFSIZ);
1401                 if (!avail)
1402                         goto out;
1403         }
1404         va_copy(args2, args);
1405         len = vsnprintf(skb_tail_pointer(skb), avail, fmt, args);
1406         if (len >= avail) {
1407                 /* The printk buffer is 1024 bytes long, so if we get
1408                  * here and AUDIT_BUFSIZ is at least 1024, then we can
1409                  * log everything that printk could have logged. */
1410                 avail = audit_expand(ab,
1411                         max_t(unsigned, AUDIT_BUFSIZ, 1+len-avail));
1412                 if (!avail)
1413                         goto out_va_end;
1414                 len = vsnprintf(skb_tail_pointer(skb), avail, fmt, args2);
1415         }
1416         if (len > 0)
1417                 skb_put(skb, len);
1418 out_va_end:
1419         va_end(args2);
1420 out:
1421         return;
1422 }
1423
1424 /**
1425  * audit_log_format - format a message into the audit buffer.
1426  * @ab: audit_buffer
1427  * @fmt: format string
1428  * @...: optional parameters matching @fmt string
1429  *
1430  * All the work is done in audit_log_vformat.
1431  */
1432 void audit_log_format(struct audit_buffer *ab, const char *fmt, ...)
1433 {
1434         va_list args;
1435
1436         if (!ab)
1437                 return;
1438         va_start(args, fmt);
1439         audit_log_vformat(ab, fmt, args);
1440         va_end(args);
1441 }
1442
1443 /**
1444  * audit_log_hex - convert a buffer to hex and append it to the audit skb
1445  * @ab: the audit_buffer
1446  * @buf: buffer to convert to hex
1447  * @len: length of @buf to be converted
1448  *
1449  * No return value; failure to expand is silently ignored.
1450  *
1451  * This function will take the passed buf and convert it into a string of
1452  * ascii hex digits. The new string is placed onto the skb.
1453  */
1454 void audit_log_n_hex(struct audit_buffer *ab, const unsigned char *buf,
1455                 size_t len)
1456 {
1457         int i, avail, new_len;
1458         unsigned char *ptr;
1459         struct sk_buff *skb;
1460         static const unsigned char *hex = "0123456789ABCDEF";
1461
1462         if (!ab)
1463                 return;
1464
1465         BUG_ON(!ab->skb);
1466         skb = ab->skb;
1467         avail = skb_tailroom(skb);
1468         new_len = len<<1;
1469         if (new_len >= avail) {
1470                 /* Round the buffer request up to the next multiple */
1471                 new_len = AUDIT_BUFSIZ*(((new_len-avail)/AUDIT_BUFSIZ) + 1);
1472                 avail = audit_expand(ab, new_len);
1473                 if (!avail)
1474                         return;
1475         }
1476
1477         ptr = skb_tail_pointer(skb);
1478         for (i=0; i<len; i++) {
1479                 *ptr++ = hex[(buf[i] & 0xF0)>>4]; /* Upper nibble */
1480                 *ptr++ = hex[buf[i] & 0x0F];      /* Lower nibble */
1481         }
1482         *ptr = 0;
1483         skb_put(skb, len << 1); /* new string is twice the old string */
1484 }
1485
1486 /*
1487  * Format a string of no more than slen characters into the audit buffer,
1488  * enclosed in quote marks.
1489  */
1490 void audit_log_n_string(struct audit_buffer *ab, const char *string,
1491                         size_t slen)
1492 {
1493         int avail, new_len;
1494         unsigned char *ptr;
1495         struct sk_buff *skb;
1496
1497         if (!ab)
1498                 return;
1499
1500         BUG_ON(!ab->skb);
1501         skb = ab->skb;
1502         avail = skb_tailroom(skb);
1503         new_len = slen + 3;     /* enclosing quotes + null terminator */
1504         if (new_len > avail) {
1505                 avail = audit_expand(ab, new_len);
1506                 if (!avail)
1507                         return;
1508         }
1509         ptr = skb_tail_pointer(skb);
1510         *ptr++ = '"';
1511         memcpy(ptr, string, slen);
1512         ptr += slen;
1513         *ptr++ = '"';
1514         *ptr = 0;
1515         skb_put(skb, slen + 2); /* don't include null terminator */
1516 }
1517
1518 /**
1519  * audit_string_contains_control - does a string need to be logged in hex
1520  * @string: string to be checked
1521  * @len: max length of the string to check
1522  */
1523 int audit_string_contains_control(const char *string, size_t len)
1524 {
1525         const unsigned char *p;
1526         for (p = string; p < (const unsigned char *)string + len; p++) {
1527                 if (*p == '"' || *p < 0x21 || *p > 0x7e)
1528                         return 1;
1529         }
1530         return 0;
1531 }
1532
1533 /**
1534  * audit_log_n_untrustedstring - log a string that may contain random characters
1535  * @ab: audit_buffer
1536  * @len: length of string (not including trailing null)
1537  * @string: string to be logged
1538  *
1539  * This code will escape a string that is passed to it if the string
1540  * contains a control character, unprintable character, double quote mark,
1541  * or a space. Unescaped strings will start and end with a double quote mark.
1542  * Strings that are escaped are printed in hex (2 digits per char).
1543  *
1544  * The caller specifies the number of characters in the string to log, which may
1545  * or may not be the entire string.
1546  */
1547 void audit_log_n_untrustedstring(struct audit_buffer *ab, const char *string,
1548                                  size_t len)
1549 {
1550         if (audit_string_contains_control(string, len))
1551                 audit_log_n_hex(ab, string, len);
1552         else
1553                 audit_log_n_string(ab, string, len);
1554 }
1555
1556 /**
1557  * audit_log_untrustedstring - log a string that may contain random characters
1558  * @ab: audit_buffer
1559  * @string: string to be logged
1560  *
1561  * Same as audit_log_n_untrustedstring(), except that strlen is used to
1562  * determine string length.
1563  */
1564 void audit_log_untrustedstring(struct audit_buffer *ab, const char *string)
1565 {
1566         audit_log_n_untrustedstring(ab, string, strlen(string));
1567 }
1568
1569 /* This is a helper-function to print the escaped d_path */
1570 void audit_log_d_path(struct audit_buffer *ab, const char *prefix,
1571                       const struct path *path)
1572 {
1573         char *p, *pathname;
1574
1575         if (prefix)
1576                 audit_log_format(ab, "%s", prefix);
1577
1578         /* We will allow 11 spaces for ' (deleted)' to be appended */
1579         pathname = kmalloc(PATH_MAX+11, ab->gfp_mask);
1580         if (!pathname) {
1581                 audit_log_string(ab, "<no_memory>");
1582                 return;
1583         }
1584         p = d_path(path, pathname, PATH_MAX+11);
1585         if (IS_ERR(p)) { /* Should never happen since we send PATH_MAX */
1586                 /* FIXME: can we save some information here? */
1587                 audit_log_string(ab, "<too_long>");
1588         } else
1589                 audit_log_untrustedstring(ab, p);
1590         kfree(pathname);
1591 }
1592
1593 void audit_log_session_info(struct audit_buffer *ab)
1594 {
1595         u32 sessionid = audit_get_sessionid(current);
1596         uid_t auid = from_kuid(&init_user_ns, audit_get_loginuid(current));
1597
1598         audit_log_format(ab, " auid=%u ses=%u", auid, sessionid);
1599 }
1600
1601 void audit_log_key(struct audit_buffer *ab, char *key)
1602 {
1603         audit_log_format(ab, " key=");
1604         if (key)
1605                 audit_log_untrustedstring(ab, key);
1606         else
1607                 audit_log_format(ab, "(null)");
1608 }
1609
1610 void audit_log_cap(struct audit_buffer *ab, char *prefix, kernel_cap_t *cap)
1611 {
1612         int i;
1613
1614         audit_log_format(ab, " %s=", prefix);
1615         CAP_FOR_EACH_U32(i) {
1616                 audit_log_format(ab, "%08x",
1617                                  cap->cap[(_KERNEL_CAPABILITY_U32S-1) - i]);
1618         }
1619 }
1620
1621 void audit_log_fcaps(struct audit_buffer *ab, struct audit_names *name)
1622 {
1623         kernel_cap_t *perm = &name->fcap.permitted;
1624         kernel_cap_t *inh = &name->fcap.inheritable;
1625         int log = 0;
1626
1627         if (!cap_isclear(*perm)) {
1628                 audit_log_cap(ab, "cap_fp", perm);
1629                 log = 1;
1630         }
1631         if (!cap_isclear(*inh)) {
1632                 audit_log_cap(ab, "cap_fi", inh);
1633                 log = 1;
1634         }
1635
1636         if (log)
1637                 audit_log_format(ab, " cap_fe=%d cap_fver=%x",
1638                                  name->fcap.fE, name->fcap_ver);
1639 }
1640
1641 static inline int audit_copy_fcaps(struct audit_names *name,
1642                                    const struct dentry *dentry)
1643 {
1644         struct cpu_vfs_cap_data caps;
1645         int rc;
1646
1647         if (!dentry)
1648                 return 0;
1649
1650         rc = get_vfs_caps_from_disk(dentry, &caps);
1651         if (rc)
1652                 return rc;
1653
1654         name->fcap.permitted = caps.permitted;
1655         name->fcap.inheritable = caps.inheritable;
1656         name->fcap.fE = !!(caps.magic_etc & VFS_CAP_FLAGS_EFFECTIVE);
1657         name->fcap_ver = (caps.magic_etc & VFS_CAP_REVISION_MASK) >>
1658                                 VFS_CAP_REVISION_SHIFT;
1659
1660         return 0;
1661 }
1662
1663 /* Copy inode data into an audit_names. */
1664 void audit_copy_inode(struct audit_names *name, const struct dentry *dentry,
1665                       const struct inode *inode)
1666 {
1667         name->ino   = inode->i_ino;
1668         name->dev   = inode->i_sb->s_dev;
1669         name->mode  = inode->i_mode;
1670         name->uid   = inode->i_uid;
1671         name->gid   = inode->i_gid;
1672         name->rdev  = inode->i_rdev;
1673         security_inode_getsecid(inode, &name->osid);
1674         audit_copy_fcaps(name, dentry);
1675 }
1676
1677 /**
1678  * audit_log_name - produce AUDIT_PATH record from struct audit_names
1679  * @context: audit_context for the task
1680  * @n: audit_names structure with reportable details
1681  * @path: optional path to report instead of audit_names->name
1682  * @record_num: record number to report when handling a list of names
1683  * @call_panic: optional pointer to int that will be updated if secid fails
1684  */
1685 void audit_log_name(struct audit_context *context, struct audit_names *n,
1686                     struct path *path, int record_num, int *call_panic)
1687 {
1688         struct audit_buffer *ab;
1689         ab = audit_log_start(context, GFP_KERNEL, AUDIT_PATH);
1690         if (!ab)
1691                 return;
1692
1693         audit_log_format(ab, "item=%d", record_num);
1694
1695         if (path)
1696                 audit_log_d_path(ab, " name=", path);
1697         else if (n->name) {
1698                 switch (n->name_len) {
1699                 case AUDIT_NAME_FULL:
1700                         /* log the full path */
1701                         audit_log_format(ab, " name=");
1702                         audit_log_untrustedstring(ab, n->name->name);
1703                         break;
1704                 case 0:
1705                         /* name was specified as a relative path and the
1706                          * directory component is the cwd */
1707                         audit_log_d_path(ab, " name=", &context->pwd);
1708                         break;
1709                 default:
1710                         /* log the name's directory component */
1711                         audit_log_format(ab, " name=");
1712                         audit_log_n_untrustedstring(ab, n->name->name,
1713                                                     n->name_len);
1714                 }
1715         } else
1716                 audit_log_format(ab, " name=(null)");
1717
1718         if (n->ino != (unsigned long)-1) {
1719                 audit_log_format(ab, " inode=%lu"
1720                                  " dev=%02x:%02x mode=%#ho"
1721                                  " ouid=%u ogid=%u rdev=%02x:%02x",
1722                                  n->ino,
1723                                  MAJOR(n->dev),
1724                                  MINOR(n->dev),
1725                                  n->mode,
1726                                  from_kuid(&init_user_ns, n->uid),
1727                                  from_kgid(&init_user_ns, n->gid),
1728                                  MAJOR(n->rdev),
1729                                  MINOR(n->rdev));
1730         }
1731         if (n->osid != 0) {
1732                 char *ctx = NULL;
1733                 u32 len;
1734                 if (security_secid_to_secctx(
1735                         n->osid, &ctx, &len)) {
1736                         audit_log_format(ab, " osid=%u", n->osid);
1737                         if (call_panic)
1738                                 *call_panic = 2;
1739                 } else {
1740                         audit_log_format(ab, " obj=%s", ctx);
1741                         security_release_secctx(ctx, len);
1742                 }
1743         }
1744
1745         /* log the audit_names record type */
1746         audit_log_format(ab, " nametype=");
1747         switch(n->type) {
1748         case AUDIT_TYPE_NORMAL:
1749                 audit_log_format(ab, "NORMAL");
1750                 break;
1751         case AUDIT_TYPE_PARENT:
1752                 audit_log_format(ab, "PARENT");
1753                 break;
1754         case AUDIT_TYPE_CHILD_DELETE:
1755                 audit_log_format(ab, "DELETE");
1756                 break;
1757         case AUDIT_TYPE_CHILD_CREATE:
1758                 audit_log_format(ab, "CREATE");
1759                 break;
1760         default:
1761                 audit_log_format(ab, "UNKNOWN");
1762                 break;
1763         }
1764
1765         audit_log_fcaps(ab, n);
1766         audit_log_end(ab);
1767 }
1768
1769 int audit_log_task_context(struct audit_buffer *ab)
1770 {
1771         char *ctx = NULL;
1772         unsigned len;
1773         int error;
1774         u32 sid;
1775
1776         security_task_getsecid(current, &sid);
1777         if (!sid)
1778                 return 0;
1779
1780         error = security_secid_to_secctx(sid, &ctx, &len);
1781         if (error) {
1782                 if (error != -EINVAL)
1783                         goto error_path;
1784                 return 0;
1785         }
1786
1787         audit_log_format(ab, " subj=%s", ctx);
1788         security_release_secctx(ctx, len);
1789         return 0;
1790
1791 error_path:
1792         audit_panic("error in audit_log_task_context");
1793         return error;
1794 }
1795 EXPORT_SYMBOL(audit_log_task_context);
1796
1797 void audit_log_task_info(struct audit_buffer *ab, struct task_struct *tsk)
1798 {
1799         const struct cred *cred;
1800         char name[sizeof(tsk->comm)];
1801         struct mm_struct *mm = tsk->mm;
1802         char *tty;
1803
1804         if (!ab)
1805                 return;
1806
1807         /* tsk == current */
1808         cred = current_cred();
1809
1810         spin_lock_irq(&tsk->sighand->siglock);
1811         if (tsk->signal && tsk->signal->tty && tsk->signal->tty->name)
1812                 tty = tsk->signal->tty->name;
1813         else
1814                 tty = "(none)";
1815         spin_unlock_irq(&tsk->sighand->siglock);
1816
1817         audit_log_format(ab,
1818                          " ppid=%ld pid=%d auid=%u uid=%u gid=%u"
1819                          " euid=%u suid=%u fsuid=%u"
1820                          " egid=%u sgid=%u fsgid=%u tty=%s ses=%u",
1821                          sys_getppid(),
1822                          tsk->pid,
1823                          from_kuid(&init_user_ns, audit_get_loginuid(tsk)),
1824                          from_kuid(&init_user_ns, cred->uid),
1825                          from_kgid(&init_user_ns, cred->gid),
1826                          from_kuid(&init_user_ns, cred->euid),
1827                          from_kuid(&init_user_ns, cred->suid),
1828                          from_kuid(&init_user_ns, cred->fsuid),
1829                          from_kgid(&init_user_ns, cred->egid),
1830                          from_kgid(&init_user_ns, cred->sgid),
1831                          from_kgid(&init_user_ns, cred->fsgid),
1832                          tty, audit_get_sessionid(tsk));
1833
1834         get_task_comm(name, tsk);
1835         audit_log_format(ab, " comm=");
1836         audit_log_untrustedstring(ab, name);
1837
1838         if (mm) {
1839                 down_read(&mm->mmap_sem);
1840                 if (mm->exe_file)
1841                         audit_log_d_path(ab, " exe=", &mm->exe_file->f_path);
1842                 up_read(&mm->mmap_sem);
1843         }
1844         audit_log_task_context(ab);
1845 }
1846 EXPORT_SYMBOL(audit_log_task_info);
1847
1848 /**
1849  * audit_log_link_denied - report a link restriction denial
1850  * @operation: specific link opreation
1851  * @link: the path that triggered the restriction
1852  */
1853 void audit_log_link_denied(const char *operation, struct path *link)
1854 {
1855         struct audit_buffer *ab;
1856         struct audit_names *name;
1857
1858         name = kzalloc(sizeof(*name), GFP_NOFS);
1859         if (!name)
1860                 return;
1861
1862         /* Generate AUDIT_ANOM_LINK with subject, operation, outcome. */
1863         ab = audit_log_start(current->audit_context, GFP_KERNEL,
1864                              AUDIT_ANOM_LINK);
1865         if (!ab)
1866                 goto out;
1867         audit_log_format(ab, "op=%s", operation);
1868         audit_log_task_info(ab, current);
1869         audit_log_format(ab, " res=0");
1870         audit_log_end(ab);
1871
1872         /* Generate AUDIT_PATH record with object. */
1873         name->type = AUDIT_TYPE_NORMAL;
1874         audit_copy_inode(name, link->dentry, link->dentry->d_inode);
1875         audit_log_name(current->audit_context, name, link, 0, NULL);
1876 out:
1877         kfree(name);
1878 }
1879
1880 /**
1881  * audit_log_end - end one audit record
1882  * @ab: the audit_buffer
1883  *
1884  * The netlink_* functions cannot be called inside an irq context, so
1885  * the audit buffer is placed on a queue and a tasklet is scheduled to
1886  * remove them from the queue outside the irq context.  May be called in
1887  * any context.
1888  */
1889 void audit_log_end(struct audit_buffer *ab)
1890 {
1891         if (!ab)
1892                 return;
1893         if (!audit_rate_check()) {
1894                 audit_log_lost("rate limit exceeded");
1895         } else {
1896                 struct nlmsghdr *nlh = nlmsg_hdr(ab->skb);
1897                 nlh->nlmsg_len = ab->skb->len - NLMSG_HDRLEN;
1898
1899                 if (audit_pid) {
1900                         skb_queue_tail(&audit_skb_queue, ab->skb);
1901                         wake_up_interruptible(&kauditd_wait);
1902                 } else {
1903                         audit_printk_skb(ab->skb);
1904                 }
1905                 ab->skb = NULL;
1906         }
1907         audit_buffer_free(ab);
1908 }
1909
1910 /**
1911  * audit_log - Log an audit record
1912  * @ctx: audit context
1913  * @gfp_mask: type of allocation
1914  * @type: audit message type
1915  * @fmt: format string to use
1916  * @...: variable parameters matching the format string
1917  *
1918  * This is a convenience function that calls audit_log_start,
1919  * audit_log_vformat, and audit_log_end.  It may be called
1920  * in any context.
1921  */
1922 void audit_log(struct audit_context *ctx, gfp_t gfp_mask, int type,
1923                const char *fmt, ...)
1924 {
1925         struct audit_buffer *ab;
1926         va_list args;
1927
1928         ab = audit_log_start(ctx, gfp_mask, type);
1929         if (ab) {
1930                 va_start(args, fmt);
1931                 audit_log_vformat(ab, fmt, args);
1932                 va_end(args);
1933                 audit_log_end(ab);
1934         }
1935 }
1936
1937 #ifdef CONFIG_SECURITY
1938 /**
1939  * audit_log_secctx - Converts and logs SELinux context
1940  * @ab: audit_buffer
1941  * @secid: security number
1942  *
1943  * This is a helper function that calls security_secid_to_secctx to convert
1944  * secid to secctx and then adds the (converted) SELinux context to the audit
1945  * log by calling audit_log_format, thus also preventing leak of internal secid
1946  * to userspace. If secid cannot be converted audit_panic is called.
1947  */
1948 void audit_log_secctx(struct audit_buffer *ab, u32 secid)
1949 {
1950         u32 len;
1951         char *secctx;
1952
1953         if (security_secid_to_secctx(secid, &secctx, &len)) {
1954                 audit_panic("Cannot convert secid to context");
1955         } else {
1956                 audit_log_format(ab, " obj=%s", secctx);
1957                 security_release_secctx(secctx, len);
1958         }
1959 }
1960 EXPORT_SYMBOL(audit_log_secctx);
1961 #endif
1962
1963 EXPORT_SYMBOL(audit_log_start);
1964 EXPORT_SYMBOL(audit_log_end);
1965 EXPORT_SYMBOL(audit_log_format);
1966 EXPORT_SYMBOL(audit_log);