]> Pileus Git - ~andy/linux/blob - arch/powerpc/kvm/book3s_64_mmu_host.c
KVM: PPC: Book3S PR: Use mmu_notifier_retry() in kvmppc_mmu_map_page()
[~andy/linux] / arch / powerpc / kvm / book3s_64_mmu_host.c
1 /*
2  * Copyright (C) 2009 SUSE Linux Products GmbH. All rights reserved.
3  *
4  * Authors:
5  *     Alexander Graf <agraf@suse.de>
6  *     Kevin Wolf <mail@kevin-wolf.de>
7  *
8  * This program is free software; you can redistribute it and/or modify
9  * it under the terms of the GNU General Public License, version 2, as
10  * published by the Free Software Foundation.
11  *
12  * This program is distributed in the hope that it will be useful,
13  * but WITHOUT ANY WARRANTY; without even the implied warranty of
14  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
15  * GNU General Public License for more details.
16  *
17  * You should have received a copy of the GNU General Public License
18  * along with this program; if not, write to the Free Software
19  * Foundation, 51 Franklin Street, Fifth Floor, Boston, MA  02110-1301, USA.
20  */
21
22 #include <linux/kvm_host.h>
23
24 #include <asm/kvm_ppc.h>
25 #include <asm/kvm_book3s.h>
26 #include <asm/mmu-hash64.h>
27 #include <asm/machdep.h>
28 #include <asm/mmu_context.h>
29 #include <asm/hw_irq.h>
30 #include "trace.h"
31
32 #define PTE_SIZE 12
33
34 void kvmppc_mmu_invalidate_pte(struct kvm_vcpu *vcpu, struct hpte_cache *pte)
35 {
36         ppc_md.hpte_invalidate(pte->slot, pte->host_vpn,
37                                pte->pagesize, pte->pagesize, MMU_SEGSIZE_256M,
38                                false);
39 }
40
41 /* We keep 512 gvsid->hvsid entries, mapping the guest ones to the array using
42  * a hash, so we don't waste cycles on looping */
43 static u16 kvmppc_sid_hash(struct kvm_vcpu *vcpu, u64 gvsid)
44 {
45         return (u16)(((gvsid >> (SID_MAP_BITS * 7)) & SID_MAP_MASK) ^
46                      ((gvsid >> (SID_MAP_BITS * 6)) & SID_MAP_MASK) ^
47                      ((gvsid >> (SID_MAP_BITS * 5)) & SID_MAP_MASK) ^
48                      ((gvsid >> (SID_MAP_BITS * 4)) & SID_MAP_MASK) ^
49                      ((gvsid >> (SID_MAP_BITS * 3)) & SID_MAP_MASK) ^
50                      ((gvsid >> (SID_MAP_BITS * 2)) & SID_MAP_MASK) ^
51                      ((gvsid >> (SID_MAP_BITS * 1)) & SID_MAP_MASK) ^
52                      ((gvsid >> (SID_MAP_BITS * 0)) & SID_MAP_MASK));
53 }
54
55
56 static struct kvmppc_sid_map *find_sid_vsid(struct kvm_vcpu *vcpu, u64 gvsid)
57 {
58         struct kvmppc_sid_map *map;
59         u16 sid_map_mask;
60
61         if (vcpu->arch.shared->msr & MSR_PR)
62                 gvsid |= VSID_PR;
63
64         sid_map_mask = kvmppc_sid_hash(vcpu, gvsid);
65         map = &to_book3s(vcpu)->sid_map[sid_map_mask];
66         if (map->valid && (map->guest_vsid == gvsid)) {
67                 trace_kvm_book3s_slb_found(gvsid, map->host_vsid);
68                 return map;
69         }
70
71         map = &to_book3s(vcpu)->sid_map[SID_MAP_MASK - sid_map_mask];
72         if (map->valid && (map->guest_vsid == gvsid)) {
73                 trace_kvm_book3s_slb_found(gvsid, map->host_vsid);
74                 return map;
75         }
76
77         trace_kvm_book3s_slb_fail(sid_map_mask, gvsid);
78         return NULL;
79 }
80
81 int kvmppc_mmu_map_page(struct kvm_vcpu *vcpu, struct kvmppc_pte *orig_pte,
82                         bool iswrite)
83 {
84         unsigned long vpn;
85         pfn_t hpaddr;
86         ulong hash, hpteg;
87         u64 vsid;
88         int ret;
89         int rflags = 0x192;
90         int vflags = 0;
91         int attempt = 0;
92         struct kvmppc_sid_map *map;
93         int r = 0;
94         int hpsize = MMU_PAGE_4K;
95         bool writable;
96         unsigned long mmu_seq;
97         struct kvm *kvm = vcpu->kvm;
98         struct hpte_cache *cpte;
99
100         /* used to check for invalidations in progress */
101         mmu_seq = kvm->mmu_notifier_seq;
102         smp_rmb();
103
104         /* Get host physical address for gpa */
105         hpaddr = kvmppc_gfn_to_pfn(vcpu, orig_pte->raddr >> PAGE_SHIFT,
106                                    iswrite, &writable);
107         if (is_error_noslot_pfn(hpaddr)) {
108                 printk(KERN_INFO "Couldn't get guest page for gfn %lx!\n", orig_pte->eaddr);
109                 r = -EINVAL;
110                 goto out;
111         }
112         hpaddr <<= PAGE_SHIFT;
113
114         /* and write the mapping ea -> hpa into the pt */
115         vcpu->arch.mmu.esid_to_vsid(vcpu, orig_pte->eaddr >> SID_SHIFT, &vsid);
116         map = find_sid_vsid(vcpu, vsid);
117         if (!map) {
118                 ret = kvmppc_mmu_map_segment(vcpu, orig_pte->eaddr);
119                 WARN_ON(ret < 0);
120                 map = find_sid_vsid(vcpu, vsid);
121         }
122         if (!map) {
123                 printk(KERN_ERR "KVM: Segment map for 0x%llx (0x%lx) failed\n",
124                                 vsid, orig_pte->eaddr);
125                 WARN_ON(true);
126                 r = -EINVAL;
127                 goto out;
128         }
129
130         vpn = hpt_vpn(orig_pte->eaddr, map->host_vsid, MMU_SEGSIZE_256M);
131
132         if (!orig_pte->may_write || !writable)
133                 rflags |= HPTE_R_PP;
134         else
135                 mark_page_dirty(vcpu->kvm, orig_pte->raddr >> PAGE_SHIFT);
136
137         if (!orig_pte->may_execute)
138                 rflags |= HPTE_R_N;
139         else
140                 kvmppc_mmu_flush_icache(hpaddr >> PAGE_SHIFT);
141
142         /*
143          * Use 64K pages if possible; otherwise, on 64K page kernels,
144          * we need to transfer 4 more bits from guest real to host real addr.
145          */
146         if (vsid & VSID_64K)
147                 hpsize = MMU_PAGE_64K;
148         else
149                 hpaddr |= orig_pte->raddr & (~0xfffULL & ~PAGE_MASK);
150
151         hash = hpt_hash(vpn, mmu_psize_defs[hpsize].shift, MMU_SEGSIZE_256M);
152
153         cpte = kvmppc_mmu_hpte_cache_next(vcpu);
154
155         spin_lock(&kvm->mmu_lock);
156         if (!cpte || mmu_notifier_retry(kvm, mmu_seq)) {
157                 r = -EAGAIN;
158                 goto out_unlock;
159         }
160
161 map_again:
162         hpteg = ((hash & htab_hash_mask) * HPTES_PER_GROUP);
163
164         /* In case we tried normal mapping already, let's nuke old entries */
165         if (attempt > 1)
166                 if (ppc_md.hpte_remove(hpteg) < 0) {
167                         r = -1;
168                         goto out_unlock;
169                 }
170
171         ret = ppc_md.hpte_insert(hpteg, vpn, hpaddr, rflags, vflags,
172                                  hpsize, hpsize, MMU_SEGSIZE_256M);
173
174         if (ret < 0) {
175                 /* If we couldn't map a primary PTE, try a secondary */
176                 hash = ~hash;
177                 vflags ^= HPTE_V_SECONDARY;
178                 attempt++;
179                 goto map_again;
180         } else {
181                 trace_kvm_book3s_64_mmu_map(rflags, hpteg,
182                                             vpn, hpaddr, orig_pte);
183
184                 /* The ppc_md code may give us a secondary entry even though we
185                    asked for a primary. Fix up. */
186                 if ((ret & _PTEIDX_SECONDARY) && !(vflags & HPTE_V_SECONDARY)) {
187                         hash = ~hash;
188                         hpteg = ((hash & htab_hash_mask) * HPTES_PER_GROUP);
189                 }
190
191                 cpte->slot = hpteg + (ret & 7);
192                 cpte->host_vpn = vpn;
193                 cpte->pte = *orig_pte;
194                 cpte->pfn = hpaddr >> PAGE_SHIFT;
195                 cpte->pagesize = hpsize;
196
197                 kvmppc_mmu_hpte_cache_map(vcpu, cpte);
198                 cpte = NULL;
199         }
200
201 out_unlock:
202         spin_unlock(&kvm->mmu_lock);
203         kvm_release_pfn_clean(hpaddr >> PAGE_SHIFT);
204         if (cpte)
205                 kvmppc_mmu_hpte_cache_free(cpte);
206
207 out:
208         return r;
209 }
210
211 void kvmppc_mmu_unmap_page(struct kvm_vcpu *vcpu, struct kvmppc_pte *pte)
212 {
213         u64 mask = 0xfffffffffULL;
214         u64 vsid;
215
216         vcpu->arch.mmu.esid_to_vsid(vcpu, pte->eaddr >> SID_SHIFT, &vsid);
217         if (vsid & VSID_64K)
218                 mask = 0xffffffff0ULL;
219         kvmppc_mmu_pte_vflush(vcpu, pte->vpage, mask);
220 }
221
222 static struct kvmppc_sid_map *create_sid_map(struct kvm_vcpu *vcpu, u64 gvsid)
223 {
224         struct kvmppc_sid_map *map;
225         struct kvmppc_vcpu_book3s *vcpu_book3s = to_book3s(vcpu);
226         u16 sid_map_mask;
227         static int backwards_map = 0;
228
229         if (vcpu->arch.shared->msr & MSR_PR)
230                 gvsid |= VSID_PR;
231
232         /* We might get collisions that trap in preceding order, so let's
233            map them differently */
234
235         sid_map_mask = kvmppc_sid_hash(vcpu, gvsid);
236         if (backwards_map)
237                 sid_map_mask = SID_MAP_MASK - sid_map_mask;
238
239         map = &to_book3s(vcpu)->sid_map[sid_map_mask];
240
241         /* Make sure we're taking the other map next time */
242         backwards_map = !backwards_map;
243
244         /* Uh-oh ... out of mappings. Let's flush! */
245         if (vcpu_book3s->proto_vsid_next == vcpu_book3s->proto_vsid_max) {
246                 vcpu_book3s->proto_vsid_next = vcpu_book3s->proto_vsid_first;
247                 memset(vcpu_book3s->sid_map, 0,
248                        sizeof(struct kvmppc_sid_map) * SID_MAP_NUM);
249                 kvmppc_mmu_pte_flush(vcpu, 0, 0);
250                 kvmppc_mmu_flush_segments(vcpu);
251         }
252         map->host_vsid = vsid_scramble(vcpu_book3s->proto_vsid_next++, 256M);
253
254         map->guest_vsid = gvsid;
255         map->valid = true;
256
257         trace_kvm_book3s_slb_map(sid_map_mask, gvsid, map->host_vsid);
258
259         return map;
260 }
261
262 static int kvmppc_mmu_next_segment(struct kvm_vcpu *vcpu, ulong esid)
263 {
264         struct kvmppc_book3s_shadow_vcpu *svcpu = svcpu_get(vcpu);
265         int i;
266         int max_slb_size = 64;
267         int found_inval = -1;
268         int r;
269
270         if (!svcpu->slb_max)
271                 svcpu->slb_max = 1;
272
273         /* Are we overwriting? */
274         for (i = 1; i < svcpu->slb_max; i++) {
275                 if (!(svcpu->slb[i].esid & SLB_ESID_V))
276                         found_inval = i;
277                 else if ((svcpu->slb[i].esid & ESID_MASK) == esid) {
278                         r = i;
279                         goto out;
280                 }
281         }
282
283         /* Found a spare entry that was invalidated before */
284         if (found_inval > 0) {
285                 r = found_inval;
286                 goto out;
287         }
288
289         /* No spare invalid entry, so create one */
290
291         if (mmu_slb_size < 64)
292                 max_slb_size = mmu_slb_size;
293
294         /* Overflowing -> purge */
295         if ((svcpu->slb_max) == max_slb_size)
296                 kvmppc_mmu_flush_segments(vcpu);
297
298         r = svcpu->slb_max;
299         svcpu->slb_max++;
300
301 out:
302         svcpu_put(svcpu);
303         return r;
304 }
305
306 int kvmppc_mmu_map_segment(struct kvm_vcpu *vcpu, ulong eaddr)
307 {
308         struct kvmppc_book3s_shadow_vcpu *svcpu = svcpu_get(vcpu);
309         u64 esid = eaddr >> SID_SHIFT;
310         u64 slb_esid = (eaddr & ESID_MASK) | SLB_ESID_V;
311         u64 slb_vsid = SLB_VSID_USER;
312         u64 gvsid;
313         int slb_index;
314         struct kvmppc_sid_map *map;
315         int r = 0;
316
317         slb_index = kvmppc_mmu_next_segment(vcpu, eaddr & ESID_MASK);
318
319         if (vcpu->arch.mmu.esid_to_vsid(vcpu, esid, &gvsid)) {
320                 /* Invalidate an entry */
321                 svcpu->slb[slb_index].esid = 0;
322                 r = -ENOENT;
323                 goto out;
324         }
325
326         map = find_sid_vsid(vcpu, gvsid);
327         if (!map)
328                 map = create_sid_map(vcpu, gvsid);
329
330         map->guest_esid = esid;
331
332         slb_vsid |= (map->host_vsid << 12);
333         slb_vsid &= ~SLB_VSID_KP;
334         slb_esid |= slb_index;
335
336 #ifdef CONFIG_PPC_64K_PAGES
337         /* Set host segment base page size to 64K if possible */
338         if (gvsid & VSID_64K)
339                 slb_vsid |= mmu_psize_defs[MMU_PAGE_64K].sllp;
340 #endif
341
342         svcpu->slb[slb_index].esid = slb_esid;
343         svcpu->slb[slb_index].vsid = slb_vsid;
344
345         trace_kvm_book3s_slbmte(slb_vsid, slb_esid);
346
347 out:
348         svcpu_put(svcpu);
349         return r;
350 }
351
352 void kvmppc_mmu_flush_segment(struct kvm_vcpu *vcpu, ulong ea, ulong seg_size)
353 {
354         struct kvmppc_book3s_shadow_vcpu *svcpu = svcpu_get(vcpu);
355         ulong seg_mask = -seg_size;
356         int i;
357
358         for (i = 1; i < svcpu->slb_max; i++) {
359                 if ((svcpu->slb[i].esid & SLB_ESID_V) &&
360                     (svcpu->slb[i].esid & seg_mask) == ea) {
361                         /* Invalidate this entry */
362                         svcpu->slb[i].esid = 0;
363                 }
364         }
365
366         svcpu_put(svcpu);
367 }
368
369 void kvmppc_mmu_flush_segments(struct kvm_vcpu *vcpu)
370 {
371         struct kvmppc_book3s_shadow_vcpu *svcpu = svcpu_get(vcpu);
372         svcpu->slb_max = 1;
373         svcpu->slb[0].esid = 0;
374         svcpu_put(svcpu);
375 }
376
377 void kvmppc_mmu_destroy(struct kvm_vcpu *vcpu)
378 {
379         kvmppc_mmu_hpte_destroy(vcpu);
380         __destroy_context(to_book3s(vcpu)->context_id[0]);
381 }
382
383 int kvmppc_mmu_init(struct kvm_vcpu *vcpu)
384 {
385         struct kvmppc_vcpu_book3s *vcpu3s = to_book3s(vcpu);
386         int err;
387
388         err = __init_new_context();
389         if (err < 0)
390                 return -1;
391         vcpu3s->context_id[0] = err;
392
393         vcpu3s->proto_vsid_max = ((u64)(vcpu3s->context_id[0] + 1)
394                                   << ESID_BITS) - 1;
395         vcpu3s->proto_vsid_first = (u64)vcpu3s->context_id[0] << ESID_BITS;
396         vcpu3s->proto_vsid_next = vcpu3s->proto_vsid_first;
397
398         kvmppc_mmu_hpte_init(vcpu);
399
400         return 0;
401 }