Revert "PM QoS: Use spinlock in the per-device PM QoS constraints code"
[firefly-linux-kernel-4.4.55.git] / arch / powerpc / kernel / entry_64.S
1 /*
2  *  PowerPC version 
3  *    Copyright (C) 1995-1996 Gary Thomas (gdt@linuxppc.org)
4  *  Rewritten by Cort Dougan (cort@cs.nmt.edu) for PReP
5  *    Copyright (C) 1996 Cort Dougan <cort@cs.nmt.edu>
6  *  Adapted for Power Macintosh by Paul Mackerras.
7  *  Low-level exception handlers and MMU support
8  *  rewritten by Paul Mackerras.
9  *    Copyright (C) 1996 Paul Mackerras.
10  *  MPC8xx modifications Copyright (C) 1997 Dan Malek (dmalek@jlc.net).
11  *
12  *  This file contains the system call entry code, context switch
13  *  code, and exception/interrupt return code for PowerPC.
14  *
15  *  This program is free software; you can redistribute it and/or
16  *  modify it under the terms of the GNU General Public License
17  *  as published by the Free Software Foundation; either version
18  *  2 of the License, or (at your option) any later version.
19  */
20
21 #include <linux/errno.h>
22 #include <asm/unistd.h>
23 #include <asm/processor.h>
24 #include <asm/page.h>
25 #include <asm/mmu.h>
26 #include <asm/thread_info.h>
27 #include <asm/ppc_asm.h>
28 #include <asm/asm-offsets.h>
29 #include <asm/cputable.h>
30 #include <asm/firmware.h>
31 #include <asm/bug.h>
32 #include <asm/ptrace.h>
33 #include <asm/irqflags.h>
34 #include <asm/ftrace.h>
35 #include <asm/hw_irq.h>
36
37 /*
38  * System calls.
39  */
40         .section        ".toc","aw"
41 .SYS_CALL_TABLE:
42         .tc .sys_call_table[TC],.sys_call_table
43
44 /* This value is used to mark exception frames on the stack. */
45 exception_marker:
46         .tc     ID_EXC_MARKER[TC],STACK_FRAME_REGS_MARKER
47
48         .section        ".text"
49         .align 7
50
51 #undef SHOW_SYSCALLS
52
53         .globl system_call_common
54 system_call_common:
55         andi.   r10,r12,MSR_PR
56         mr      r10,r1
57         addi    r1,r1,-INT_FRAME_SIZE
58         beq-    1f
59         ld      r1,PACAKSAVE(r13)
60 1:      std     r10,0(r1)
61         std     r11,_NIP(r1)
62         std     r12,_MSR(r1)
63         std     r0,GPR0(r1)
64         std     r10,GPR1(r1)
65         ACCOUNT_CPU_USER_ENTRY(r10, r11)
66         std     r2,GPR2(r1)
67         std     r3,GPR3(r1)
68         mfcr    r2
69         std     r4,GPR4(r1)
70         std     r5,GPR5(r1)
71         std     r6,GPR6(r1)
72         std     r7,GPR7(r1)
73         std     r8,GPR8(r1)
74         li      r11,0
75         std     r11,GPR9(r1)
76         std     r11,GPR10(r1)
77         std     r11,GPR11(r1)
78         std     r11,GPR12(r1)
79         std     r11,_XER(r1)
80         std     r11,_CTR(r1)
81         std     r9,GPR13(r1)
82         mflr    r10
83         /*
84          * This clears CR0.SO (bit 28), which is the error indication on
85          * return from this system call.
86          */
87         rldimi  r2,r11,28,(63-28)
88         li      r11,0xc01
89         std     r10,_LINK(r1)
90         std     r11,_TRAP(r1)
91         std     r3,ORIG_GPR3(r1)
92         std     r2,_CCR(r1)
93         ld      r2,PACATOC(r13)
94         addi    r9,r1,STACK_FRAME_OVERHEAD
95         ld      r11,exception_marker@toc(r2)
96         std     r11,-16(r9)             /* "regshere" marker */
97 #if defined(CONFIG_VIRT_CPU_ACCOUNTING) && defined(CONFIG_PPC_SPLPAR)
98 BEGIN_FW_FTR_SECTION
99         beq     33f
100         /* if from user, see if there are any DTL entries to process */
101         ld      r10,PACALPPACAPTR(r13)  /* get ptr to VPA */
102         ld      r11,PACA_DTL_RIDX(r13)  /* get log read index */
103         ld      r10,LPPACA_DTLIDX(r10)  /* get log write index */
104         cmpd    cr1,r11,r10
105         beq+    cr1,33f
106         bl      .accumulate_stolen_time
107         REST_GPR(0,r1)
108         REST_4GPRS(3,r1)
109         REST_2GPRS(7,r1)
110         addi    r9,r1,STACK_FRAME_OVERHEAD
111 33:
112 END_FW_FTR_SECTION_IFSET(FW_FEATURE_SPLPAR)
113 #endif /* CONFIG_VIRT_CPU_ACCOUNTING && CONFIG_PPC_SPLPAR */
114
115         /*
116          * A syscall should always be called with interrupts enabled
117          * so we just unconditionally hard-enable here. When some kind
118          * of irq tracing is used, we additionally check that condition
119          * is correct
120          */
121 #if defined(CONFIG_TRACE_IRQFLAGS) && defined(CONFIG_BUG)
122         lbz     r10,PACASOFTIRQEN(r13)
123         xori    r10,r10,1
124 1:      tdnei   r10,0
125         EMIT_BUG_ENTRY 1b,__FILE__,__LINE__,BUGFLAG_WARNING
126 #endif
127
128 #ifdef CONFIG_PPC_BOOK3E
129         wrteei  1
130 #else
131         ld      r11,PACAKMSR(r13)
132         ori     r11,r11,MSR_EE
133         mtmsrd  r11,1
134 #endif /* CONFIG_PPC_BOOK3E */
135
136         /* We do need to set SOFTE in the stack frame or the return
137          * from interrupt will be painful
138          */
139         li      r10,1
140         std     r10,SOFTE(r1)
141
142 #ifdef SHOW_SYSCALLS
143         bl      .do_show_syscall
144         REST_GPR(0,r1)
145         REST_4GPRS(3,r1)
146         REST_2GPRS(7,r1)
147         addi    r9,r1,STACK_FRAME_OVERHEAD
148 #endif
149         CURRENT_THREAD_INFO(r11, r1)
150         ld      r10,TI_FLAGS(r11)
151         andi.   r11,r10,_TIF_SYSCALL_T_OR_A
152         bne-    syscall_dotrace
153 .Lsyscall_dotrace_cont:
154         cmpldi  0,r0,NR_syscalls
155         bge-    syscall_enosys
156
157 system_call:                    /* label this so stack traces look sane */
158 /*
159  * Need to vector to 32 Bit or default sys_call_table here,
160  * based on caller's run-mode / personality.
161  */
162         ld      r11,.SYS_CALL_TABLE@toc(2)
163         andi.   r10,r10,_TIF_32BIT
164         beq     15f
165         addi    r11,r11,8       /* use 32-bit syscall entries */
166         clrldi  r3,r3,32
167         clrldi  r4,r4,32
168         clrldi  r5,r5,32
169         clrldi  r6,r6,32
170         clrldi  r7,r7,32
171         clrldi  r8,r8,32
172 15:
173         slwi    r0,r0,4
174         ldx     r10,r11,r0      /* Fetch system call handler [ptr] */
175         mtctr   r10
176         bctrl                   /* Call handler */
177
178 syscall_exit:
179         std     r3,RESULT(r1)
180 #ifdef SHOW_SYSCALLS
181         bl      .do_show_syscall_exit
182         ld      r3,RESULT(r1)
183 #endif
184         CURRENT_THREAD_INFO(r12, r1)
185
186         ld      r8,_MSR(r1)
187 #ifdef CONFIG_PPC_BOOK3S
188         /* No MSR:RI on BookE */
189         andi.   r10,r8,MSR_RI
190         beq-    unrecov_restore
191 #endif
192         /*
193          * Disable interrupts so current_thread_info()->flags can't change,
194          * and so that we don't get interrupted after loading SRR0/1.
195          */
196 #ifdef CONFIG_PPC_BOOK3E
197         wrteei  0
198 #else
199         ld      r10,PACAKMSR(r13)
200         /*
201          * For performance reasons we clear RI the same time that we
202          * clear EE. We only need to clear RI just before we restore r13
203          * below, but batching it with EE saves us one expensive mtmsrd call.
204          * We have to be careful to restore RI if we branch anywhere from
205          * here (eg syscall_exit_work).
206          */
207         li      r9,MSR_RI
208         andc    r11,r10,r9
209         mtmsrd  r11,1
210 #endif /* CONFIG_PPC_BOOK3E */
211
212         ld      r9,TI_FLAGS(r12)
213         li      r11,-_LAST_ERRNO
214         andi.   r0,r9,(_TIF_SYSCALL_T_OR_A|_TIF_SINGLESTEP|_TIF_USER_WORK_MASK|_TIF_PERSYSCALL_MASK)
215         bne-    syscall_exit_work
216         cmpld   r3,r11
217         ld      r5,_CCR(r1)
218         bge-    syscall_error
219 .Lsyscall_error_cont:
220         ld      r7,_NIP(r1)
221 BEGIN_FTR_SECTION
222         stdcx.  r0,0,r1                 /* to clear the reservation */
223 END_FTR_SECTION_IFCLR(CPU_FTR_STCX_CHECKS_ADDRESS)
224         andi.   r6,r8,MSR_PR
225         ld      r4,_LINK(r1)
226
227         beq-    1f
228         ACCOUNT_CPU_USER_EXIT(r11, r12)
229         ld      r13,GPR13(r1)   /* only restore r13 if returning to usermode */
230 1:      ld      r2,GPR2(r1)
231         ld      r1,GPR1(r1)
232         mtlr    r4
233         mtcr    r5
234         mtspr   SPRN_SRR0,r7
235         mtspr   SPRN_SRR1,r8
236         RFI
237         b       .       /* prevent speculative execution */
238
239 syscall_error:  
240         oris    r5,r5,0x1000    /* Set SO bit in CR */
241         neg     r3,r3
242         std     r5,_CCR(r1)
243         b       .Lsyscall_error_cont
244         
245 /* Traced system call support */
246 syscall_dotrace:
247         bl      .save_nvgprs
248         addi    r3,r1,STACK_FRAME_OVERHEAD
249         bl      .do_syscall_trace_enter
250         /*
251          * Restore argument registers possibly just changed.
252          * We use the return value of do_syscall_trace_enter
253          * for the call number to look up in the table (r0).
254          */
255         mr      r0,r3
256         ld      r3,GPR3(r1)
257         ld      r4,GPR4(r1)
258         ld      r5,GPR5(r1)
259         ld      r6,GPR6(r1)
260         ld      r7,GPR7(r1)
261         ld      r8,GPR8(r1)
262         addi    r9,r1,STACK_FRAME_OVERHEAD
263         CURRENT_THREAD_INFO(r10, r1)
264         ld      r10,TI_FLAGS(r10)
265         b       .Lsyscall_dotrace_cont
266
267 syscall_enosys:
268         li      r3,-ENOSYS
269         b       syscall_exit
270         
271 syscall_exit_work:
272 #ifdef CONFIG_PPC_BOOK3S
273         mtmsrd  r10,1           /* Restore RI */
274 #endif
275         /* If TIF_RESTOREALL is set, don't scribble on either r3 or ccr.
276          If TIF_NOERROR is set, just save r3 as it is. */
277
278         andi.   r0,r9,_TIF_RESTOREALL
279         beq+    0f
280         REST_NVGPRS(r1)
281         b       2f
282 0:      cmpld   r3,r11          /* r10 is -LAST_ERRNO */
283         blt+    1f
284         andi.   r0,r9,_TIF_NOERROR
285         bne-    1f
286         ld      r5,_CCR(r1)
287         neg     r3,r3
288         oris    r5,r5,0x1000    /* Set SO bit in CR */
289         std     r5,_CCR(r1)
290 1:      std     r3,GPR3(r1)
291 2:      andi.   r0,r9,(_TIF_PERSYSCALL_MASK)
292         beq     4f
293
294         /* Clear per-syscall TIF flags if any are set.  */
295
296         li      r11,_TIF_PERSYSCALL_MASK
297         addi    r12,r12,TI_FLAGS
298 3:      ldarx   r10,0,r12
299         andc    r10,r10,r11
300         stdcx.  r10,0,r12
301         bne-    3b
302         subi    r12,r12,TI_FLAGS
303
304 4:      /* Anything else left to do? */
305         andi.   r0,r9,(_TIF_SYSCALL_T_OR_A|_TIF_SINGLESTEP)
306         beq     .ret_from_except_lite
307
308         /* Re-enable interrupts */
309 #ifdef CONFIG_PPC_BOOK3E
310         wrteei  1
311 #else
312         ld      r10,PACAKMSR(r13)
313         ori     r10,r10,MSR_EE
314         mtmsrd  r10,1
315 #endif /* CONFIG_PPC_BOOK3E */
316
317         bl      .save_nvgprs
318         addi    r3,r1,STACK_FRAME_OVERHEAD
319         bl      .do_syscall_trace_leave
320         b       .ret_from_except
321
322 /* Save non-volatile GPRs, if not already saved. */
323 _GLOBAL(save_nvgprs)
324         ld      r11,_TRAP(r1)
325         andi.   r0,r11,1
326         beqlr-
327         SAVE_NVGPRS(r1)
328         clrrdi  r0,r11,1
329         std     r0,_TRAP(r1)
330         blr
331
332         
333 /*
334  * The sigsuspend and rt_sigsuspend system calls can call do_signal
335  * and thus put the process into the stopped state where we might
336  * want to examine its user state with ptrace.  Therefore we need
337  * to save all the nonvolatile registers (r14 - r31) before calling
338  * the C code.  Similarly, fork, vfork and clone need the full
339  * register state on the stack so that it can be copied to the child.
340  */
341
342 _GLOBAL(ppc_fork)
343         bl      .save_nvgprs
344         bl      .sys_fork
345         b       syscall_exit
346
347 _GLOBAL(ppc_vfork)
348         bl      .save_nvgprs
349         bl      .sys_vfork
350         b       syscall_exit
351
352 _GLOBAL(ppc_clone)
353         bl      .save_nvgprs
354         bl      .sys_clone
355         b       syscall_exit
356
357 _GLOBAL(ppc32_swapcontext)
358         bl      .save_nvgprs
359         bl      .compat_sys_swapcontext
360         b       syscall_exit
361
362 _GLOBAL(ppc64_swapcontext)
363         bl      .save_nvgprs
364         bl      .sys_swapcontext
365         b       syscall_exit
366
367 _GLOBAL(ret_from_fork)
368         bl      .schedule_tail
369         REST_NVGPRS(r1)
370         li      r3,0
371         b       syscall_exit
372
373 /*
374  * This routine switches between two different tasks.  The process
375  * state of one is saved on its kernel stack.  Then the state
376  * of the other is restored from its kernel stack.  The memory
377  * management hardware is updated to the second process's state.
378  * Finally, we can return to the second process, via ret_from_except.
379  * On entry, r3 points to the THREAD for the current task, r4
380  * points to the THREAD for the new task.
381  *
382  * Note: there are two ways to get to the "going out" portion
383  * of this code; either by coming in via the entry (_switch)
384  * or via "fork" which must set up an environment equivalent
385  * to the "_switch" path.  If you change this you'll have to change
386  * the fork code also.
387  *
388  * The code which creates the new task context is in 'copy_thread'
389  * in arch/powerpc/kernel/process.c 
390  */
391         .align  7
392 _GLOBAL(_switch)
393         mflr    r0
394         std     r0,16(r1)
395         stdu    r1,-SWITCH_FRAME_SIZE(r1)
396         /* r3-r13 are caller saved -- Cort */
397         SAVE_8GPRS(14, r1)
398         SAVE_10GPRS(22, r1)
399         mflr    r20             /* Return to switch caller */
400         mfmsr   r22
401         li      r0, MSR_FP
402 #ifdef CONFIG_VSX
403 BEGIN_FTR_SECTION
404         oris    r0,r0,MSR_VSX@h /* Disable VSX */
405 END_FTR_SECTION_IFSET(CPU_FTR_VSX)
406 #endif /* CONFIG_VSX */
407 #ifdef CONFIG_ALTIVEC
408 BEGIN_FTR_SECTION
409         oris    r0,r0,MSR_VEC@h /* Disable altivec */
410         mfspr   r24,SPRN_VRSAVE /* save vrsave register value */
411         std     r24,THREAD_VRSAVE(r3)
412 END_FTR_SECTION_IFSET(CPU_FTR_ALTIVEC)
413 #endif /* CONFIG_ALTIVEC */
414 #ifdef CONFIG_PPC64
415 BEGIN_FTR_SECTION
416         mfspr   r25,SPRN_DSCR
417         std     r25,THREAD_DSCR(r3)
418 END_FTR_SECTION_IFSET(CPU_FTR_DSCR)
419 #endif
420         and.    r0,r0,r22
421         beq+    1f
422         andc    r22,r22,r0
423         MTMSRD(r22)
424         isync
425 1:      std     r20,_NIP(r1)
426         mfcr    r23
427         std     r23,_CCR(r1)
428         std     r1,KSP(r3)      /* Set old stack pointer */
429
430 #ifdef CONFIG_SMP
431         /* We need a sync somewhere here to make sure that if the
432          * previous task gets rescheduled on another CPU, it sees all
433          * stores it has performed on this one.
434          */
435         sync
436 #endif /* CONFIG_SMP */
437
438         /*
439          * If we optimise away the clear of the reservation in system
440          * calls because we know the CPU tracks the address of the
441          * reservation, then we need to clear it here to cover the
442          * case that the kernel context switch path has no larx
443          * instructions.
444          */
445 BEGIN_FTR_SECTION
446         ldarx   r6,0,r1
447 END_FTR_SECTION_IFSET(CPU_FTR_STCX_CHECKS_ADDRESS)
448
449         addi    r6,r4,-THREAD   /* Convert THREAD to 'current' */
450         std     r6,PACACURRENT(r13)     /* Set new 'current' */
451
452         ld      r8,KSP(r4)      /* new stack pointer */
453 #ifdef CONFIG_PPC_BOOK3S
454 BEGIN_FTR_SECTION
455   BEGIN_FTR_SECTION_NESTED(95)
456         clrrdi  r6,r8,28        /* get its ESID */
457         clrrdi  r9,r1,28        /* get current sp ESID */
458   FTR_SECTION_ELSE_NESTED(95)
459         clrrdi  r6,r8,40        /* get its 1T ESID */
460         clrrdi  r9,r1,40        /* get current sp 1T ESID */
461   ALT_MMU_FTR_SECTION_END_NESTED_IFCLR(MMU_FTR_1T_SEGMENT, 95)
462 FTR_SECTION_ELSE
463         b       2f
464 ALT_MMU_FTR_SECTION_END_IFSET(MMU_FTR_SLB)
465         clrldi. r0,r6,2         /* is new ESID c00000000? */
466         cmpd    cr1,r6,r9       /* or is new ESID the same as current ESID? */
467         cror    eq,4*cr1+eq,eq
468         beq     2f              /* if yes, don't slbie it */
469
470         /* Bolt in the new stack SLB entry */
471         ld      r7,KSP_VSID(r4) /* Get new stack's VSID */
472         oris    r0,r6,(SLB_ESID_V)@h
473         ori     r0,r0,(SLB_NUM_BOLTED-1)@l
474 BEGIN_FTR_SECTION
475         li      r9,MMU_SEGSIZE_1T       /* insert B field */
476         oris    r6,r6,(MMU_SEGSIZE_1T << SLBIE_SSIZE_SHIFT)@h
477         rldimi  r7,r9,SLB_VSID_SSIZE_SHIFT,0
478 END_MMU_FTR_SECTION_IFSET(MMU_FTR_1T_SEGMENT)
479
480         /* Update the last bolted SLB.  No write barriers are needed
481          * here, provided we only update the current CPU's SLB shadow
482          * buffer.
483          */
484         ld      r9,PACA_SLBSHADOWPTR(r13)
485         li      r12,0
486         std     r12,SLBSHADOW_STACKESID(r9) /* Clear ESID */
487         std     r7,SLBSHADOW_STACKVSID(r9)  /* Save VSID */
488         std     r0,SLBSHADOW_STACKESID(r9)  /* Save ESID */
489
490         /* No need to check for MMU_FTR_NO_SLBIE_B here, since when
491          * we have 1TB segments, the only CPUs known to have the errata
492          * only support less than 1TB of system memory and we'll never
493          * actually hit this code path.
494          */
495
496         slbie   r6
497         slbie   r6              /* Workaround POWER5 < DD2.1 issue */
498         slbmte  r7,r0
499         isync
500 2:
501 #endif /* !CONFIG_PPC_BOOK3S */
502
503         CURRENT_THREAD_INFO(r7, r8)  /* base of new stack */
504         /* Note: this uses SWITCH_FRAME_SIZE rather than INT_FRAME_SIZE
505            because we don't need to leave the 288-byte ABI gap at the
506            top of the kernel stack. */
507         addi    r7,r7,THREAD_SIZE-SWITCH_FRAME_SIZE
508
509         mr      r1,r8           /* start using new stack pointer */
510         std     r7,PACAKSAVE(r13)
511
512         ld      r6,_CCR(r1)
513         mtcrf   0xFF,r6
514
515 #ifdef CONFIG_ALTIVEC
516 BEGIN_FTR_SECTION
517         ld      r0,THREAD_VRSAVE(r4)
518         mtspr   SPRN_VRSAVE,r0          /* if G4, restore VRSAVE reg */
519 END_FTR_SECTION_IFSET(CPU_FTR_ALTIVEC)
520 #endif /* CONFIG_ALTIVEC */
521 #ifdef CONFIG_PPC64
522 BEGIN_FTR_SECTION
523         ld      r0,THREAD_DSCR(r4)
524         cmpd    r0,r25
525         beq     1f
526         mtspr   SPRN_DSCR,r0
527 1:      
528 END_FTR_SECTION_IFSET(CPU_FTR_DSCR)
529 #endif
530
531         /* r3-r13 are destroyed -- Cort */
532         REST_8GPRS(14, r1)
533         REST_10GPRS(22, r1)
534
535         /* convert old thread to its task_struct for return value */
536         addi    r3,r3,-THREAD
537         ld      r7,_NIP(r1)     /* Return to _switch caller in new task */
538         mtlr    r7
539         addi    r1,r1,SWITCH_FRAME_SIZE
540         blr
541
542         .align  7
543 _GLOBAL(ret_from_except)
544         ld      r11,_TRAP(r1)
545         andi.   r0,r11,1
546         bne     .ret_from_except_lite
547         REST_NVGPRS(r1)
548
549 _GLOBAL(ret_from_except_lite)
550         /*
551          * Disable interrupts so that current_thread_info()->flags
552          * can't change between when we test it and when we return
553          * from the interrupt.
554          */
555 #ifdef CONFIG_PPC_BOOK3E
556         wrteei  0
557 #else
558         ld      r10,PACAKMSR(r13) /* Get kernel MSR without EE */
559         mtmsrd  r10,1             /* Update machine state */
560 #endif /* CONFIG_PPC_BOOK3E */
561
562         CURRENT_THREAD_INFO(r9, r1)
563         ld      r3,_MSR(r1)
564         ld      r4,TI_FLAGS(r9)
565         andi.   r3,r3,MSR_PR
566         beq     resume_kernel
567
568         /* Check current_thread_info()->flags */
569         andi.   r0,r4,_TIF_USER_WORK_MASK
570         beq     restore
571
572         andi.   r0,r4,_TIF_NEED_RESCHED
573         beq     1f
574         bl      .restore_interrupts
575         bl      .schedule
576         b       .ret_from_except_lite
577
578 1:      bl      .save_nvgprs
579         bl      .restore_interrupts
580         addi    r3,r1,STACK_FRAME_OVERHEAD
581         bl      .do_notify_resume
582         b       .ret_from_except
583
584 resume_kernel:
585 #ifdef CONFIG_PREEMPT
586         /* Check if we need to preempt */
587         andi.   r0,r4,_TIF_NEED_RESCHED
588         beq+    restore
589         /* Check that preempt_count() == 0 and interrupts are enabled */
590         lwz     r8,TI_PREEMPT(r9)
591         cmpwi   cr1,r8,0
592         ld      r0,SOFTE(r1)
593         cmpdi   r0,0
594         crandc  eq,cr1*4+eq,eq
595         bne     restore
596
597         /*
598          * Here we are preempting the current task. We want to make
599          * sure we are soft-disabled first
600          */
601         SOFT_DISABLE_INTS(r3,r4)
602 1:      bl      .preempt_schedule_irq
603
604         /* Re-test flags and eventually loop */
605         CURRENT_THREAD_INFO(r9, r1)
606         ld      r4,TI_FLAGS(r9)
607         andi.   r0,r4,_TIF_NEED_RESCHED
608         bne     1b
609 #endif /* CONFIG_PREEMPT */
610
611         .globl  fast_exc_return_irq
612 fast_exc_return_irq:
613 restore:
614         /*
615          * This is the main kernel exit path. First we check if we
616          * are about to re-enable interrupts
617          */
618         ld      r5,SOFTE(r1)
619         lbz     r6,PACASOFTIRQEN(r13)
620         cmpwi   cr0,r5,0
621         beq     restore_irq_off
622
623         /* We are enabling, were we already enabled ? Yes, just return */
624         cmpwi   cr0,r6,1
625         beq     cr0,do_restore
626
627         /*
628          * We are about to soft-enable interrupts (we are hard disabled
629          * at this point). We check if there's anything that needs to
630          * be replayed first.
631          */
632         lbz     r0,PACAIRQHAPPENED(r13)
633         cmpwi   cr0,r0,0
634         bne-    restore_check_irq_replay
635
636         /*
637          * Get here when nothing happened while soft-disabled, just
638          * soft-enable and move-on. We will hard-enable as a side
639          * effect of rfi
640          */
641 restore_no_replay:
642         TRACE_ENABLE_INTS
643         li      r0,1
644         stb     r0,PACASOFTIRQEN(r13);
645
646         /*
647          * Final return path. BookE is handled in a different file
648          */
649 do_restore:
650 #ifdef CONFIG_PPC_BOOK3E
651         b       .exception_return_book3e
652 #else
653         /*
654          * Clear the reservation. If we know the CPU tracks the address of
655          * the reservation then we can potentially save some cycles and use
656          * a larx. On POWER6 and POWER7 this is significantly faster.
657          */
658 BEGIN_FTR_SECTION
659         stdcx.  r0,0,r1         /* to clear the reservation */
660 FTR_SECTION_ELSE
661         ldarx   r4,0,r1
662 ALT_FTR_SECTION_END_IFCLR(CPU_FTR_STCX_CHECKS_ADDRESS)
663
664         /*
665          * Some code path such as load_up_fpu or altivec return directly
666          * here. They run entirely hard disabled and do not alter the
667          * interrupt state. They also don't use lwarx/stwcx. and thus
668          * are known not to leave dangling reservations.
669          */
670         .globl  fast_exception_return
671 fast_exception_return:
672         ld      r3,_MSR(r1)
673         ld      r4,_CTR(r1)
674         ld      r0,_LINK(r1)
675         mtctr   r4
676         mtlr    r0
677         ld      r4,_XER(r1)
678         mtspr   SPRN_XER,r4
679
680         REST_8GPRS(5, r1)
681
682         andi.   r0,r3,MSR_RI
683         beq-    unrecov_restore
684
685         /*
686          * Clear RI before restoring r13.  If we are returning to
687          * userspace and we take an exception after restoring r13,
688          * we end up corrupting the userspace r13 value.
689          */
690         ld      r4,PACAKMSR(r13) /* Get kernel MSR without EE */
691         andc    r4,r4,r0         /* r0 contains MSR_RI here */
692         mtmsrd  r4,1
693
694         /*
695          * r13 is our per cpu area, only restore it if we are returning to
696          * userspace the value stored in the stack frame may belong to
697          * another CPU.
698          */
699         andi.   r0,r3,MSR_PR
700         beq     1f
701         ACCOUNT_CPU_USER_EXIT(r2, r4)
702         REST_GPR(13, r1)
703 1:
704         mtspr   SPRN_SRR1,r3
705
706         ld      r2,_CCR(r1)
707         mtcrf   0xFF,r2
708         ld      r2,_NIP(r1)
709         mtspr   SPRN_SRR0,r2
710
711         ld      r0,GPR0(r1)
712         ld      r2,GPR2(r1)
713         ld      r3,GPR3(r1)
714         ld      r4,GPR4(r1)
715         ld      r1,GPR1(r1)
716
717         rfid
718         b       .       /* prevent speculative execution */
719
720 #endif /* CONFIG_PPC_BOOK3E */
721
722         /*
723          * We are returning to a context with interrupts soft disabled.
724          *
725          * However, we may also about to hard enable, so we need to
726          * make sure that in this case, we also clear PACA_IRQ_HARD_DIS
727          * or that bit can get out of sync and bad things will happen
728          */
729 restore_irq_off:
730         ld      r3,_MSR(r1)
731         lbz     r7,PACAIRQHAPPENED(r13)
732         andi.   r0,r3,MSR_EE
733         beq     1f
734         rlwinm  r7,r7,0,~PACA_IRQ_HARD_DIS
735         stb     r7,PACAIRQHAPPENED(r13)
736 1:      li      r0,0
737         stb     r0,PACASOFTIRQEN(r13);
738         TRACE_DISABLE_INTS
739         b       do_restore
740
741         /*
742          * Something did happen, check if a re-emit is needed
743          * (this also clears paca->irq_happened)
744          */
745 restore_check_irq_replay:
746         /* XXX: We could implement a fast path here where we check
747          * for irq_happened being just 0x01, in which case we can
748          * clear it and return. That means that we would potentially
749          * miss a decrementer having wrapped all the way around.
750          *
751          * Still, this might be useful for things like hash_page
752          */
753         bl      .__check_irq_replay
754         cmpwi   cr0,r3,0
755         beq     restore_no_replay
756  
757         /*
758          * We need to re-emit an interrupt. We do so by re-using our
759          * existing exception frame. We first change the trap value,
760          * but we need to ensure we preserve the low nibble of it
761          */
762         ld      r4,_TRAP(r1)
763         clrldi  r4,r4,60
764         or      r4,r4,r3
765         std     r4,_TRAP(r1)
766
767         /*
768          * Then find the right handler and call it. Interrupts are
769          * still soft-disabled and we keep them that way.
770         */
771         cmpwi   cr0,r3,0x500
772         bne     1f
773         addi    r3,r1,STACK_FRAME_OVERHEAD;
774         bl      .do_IRQ
775         b       .ret_from_except
776 1:      cmpwi   cr0,r3,0x900
777         bne     1f
778         addi    r3,r1,STACK_FRAME_OVERHEAD;
779         bl      .timer_interrupt
780         b       .ret_from_except
781 #ifdef CONFIG_PPC_BOOK3E
782 1:      cmpwi   cr0,r3,0x280
783         bne     1f
784         addi    r3,r1,STACK_FRAME_OVERHEAD;
785         bl      .doorbell_exception
786         b       .ret_from_except
787 #endif /* CONFIG_PPC_BOOK3E */
788 1:      b       .ret_from_except /* What else to do here ? */
789  
790 unrecov_restore:
791         addi    r3,r1,STACK_FRAME_OVERHEAD
792         bl      .unrecoverable_exception
793         b       unrecov_restore
794
795 #ifdef CONFIG_PPC_RTAS
796 /*
797  * On CHRP, the Run-Time Abstraction Services (RTAS) have to be
798  * called with the MMU off.
799  *
800  * In addition, we need to be in 32b mode, at least for now.
801  * 
802  * Note: r3 is an input parameter to rtas, so don't trash it...
803  */
804 _GLOBAL(enter_rtas)
805         mflr    r0
806         std     r0,16(r1)
807         stdu    r1,-RTAS_FRAME_SIZE(r1) /* Save SP and create stack space. */
808
809         /* Because RTAS is running in 32b mode, it clobbers the high order half
810          * of all registers that it saves.  We therefore save those registers
811          * RTAS might touch to the stack.  (r0, r3-r13 are caller saved)
812          */
813         SAVE_GPR(2, r1)                 /* Save the TOC */
814         SAVE_GPR(13, r1)                /* Save paca */
815         SAVE_8GPRS(14, r1)              /* Save the non-volatiles */
816         SAVE_10GPRS(22, r1)             /* ditto */
817
818         mfcr    r4
819         std     r4,_CCR(r1)
820         mfctr   r5
821         std     r5,_CTR(r1)
822         mfspr   r6,SPRN_XER
823         std     r6,_XER(r1)
824         mfdar   r7
825         std     r7,_DAR(r1)
826         mfdsisr r8
827         std     r8,_DSISR(r1)
828
829         /* Temporary workaround to clear CR until RTAS can be modified to
830          * ignore all bits.
831          */
832         li      r0,0
833         mtcr    r0
834
835 #ifdef CONFIG_BUG       
836         /* There is no way it is acceptable to get here with interrupts enabled,
837          * check it with the asm equivalent of WARN_ON
838          */
839         lbz     r0,PACASOFTIRQEN(r13)
840 1:      tdnei   r0,0
841         EMIT_BUG_ENTRY 1b,__FILE__,__LINE__,BUGFLAG_WARNING
842 #endif
843         
844         /* Hard-disable interrupts */
845         mfmsr   r6
846         rldicl  r7,r6,48,1
847         rotldi  r7,r7,16
848         mtmsrd  r7,1
849
850         /* Unfortunately, the stack pointer and the MSR are also clobbered,
851          * so they are saved in the PACA which allows us to restore
852          * our original state after RTAS returns.
853          */
854         std     r1,PACAR1(r13)
855         std     r6,PACASAVEDMSR(r13)
856
857         /* Setup our real return addr */        
858         LOAD_REG_ADDR(r4,.rtas_return_loc)
859         clrldi  r4,r4,2                 /* convert to realmode address */
860         mtlr    r4
861
862         li      r0,0
863         ori     r0,r0,MSR_EE|MSR_SE|MSR_BE|MSR_RI
864         andc    r0,r6,r0
865         
866         li      r9,1
867         rldicr  r9,r9,MSR_SF_LG,(63-MSR_SF_LG)
868         ori     r9,r9,MSR_IR|MSR_DR|MSR_FE0|MSR_FE1|MSR_FP|MSR_RI
869         andc    r6,r0,r9
870         sync                            /* disable interrupts so SRR0/1 */
871         mtmsrd  r0                      /* don't get trashed */
872
873         LOAD_REG_ADDR(r4, rtas)
874         ld      r5,RTASENTRY(r4)        /* get the rtas->entry value */
875         ld      r4,RTASBASE(r4)         /* get the rtas->base value */
876         
877         mtspr   SPRN_SRR0,r5
878         mtspr   SPRN_SRR1,r6
879         rfid
880         b       .       /* prevent speculative execution */
881
882 _STATIC(rtas_return_loc)
883         /* relocation is off at this point */
884         GET_PACA(r4)
885         clrldi  r4,r4,2                 /* convert to realmode address */
886
887         bcl     20,31,$+4
888 0:      mflr    r3
889         ld      r3,(1f-0b)(r3)          /* get &.rtas_restore_regs */
890
891         mfmsr   r6
892         li      r0,MSR_RI
893         andc    r6,r6,r0
894         sync    
895         mtmsrd  r6
896         
897         ld      r1,PACAR1(r4)           /* Restore our SP */
898         ld      r4,PACASAVEDMSR(r4)     /* Restore our MSR */
899
900         mtspr   SPRN_SRR0,r3
901         mtspr   SPRN_SRR1,r4
902         rfid
903         b       .       /* prevent speculative execution */
904
905         .align  3
906 1:      .llong  .rtas_restore_regs
907
908 _STATIC(rtas_restore_regs)
909         /* relocation is on at this point */
910         REST_GPR(2, r1)                 /* Restore the TOC */
911         REST_GPR(13, r1)                /* Restore paca */
912         REST_8GPRS(14, r1)              /* Restore the non-volatiles */
913         REST_10GPRS(22, r1)             /* ditto */
914
915         GET_PACA(r13)
916
917         ld      r4,_CCR(r1)
918         mtcr    r4
919         ld      r5,_CTR(r1)
920         mtctr   r5
921         ld      r6,_XER(r1)
922         mtspr   SPRN_XER,r6
923         ld      r7,_DAR(r1)
924         mtdar   r7
925         ld      r8,_DSISR(r1)
926         mtdsisr r8
927
928         addi    r1,r1,RTAS_FRAME_SIZE   /* Unstack our frame */
929         ld      r0,16(r1)               /* get return address */
930
931         mtlr    r0
932         blr                             /* return to caller */
933
934 #endif /* CONFIG_PPC_RTAS */
935
936 _GLOBAL(enter_prom)
937         mflr    r0
938         std     r0,16(r1)
939         stdu    r1,-PROM_FRAME_SIZE(r1) /* Save SP and create stack space */
940
941         /* Because PROM is running in 32b mode, it clobbers the high order half
942          * of all registers that it saves.  We therefore save those registers
943          * PROM might touch to the stack.  (r0, r3-r13 are caller saved)
944          */
945         SAVE_GPR(2, r1)
946         SAVE_GPR(13, r1)
947         SAVE_8GPRS(14, r1)
948         SAVE_10GPRS(22, r1)
949         mfcr    r10
950         mfmsr   r11
951         std     r10,_CCR(r1)
952         std     r11,_MSR(r1)
953
954         /* Get the PROM entrypoint */
955         mtlr    r4
956
957         /* Switch MSR to 32 bits mode
958          */
959 #ifdef CONFIG_PPC_BOOK3E
960         rlwinm  r11,r11,0,1,31
961         mtmsr   r11
962 #else /* CONFIG_PPC_BOOK3E */
963         mfmsr   r11
964         li      r12,1
965         rldicr  r12,r12,MSR_SF_LG,(63-MSR_SF_LG)
966         andc    r11,r11,r12
967         li      r12,1
968         rldicr  r12,r12,MSR_ISF_LG,(63-MSR_ISF_LG)
969         andc    r11,r11,r12
970         mtmsrd  r11
971 #endif /* CONFIG_PPC_BOOK3E */
972         isync
973
974         /* Enter PROM here... */
975         blrl
976
977         /* Just make sure that r1 top 32 bits didn't get
978          * corrupt by OF
979          */
980         rldicl  r1,r1,0,32
981
982         /* Restore the MSR (back to 64 bits) */
983         ld      r0,_MSR(r1)
984         MTMSRD(r0)
985         isync
986
987         /* Restore other registers */
988         REST_GPR(2, r1)
989         REST_GPR(13, r1)
990         REST_8GPRS(14, r1)
991         REST_10GPRS(22, r1)
992         ld      r4,_CCR(r1)
993         mtcr    r4
994         
995         addi    r1,r1,PROM_FRAME_SIZE
996         ld      r0,16(r1)
997         mtlr    r0
998         blr
999
1000 #ifdef CONFIG_FUNCTION_TRACER
1001 #ifdef CONFIG_DYNAMIC_FTRACE
1002 _GLOBAL(mcount)
1003 _GLOBAL(_mcount)
1004         blr
1005
1006 _GLOBAL(ftrace_caller)
1007         /* Taken from output of objdump from lib64/glibc */
1008         mflr    r3
1009         ld      r11, 0(r1)
1010         stdu    r1, -112(r1)
1011         std     r3, 128(r1)
1012         ld      r4, 16(r11)
1013         subi    r3, r3, MCOUNT_INSN_SIZE
1014 .globl ftrace_call
1015 ftrace_call:
1016         bl      ftrace_stub
1017         nop
1018 #ifdef CONFIG_FUNCTION_GRAPH_TRACER
1019 .globl ftrace_graph_call
1020 ftrace_graph_call:
1021         b       ftrace_graph_stub
1022 _GLOBAL(ftrace_graph_stub)
1023 #endif
1024         ld      r0, 128(r1)
1025         mtlr    r0
1026         addi    r1, r1, 112
1027 _GLOBAL(ftrace_stub)
1028         blr
1029 #else
1030 _GLOBAL(mcount)
1031         blr
1032
1033 _GLOBAL(_mcount)
1034         /* Taken from output of objdump from lib64/glibc */
1035         mflr    r3
1036         ld      r11, 0(r1)
1037         stdu    r1, -112(r1)
1038         std     r3, 128(r1)
1039         ld      r4, 16(r11)
1040
1041         subi    r3, r3, MCOUNT_INSN_SIZE
1042         LOAD_REG_ADDR(r5,ftrace_trace_function)
1043         ld      r5,0(r5)
1044         ld      r5,0(r5)
1045         mtctr   r5
1046         bctrl
1047         nop
1048
1049
1050 #ifdef CONFIG_FUNCTION_GRAPH_TRACER
1051         b       ftrace_graph_caller
1052 #endif
1053         ld      r0, 128(r1)
1054         mtlr    r0
1055         addi    r1, r1, 112
1056 _GLOBAL(ftrace_stub)
1057         blr
1058
1059 #endif /* CONFIG_DYNAMIC_FTRACE */
1060
1061 #ifdef CONFIG_FUNCTION_GRAPH_TRACER
1062 _GLOBAL(ftrace_graph_caller)
1063         /* load r4 with local address */
1064         ld      r4, 128(r1)
1065         subi    r4, r4, MCOUNT_INSN_SIZE
1066
1067         /* get the parent address */
1068         ld      r11, 112(r1)
1069         addi    r3, r11, 16
1070
1071         bl      .prepare_ftrace_return
1072         nop
1073
1074         ld      r0, 128(r1)
1075         mtlr    r0
1076         addi    r1, r1, 112
1077         blr
1078
1079 _GLOBAL(return_to_handler)
1080         /* need to save return values */
1081         std     r4,  -24(r1)
1082         std     r3,  -16(r1)
1083         std     r31, -8(r1)
1084         mr      r31, r1
1085         stdu    r1, -112(r1)
1086
1087         bl      .ftrace_return_to_handler
1088         nop
1089
1090         /* return value has real return address */
1091         mtlr    r3
1092
1093         ld      r1, 0(r1)
1094         ld      r4,  -24(r1)
1095         ld      r3,  -16(r1)
1096         ld      r31, -8(r1)
1097
1098         /* Jump back to real return address */
1099         blr
1100
1101 _GLOBAL(mod_return_to_handler)
1102         /* need to save return values */
1103         std     r4,  -32(r1)
1104         std     r3,  -24(r1)
1105         /* save TOC */
1106         std     r2,  -16(r1)
1107         std     r31, -8(r1)
1108         mr      r31, r1
1109         stdu    r1, -112(r1)
1110
1111         /*
1112          * We are in a module using the module's TOC.
1113          * Switch to our TOC to run inside the core kernel.
1114          */
1115         ld      r2, PACATOC(r13)
1116
1117         bl      .ftrace_return_to_handler
1118         nop
1119
1120         /* return value has real return address */
1121         mtlr    r3
1122
1123         ld      r1, 0(r1)
1124         ld      r4,  -32(r1)
1125         ld      r3,  -24(r1)
1126         ld      r2,  -16(r1)
1127         ld      r31, -8(r1)
1128
1129         /* Jump back to real return address */
1130         blr
1131 #endif /* CONFIG_FUNCTION_GRAPH_TRACER */
1132 #endif /* CONFIG_FUNCTION_TRACER */