Follow up to r165072. Try a different approach: only move the load when it's going...
[oota-llvm.git] / test / CodeGen / Mips / tls.ll
1 ; RUN: llc -march=mipsel -disable-mips-delay-filler < %s | \
2 ; RUN:     FileCheck %s -check-prefix=PIC
3 ; RUN: llc -march=mipsel -relocation-model=static -disable-mips-delay-filler < \
4 ; RUN:     %s | FileCheck %s -check-prefix=STATIC
5 ; RUN: llc -march=mipsel -relocation-model=static -disable-mips-delay-filler \
6 ; RUN:     -mips-fix-global-base-reg=false < %s  | \
7 ; RUN:     FileCheck %s -check-prefix=STATICGP
8
9 @t1 = thread_local global i32 0, align 4
10
11 define i32 @f1() nounwind {
12 entry:
13   %tmp = load i32* @t1, align 4
14   ret i32 %tmp
15
16 ; CHECK: f1:
17
18 ; PIC:   addu    $[[R0:[a-z0-9]+]], $2, $25
19 ; PIC:   lw      $25, %call16(__tls_get_addr)($[[R0]])
20 ; PIC:   addiu   $4, $[[R0]], %tlsgd(t1)
21 ; PIC:   jalr    $25
22 ; PIC:   lw      $2, 0($2)
23
24 ; STATIC:   rdhwr   $3, $29
25 ; STATIC:   lui     $[[R0:[0-9]+]], %tprel_hi(t1)
26 ; STATIC:   addiu   $[[R1:[0-9]+]], $[[R0]], %tprel_lo(t1)
27 ; STATIC:   addu    $[[R2:[0-9]+]], $3, $[[R1]]
28 ; STATIC:   lw      $2, 0($[[R2]])
29 }
30
31
32 @t2 = external thread_local global i32
33
34 define i32 @f2() nounwind {
35 entry:
36   %tmp = load i32* @t2, align 4
37   ret i32 %tmp
38
39 ; CHECK: f2:
40
41 ; PIC:   addu    $[[R0:[a-z0-9]+]], $2, $25
42 ; PIC:   lw      $25, %call16(__tls_get_addr)($[[R0]])
43 ; PIC:   addiu   $4, $[[R0]], %tlsgd(t2)
44 ; PIC:   jalr    $25
45 ; PIC:   lw      $2, 0($2)
46
47 ; STATICGP: lui     $[[R0:[0-9]+]], %hi(__gnu_local_gp)
48 ; STATICGP: addiu   $[[GP:[0-9]+]], $[[R0]], %lo(__gnu_local_gp)
49 ; STATICGP: lw      ${{[0-9]+}}, %gottprel(t2)($[[GP]])
50 ; STATIC:   lui     $[[R0:[0-9]+]], %hi(__gnu_local_gp)
51 ; STATIC:   addiu   $[[GP:[0-9]+]], $[[R0]], %lo(__gnu_local_gp)
52 ; STATIC:   rdhwr   $3, $29
53 ; STATIC:   lw      $[[R0:[0-9]+]], %gottprel(t2)($[[GP]])
54 ; STATIC:   addu    $[[R1:[0-9]+]], $3, $[[R0]]
55 ; STATIC:   lw      $2, 0($[[R1]])
56 }
57
58 @f3.i = internal thread_local unnamed_addr global i32 1, align 4
59
60 define i32 @f3() nounwind {
61 entry:
62 ; CHECK: f3:
63
64 ; PIC:   addiu   $4, ${{[a-z0-9]+}}, %tlsldm(f3.i)
65 ; PIC:   jalr    $25
66 ; PIC:   lui     $[[R0:[0-9]+]], %dtprel_hi(f3.i)
67 ; PIC:   addu    $[[R1:[0-9]+]], $[[R0]], $2
68 ; PIC:   lw      ${{[0-9]+}}, %dtprel_lo(f3.i)($[[R1]])
69
70   %0 = load i32* @f3.i, align 4
71   %inc = add nsw i32 %0, 1
72   store i32 %inc, i32* @f3.i, align 4
73   ret i32 %inc
74 }
75