ptx: remove reg-reg addressing mode and st.const
[oota-llvm.git] / test / CodeGen / PTX / ld.ll
1 ; RUN: llc < %s -march=ptx | FileCheck %s
2
3 ;CHECK: .extern .global .s32 array[];
4 @array = external global [10 x i32]
5
6 ;CHECK: .extern .const .s32 array_constant[];
7 @array_constant = external addrspace(1) constant [10 x i32]
8
9 ;CHECK: .extern .local .s32 array_local[];
10 @array_local = external addrspace(2) global [10 x i32]
11
12 ;CHECK: .extern .shared .s32 array_shared[];
13 @array_shared = external addrspace(4) global [10 x i32]
14
15 define ptx_device i32 @t1(i32* %p) {
16 entry:
17 ;CHECK: ld.global.s32 r0, [r1];
18   %x = load i32* %p
19   ret i32 %x
20 }
21
22 define ptx_device i32 @t2(i32* %p) {
23 entry:
24 ;CHECK: ld.global.s32 r0, [r1+4];
25   %i = getelementptr i32* %p, i32 1
26   %x = load i32* %i
27   ret i32 %x
28 }
29
30 define ptx_device i32 @t3(i32* %p, i32 %q) {
31 entry:
32 ;CHECK: shl.b32 r0, r2, 2;
33 ;CHECK: add.s32 r0, r1, r0;
34 ;CHECK: ld.global.s32 r0, [r0];
35   %i = getelementptr i32* %p, i32 %q
36   %x = load i32* %i
37   ret i32 %x
38 }
39
40 define ptx_device i32 @t4_global() {
41 entry:
42 ;CHECK: ld.global.s32 r0, [array];
43   %i = getelementptr [10 x i32]* @array, i32 0, i32 0
44   %x = load i32* %i
45   ret i32 %x
46 }
47
48 define ptx_device i32 @t4_const() {
49 entry:
50 ;CHECK: ld.const.s32 r0, [array_constant];
51   %i = getelementptr [10 x i32] addrspace(1)* @array_constant, i32 0, i32 0
52   %x = load i32 addrspace(1)* %i
53   ret i32 %x
54 }
55
56 define ptx_device i32 @t4_local() {
57 entry:
58 ;CHECK: ld.local.s32 r0, [array_local];
59   %i = getelementptr [10 x i32] addrspace(2)* @array_local, i32 0, i32 0
60   %x = load i32 addrspace(2)* %i
61   ret i32 %x
62 }
63
64 define ptx_device i32 @t4_shared() {
65 entry:
66 ;CHECK: ld.shared.s32 r0, [array_shared];
67   %i = getelementptr [10 x i32] addrspace(4)* @array_shared, i32 0, i32 0
68   %x = load i32 addrspace(4)* %i
69   ret i32 %x
70 }
71
72 define ptx_device i32 @t5() {
73 entry:
74 ;CHECK: ld.global.s32 r0, [array+4];
75   %i = getelementptr [10 x i32]* @array, i32 0, i32 1
76   %x = load i32* %i
77   ret i32 %x
78 }