ptx: add state spaces
[oota-llvm.git] / test / CodeGen / PTX / ld.ll
1 ; RUN: llc < %s -march=ptx | FileCheck %s
2
3 ;CHECK: .extern .global .s32 array[];
4 @array = external global [10 x i32]
5
6 ;CHECK: .extern .const .s32 array_constant[];
7 @array_constant = external addrspace(1) constant [10 x i32]
8
9 ;CHECK: .extern .local .s32 array_local[];
10 @array_local = external addrspace(2) global [10 x i32]
11
12 ;CHECK: .extern .shared .s32 array_shared[];
13 @array_shared = external addrspace(4) global [10 x i32]
14
15 define ptx_device i32 @t1(i32* %p) {
16 entry:
17 ;CHECK: ld.global.s32 r0, [r1];
18   %x = load i32* %p
19   ret i32 %x
20 }
21
22 define ptx_device i32 @t2(i32* %p) {
23 entry:
24 ;CHECK: ld.global.s32 r0, [r1+4];
25   %i = getelementptr i32* %p, i32 1
26   %x = load i32* %i
27   ret i32 %x
28 }
29
30 define ptx_device i32 @t3(i32* %p, i32 %q) {
31 entry:
32 ;CHECK: shl.b32 r0, r2, 2;
33 ;CHECK: ld.global.s32 r0, [r1+r0];
34   %i = getelementptr i32* %p, i32 %q
35   %x = load i32* %i
36   ret i32 %x
37 }
38
39 define ptx_device i32 @t4_global() {
40 entry:
41 ;CHECK: ld.global.s32 r0, [array];
42   %i = getelementptr [10 x i32]* @array, i32 0, i32 0
43   %x = load i32* %i
44   ret i32 %x
45 }
46
47 define ptx_device i32 @t4_const() {
48 entry:
49 ;CHECK: ld.const.s32 r0, [array_constant];
50   %i = getelementptr [10 x i32] addrspace(1)* @array_constant, i32 0, i32 0
51   %x = load i32 addrspace(1)* %i
52   ret i32 %x
53 }
54
55 define ptx_device i32 @t4_local() {
56 entry:
57 ;CHECK: ld.local.s32 r0, [array_local];
58   %i = getelementptr [10 x i32] addrspace(2)* @array_local, i32 0, i32 0
59   %x = load i32 addrspace(2)* %i
60   ret i32 %x
61 }
62
63 define ptx_device i32 @t4_shared() {
64 entry:
65 ;CHECK: ld.shared.s32 r0, [array_shared];
66   %i = getelementptr [10 x i32] addrspace(4)* @array_shared, i32 0, i32 0
67   %x = load i32 addrspace(4)* %i
68   ret i32 %x
69 }
70
71 define ptx_device i32 @t5() {
72 entry:
73 ;CHECK: ld.global.s32 r0, [array+4];
74   %i = getelementptr [10 x i32]* @array, i32 0, i32 1
75   %x = load i32* %i
76   ret i32 %x
77 }