R600/SI: Add a MUBUF load pattern for Reg+Imm offsets
[oota-llvm.git] / test / CodeGen / R600 / mubuf.ll
1 ; RUN: llc < %s -march=r600 -mcpu=SI -show-mc-encoding -verify-machineinstrs | FileCheck %s
2
3 ;;;==========================================================================;;;
4 ;;; MUBUF LOAD TESTS
5 ;;;==========================================================================;;;
6
7 ; MUBUF load with an immediate byte offset that fits into 12-bits
8 ; CHECK-LABEL: @mubuf_load0
9 ; CHECK: BUFFER_LOAD_DWORD v{{[0-9]}}, s[{{[0-9]:[0-9]}}] + v[{{[0-9]:[0-9]}}] + 4 ; encoding: [0x04,0x80
10 define void @mubuf_load0(i32 addrspace(1)* %out, i32 addrspace(1)* %in) {
11 entry:
12   %0 = getelementptr i32 addrspace(1)* %in, i64 1
13   %1 = load i32 addrspace(1)* %0
14   store i32 %1, i32 addrspace(1)* %out
15   ret void
16 }
17
18 ; MUBUF load with the largest possible immediate offset
19 ; CHECK-LABEL: @mubuf_load1
20 ; CHECK: BUFFER_LOAD_UBYTE v{{[0-9]}}, s[{{[0-9]:[0-9]}}] + v[{{[0-9]:[0-9]}}] + 4095 ; encoding: [0xff,0x8f
21 define void @mubuf_load1(i8 addrspace(1)* %out, i8 addrspace(1)* %in) {
22 entry:
23   %0 = getelementptr i8 addrspace(1)* %in, i64 4095
24   %1 = load i8 addrspace(1)* %0
25   store i8 %1, i8 addrspace(1)* %out
26   ret void
27 }
28
29 ; MUBUF load with an immediate byte offset that doesn't fit into 12-bits
30 ; CHECK-LABEL: @mubuf_load2
31 ; CHECK: BUFFER_LOAD_DWORD v{{[0-9]}}, s[{{[0-9]:[0-9]}}] + v[{{[0-9]:[0-9]}}] + 0 ; encoding: [0x00,0x80
32 define void @mubuf_load2(i32 addrspace(1)* %out, i32 addrspace(1)* %in) {
33 entry:
34   %0 = getelementptr i32 addrspace(1)* %in, i64 1024
35   %1 = load i32 addrspace(1)* %0
36   store i32 %1, i32 addrspace(1)* %out
37   ret void
38 }
39
40 ; MUBUF load with a 12-bit immediate offset and a register offset
41 ; CHECK-LABEL: @mubuf_load3
42 ; CHECK-NOT: ADD
43 ; CHECK: BUFFER_LOAD_DWORD v{{[0-9]}}, s[{{[0-9]:[0-9]}}] + v[{{[0-9]:[0-9]}}] + 4 ; encoding: [0x04,0x80
44 define void @mubuf_load3(i32 addrspace(1)* %out, i32 addrspace(1)* %in, i64 %offset) {
45 entry:
46   %0 = getelementptr i32 addrspace(1)* %in, i64 %offset
47   %1 = getelementptr i32 addrspace(1)* %0, i64 1
48   %2 = load i32 addrspace(1)* %1
49   store i32 %2, i32 addrspace(1)* %out
50   ret void
51 }