R600: Fix trunc i64 to i32 on SI
authorMatt Arsenault <Matthew.Arsenault@amd.com>
Thu, 10 Oct 2013 18:04:16 +0000 (18:04 +0000)
committerMatt Arsenault <Matthew.Arsenault@amd.com>
Thu, 10 Oct 2013 18:04:16 +0000 (18:04 +0000)
git-svn-id: https://llvm.org/svn/llvm-project/llvm/trunk@192375 91177308-0d34-0410-b5e6-96231b3b80d8

lib/Target/R600/SIInstructions.td
test/CodeGen/R600/trunc.ll

index d9cf1e5c5711b62d74f7eace9a750b2883442ed7..c0db7f9c2b0f13c0e0bac426dfbeb0874c40c0be 100644 (file)
@@ -851,6 +851,11 @@ def : Pat <
   (V_CNDMASK_B32_e64 $src0, $src1, $src2)
 >;
 
+def : Pat <
+  (i32 (trunc i64:$val)),
+  (EXTRACT_SUBREG $val, sub0)
+>;
+
 //use two V_CNDMASK_B32_e64 instructions for f64
 def : Pat <
   (f64 (select i1:$src2, f64:$src1, f64:$src0)),
index 1fbe7205fbb0cc913ca6682487674095f8a7640f..be7a430885ffd76689d4641b9dc5ee8d2bd14461 100644 (file)
@@ -17,3 +17,15 @@ define void @trunc_i64_to_i32_store(i32 addrspace(1)* %out, i64 %in) {
   ret void
 }
 
+; SI-LABEL: @trunc_shl_i64:
+; SI: S_LOAD_DWORDX2
+; SI: S_LOAD_DWORDX2 [[SREG:SGPR[0-9]+_SGPR[0-9]+]]
+; SI: V_LSHL_B64 [[LO_VREG:VGPR[0-9]+]]_VGPR{{[0-9]+}}, [[SREG]], 2
+; SI-NOT: [[LO_VREG]]
+; SI: BUFFER_STORE_DWORD [[LO_VREG]],
+define void @trunc_shl_i64(i32 addrspace(1)* %out, i64 %a) {
+  %b = shl i64 %a, 2
+  %result = trunc i64 %b to i32
+  store i32 %result, i32 addrspace(1)* %out, align 4
+  ret void
+}