Fix a really nasty SROA bug with how we handled out-of-bounds memcpy
[oota-llvm.git] / test / CodeGen / SystemZ / risbg-01.ll
index 178fa4f21663a56aafcc2fb43b811d6144944c9c..d75e8e4b11a6e32402f42a3c32261c7b0ea562c3 100644 (file)
@@ -1,10 +1,11 @@
-; Test sequences that can use RISBG.
+; Test sequences that can use RISBG with a zeroed first operand.
+; The tests here assume that RISBLG isn't available.
 ;
-; RUN: llc < %s -mtriple=s390x-linux-gnu | FileCheck %s
+; RUN: llc < %s -mtriple=s390x-linux-gnu -mcpu=z10 | FileCheck %s
 
 ; Test an extraction of bit 0 from a right-shifted value.
 define i32 @f1(i32 %foo) {
-; CHECK: f1:
+; CHECK-LABEL: f1:
 ; CHECK: risbg %r2, %r2, 63, 191, 54
 ; CHECK: br %r14
   %shr = lshr i32 %foo, 10
@@ -14,7 +15,7 @@ define i32 @f1(i32 %foo) {
 
 ; ...and again with i64.
 define i64 @f2(i64 %foo) {
-; CHECK: f2:
+; CHECK-LABEL: f2:
 ; CHECK: risbg %r2, %r2, 63, 191, 54
 ; CHECK: br %r14
   %shr = lshr i64 %foo, 10
@@ -24,7 +25,7 @@ define i64 @f2(i64 %foo) {
 
 ; Test an extraction of other bits from a right-shifted value.
 define i32 @f3(i32 %foo) {
-; CHECK: f3:
+; CHECK-LABEL: f3:
 ; CHECK: risbg %r2, %r2, 60, 189, 42
 ; CHECK: br %r14
   %shr = lshr i32 %foo, 22
@@ -34,7 +35,7 @@ define i32 @f3(i32 %foo) {
 
 ; ...and again with i64.
 define i64 @f4(i64 %foo) {
-; CHECK: f4:
+; CHECK-LABEL: f4:
 ; CHECK: risbg %r2, %r2, 60, 189, 42
 ; CHECK: br %r14
   %shr = lshr i64 %foo, 22
@@ -45,7 +46,7 @@ define i64 @f4(i64 %foo) {
 ; Test an extraction of most bits from a right-shifted value.
 ; The range should be reduced to exclude the zeroed high bits.
 define i32 @f5(i32 %foo) {
-; CHECK: f5:
+; CHECK-LABEL: f5:
 ; CHECK: risbg %r2, %r2, 34, 188, 62
 ; CHECK: br %r14
   %shr = lshr i32 %foo, 2
@@ -55,7 +56,7 @@ define i32 @f5(i32 %foo) {
 
 ; ...and again with i64.
 define i64 @f6(i64 %foo) {
-; CHECK: f6:
+; CHECK-LABEL: f6:
 ; CHECK: risbg %r2, %r2, 2, 188, 62
 ; CHECK: br %r14
   %shr = lshr i64 %foo, 2
@@ -63,12 +64,12 @@ define i64 @f6(i64 %foo) {
   ret i64 %and
 }
 
-; Try the next value up (mask ....1111001).  The mask itself is suitable
-; for RISBG, but the shift is still needed.
+; Try the next value up (mask ....1111001).  This needs a separate shift
+; and mask.
 define i32 @f7(i32 %foo) {
-; CHECK: f7:
+; CHECK-LABEL: f7:
 ; CHECK: srl %r2, 2
-; CHECK: risbg %r2, %r2, 63, 188, 0
+; CHECK: nill %r2, 65529
 ; CHECK: br %r14
   %shr = lshr i32 %foo, 2
   %and = and i32 %shr, -7
@@ -77,9 +78,9 @@ define i32 @f7(i32 %foo) {
 
 ; ...and again with i64.
 define i64 @f8(i64 %foo) {
-; CHECK: f8:
-; CHECK: srlg [[REG:%r[0-5]]], %r2, 2
-; CHECK: risbg %r2, [[REG]], 63, 188, 0
+; CHECK-LABEL: f8:
+; CHECK: srlg %r2, %r2, 2
+; CHECK: nill %r2, 65529
 ; CHECK: br %r14
   %shr = lshr i64 %foo, 2
   %and = and i64 %shr, -7
@@ -89,7 +90,7 @@ define i64 @f8(i64 %foo) {
 ; Test an extraction of bits from a left-shifted value.  The range should
 ; be reduced to exclude the zeroed low bits.
 define i32 @f9(i32 %foo) {
-; CHECK: f9:
+; CHECK-LABEL: f9:
 ; CHECK: risbg %r2, %r2, 56, 189, 2
 ; CHECK: br %r14
   %shr = shl i32 %foo, 2
@@ -99,7 +100,7 @@ define i32 @f9(i32 %foo) {
 
 ; ...and again with i64.
 define i64 @f10(i64 %foo) {
-; CHECK: f10:
+; CHECK-LABEL: f10:
 ; CHECK: risbg %r2, %r2, 56, 189, 2
 ; CHECK: br %r14
   %shr = shl i64 %foo, 2
@@ -107,12 +108,12 @@ define i64 @f10(i64 %foo) {
   ret i64 %and
 }
 
-; Try a wrap-around mask (mask ....111100001111).  The mask itself is suitable
-; for RISBG, but the shift is still needed.
+; Try a wrap-around mask (mask ....111100001111).  This needs a separate shift
+; and mask.
 define i32 @f11(i32 %foo) {
-; CHECK: f11:
+; CHECK-LABEL: f11:
 ; CHECK: sll %r2, 2
-; CHECK: risbg %r2, %r2, 60, 183, 0
+; CHECK: nill %r2, 65295
 ; CHECK: br %r14
   %shr = shl i32 %foo, 2
   %and = and i32 %shr, -241
@@ -121,9 +122,9 @@ define i32 @f11(i32 %foo) {
 
 ; ...and again with i64.
 define i64 @f12(i64 %foo) {
-; CHECK: f12:
-; CHECK: sllg [[REG:%r[0-5]]], %r2, 2
-; CHECK: risbg %r2, [[REG]], 60, 183, 0
+; CHECK-LABEL: f12:
+; CHECK: sllg %r2, %r2, 2
+; CHECK: nill %r2, 65295
 ; CHECK: br %r14
   %shr = shl i64 %foo, 2
   %and = and i64 %shr, -241
@@ -134,7 +135,7 @@ define i64 @f12(i64 %foo) {
 ; This is equivalent to the lshr case, because the bits from the
 ; shl are not used.
 define i32 @f13(i32 %foo) {
-; CHECK: f13:
+; CHECK-LABEL: f13:
 ; CHECK: risbg %r2, %r2, 56, 188, 46
 ; CHECK: br %r14
   %parta = shl i32 %foo, 14
@@ -146,7 +147,7 @@ define i32 @f13(i32 %foo) {
 
 ; ...and again with i64.
 define i64 @f14(i64 %foo) {
-; CHECK: f14:
+; CHECK-LABEL: f14:
 ; CHECK: risbg %r2, %r2, 56, 188, 14
 ; CHECK: br %r14
   %parta = shl i64 %foo, 14
@@ -158,7 +159,7 @@ define i64 @f14(i64 %foo) {
 
 ; Try a case in which only the bits from the shl are used.
 define i32 @f15(i32 %foo) {
-; CHECK: f15:
+; CHECK-LABEL: f15:
 ; CHECK: risbg %r2, %r2, 47, 177, 14
 ; CHECK: br %r14
   %parta = shl i32 %foo, 14
@@ -170,7 +171,7 @@ define i32 @f15(i32 %foo) {
 
 ; ...and again with i64.
 define i64 @f16(i64 %foo) {
-; CHECK: f16:
+; CHECK-LABEL: f16:
 ; CHECK: risbg %r2, %r2, 47, 177, 14
 ; CHECK: br %r14
   %parta = shl i64 %foo, 14
@@ -181,12 +182,11 @@ define i64 @f16(i64 %foo) {
 }
 
 ; Test a 32-bit rotate in which both parts of the OR are needed.
-; This needs a separate shift (although RISBLG would be better
-; if supported).
+; This needs a separate shift and mask.
 define i32 @f17(i32 %foo) {
-; CHECK: f17:
-; CHECK: rll [[REG:%r[0-5]]], %r2, 4
-; CHECK: risbg %r2, [[REG]], 57, 190, 0
+; CHECK-LABEL: f17:
+; CHECK: rll %r2, %r2, 4
+; CHECK: nilf %r2, 126
 ; CHECK: br %r14
   %parta = shl i32 %foo, 4
   %partb = lshr i32 %foo, 28
@@ -197,7 +197,7 @@ define i32 @f17(i32 %foo) {
 
 ; ...and for i64, where RISBG should do the rotate too.
 define i64 @f18(i64 %foo) {
-; CHECK: f18:
+; CHECK-LABEL: f18:
 ; CHECK: risbg %r2, %r2, 57, 190, 4
 ; CHECK: br %r14
   %parta = shl i64 %foo, 4
@@ -208,20 +208,20 @@ define i64 @f18(i64 %foo) {
 }
 
 ; Test an arithmetic shift right in which some of the sign bits are kept.
-; The SRA is still needed.
+; This needs a separate shift and mask.
 define i32 @f19(i32 %foo) {
-; CHECK: f19:
+; CHECK-LABEL: f19:
 ; CHECK: sra %r2, 28
-; CHECK: risbg %r2, %r2, 59, 190, 0
+; CHECK: nilf %r2, 30
 ; CHECK: br %r14
   %shr = ashr i32 %foo, 28
   %and = and i32 %shr, 30
   ret i32 %and
 }
 
-; ...and again with i64.
+; ...and again with i64.  In this case RISBG is the best way of doing the AND.
 define i64 @f20(i64 %foo) {
-; CHECK: f20:
+; CHECK-LABEL: f20:
 ; CHECK: srag [[REG:%r[0-5]]], %r2, 60
 ; CHECK: risbg %r2, [[REG]], 59, 190, 0
 ; CHECK: br %r14
@@ -234,7 +234,7 @@ define i64 @f20(i64 %foo) {
 ; Introduce a second use of %shr so that the ashr doesn't decompose to
 ; an lshr.
 define i32 @f21(i32 %foo, i32 *%dest) {
-; CHECK: f21:
+; CHECK-LABEL: f21:
 ; CHECK: risbg %r2, %r2, 60, 190, 36
 ; CHECK: br %r14
   %shr = ashr i32 %foo, 28
@@ -245,7 +245,7 @@ define i32 @f21(i32 %foo, i32 *%dest) {
 
 ; ...and again with i64.
 define i64 @f22(i64 %foo, i64 *%dest) {
-; CHECK: f22:
+; CHECK-LABEL: f22:
 ; CHECK: risbg %r2, %r2, 60, 190, 4
 ; CHECK: br %r14
   %shr = ashr i64 %foo, 60
@@ -257,10 +257,226 @@ define i64 @f22(i64 %foo, i64 *%dest) {
 ; Check that we use RISBG for shifted values even if the AND is a
 ; natural zero extension.
 define i64 @f23(i64 %foo) {
-; CHECK: f23:
+; CHECK-LABEL: f23:
 ; CHECK: risbg %r2, %r2, 56, 191, 62
 ; CHECK: br %r14
   %shr = lshr i64 %foo, 2
   %and = and i64 %shr, 255
   ret i64 %and
 }
+
+; Test a case where the AND comes before a rotate.  This needs a separate
+; mask and rotate.
+define i32 @f24(i32 %foo) {
+; CHECK-LABEL: f24:
+; CHECK: nilf %r2, 254
+; CHECK: rll %r2, %r2, 29
+; CHECK: br %r14
+  %and = and i32 %foo, 254
+  %parta = lshr i32 %and, 3
+  %partb = shl i32 %and, 29
+  %rotl = or i32 %parta, %partb
+  ret i32 %rotl
+}
+
+; ...and again with i64, where a single RISBG is enough.
+define i64 @f25(i64 %foo) {
+; CHECK-LABEL: f25:
+; CHECK: risbg %r2, %r2, 57, 187, 3
+; CHECK: br %r14
+  %and = and i64 %foo, 14
+  %parta = shl i64 %and, 3
+  %partb = lshr i64 %and, 61
+  %rotl = or i64 %parta, %partb
+  ret i64 %rotl
+}
+
+; Test a wrap-around case in which the AND comes before a rotate.
+; This again needs a separate mask and rotate.
+define i32 @f26(i32 %foo) {
+; CHECK-LABEL: f26:
+; CHECK: rll %r2, %r2, 5
+; CHECK: br %r14
+  %and = and i32 %foo, -49
+  %parta = shl i32 %and, 5
+  %partb = lshr i32 %and, 27
+  %rotl = or i32 %parta, %partb
+  ret i32 %rotl
+}
+
+; ...and again with i64, where a single RISBG is OK.
+define i64 @f27(i64 %foo) {
+; CHECK-LABEL: f27:
+; CHECK: risbg %r2, %r2, 55, 180, 5
+; CHECK: br %r14
+  %and = and i64 %foo, -49
+  %parta = shl i64 %and, 5
+  %partb = lshr i64 %and, 59
+  %rotl = or i64 %parta, %partb
+  ret i64 %rotl
+}
+
+; Test a case where the AND comes before a shift left.
+define i32 @f28(i32 %foo) {
+; CHECK-LABEL: f28:
+; CHECK: risbg %r2, %r2, 32, 173, 17
+; CHECK: br %r14
+  %and = and i32 %foo, 32766
+  %shl = shl i32 %and, 17
+  ret i32 %shl
+}
+
+; ...and again with i64.
+define i64 @f29(i64 %foo) {
+; CHECK-LABEL: f29:
+; CHECK: risbg %r2, %r2, 0, 141, 49
+; CHECK: br %r14
+  %and = and i64 %foo, 32766
+  %shl = shl i64 %and, 49
+  ret i64 %shl
+}
+
+; Test the next shift up from f28, in which the mask should get shortened.
+define i32 @f30(i32 %foo) {
+; CHECK-LABEL: f30:
+; CHECK: risbg %r2, %r2, 32, 172, 18
+; CHECK: br %r14
+  %and = and i32 %foo, 32766
+  %shl = shl i32 %and, 18
+  ret i32 %shl
+}
+
+; ...and again with i64.
+define i64 @f31(i64 %foo) {
+; CHECK-LABEL: f31:
+; CHECK: risbg %r2, %r2, 0, 140, 50
+; CHECK: br %r14
+  %and = and i64 %foo, 32766
+  %shl = shl i64 %and, 50
+  ret i64 %shl
+}
+
+; Test a wrap-around case in which the shift left comes after the AND.
+; We can't use RISBG for the shift in that case.
+define i32 @f32(i32 %foo) {
+; CHECK-LABEL: f32:
+; CHECK: sll %r2
+; CHECK: br %r14
+  %and = and i32 %foo, -7
+  %shl = shl i32 %and, 10
+  ret i32 %shl
+}
+
+; ...and again with i64.
+define i64 @f33(i64 %foo) {
+; CHECK-LABEL: f33:
+; CHECK: sllg %r2
+; CHECK: br %r14
+  %and = and i64 %foo, -7
+  %shl = shl i64 %and, 10
+  ret i64 %shl
+}
+
+; Test a case where the AND comes before a shift right.
+define i32 @f34(i32 %foo) {
+; CHECK-LABEL: f34:
+; CHECK: risbg %r2, %r2, 57, 191, 55
+; CHECK: br %r14
+  %and = and i32 %foo, 65535
+  %shl = lshr i32 %and, 9
+  ret i32 %shl
+}
+
+; ...and again with i64.
+define i64 @f35(i64 %foo) {
+; CHECK-LABEL: f35:
+; CHECK: risbg %r2, %r2, 57, 191, 55
+; CHECK: br %r14
+  %and = and i64 %foo, 65535
+  %shl = lshr i64 %and, 9
+  ret i64 %shl
+}
+
+; Test a wrap-around case where the AND comes before a shift right.
+; We can't use RISBG for the shift in that case.
+define i32 @f36(i32 %foo) {
+; CHECK-LABEL: f36:
+; CHECK: srl %r2
+; CHECK: br %r14
+  %and = and i32 %foo, -25
+  %shl = lshr i32 %and, 1
+  ret i32 %shl
+}
+
+; ...and again with i64.
+define i64 @f37(i64 %foo) {
+; CHECK-LABEL: f37:
+; CHECK: srlg %r2
+; CHECK: br %r14
+  %and = and i64 %foo, -25
+  %shl = lshr i64 %and, 1
+  ret i64 %shl
+}
+
+; Test a combination involving a large ASHR and a shift left.  We can't
+; use RISBG there.
+define i64 @f38(i64 %foo) {
+; CHECK-LABEL: f38:
+; CHECK: srag {{%r[0-5]}}
+; CHECK: sllg {{%r[0-5]}}
+; CHECK: br %r14
+  %ashr = ashr i64 %foo, 32
+  %shl = shl i64 %ashr, 5
+  ret i64 %shl
+}
+
+; Try a similar thing in which no shifted sign bits are kept.
+define i64 @f39(i64 %foo, i64 *%dest) {
+; CHECK-LABEL: f39:
+; CHECK: srag [[REG:%r[01345]]], %r2, 35
+; CHECK: risbg %r2, %r2, 33, 189, 31
+; CHECK: br %r14
+  %ashr = ashr i64 %foo, 35
+  store i64 %ashr, i64 *%dest
+  %shl = shl i64 %ashr, 2
+  %and = and i64 %shl, 2147483647
+  ret i64 %and
+}
+
+; ...and again with the next highest shift value, where one sign bit is kept.
+define i64 @f40(i64 %foo, i64 *%dest) {
+; CHECK-LABEL: f40:
+; CHECK: srag [[REG:%r[01345]]], %r2, 36
+; CHECK: risbg %r2, [[REG]], 33, 189, 2
+; CHECK: br %r14
+  %ashr = ashr i64 %foo, 36
+  store i64 %ashr, i64 *%dest
+  %shl = shl i64 %ashr, 2
+  %and = and i64 %shl, 2147483647
+  ret i64 %and
+}
+
+; Check a case where the result is zero-extended.
+define i64 @f41(i32 %a) {
+; CHECK-LABEL: f41
+; CHECK: risbg %r2, %r2, 36, 191, 62
+; CHECK: br %r14
+  %shl = shl i32 %a, 2
+  %shr = lshr i32 %shl, 4
+  %ext = zext i32 %shr to i64
+  ret i64 %ext
+}
+
+; In this case the sign extension is converted to a pair of 32-bit shifts,
+; which is then extended to 64 bits.  We previously used the wrong bit size
+; when testing whether the shifted-in bits of the shift right were significant.
+define i64 @f42(i1 %x) {
+; CHECK-LABEL: f42:
+; CHECK: sll %r2, 31
+; CHECK: sra %r2, 31
+; CHECK: llgcr %r2, %r2
+; CHECK: br %r14
+  %ext = sext i1 %x to i8
+  %ext2 = zext i8 %ext to i64
+  ret i64 %ext2
+}