Update to remove the no-frame-pointer-elim-non-leaf flag if it was set to 'false'.
[oota-llvm.git] / test / CodeGen / X86 / rot32.ll
index 7cebcb86ce120b3c1ee09778d041e6e7fe669d30..7bdd606e9cbb247031360945c365b333885baafc 100644 (file)
@@ -1,11 +1,10 @@
-; RUN: llvm-as < %s | llc -march=x86 > %t
-; RUN: grep rol %t | count 3
-; RUN: grep ror %t | count 1
-; RUN: grep shld %t | count 2
-; RUN: grep shrd %t | count 2
+; RUN: llc < %s -march=x86 -mcpu=corei7 | FileCheck %s
+; RUN: llc < %s -march=x86 -mcpu=core-avx2 | FileCheck %s --check-prefix=BMI2
 
 define i32 @foo(i32 %x, i32 %y, i32 %z) nounwind readnone {
 entry:
+; CHECK-LABEL: foo:
+; CHECK: roll %cl
        %0 = shl i32 %x, %z
        %1 = sub i32 32, %z
        %2 = lshr i32 %x, %1
@@ -15,6 +14,8 @@ entry:
 
 define i32 @bar(i32 %x, i32 %y, i32 %z) nounwind readnone {
 entry:
+; CHECK-LABEL: bar:
+; CHECK: shldl %cl
        %0 = shl i32 %y, %z
        %1 = sub i32 32, %z
        %2 = lshr i32 %x, %1
@@ -24,6 +25,8 @@ entry:
 
 define i32 @un(i32 %x, i32 %y, i32 %z) nounwind readnone {
 entry:
+; CHECK-LABEL: un:
+; CHECK: rorl %cl
        %0 = lshr i32 %x, %z
        %1 = sub i32 32, %z
        %2 = shl i32 %x, %1
@@ -33,6 +36,8 @@ entry:
 
 define i32 @bu(i32 %x, i32 %y, i32 %z) nounwind readnone {
 entry:
+; CHECK-LABEL: bu:
+; CHECK: shrdl %cl
        %0 = lshr i32 %y, %z
        %1 = sub i32 32, %z
        %2 = shl i32 %x, %1
@@ -42,14 +47,31 @@ entry:
 
 define i32 @xfoo(i32 %x, i32 %y, i32 %z) nounwind readnone {
 entry:
+; CHECK-LABEL: xfoo:
+; CHECK: roll $7
+; BMI2-LABEL: xfoo:
+; BMI2: rorxl $25
        %0 = lshr i32 %x, 25
        %1 = shl i32 %x, 7
        %2 = or i32 %0, %1
        ret i32 %2
 }
 
+define i32 @xfoop(i32* %p) nounwind readnone {
+entry:
+; BMI2-LABEL: xfoop:
+; BMI2: rorxl $25, ({{.+}}), %{{.+}}
+       %x = load i32* %p
+       %a = lshr i32 %x, 25
+       %b = shl i32 %x, 7
+       %c = or i32 %a, %b
+       ret i32 %c
+}
+
 define i32 @xbar(i32 %x, i32 %y, i32 %z) nounwind readnone {
 entry:
+; CHECK-LABEL: xbar:
+; CHECK: shldl $7
        %0 = shl i32 %y, 7
        %1 = lshr i32 %x, 25
        %2 = or i32 %0, %1
@@ -58,14 +80,31 @@ entry:
 
 define i32 @xun(i32 %x, i32 %y, i32 %z) nounwind readnone {
 entry:
+; CHECK-LABEL: xun:
+; CHECK: roll $25
+; BMI2-LABEL: xun:
+; BMI2: rorxl $7
        %0 = lshr i32 %x, 7
        %1 = shl i32 %x, 25
        %2 = or i32 %0, %1
        ret i32 %2
 }
 
+define i32 @xunp(i32* %p) nounwind readnone {
+entry:
+; BMI2-LABEL: xunp:
+; BMI2: rorxl $7, ({{.+}}), %{{.+}}
+       %x = load i32* %p
+       %a = lshr i32 %x, 7
+       %b = shl i32 %x, 25
+       %c = or i32 %a, %b
+       ret i32 %c
+}
+
 define i32 @xbu(i32 %x, i32 %y, i32 %z) nounwind readnone {
 entry:
+; CHECK-LABEL: xbu:
+; CHECK: shldl
        %0 = lshr i32 %y, 7
        %1 = shl i32 %x, 25
        %2 = or i32 %0, %1