CodeGen peephole: fold redundant phys reg copies
[oota-llvm.git] / test / CodeGen / X86 / add.ll
index d6e99ee1a7eb6d26ae440eab0c3740d6f612d21a..62a62a460bd7c6594e415f2ea42d556d0e5beb6e 100644 (file)
@@ -1,5 +1,6 @@
-; RUN: llc < %s -march=x86 | FileCheck %s -check-prefix=X32
-; RUN: llc < %s -march=x86-64 | FileCheck %s -check-prefix=X64
+; RUN: llc < %s -mcpu=generic -march=x86 | FileCheck %s -check-prefix=X32
+; RUN: llc < %s -mcpu=generic -mtriple=x86_64-linux | FileCheck %s -check-prefix=X64
+; RUN: llc < %s -mcpu=generic -mtriple=x86_64-win32 | FileCheck %s -check-prefix=X64
 
 ; The immediate can be encoded in a smaller way if the
 ; instruction is a sub instead of an add.
@@ -8,7 +9,7 @@ define i32 @test1(i32 inreg %a) nounwind {
   %b = add i32 %a, 128
   ret i32 %b
 ; X32: subl    $-128, %eax
-; X64: subl $-128, 
+; X64: subl $-128,
 }
 define i64 @test2(i64 inreg %a) nounwind {
   %b = add i64 %a, 2147483648
@@ -19,7 +20,7 @@ define i64 @test2(i64 inreg %a) nounwind {
 define i64 @test3(i64 inreg %a) nounwind {
   %b = add i64 %a, 128
   ret i64 %b
-  
+
 ; X32: addl $128, %eax
 ; X64: subq    $-128,
 }
@@ -37,13 +38,13 @@ normal:
 
 overflow:
   ret i1 false
-  
-; X32: test4:
+
+; X32-LABEL: test4:
 ; X32: addl
 ; X32-NEXT: jo
 
-; X64:        test4:
-; X64:          addl   %esi, %edi
+; X64-LABEL:        test4:
+; X64:          addl   %e[[A1:si|dx]], %e[[A0:di|cx]]
 ; X64-NEXT:    jo
 }
 
@@ -61,12 +62,12 @@ normal:
 carry:
   ret i1 false
 
-; X32: test5:
+; X32-LABEL: test5:
 ; X32: addl
 ; X32-NEXT: jb
 
-; X64:        test5:
-; X64:          addl   %esi, %edi
+; X64-LABEL:        test5:
+; X64:          addl   %e[[A1]], %e[[A0]]
 ; X64-NEXT:    jb
 }
 
@@ -80,15 +81,15 @@ define i64 @test6(i64 %A, i32 %B) nounwind {
         %tmp5 = add i64 %tmp3, %A               ; <i64> [#uses=1]
         ret i64 %tmp5
 
-; X32: test6:
-; X32:     movl 12(%esp), %edx
+; X32-LABEL: test6:
+; X32:     movl 4(%esp), %eax
+; X32-NEXT: movl 12(%esp), %edx
 ; X32-NEXT: addl 8(%esp), %edx
-; X32-NEXT: movl 4(%esp), %eax
 ; X32-NEXT: ret
-        
-; X64: test6:
-; X64: shlq    $32, %rsi
-; X64: leaq    (%rsi,%rdi), %rax
+
+; X64-LABEL: test6:
+; X64: shlq    $32, %r[[A1]]
+; X64: leaq    (%r[[A1]],%r[[A0]]), %rax
 ; X64: ret
 }
 
@@ -97,10 +98,10 @@ define {i32, i1} @test7(i32 %v1, i32 %v2) nounwind {
    ret {i32, i1} %t
 }
 
-; X64: test7:
-; X64: addl %esi, %eax
+; X64-LABEL: test7:
+; X64: addl %e[[A1]], %e
 ; X64-NEXT: setb %dl
-; X64-NEXT: ret
+; X64: ret
 
 ; PR5443
 define {i64, i1} @test8(i64 %left, i64 %right) nounwind {
@@ -116,7 +117,34 @@ entry:
     ret {i64, i1} %final1
 }
 
-; X64: test8:
+; X64-LABEL: test8:
 ; X64: addq
-; X64-NEXT: sbbq
-; X64-NEXT: testb
+; X64-NEXT: setb
+; X64: ret
+
+define i32 @test9(i32 %x, i32 %y) nounwind readnone {
+  %cmp = icmp eq i32 %x, 10
+  %sub = sext i1 %cmp to i32
+  %cond = add i32 %sub, %y
+  ret i32 %cond
+; X64-LABEL: test9:
+; X64: cmpl $10
+; X64: sete
+; X64: subl
+; X64: ret
+}
+
+define i1 @test10(i32 %x) nounwind {
+entry:
+  %t = call {i32, i1} @llvm.sadd.with.overflow.i32(i32 %x, i32 1)
+  %obit = extractvalue {i32, i1} %t, 1
+  ret i1 %obit
+
+; X32-LABEL: test10:
+; X32: incl
+; X32-NEXT: seto
+
+; X64-LABEL: test10:
+; X64: incl
+; X64-NEXT: seto
+}