CodeGen peephole: fold redundant phys reg copies
[oota-llvm.git] / test / CodeGen / X86 / stride-nine-with-base-reg.ll
index f443c76015dd5d7fbc2daa277c5267bdaba6998a..551bd7c2541e0d9cbea6783080484f2aa6b16832 100644 (file)
@@ -1,29 +1,33 @@
-; RUN: llvm-as < %s | llc -march=x86 | grep lea | count 1
-; RUN: llvm-as < %s | llc -march=x86-64 | not grep lea
+; RUN: llc < %s -march=x86 -relocation-model=static | FileCheck %s
+; RUN: llc < %s -mtriple=x86_64-linux               | FileCheck %s
+; CHECK-NOT:     lea
 
-; For x86 there's an lea above the loop. In both cases, there shouldn't
-; be any lea instructions inside the loop.
+; P should be sunk into the loop and folded into the address mode. There
+; shouldn't be any lea instructions inside the loop.
 
 @B = external global [1000 x i8], align 32
 @A = external global [1000 x i8], align 32
 @P = external global [1000 x i8], align 32
+@Q = external global [1000 x i8], align 32
 
-define void @foo(i32 %m, i32 %p) {
+define void @foo(i32 %m, i32 %p) nounwind {
 entry:
        %tmp1 = icmp sgt i32 %m, 0
        br i1 %tmp1, label %bb, label %return
 
 bb:
        %i.019.0 = phi i32 [ %indvar.next, %bb ], [ 0, %entry ]
-       %tmp2 = getelementptr [1000 x i8]* @B, i32 0, i32 %i.019.0
-       %tmp3 = load i8* %tmp2, align 4
+       %tmp2 = getelementptr [1000 x i8], [1000 x i8]* @B, i32 0, i32 %i.019.0
+       %tmp3 = load i8, i8* %tmp2, align 4
        %tmp4 = mul i8 %tmp3, 2
-       %tmp5 = getelementptr [1000 x i8]* @A, i32 0, i32 %i.019.0
+       %tmp5 = getelementptr [1000 x i8], [1000 x i8]* @A, i32 0, i32 %i.019.0
        store i8 %tmp4, i8* %tmp5, align 4
        %tmp8 = mul i32 %i.019.0, 9
         %tmp0 = add i32 %tmp8, %p
-       %tmp10 = getelementptr [1000 x i8]* @P, i32 0, i32 %tmp0
+       %tmp10 = getelementptr [1000 x i8], [1000 x i8]* @P, i32 0, i32 %tmp0
        store i8 17, i8* %tmp10, align 4
+       %tmp11 = getelementptr [1000 x i8], [1000 x i8]* @Q, i32 0, i32 %tmp0
+       store i8 19, i8* %tmp11, align 4
        %indvar.next = add i32 %i.019.0, 1
        %exitcond = icmp eq i32 %indvar.next, %m
        br i1 %exitcond, label %return, label %bb