[x86] Fold extract_vector_elt of a load into the Load's address computation.
[oota-llvm.git] / test / CodeGen / X86 / pr2659.ll
1 ; RUN: llc < %s -march=x86 -mtriple=i686-apple-darwin9.4.0 -disable-branch-fold | FileCheck %s
2 ; PR2659
3
4 target datalayout = "e-p:32:32:32-i1:8:8-i8:8:8-i16:16:16-i32:32:32-i64:32:64-f32:32:32-f64:32:64-v64:64:64-v128:128:128-a0:0:64-f80:128:128"
5 target triple = "i686-apple-darwin9.4.0"
6
7 define i32 @binomial(i32 %n, i32 %k) nounwind  {
8 entry:
9   %cmp = icmp ugt i32 %k, %n            ; <i1> [#uses=1]
10   br i1 %cmp, label %ifthen, label %forcond.preheader
11
12 forcond.preheader:              ; preds = %entry
13   %cmp44 = icmp eq i32 %k, 0            ; <i1> [#uses=1]
14   br i1 %cmp44, label %afterfor, label %forbody
15
16 ; CHECK: %forcond.preheader
17 ; CHECK: movl $1
18 ; CHECK-NOT: xorl
19 ; CHECK-NOT: movl
20 ; CHECK-NOT: LBB
21 ; CHECK: je
22
23 ; There should be no moves required in the for loop body.
24 ; CHECK: %forbody
25 ; CHECK-NOT: mov
26 ; CHECK: jbe
27
28 ifthen:         ; preds = %entry
29   ret i32 0
30
31 forbody:                ; preds = %forbody, %forcond.preheader
32   %indvar = phi i32 [ 0, %forcond.preheader ], [ %divisor.02, %forbody ]                ; <i32> [#uses=3]
33   %accumulator.01 = phi i32 [ 1, %forcond.preheader ], [ %div, %forbody ]               ; <i32> [#uses=1]
34   %divisor.02 = add i32 %indvar, 1              ; <i32> [#uses=2]
35   %n.addr.03 = sub i32 %n, %indvar              ; <i32> [#uses=1]
36   %mul = mul i32 %n.addr.03, %accumulator.01            ; <i32> [#uses=1]
37   %div = udiv i32 %mul, %divisor.02             ; <i32> [#uses=2]
38   %inc = add i32 %indvar, 2             ; <i32> [#uses=1]
39   %cmp4 = icmp ugt i32 %inc, %k         ; <i1> [#uses=1]
40   br i1 %cmp4, label %afterfor, label %forbody
41
42 afterfor:               ; preds = %forbody, %forcond.preheader
43   %accumulator.0.lcssa = phi i32 [ 1, %forcond.preheader ], [ %div, %forbody ]          ; <i32> [#uses=1]
44   ret i32 %accumulator.0.lcssa
45 }