This implements the second half of the fix for PR3290, handling
[oota-llvm.git] / test / Transforms / InstCombine / getelementptr_promote.ll
1 ; RUN: llvm-as < %s | opt -instcombine | llvm-dis | grep getelementptr | grep {, i64}
2
3 ; Instcombine should promote the getelementptr index up to the target's
4 ; pointer size, making the conversion explicit, which helps expose it to
5 ; other optimizations.
6
7 target datalayout = "e-p:64:64:64-i1:8:8-i8:8:8-i16:16:16-i32:32:32-i64:64:64-f32:32:32-f64:64:64-v64:64:64-v128:128:128-a0:0:64-s0:64:64-f80:128:128"
8 target triple = "x86_64-apple-darwin8"
9
10 define i64 @test(i64* %first, i32 %count) nounwind {
11 entry:
12         %first_addr = alloca i64*               ; <i64**> [#uses=2]
13         %count_addr = alloca i32                ; <i32*> [#uses=2]
14         %retval = alloca i64            ; <i64*> [#uses=2]
15         %n = alloca i32         ; <i32*> [#uses=5]
16         %result = alloca i64            ; <i64*> [#uses=4]
17         %0 = alloca i64         ; <i64*> [#uses=2]
18         %"alloca point" = bitcast i32 0 to i32          ; <i32> [#uses=0]
19         store i64* %first, i64** %first_addr
20         store i32 %count, i32* %count_addr
21         store i64 0, i64* %result, align 8
22         store i32 0, i32* %n, align 4
23         br label %bb1
24
25 bb:             ; preds = %bb1
26         %1 = load i64** %first_addr, align 8            ; <i64*> [#uses=1]
27         %2 = load i32* %n, align 4              ; <i32> [#uses=1]
28         %3 = bitcast i32 %2 to i32              ; <i64> [#uses=1]
29         %4 = getelementptr i64* %1, i32 %3              ; <i64*> [#uses=1]
30         %5 = load i64* %4, align 8              ; <i64> [#uses=1]
31         %6 = lshr i64 %5, 4             ; <i64> [#uses=1]
32         %7 = load i64* %result, align 8         ; <i64> [#uses=1]
33         %8 = add i64 %6, %7             ; <i64> [#uses=1]
34         store i64 %8, i64* %result, align 8
35         %9 = load i32* %n, align 4              ; <i32> [#uses=1]
36         %10 = add i32 %9, 1             ; <i32> [#uses=1]
37         store i32 %10, i32* %n, align 4
38         br label %bb1
39
40 bb1:            ; preds = %bb, %entry
41         %11 = load i32* %n, align 4             ; <i32> [#uses=1]
42         %12 = load i32* %count_addr, align 4            ; <i32> [#uses=1]
43         %13 = icmp slt i32 %11, %12             ; <i1> [#uses=1]
44         %14 = zext i1 %13 to i8         ; <i8> [#uses=1]
45         %toBool = icmp ne i8 %14, 0             ; <i1> [#uses=1]
46         br i1 %toBool, label %bb, label %bb2
47
48 bb2:            ; preds = %bb1
49         %15 = load i64* %result, align 8                ; <i64> [#uses=1]
50         store i64 %15, i64* %0, align 8
51         %16 = load i64* %0, align 8             ; <i64> [#uses=1]
52         store i64 %16, i64* %retval, align 8
53         br label %return
54
55 return:         ; preds = %bb2
56         %retval3 = load i64* %retval            ; <i64> [#uses=1]
57         ret i64 %retval3
58 }