Add a testcase for the scheduling heuristic introduced in r67586.
[oota-llvm.git] / test / CodeGen / CellSPU / loads.ll
1 ; RUN: llvm-as -o - %s | llc -march=cellspu > %t1.s
2 ; RUN: grep {lqd.*0(\$3)}   %t1.s | count 1
3 ; RUN: grep {lqd.*16(\$3)}  %t1.s | count 1
4
5 ; ModuleID = 'loads.bc'
6 target datalayout = "E-p:32:32:128-f64:64:128-f32:32:128-i64:32:128-i32:32:128-i16:16:128-i8:8:128-i1:8:128-a0:0:128-v128:128:128-s0:128:128"
7 target triple = "spu"
8
9 define <4 x float> @load_v4f32_1(<4 x float>* %a) nounwind readonly {
10 entry:
11         %tmp1 = load <4 x float>* %a
12         ret <4 x float> %tmp1
13 }
14
15 define <4 x float> @load_v4f32_2(<4 x float>* %a) nounwind readonly {
16 entry:
17         %arrayidx = getelementptr <4 x float>* %a, i32 1                ; <<4 x float>*> [#uses=1]
18         %tmp1 = load <4 x float>* %arrayidx             ; <<4 x float>> [#uses=1]
19         ret <4 x float> %tmp1
20 }