On Sandybridge loading unaligned 256bits using two XMM loads (vmovups and vinsertf128...
[oota-llvm.git] / test / CodeGen / X86 / sandybridge-loads.ll
1 ; RUN: llc -march=x86-64 -mtriple=x86_64-apple-darwin -mcpu=corei7-avx -o - < %s | FileCheck %s
2
3 ;CHECK: wideloads
4 ;CHECK: vmovaps
5 ;CHECK: vinsertf128
6 ;CHECK: vmovups
7 ;CHECK-NOT: vinsertf128
8 ;CHECK: ret
9
10 define void @wideloads(<8 x float>* %a, <8 x float>* %b, <8 x float>* %c) nounwind uwtable noinline ssp {
11   %v0 = load <8 x float>* %a, align 16  ; <---- unaligned!
12   %v1 = load <8 x float>* %b, align 32  ; <---- aligned!
13   %m0 = fcmp olt <8 x float> %v1, %v0
14   %v2 = load <8 x float>* %c, align 16
15   %m1 = fcmp olt <8 x float> %v2, %v0
16   %mand = and <8 x i1> %m1, %m0
17   %r = zext <8 x i1> %mand to <8 x i32>
18   store <8 x i32> %r, <8 x i32>* undef, align 16
19   ret void
20 }
21