Implement PR3495: local spiller optimization. The local spiller can now keep availabi...
[oota-llvm.git] / test / CodeGen / X86 / vec_shuffle-24.ll
1 ; RUN: llvm-as < %s | llc -march=x86 -mattr=+sse2  |     grep punpck
2
3 define i32 @t() nounwind optsize {
4 entry:
5         %a = alloca <4 x i32>           ; <<4 x i32>*> [#uses=2]
6         %b = alloca <4 x i32>           ; <<4 x i32>*> [#uses=5]
7         volatile store <4 x i32> < i32 0, i32 1, i32 2, i32 3 >, <4 x i32>* %a
8         %tmp = load <4 x i32>* %a               ; <<4 x i32>> [#uses=1]
9         store <4 x i32> %tmp, <4 x i32>* %b
10         %tmp1 = load <4 x i32>* %b              ; <<4 x i32>> [#uses=1]
11         %tmp2 = load <4 x i32>* %b              ; <<4 x i32>> [#uses=1]
12         %punpckldq = shufflevector <4 x i32> %tmp1, <4 x i32> %tmp2, <4 x i32> < i32 0, i32 4, i32 1, i32 5 >           ; <<4 x i32>> [#uses=1]
13         store <4 x i32> %punpckldq, <4 x i32>* %b
14         %tmp3 = load <4 x i32>* %b              ; <<4 x i32>> [#uses=1]
15         %result = extractelement <4 x i32> %tmp3, i32 0         ; <i32> [#uses=1]
16         ret i32 %result
17 }