[x86] Regenerate this test case now that I've improved my script for
[oota-llvm.git] / test / CodeGen / X86 / vector-shuffle-256-v8.ll
1 ; RUN: llc < %s -mcpu=x86-64 -mattr=+avx -x86-experimental-vector-shuffle-lowering | FileCheck %s --check-prefix=ALL --check-prefix=AVX1
2 ; RUN: llc < %s -mcpu=x86-64 -mattr=+avx2 -x86-experimental-vector-shuffle-lowering | FileCheck %s --check-prefix=ALL --check-prefix=AVX2
3
4 target triple = "x86_64-unknown-unknown"
5
6 define <8 x float> @shuffle_v8f32_00000000(<8 x float> %a, <8 x float> %b) {
7 ; ALL-LABEL: @shuffle_v8f32_00000000
8 ; ALL:       # BB#0:
9 ; ALL-NEXT:    vpermilps {{.*}} # xmm0 = xmm0[0,0,0,0]
10 ; ALL-NEXT:    vinsertf128 $1, %xmm0, %ymm0, %ymm0
11 ; ALL-NEXT:    retq
12   %shuffle = shufflevector <8 x float> %a, <8 x float> %b, <8 x i32> <i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0>
13   ret <8 x float> %shuffle
14 }
15
16 define <8 x float> @shuffle_v8f32_00000010(<8 x float> %a, <8 x float> %b) {
17 ; ALL-LABEL: @shuffle_v8f32_00000010
18 ; ALL:       # BB#0:
19 ; ALL-NEXT:    vpermilps {{.*}} # xmm1 = xmm0[0,0,0,0]
20 ; ALL-NEXT:    vpermilps {{.*}} # xmm0 = xmm0[0,0,1,0]
21 ; ALL-NEXT:    vinsertf128 $1, %xmm0, %ymm1, %ymm0
22 ; ALL-NEXT:    retq
23   %shuffle = shufflevector <8 x float> %a, <8 x float> %b, <8 x i32> <i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 1, i32 0>
24   ret <8 x float> %shuffle
25 }
26
27 define <8 x float> @shuffle_v8f32_00000200(<8 x float> %a, <8 x float> %b) {
28 ; ALL-LABEL: @shuffle_v8f32_00000200
29 ; ALL:       # BB#0:
30 ; ALL-NEXT:    vpermilps {{.*}} # xmm1 = xmm0[0,0,0,0]
31 ; ALL-NEXT:    vpermilps {{.*}} # xmm0 = xmm0[0,2,0,0]
32 ; ALL-NEXT:    vinsertf128 $1, %xmm0, %ymm1, %ymm0
33 ; ALL-NEXT:    retq
34   %shuffle = shufflevector <8 x float> %a, <8 x float> %b, <8 x i32> <i32 0, i32 0, i32 0, i32 0, i32 0, i32 2, i32 0, i32 0>
35   ret <8 x float> %shuffle
36 }
37
38 define <8 x float> @shuffle_v8f32_00003000(<8 x float> %a, <8 x float> %b) {
39 ; ALL-LABEL: @shuffle_v8f32_00003000
40 ; ALL:       # BB#0:
41 ; ALL-NEXT:    vpermilps {{.*}} # xmm1 = xmm0[0,0,0,0]
42 ; ALL-NEXT:    vpermilps {{.*}} # xmm0 = xmm0[3,0,0,0]
43 ; ALL-NEXT:    vinsertf128 $1, %xmm0, %ymm1, %ymm0
44 ; ALL-NEXT:    retq
45   %shuffle = shufflevector <8 x float> %a, <8 x float> %b, <8 x i32> <i32 0, i32 0, i32 0, i32 0, i32 3, i32 0, i32 0, i32 0>
46   ret <8 x float> %shuffle
47 }
48
49 define <8 x float> @shuffle_v8f32_00040000(<8 x float> %a, <8 x float> %b) {
50 ; ALL-LABEL: @shuffle_v8f32_00040000
51 ; ALL:       # BB#0:
52 ; ALL-NEXT:    vextractf128 $1, %ymm0, %xmm1
53 ; ALL-NEXT:    vshufps {{.*}} # xmm1 = xmm1[0,0],xmm0[0,0]
54 ; ALL-NEXT:    vshufps {{.*}} # xmm1 = xmm0[0,0],xmm1[2,0]
55 ; ALL-NEXT:    vpermilps {{.*}} # xmm0 = xmm0[0,0,0,0]
56 ; ALL-NEXT:    vinsertf128 $1, %xmm0, %ymm1, %ymm0
57 ; ALL-NEXT:    retq
58   %shuffle = shufflevector <8 x float> %a, <8 x float> %b, <8 x i32> <i32 0, i32 0, i32 0, i32 4, i32 0, i32 0, i32 0, i32 0>
59   ret <8 x float> %shuffle
60 }
61
62 define <8 x float> @shuffle_v8f32_00500000(<8 x float> %a, <8 x float> %b) {
63 ; ALL-LABEL: @shuffle_v8f32_00500000
64 ; ALL:       # BB#0:
65 ; ALL-NEXT:    vextractf128 $1, %ymm0, %xmm1
66 ; ALL-NEXT:    vshufps {{.*}} # xmm1 = xmm1[1,0],xmm0[0,0]
67 ; ALL-NEXT:    vshufps {{.*}} # xmm1 = xmm0[0,0],xmm1[0,2]
68 ; ALL-NEXT:    vpermilps {{.*}} # xmm0 = xmm0[0,0,0,0]
69 ; ALL-NEXT:    vinsertf128 $1, %xmm0, %ymm1, %ymm0
70 ; ALL-NEXT:    retq
71   %shuffle = shufflevector <8 x float> %a, <8 x float> %b, <8 x i32> <i32 0, i32 0, i32 5, i32 0, i32 0, i32 0, i32 0, i32 0>
72   ret <8 x float> %shuffle
73 }
74
75 define <8 x float> @shuffle_v8f32_06000000(<8 x float> %a, <8 x float> %b) {
76 ; ALL-LABEL: @shuffle_v8f32_06000000
77 ; ALL:       # BB#0:
78 ; ALL-NEXT:    vextractf128 $1, %ymm0, %xmm1
79 ; ALL-NEXT:    vshufps {{.*}} # xmm1 = xmm1[2,0],xmm0[0,0]
80 ; ALL-NEXT:    vshufps {{.*}} # xmm1 = xmm1[2,0],xmm0[0,0]
81 ; ALL-NEXT:    vpermilps {{.*}} # xmm0 = xmm0[0,0,0,0]
82 ; ALL-NEXT:    vinsertf128 $1, %xmm0, %ymm1, %ymm0
83 ; ALL-NEXT:    retq
84   %shuffle = shufflevector <8 x float> %a, <8 x float> %b, <8 x i32> <i32 0, i32 6, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0>
85   ret <8 x float> %shuffle
86 }
87
88 define <8 x float> @shuffle_v8f32_70000000(<8 x float> %a, <8 x float> %b) {
89 ; ALL-LABEL: @shuffle_v8f32_70000000
90 ; ALL:       # BB#0:
91 ; ALL-NEXT:    vextractf128 $1, %ymm0, %xmm1
92 ; ALL-NEXT:    vshufps {{.*}} # xmm1 = xmm1[3,0],xmm0[0,0]
93 ; ALL-NEXT:    vshufps {{.*}} # xmm1 = xmm1[0,2],xmm0[0,0]
94 ; ALL-NEXT:    vpermilps {{.*}} # xmm0 = xmm0[0,0,0,0]
95 ; ALL-NEXT:    vinsertf128 $1, %xmm0, %ymm1, %ymm0
96 ; ALL-NEXT:    retq
97   %shuffle = shufflevector <8 x float> %a, <8 x float> %b, <8 x i32> <i32 7, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0>
98   ret <8 x float> %shuffle
99 }
100
101 define <8 x float> @shuffle_v8f32_01014545(<8 x float> %a, <8 x float> %b) {
102 ; ALL-LABEL: @shuffle_v8f32_01014545
103 ; ALL:       # BB#0:
104 ; ALL-NEXT:    vunpcklpd {{.*}} # xmm1 = xmm0[0,0]
105 ; ALL-NEXT:    vextractf128 $1, %ymm0, %xmm0
106 ; ALL-NEXT:    vunpcklpd {{.*}} # xmm0 = xmm0[0,0]
107 ; ALL-NEXT:    vinsertf128 $1, %xmm0, %ymm1, %ymm0
108 ; ALL-NEXT:    retq
109   %shuffle = shufflevector <8 x float> %a, <8 x float> %b, <8 x i32> <i32 0, i32 1, i32 0, i32 1, i32 4, i32 5, i32 4, i32 5>
110   ret <8 x float> %shuffle
111 }
112
113 define <8 x float> @shuffle_v8f32_00112233(<8 x float> %a, <8 x float> %b) {
114 ; ALL-LABEL: @shuffle_v8f32_00112233
115 ; ALL:       # BB#0:
116 ; ALL-NEXT:    vunpcklps {{.*}} # xmm1 = xmm0[0,0,1,1]
117 ; ALL-NEXT:    vunpckhps {{.*}} # xmm0 = xmm0[2,2,3,3]
118 ; ALL-NEXT:    vinsertf128 $1, %xmm0, %ymm1, %ymm0
119 ; ALL-NEXT:    retq
120   %shuffle = shufflevector <8 x float> %a, <8 x float> %b, <8 x i32> <i32 0, i32 0, i32 1, i32 1, i32 2, i32 2, i32 3, i32 3>
121   ret <8 x float> %shuffle
122 }
123
124 define <8 x float> @shuffle_v8f32_00001111(<8 x float> %a, <8 x float> %b) {
125 ; ALL-LABEL: @shuffle_v8f32_00001111
126 ; ALL:       # BB#0:
127 ; ALL-NEXT:    vpermilps {{.*}} # xmm1 = xmm0[0,0,0,0]
128 ; ALL-NEXT:    vpermilps {{.*}} # xmm0 = xmm0[1,1,1,1]
129 ; ALL-NEXT:    vinsertf128 $1, %xmm0, %ymm1, %ymm0
130 ; ALL-NEXT:    retq
131   %shuffle = shufflevector <8 x float> %a, <8 x float> %b, <8 x i32> <i32 0, i32 0, i32 0, i32 0, i32 1, i32 1, i32 1, i32 1>
132   ret <8 x float> %shuffle
133 }
134
135 define <8 x float> @shuffle_v8f32_81a3c5e7(<8 x float> %a, <8 x float> %b) {
136 ; ALL-LABEL: @shuffle_v8f32_81a3c5e7
137 ; ALL:       # BB#0:
138 ; ALL-NEXT:    vblendps {{.*}} # ymm0 = ymm1[0],ymm0[1],ymm1[2],ymm0[3],ymm1[4],ymm0[5],ymm1[6],ymm0[7]
139 ; ALL-NEXT:    retq
140   %shuffle = shufflevector <8 x float> %a, <8 x float> %b, <8 x i32> <i32 8, i32 1, i32 10, i32 3, i32 12, i32 5, i32 14, i32 7>
141   ret <8 x float> %shuffle
142 }
143
144 define <8 x float> @shuffle_v8f32_08080808(<8 x float> %a, <8 x float> %b) {
145 ; ALL-LABEL: @shuffle_v8f32_08080808
146 ; ALL:       # BB#0:
147 ; ALL-NEXT:    vpermilps {{.*}} # xmm1 = xmm1[0,0,2,0]
148 ; ALL-NEXT:    vpermilps {{.*}} # xmm0 = xmm0[0,1,0,3]
149 ; ALL-NEXT:    vblendps {{.*}} # xmm0 = xmm0[0],xmm1[1],xmm0[2],xmm1[3]
150 ; ALL-NEXT:    vinsertf128 $1, %xmm0, %ymm0, %ymm0
151 ; ALL-NEXT:    retq
152   %shuffle = shufflevector <8 x float> %a, <8 x float> %b, <8 x i32> <i32 0, i32 8, i32 0, i32 8, i32 0, i32 8, i32 0, i32 8>
153   ret <8 x float> %shuffle
154 }
155
156 define <8 x float> @shuffle_v8f32_08084c4c(<8 x float> %a, <8 x float> %b) {
157 ; ALL-LABEL: @shuffle_v8f32_08084c4c
158 ; ALL:       # BB#0:
159 ; ALL-NEXT:    vpermilps {{.*}} # xmm2 = xmm1[0,0,2,0]
160 ; ALL-NEXT:    vextractf128 $1, %ymm1, %xmm1
161 ; ALL-NEXT:    vpermilps {{.*}} # xmm1 = xmm1[0,0,2,0]
162 ; ALL-NEXT:    vinsertf128 $1, %xmm1, %ymm2, %ymm1
163 ; ALL-NEXT:    vpermilps {{.*}} # xmm2 = xmm0[0,1,0,3]
164 ; ALL-NEXT:    vextractf128 $1, %ymm0, %xmm0
165 ; ALL-NEXT:    vpermilps {{.*}} # xmm0 = xmm0[0,1,0,3]
166 ; ALL-NEXT:    vinsertf128 $1, %xmm0, %ymm2, %ymm0
167 ; ALL-NEXT:    vblendps {{.*}} # ymm0 = ymm0[0],ymm1[1],ymm0[2],ymm1[3],ymm0[4],ymm1[5],ymm0[6],ymm1[7]
168 ; ALL-NEXT:    retq
169   %shuffle = shufflevector <8 x float> %a, <8 x float> %b, <8 x i32> <i32 0, i32 8, i32 0, i32 8, i32 4, i32 12, i32 4, i32 12>
170   ret <8 x float> %shuffle
171 }
172
173 define <8 x float> @shuffle_v8f32_8823cc67(<8 x float> %a, <8 x float> %b) {
174 ; ALL-LABEL: @shuffle_v8f32_8823cc67
175 ; ALL:       # BB#0:
176 ; ALL-NEXT:    vpermilps {{.*}} # xmm2 = xmm1[0,0,2,3]
177 ; ALL-NEXT:    vextractf128 $1, %ymm1, %xmm1
178 ; ALL-NEXT:    vpermilps {{.*}} # xmm1 = xmm1[0,0,2,3]
179 ; ALL-NEXT:    vinsertf128 $1, %xmm1, %ymm2, %ymm1
180 ; ALL-NEXT:    vblendps {{.*}} # ymm0 = ymm1[0,1],ymm0[2,3],ymm1[4,5],ymm0[6,7]
181 ; ALL-NEXT:    retq
182   %shuffle = shufflevector <8 x float> %a, <8 x float> %b, <8 x i32> <i32 8, i32 8, i32 2, i32 3, i32 12, i32 12, i32 6, i32 7>
183   ret <8 x float> %shuffle
184 }
185
186 define <8 x float> @shuffle_v8f32_9832dc76(<8 x float> %a, <8 x float> %b) {
187 ; ALL-LABEL: @shuffle_v8f32_9832dc76
188 ; ALL:       # BB#0:
189 ; ALL-NEXT:    vpermilps {{.*}} # xmm2 = xmm1[1,0,2,3]
190 ; ALL-NEXT:    vextractf128 $1, %ymm1, %xmm1
191 ; ALL-NEXT:    vpermilps {{.*}} # xmm1 = xmm1[1,0,2,3]
192 ; ALL-NEXT:    vinsertf128 $1, %xmm1, %ymm2, %ymm1
193 ; ALL-NEXT:    vpermilps {{.*}} # xmm2 = xmm0[0,1,3,2]
194 ; ALL-NEXT:    vextractf128 $1, %ymm0, %xmm0
195 ; ALL-NEXT:    vpermilps {{.*}} # xmm0 = xmm0[0,1,3,2]
196 ; ALL-NEXT:    vinsertf128 $1, %xmm0, %ymm2, %ymm0
197 ; ALL-NEXT:    vblendps {{.*}} # ymm0 = ymm1[0,1],ymm0[2,3],ymm1[4,5],ymm0[6,7]
198 ; ALL-NEXT:    retq
199   %shuffle = shufflevector <8 x float> %a, <8 x float> %b, <8 x i32> <i32 9, i32 8, i32 3, i32 2, i32 13, i32 12, i32 7, i32 6>
200   ret <8 x float> %shuffle
201 }
202
203 define <8 x float> @shuffle_v8f32_9810dc54(<8 x float> %a, <8 x float> %b) {
204 ; ALL-LABEL: @shuffle_v8f32_9810dc54
205 ; ALL:       # BB#0:
206 ; ALL-NEXT:    vpermilps {{.*}} # xmm2 = xmm1[1,0,2,3]
207 ; ALL-NEXT:    vextractf128 $1, %ymm1, %xmm1
208 ; ALL-NEXT:    vpermilps {{.*}} # xmm1 = xmm1[1,0,2,3]
209 ; ALL-NEXT:    vinsertf128 $1, %xmm1, %ymm2, %ymm1
210 ; ALL-NEXT:    vpermilps {{.*}} # xmm2 = xmm0[0,1,1,0]
211 ; ALL-NEXT:    vextractf128 $1, %ymm0, %xmm0
212 ; ALL-NEXT:    vpermilps {{.*}} # xmm0 = xmm0[0,1,1,0]
213 ; ALL-NEXT:    vinsertf128 $1, %xmm0, %ymm2, %ymm0
214 ; ALL-NEXT:    vblendps {{.*}} # ymm0 = ymm1[0,1],ymm0[2,3],ymm1[4,5],ymm0[6,7]
215 ; ALL-NEXT:    retq
216   %shuffle = shufflevector <8 x float> %a, <8 x float> %b, <8 x i32> <i32 9, i32 8, i32 1, i32 0, i32 13, i32 12, i32 5, i32 4>
217   ret <8 x float> %shuffle
218 }
219
220 define <8 x float> @shuffle_v8f32_08192a3b(<8 x float> %a, <8 x float> %b) {
221 ; ALL-LABEL: @shuffle_v8f32_08192a3b
222 ; ALL:       # BB#0:
223 ; ALL-NEXT:    vpermilps {{.*}} # xmm2 = xmm1[0,2,2,3]
224 ; ALL-NEXT:    vpermilps {{.*}} # xmm3 = xmm0[2,1,3,3]
225 ; ALL-NEXT:    vblendps {{.*}} # xmm2 = xmm3[0],xmm2[1],xmm3[2],xmm2[3]
226 ; ALL-NEXT:    vpermilps {{.*}} # xmm1 = xmm1[0,0,2,1]
227 ; ALL-NEXT:    vpermilps {{.*}} # xmm0 = xmm0[0,1,1,3]
228 ; ALL-NEXT:    vblendps {{.*}} # xmm0 = xmm0[0],xmm1[1],xmm0[2],xmm1[3]
229 ; ALL-NEXT:    vinsertf128 $1, %xmm2, %ymm0, %ymm0
230 ; ALL-NEXT:    retq
231   %shuffle = shufflevector <8 x float> %a, <8 x float> %b, <8 x i32> <i32 0, i32 8, i32 1, i32 9, i32 2, i32 10, i32 3, i32 11>
232   ret <8 x float> %shuffle
233 }
234
235 define <8 x float> @shuffle_v8f32_08991abb(<8 x float> %a, <8 x float> %b) {
236 ; ALL-LABEL: @shuffle_v8f32_08991abb
237 ; ALL:       # BB#0:
238 ; ALL-NEXT:    vpermilps {{.*}} # xmm2 = xmm0[1,1,2,3]
239 ; ALL-NEXT:    vpermilps {{.*}} # xmm3 = xmm1[0,2,3,3]
240 ; ALL-NEXT:    vblendps {{.*}} # xmm2 = xmm2[0],xmm3[1,2,3]
241 ; ALL-NEXT:    vunpcklps {{.*}} # xmm1 = xmm1[0,0,1,1]
242 ; ALL-NEXT:    vblendps {{.*}} # xmm0 = xmm0[0],xmm1[1,2,3]
243 ; ALL-NEXT:    vinsertf128 $1, %xmm2, %ymm0, %ymm0
244 ; ALL-NEXT:    retq
245   %shuffle = shufflevector <8 x float> %a, <8 x float> %b, <8 x i32> <i32 0, i32 8, i32 9, i32 9, i32 1, i32 10, i32 11, i32 11>
246   ret <8 x float> %shuffle
247 }
248
249 define <8 x float> @shuffle_v8f32_091b2d3f(<8 x float> %a, <8 x float> %b) {
250 ; ALL-LABEL: @shuffle_v8f32_091b2d3f
251 ; ALL:       # BB#0:
252 ; ALL-NEXT:    vextractf128 $1, %ymm1, %xmm2
253 ; ALL-NEXT:    vpermilps {{.*}} # xmm3 = xmm0[2,1,3,3]
254 ; ALL-NEXT:    vblendps {{.*}} # xmm2 = xmm3[0],xmm2[1],xmm3[2],xmm2[3]
255 ; ALL-NEXT:    vpermilps {{.*}} # xmm0 = xmm0[0,1,1,3]
256 ; ALL-NEXT:    vblendps {{.*}} # xmm0 = xmm0[0],xmm1[1],xmm0[2],xmm1[3]
257 ; ALL-NEXT:    vinsertf128 $1, %xmm2, %ymm0, %ymm0
258 ; ALL-NEXT:    retq
259   %shuffle = shufflevector <8 x float> %a, <8 x float> %b, <8 x i32> <i32 0, i32 9, i32 1, i32 11, i32 2, i32 13, i32 3, i32 15>
260   ret <8 x float> %shuffle
261 }
262
263 define <8 x float> @shuffle_v8f32_09ab1def(<8 x float> %a, <8 x float> %b) {
264 ; ALL-LABEL: @shuffle_v8f32_09ab1def
265 ; ALL:       # BB#0:
266 ; ALL-NEXT:    vextractf128 $1, %ymm1, %xmm2
267 ; ALL-NEXT:    vpermilps {{.*}} # xmm3 = xmm0[1,1,2,3]
268 ; ALL-NEXT:    vblendps {{.*}} # xmm2 = xmm3[0],xmm2[1,2,3]
269 ; ALL-NEXT:    vblendps {{.*}} # xmm0 = xmm0[0],xmm1[1,2,3]
270 ; ALL-NEXT:    vinsertf128 $1, %xmm2, %ymm0, %ymm0
271 ; ALL-NEXT:    retq
272   %shuffle = shufflevector <8 x float> %a, <8 x float> %b, <8 x i32> <i32 0, i32 9, i32 10, i32 11, i32 1, i32 13, i32 14, i32 15>
273   ret <8 x float> %shuffle
274 }
275
276 define <8 x float> @shuffle_v8f32_00014445(<8 x float> %a, <8 x float> %b) {
277 ; ALL-LABEL: @shuffle_v8f32_00014445
278 ; ALL:       # BB#0:
279 ; ALL-NEXT:    vpermilps {{.*}} # xmm1 = xmm0[0,0,0,1]
280 ; ALL-NEXT:    vextractf128 $1, %ymm0, %xmm0
281 ; ALL-NEXT:    vpermilps {{.*}} # xmm0 = xmm0[0,0,0,1]
282 ; ALL-NEXT:    vinsertf128 $1, %xmm0, %ymm1, %ymm0
283 ; ALL-NEXT:    retq
284   %shuffle = shufflevector <8 x float> %a, <8 x float> %b, <8 x i32> <i32 0, i32 0, i32 0, i32 1, i32 4, i32 4, i32 4, i32 5>
285   ret <8 x float> %shuffle
286 }
287
288 define <8 x float> @shuffle_v8f32_00204464(<8 x float> %a, <8 x float> %b) {
289 ; ALL-LABEL: @shuffle_v8f32_00204464
290 ; ALL:       # BB#0:
291 ; ALL-NEXT:    vpermilps {{.*}} # xmm1 = xmm0[0,0,2,0]
292 ; ALL-NEXT:    vextractf128 $1, %ymm0, %xmm0
293 ; ALL-NEXT:    vpermilps {{.*}} # xmm0 = xmm0[0,0,2,0]
294 ; ALL-NEXT:    vinsertf128 $1, %xmm0, %ymm1, %ymm0
295 ; ALL-NEXT:    retq
296   %shuffle = shufflevector <8 x float> %a, <8 x float> %b, <8 x i32> <i32 0, i32 0, i32 2, i32 0, i32 4, i32 4, i32 6, i32 4>
297   ret <8 x float> %shuffle
298 }
299
300 define <8 x float> @shuffle_v8f32_03004744(<8 x float> %a, <8 x float> %b) {
301 ; ALL-LABEL: @shuffle_v8f32_03004744
302 ; ALL:       # BB#0:
303 ; ALL-NEXT:    vpermilps {{.*}} # xmm1 = xmm0[0,3,0,0]
304 ; ALL-NEXT:    vextractf128 $1, %ymm0, %xmm0
305 ; ALL-NEXT:    vpermilps {{.*}} # xmm0 = xmm0[0,3,0,0]
306 ; ALL-NEXT:    vinsertf128 $1, %xmm0, %ymm1, %ymm0
307 ; ALL-NEXT:    retq
308   %shuffle = shufflevector <8 x float> %a, <8 x float> %b, <8 x i32> <i32 0, i32 3, i32 0, i32 0, i32 4, i32 7, i32 4, i32 4>
309   ret <8 x float> %shuffle
310 }
311
312 define <8 x float> @shuffle_v8f32_10005444(<8 x float> %a, <8 x float> %b) {
313 ; ALL-LABEL: @shuffle_v8f32_10005444
314 ; ALL:       # BB#0:
315 ; ALL-NEXT:    vpermilps {{.*}} # xmm1 = xmm0[1,0,0,0]
316 ; ALL-NEXT:    vextractf128 $1, %ymm0, %xmm0
317 ; ALL-NEXT:    vpermilps {{.*}} # xmm0 = xmm0[1,0,0,0]
318 ; ALL-NEXT:    vinsertf128 $1, %xmm0, %ymm1, %ymm0
319 ; ALL-NEXT:    retq
320   %shuffle = shufflevector <8 x float> %a, <8 x float> %b, <8 x i32> <i32 1, i32 0, i32 0, i32 0, i32 5, i32 4, i32 4, i32 4>
321   ret <8 x float> %shuffle
322 }
323
324 define <8 x float> @shuffle_v8f32_22006644(<8 x float> %a, <8 x float> %b) {
325 ; ALL-LABEL: @shuffle_v8f32_22006644
326 ; ALL:       # BB#0:
327 ; ALL-NEXT:    vpermilps {{.*}} # xmm1 = xmm0[2,2,0,0]
328 ; ALL-NEXT:    vextractf128 $1, %ymm0, %xmm0
329 ; ALL-NEXT:    vpermilps {{.*}} # xmm0 = xmm0[2,2,0,0]
330 ; ALL-NEXT:    vinsertf128 $1, %xmm0, %ymm1, %ymm0
331 ; ALL-NEXT:    retq
332   %shuffle = shufflevector <8 x float> %a, <8 x float> %b, <8 x i32> <i32 2, i32 2, i32 0, i32 0, i32 6, i32 6, i32 4, i32 4>
333   ret <8 x float> %shuffle
334 }
335
336 define <8 x float> @shuffle_v8f32_33307774(<8 x float> %a, <8 x float> %b) {
337 ; ALL-LABEL: @shuffle_v8f32_33307774
338 ; ALL:       # BB#0:
339 ; ALL-NEXT:    vpermilps {{.*}} # xmm1 = xmm0[3,3,3,0]
340 ; ALL-NEXT:    vextractf128 $1, %ymm0, %xmm0
341 ; ALL-NEXT:    vpermilps {{.*}} # xmm0 = xmm0[3,3,3,0]
342 ; ALL-NEXT:    vinsertf128 $1, %xmm0, %ymm1, %ymm0
343 ; ALL-NEXT:    retq
344   %shuffle = shufflevector <8 x float> %a, <8 x float> %b, <8 x i32> <i32 3, i32 3, i32 3, i32 0, i32 7, i32 7, i32 7, i32 4>
345   ret <8 x float> %shuffle
346 }
347
348 define <8 x float> @shuffle_v8f32_32107654(<8 x float> %a, <8 x float> %b) {
349 ; ALL-LABEL: @shuffle_v8f32_32107654
350 ; ALL:       # BB#0:
351 ; ALL-NEXT:    vpermilps {{.*}} # xmm1 = xmm0[3,2,1,0]
352 ; ALL-NEXT:    vextractf128 $1, %ymm0, %xmm0
353 ; ALL-NEXT:    vpermilps {{.*}} # xmm0 = xmm0[3,2,1,0]
354 ; ALL-NEXT:    vinsertf128 $1, %xmm0, %ymm1, %ymm0
355 ; ALL-NEXT:    retq
356   %shuffle = shufflevector <8 x float> %a, <8 x float> %b, <8 x i32> <i32 3, i32 2, i32 1, i32 0, i32 7, i32 6, i32 5, i32 4>
357   ret <8 x float> %shuffle
358 }
359
360 define <8 x float> @shuffle_v8f32_00234467(<8 x float> %a, <8 x float> %b) {
361 ; ALL-LABEL: @shuffle_v8f32_00234467
362 ; ALL:       # BB#0:
363 ; ALL-NEXT:    vpermilps {{.*}} # xmm1 = xmm0[0,0,2,3]
364 ; ALL-NEXT:    vextractf128 $1, %ymm0, %xmm0
365 ; ALL-NEXT:    vpermilps {{.*}} # xmm0 = xmm0[0,0,2,3]
366 ; ALL-NEXT:    vinsertf128 $1, %xmm0, %ymm1, %ymm0
367 ; ALL-NEXT:    retq
368   %shuffle = shufflevector <8 x float> %a, <8 x float> %b, <8 x i32> <i32 0, i32 0, i32 2, i32 3, i32 4, i32 4, i32 6, i32 7>
369   ret <8 x float> %shuffle
370 }
371
372 define <8 x float> @shuffle_v8f32_00224466(<8 x float> %a, <8 x float> %b) {
373 ; ALL-LABEL: @shuffle_v8f32_00224466
374 ; ALL:       # BB#0:
375 ; ALL-NEXT:    vmovsldup {{.*}} # xmm1 = xmm0[0,0,2,2]
376 ; ALL-NEXT:    vextractf128 $1, %ymm0, %xmm0
377 ; ALL-NEXT:    vmovsldup {{.*}} # xmm0 = xmm0[0,0,2,2]
378 ; ALL-NEXT:    vinsertf128 $1, %xmm0, %ymm1, %ymm0
379 ; ALL-NEXT:    retq
380   %shuffle = shufflevector <8 x float> %a, <8 x float> %b, <8 x i32> <i32 0, i32 0, i32 2, i32 2, i32 4, i32 4, i32 6, i32 6>
381   ret <8 x float> %shuffle
382 }
383
384 define <8 x float> @shuffle_v8f32_10325476(<8 x float> %a, <8 x float> %b) {
385 ; ALL-LABEL: @shuffle_v8f32_10325476
386 ; ALL:       # BB#0:
387 ; ALL-NEXT:    vpermilps {{.*}} # xmm1 = xmm0[1,0,3,2]
388 ; ALL-NEXT:    vextractf128 $1, %ymm0, %xmm0
389 ; ALL-NEXT:    vpermilps {{.*}} # xmm0 = xmm0[1,0,3,2]
390 ; ALL-NEXT:    vinsertf128 $1, %xmm0, %ymm1, %ymm0
391 ; ALL-NEXT:    retq
392   %shuffle = shufflevector <8 x float> %a, <8 x float> %b, <8 x i32> <i32 1, i32 0, i32 3, i32 2, i32 5, i32 4, i32 7, i32 6>
393   ret <8 x float> %shuffle
394 }
395
396 define <8 x float> @shuffle_v8f32_11335577(<8 x float> %a, <8 x float> %b) {
397 ; ALL-LABEL: @shuffle_v8f32_11335577
398 ; ALL:       # BB#0:
399 ; ALL-NEXT:    vmovshdup {{.*}} # xmm1 = xmm0[1,1,3,3]
400 ; ALL-NEXT:    vextractf128 $1, %ymm0, %xmm0
401 ; ALL-NEXT:    vmovshdup {{.*}} # xmm0 = xmm0[1,1,3,3]
402 ; ALL-NEXT:    vinsertf128 $1, %xmm0, %ymm1, %ymm0
403 ; ALL-NEXT:    retq
404   %shuffle = shufflevector <8 x float> %a, <8 x float> %b, <8 x i32> <i32 1, i32 1, i32 3, i32 3, i32 5, i32 5, i32 7, i32 7>
405   ret <8 x float> %shuffle
406 }
407
408 define <8 x float> @shuffle_v8f32_10235467(<8 x float> %a, <8 x float> %b) {
409 ; ALL-LABEL: @shuffle_v8f32_10235467
410 ; ALL:       # BB#0:
411 ; ALL-NEXT:    vpermilps {{.*}} # xmm1 = xmm0[1,0,2,3]
412 ; ALL-NEXT:    vextractf128 $1, %ymm0, %xmm0
413 ; ALL-NEXT:    vpermilps {{.*}} # xmm0 = xmm0[1,0,2,3]
414 ; ALL-NEXT:    vinsertf128 $1, %xmm0, %ymm1, %ymm0
415 ; ALL-NEXT:    retq
416   %shuffle = shufflevector <8 x float> %a, <8 x float> %b, <8 x i32> <i32 1, i32 0, i32 2, i32 3, i32 5, i32 4, i32 6, i32 7>
417   ret <8 x float> %shuffle
418 }
419
420 define <8 x float> @shuffle_v8f32_10225466(<8 x float> %a, <8 x float> %b) {
421 ; ALL-LABEL: @shuffle_v8f32_10225466
422 ; ALL:       # BB#0:
423 ; ALL-NEXT:    vpermilps {{.*}} # xmm1 = xmm0[1,0,2,2]
424 ; ALL-NEXT:    vextractf128 $1, %ymm0, %xmm0
425 ; ALL-NEXT:    vpermilps {{.*}} # xmm0 = xmm0[1,0,2,2]
426 ; ALL-NEXT:    vinsertf128 $1, %xmm0, %ymm1, %ymm0
427 ; ALL-NEXT:    retq
428   %shuffle = shufflevector <8 x float> %a, <8 x float> %b, <8 x i32> <i32 1, i32 0, i32 2, i32 2, i32 5, i32 4, i32 6, i32 6>
429   ret <8 x float> %shuffle
430 }