[PowerPC] Fix v2f64 vector extract and related patterns
[oota-llvm.git] / test / CodeGen / PowerPC / vsx.ll
1 ; RUN: llc -mcpu=pwr7 -mattr=+vsx < %s | FileCheck %s
2 target datalayout = "E-m:e-i64:64-n32:64"
3 target triple = "powerpc64-unknown-linux-gnu"
4
5 define double @test1(double %a, double %b) {
6 entry:
7   %v = fmul double %a, %b
8   ret double %v
9
10 ; CHECK-LABEL: @test1
11 ; CHECK: xsmuldp 1, 1, 2
12 ; CHECK: blr
13 }
14
15 define double @test2(double %a, double %b) {
16 entry:
17   %v = fdiv double %a, %b
18   ret double %v
19
20 ; CHECK-LABEL: @test2
21 ; CHECK: xsdivdp 1, 1, 2
22 ; CHECK: blr
23 }
24
25 define double @test3(double %a, double %b) {
26 entry:
27   %v = fadd double %a, %b
28   ret double %v
29
30 ; CHECK-LABEL: @test3
31 ; CHECK: xsadddp 1, 1, 2
32 ; CHECK: blr
33 }
34
35 define <2 x double> @test4(<2 x double> %a, <2 x double> %b) {
36 entry:
37   %v = fadd <2 x double> %a, %b
38   ret <2 x double> %v
39
40 ; CHECK-LABEL: @test4
41 ; CHECK: xvadddp 34, 34, 35
42 ; CHECK: blr
43 }
44
45 define <4 x i32> @test5(<4 x i32> %a, <4 x i32> %b) {
46 entry:
47   %v = xor <4 x i32> %a, %b
48   ret <4 x i32> %v
49
50 ; CHECK-LABEL: @test5
51 ; CHECK: xxlxor 34, 34, 35
52 ; CHECK: blr
53 }
54
55 define <8 x i16> @test6(<8 x i16> %a, <8 x i16> %b) {
56 entry:
57   %v = xor <8 x i16> %a, %b
58   ret <8 x i16> %v
59
60 ; CHECK-LABEL: @test6
61 ; CHECK: xxlxor 34, 34, 35
62 ; CHECK: blr
63 }
64
65 define <16 x i8> @test7(<16 x i8> %a, <16 x i8> %b) {
66 entry:
67   %v = xor <16 x i8> %a, %b
68   ret <16 x i8> %v
69
70 ; CHECK-LABEL: @test7
71 ; CHECK: xxlxor 34, 34, 35
72 ; CHECK: blr
73 }
74
75 define <4 x i32> @test8(<4 x i32> %a, <4 x i32> %b) {
76 entry:
77   %v = or <4 x i32> %a, %b
78   ret <4 x i32> %v
79
80 ; CHECK-LABEL: @test8
81 ; CHECK: xxlor 34, 34, 35
82 ; CHECK: blr
83 }
84
85 define <8 x i16> @test9(<8 x i16> %a, <8 x i16> %b) {
86 entry:
87   %v = or <8 x i16> %a, %b
88   ret <8 x i16> %v
89
90 ; CHECK-LABEL: @test9
91 ; CHECK: xxlor 34, 34, 35
92 ; CHECK: blr
93 }
94
95 define <16 x i8> @test10(<16 x i8> %a, <16 x i8> %b) {
96 entry:
97   %v = or <16 x i8> %a, %b
98   ret <16 x i8> %v
99
100 ; CHECK-LABEL: @test10
101 ; CHECK: xxlor 34, 34, 35
102 ; CHECK: blr
103 }
104
105 define <4 x i32> @test11(<4 x i32> %a, <4 x i32> %b) {
106 entry:
107   %v = and <4 x i32> %a, %b
108   ret <4 x i32> %v
109
110 ; CHECK-LABEL: @test11
111 ; CHECK: xxland 34, 34, 35
112 ; CHECK: blr
113 }
114
115 define <8 x i16> @test12(<8 x i16> %a, <8 x i16> %b) {
116 entry:
117   %v = and <8 x i16> %a, %b
118   ret <8 x i16> %v
119
120 ; CHECK-LABEL: @test12
121 ; CHECK: xxland 34, 34, 35
122 ; CHECK: blr
123 }
124
125 define <16 x i8> @test13(<16 x i8> %a, <16 x i8> %b) {
126 entry:
127   %v = and <16 x i8> %a, %b
128   ret <16 x i8> %v
129
130 ; CHECK-LABEL: @test13
131 ; CHECK: xxland 34, 34, 35
132 ; CHECK: blr
133 }
134
135 define <4 x i32> @test14(<4 x i32> %a, <4 x i32> %b) {
136 entry:
137   %v = or <4 x i32> %a, %b
138   %w = xor <4 x i32> %v, <i32 -1, i32 -1, i32 -1, i32 -1>
139   ret <4 x i32> %w
140
141 ; CHECK-LABEL: @test14
142 ; CHECK: xxlnor 34, 34, 35
143 ; CHECK: blr
144 }
145
146 define <8 x i16> @test15(<8 x i16> %a, <8 x i16> %b) {
147 entry:
148   %v = or <8 x i16> %a, %b
149   %w = xor <8 x i16> %v, <i16 -1, i16 -1, i16 -1, i16 -1, i16 -1, i16 -1, i16 -1, i16 -1>
150   ret <8 x i16> %w
151
152 ; CHECK-LABEL: @test15
153 ; CHECK: xxlnor 34, 34, 35
154 ; CHECK: blr
155 }
156
157 define <16 x i8> @test16(<16 x i8> %a, <16 x i8> %b) {
158 entry:
159   %v = or <16 x i8> %a, %b
160   %w = xor <16 x i8> %v, <i8 -1, i8 -1, i8 -1, i8 -1, i8 -1, i8 -1, i8 -1, i8 -1, i8 -1, i8 -1, i8 -1, i8 -1, i8 -1, i8 -1, i8 -1, i8 -1>
161   ret <16 x i8> %w
162
163 ; CHECK-LABEL: @test16
164 ; CHECK: xxlnor 34, 34, 35
165 ; CHECK: blr
166 }
167
168 define <4 x i32> @test17(<4 x i32> %a, <4 x i32> %b) {
169 entry:
170   %w = xor <4 x i32> %b, <i32 -1, i32 -1, i32 -1, i32 -1>
171   %v = and <4 x i32> %a, %w
172   ret <4 x i32> %v
173
174 ; CHECK-LABEL: @test17
175 ; CHECK: xxlandc 34, 34, 35
176 ; CHECK: blr
177 }
178
179 define <8 x i16> @test18(<8 x i16> %a, <8 x i16> %b) {
180 entry:
181   %w = xor <8 x i16> %b, <i16 -1, i16 -1, i16 -1, i16 -1, i16 -1, i16 -1, i16 -1, i16 -1>
182   %v = and <8 x i16> %a, %w
183   ret <8 x i16> %v
184
185 ; CHECK-LABEL: @test18
186 ; CHECK: xxlandc 34, 34, 35
187 ; CHECK: blr
188 }
189
190 define <16 x i8> @test19(<16 x i8> %a, <16 x i8> %b) {
191 entry:
192   %w = xor <16 x i8> %b, <i8 -1, i8 -1, i8 -1, i8 -1, i8 -1, i8 -1, i8 -1, i8 -1, i8 -1, i8 -1, i8 -1, i8 -1, i8 -1, i8 -1, i8 -1, i8 -1>
193   %v = and <16 x i8> %a, %w
194   ret <16 x i8> %v
195
196 ; CHECK-LABEL: @test19
197 ; CHECK: xxlandc 34, 34, 35
198 ; CHECK: blr
199 }
200
201 define <4 x i32> @test20(<4 x i32> %a, <4 x i32> %b, <4 x i32> %c, <4 x i32> %d) {
202 entry:
203   %m = icmp eq <4 x i32> %c, %d
204   %v = select <4 x i1> %m, <4 x i32> %a, <4 x i32> %b
205   ret <4 x i32> %v
206
207 ; CHECK-LABEL: @test20
208 ; CHECK: vcmpequw {{[0-9]+}}, 4, 5
209 ; CHECK: xxsel 34, 35, 34, {{[0-9]+}}
210 ; CHECK: blr
211 }
212
213 define <4 x float> @test21(<4 x float> %a, <4 x float> %b, <4 x float> %c, <4 x float> %d) {
214 entry:
215   %m = fcmp oeq <4 x float> %c, %d
216   %v = select <4 x i1> %m, <4 x float> %a, <4 x float> %b
217   ret <4 x float> %v
218
219 ; CHECK-LABEL: @test21
220 ; CHECK: xvcmpeqsp [[V1:[0-9]+]], 36, 37
221 ; CHECK: xxsel 34, 35, 34, [[V1]]
222 ; CHECK: blr
223 }
224
225 define <4 x float> @test22(<4 x float> %a, <4 x float> %b, <4 x float> %c, <4 x float> %d) {
226 entry:
227   %m = fcmp ueq <4 x float> %c, %d
228   %v = select <4 x i1> %m, <4 x float> %a, <4 x float> %b
229   ret <4 x float> %v
230
231 ; CHECK-LABEL: @test22
232 ; CHECK-DAG: xvcmpeqsp {{[0-9]+}}, 37, 37
233 ; CHECK-DAG: xvcmpeqsp {{[0-9]+}}, 36, 36
234 ; CHECK-DAG: xvcmpeqsp {{[0-9]+}}, 36, 37
235 ; CHECK-DAG: xxlnor
236 ; CHECK-DAG: xxlnor
237 ; CHECK-DAG: xxlor
238 ; CHECK-DAG: xxlor
239 ; CHECK: xxsel 34, 35, 34, {{[0-9]+}}
240 ; CHECK: blr
241 }
242
243 define <8 x i16> @test23(<8 x i16> %a, <8 x i16> %b, <8 x i16> %c, <8 x i16> %d) {
244 entry:
245   %m = icmp eq <8 x i16> %c, %d
246   %v = select <8 x i1> %m, <8 x i16> %a, <8 x i16> %b
247   ret <8 x i16> %v
248
249 ; CHECK-LABEL: @test23
250 ; CHECK: vcmpequh {{[0-9]+}}, 4, 5
251 ; CHECK: xxsel 34, 35, 34, {{[0-9]+}}
252 ; CHECK: blr
253 }
254
255 define <16 x i8> @test24(<16 x i8> %a, <16 x i8> %b, <16 x i8> %c, <16 x i8> %d) {
256 entry:
257   %m = icmp eq <16 x i8> %c, %d
258   %v = select <16 x i1> %m, <16 x i8> %a, <16 x i8> %b
259   ret <16 x i8> %v
260
261 ; CHECK-LABEL: @test24
262 ; CHECK: vcmpequb {{[0-9]+}}, 4, 5
263 ; CHECK: xxsel 34, 35, 34, {{[0-9]+}}
264 ; CHECK: blr
265 }
266
267 define <2 x double> @test25(<2 x double> %a, <2 x double> %b, <2 x double> %c, <2 x double> %d) {
268 entry:
269   %m = fcmp oeq <2 x double> %c, %d
270   %v = select <2 x i1> %m, <2 x double> %a, <2 x double> %b
271   ret <2 x double> %v
272
273 ; CHECK-LABEL: @test25
274 ; CHECK: xvcmpeqdp [[V1:[0-9]+]], 36, 37
275 ; CHECK: xxsel 34, 35, 34, [[V1]]
276 ; CHECK: blr
277 }
278
279 define <2 x i64> @test26(<2 x i64> %a, <2 x i64> %b) {
280   %v = add <2 x i64> %a, %b
281   ret <2 x i64> %v
282
283 ; CHECK-LABEL: @test26
284 ; FIXME: The code quality here is not good; just make sure we do something for now.
285 ; CHECK: add
286 ; CHECK: add
287 ; CHECK: blr
288 }
289
290 define <2 x i64> @test27(<2 x i64> %a, <2 x i64> %b) {
291   %v = and <2 x i64> %a, %b
292   ret <2 x i64> %v
293
294 ; CHECK-LABEL: @test27
295 ; CHECK: xxland 34, 34, 35
296 ; CHECK: blr
297 }
298
299 define <2 x double> @test28(<2 x double>* %a) {
300   %v = load <2 x double>* %a, align 16
301   ret <2 x double> %v
302
303 ; CHECK-LABEL: @test28
304 ; CHECK: lxvd2x 34, 0, 3
305 ; CHECK: blr
306 }
307
308 define void @test29(<2 x double>* %a, <2 x double> %b) {
309   store <2 x double> %b, <2 x double>* %a, align 16
310   ret void
311
312 ; CHECK-LABEL: @test29
313 ; CHECK: stxvd2x 34, 0, 3
314 ; CHECK: blr
315 }
316
317 define <2 x double> @test28u(<2 x double>* %a) {
318   %v = load <2 x double>* %a, align 8
319   ret <2 x double> %v
320
321 ; CHECK-LABEL: @test28u
322 ; CHECK: lxvd2x 34, 0, 3
323 ; CHECK: blr
324 }
325
326 define void @test29u(<2 x double>* %a, <2 x double> %b) {
327   store <2 x double> %b, <2 x double>* %a, align 8
328   ret void
329
330 ; CHECK-LABEL: @test29u
331 ; CHECK: stxvd2x 34, 0, 3
332 ; CHECK: blr
333 }
334
335 define <2 x i64> @test30(<2 x i64>* %a) {
336   %v = load <2 x i64>* %a, align 16
337   ret <2 x i64> %v
338
339 ; CHECK-LABEL: @test30
340 ; CHECK: lxvd2x 34, 0, 3
341 ; CHECK: blr
342 }
343
344 define void @test31(<2 x i64>* %a, <2 x i64> %b) {
345   store <2 x i64> %b, <2 x i64>* %a, align 16
346   ret void
347
348 ; CHECK-LABEL: @test31
349 ; CHECK: stxvd2x 34, 0, 3
350 ; CHECK: blr
351 }
352
353 define <2 x double> @test40(<2 x i64> %a) {
354   %v = uitofp <2 x i64> %a to <2 x double>
355   ret <2 x double> %v
356
357 ; CHECK-LABEL: @test40
358 ; CHECK: xvcvuxddp 34, 34
359 ; CHECK: blr
360 }
361
362 define <2 x double> @test41(<2 x i64> %a) {
363   %v = sitofp <2 x i64> %a to <2 x double>
364   ret <2 x double> %v
365
366 ; CHECK-LABEL: @test41
367 ; CHECK: xvcvsxddp 34, 34
368 ; CHECK: blr
369 }
370
371 define <2 x i64> @test42(<2 x double> %a) {
372   %v = fptoui <2 x double> %a to <2 x i64>
373   ret <2 x i64> %v
374
375 ; CHECK-LABEL: @test42
376 ; CHECK: xvcvdpuxds 34, 34
377 ; CHECK: blr
378 }
379
380 define <2 x i64> @test43(<2 x double> %a) {
381   %v = fptosi <2 x double> %a to <2 x i64>
382   ret <2 x i64> %v
383
384 ; CHECK-LABEL: @test43
385 ; CHECK: xvcvdpsxds 34, 34
386 ; CHECK: blr
387 }
388
389 define <2 x float> @test44(<2 x i64> %a) {
390   %v = uitofp <2 x i64> %a to <2 x float>
391   ret <2 x float> %v
392
393 ; CHECK-LABEL: @test44
394 ; FIXME: The code quality here looks pretty bad.
395 ; CHECK: blr
396 }
397
398 define <2 x float> @test45(<2 x i64> %a) {
399   %v = sitofp <2 x i64> %a to <2 x float>
400   ret <2 x float> %v
401
402 ; CHECK-LABEL: @test45
403 ; FIXME: The code quality here looks pretty bad.
404 ; CHECK: blr
405 }
406
407 define <2 x i64> @test46(<2 x float> %a) {
408   %v = fptoui <2 x float> %a to <2 x i64>
409   ret <2 x i64> %v
410
411 ; CHECK-LABEL: @test46
412 ; FIXME: The code quality here looks pretty bad.
413 ; CHECK: blr
414 }
415
416 define <2 x i64> @test47(<2 x float> %a) {
417   %v = fptosi <2 x float> %a to <2 x i64>
418   ret <2 x i64> %v
419
420 ; CHECK-LABEL: @test47
421 ; FIXME: The code quality here looks pretty bad.
422 ; CHECK: blr
423 }
424
425 define <2 x double> @test50(double* %a) {
426   %v = load double* %a, align 8
427   %w = insertelement <2 x double> undef, double %v, i32 0
428   %x = insertelement <2 x double> %w, double %v, i32 1
429   ret <2 x double> %x
430
431 ; CHECK-LABEL: @test50
432 ; CHECK: lxvdsx 34, 0, 3
433 ; CHECK: blr
434 }
435
436 define <2 x double> @test51(<2 x double> %a, <2 x double> %b) {
437   %v = shufflevector <2 x double> %a, <2 x double> %b, <2 x i32> <i32 0, i32 0>
438   ret <2 x double> %v
439
440 ; CHECK-LABEL: @test51
441 ; CHECK: xxpermdi 34, 34, 34, 0
442 ; CHECK: blr
443 }
444
445 define <2 x double> @test52(<2 x double> %a, <2 x double> %b) {
446   %v = shufflevector <2 x double> %a, <2 x double> %b, <2 x i32> <i32 0, i32 2>
447   ret <2 x double> %v
448
449 ; CHECK-LABEL: @test52
450 ; CHECK: xxpermdi 34, 34, 35, 0
451 ; CHECK: blr
452 }
453
454 define <2 x double> @test53(<2 x double> %a, <2 x double> %b) {
455   %v = shufflevector <2 x double> %a, <2 x double> %b, <2 x i32> <i32 2, i32 0>
456   ret <2 x double> %v
457
458 ; CHECK-LABEL: @test53
459 ; CHECK: xxpermdi 34, 35, 34, 0
460 ; CHECK: blr
461 }
462
463 define <2 x double> @test54(<2 x double> %a, <2 x double> %b) {
464   %v = shufflevector <2 x double> %a, <2 x double> %b, <2 x i32> <i32 1, i32 2>
465   ret <2 x double> %v
466
467 ; CHECK-LABEL: @test54
468 ; CHECK: xxpermdi 34, 34, 35, 1
469 ; CHECK: blr
470 }
471
472 define <2 x double> @test55(<2 x double> %a, <2 x double> %b) {
473   %v = shufflevector <2 x double> %a, <2 x double> %b, <2 x i32> <i32 1, i32 3>
474   ret <2 x double> %v
475
476 ; CHECK-LABEL: @test55
477 ; CHECK: xxpermdi 34, 34, 35, 3
478 ; CHECK: blr
479 }
480
481 define <2 x i64> @test56(<2 x i64> %a, <2 x i64> %b) {
482   %v = shufflevector <2 x i64> %a, <2 x i64> %b, <2 x i32> <i32 1, i32 3>
483   ret <2 x i64> %v
484
485 ; CHECK-LABEL: @test56
486 ; CHECK: xxpermdi 34, 34, 35, 3
487 ; CHECK: blr
488 }
489
490 define <2 x i64> @test60(<2 x i64> %a, <2 x i64> %b) {
491   %v = shl <2 x i64> %a, %b
492   ret <2 x i64> %v
493
494 ; CHECK-LABEL: @test60
495 ; This should scalarize, and the current code quality is not good.
496 ; CHECK: stxvd2x
497 ; CHECK: stxvd2x
498 ; CHECK: sld
499 ; CHECK: sld
500 ; CHECK: lxvd2x
501 ; CHECK: blr
502 }
503
504 define <2 x i64> @test61(<2 x i64> %a, <2 x i64> %b) {
505   %v = lshr <2 x i64> %a, %b
506   ret <2 x i64> %v
507
508 ; CHECK-LABEL: @test61
509 ; This should scalarize, and the current code quality is not good.
510 ; CHECK: stxvd2x
511 ; CHECK: stxvd2x
512 ; CHECK: srd
513 ; CHECK: srd
514 ; CHECK: lxvd2x
515 ; CHECK: blr
516 }
517
518 define <2 x i64> @test62(<2 x i64> %a, <2 x i64> %b) {
519   %v = ashr <2 x i64> %a, %b
520   ret <2 x i64> %v
521
522 ; CHECK-LABEL: @test62
523 ; This should scalarize, and the current code quality is not good.
524 ; CHECK: stxvd2x
525 ; CHECK: stxvd2x
526 ; CHECK: srad
527 ; CHECK: srad
528 ; CHECK: lxvd2x
529 ; CHECK: blr
530 }
531
532 define double @test63(<2 x double> %a) {
533   %v = extractelement <2 x double> %a, i32 0
534   ret double %v
535
536 ; CHECK-LABEL: @test63
537 ; CHECK: xxlor 1, 34, 34
538 ; CHECK: blr
539 }
540
541 define double @test64(<2 x double> %a) {
542   %v = extractelement <2 x double> %a, i32 1
543   ret double %v
544
545 ; CHECK-LABEL: @test64
546 ; CHECK: xxpermdi 1, 34, 34, 2
547 ; CHECK: blr
548 }
549