[AArch64] Extend the number of scalar instructions supported in the AdvSIMD
[oota-llvm.git] / test / CodeGen / AArch64 / arm64-AdvSIMD-Scalar.ll
1 ; RUN: llc < %s -march=arm64 -aarch64-neon-syntax=apple -aarch64-simd-scalar=true -asm-verbose=false | FileCheck %s
2 ; RUN: llc < %s -march=arm64 -aarch64-neon-syntax=generic -aarch64-simd-scalar=true -asm-verbose=false | FileCheck %s -check-prefix=GENERIC
3
4 define <2 x i64> @bar(<2 x i64> %a, <2 x i64> %b) nounwind readnone {
5 ; CHECK-LABEL: bar:
6 ; CHECK: add.2d v[[REG:[0-9]+]], v0, v1
7 ; CHECK: add    d[[REG3:[0-9]+]], d[[REG]], d1
8 ; CHECK: sub    d[[REG2:[0-9]+]], d[[REG]], d1
9 ; GENERIC-LABEL: bar:
10 ; GENERIC: add  v[[REG:[0-9]+]].2d, v0.2d, v1.2d
11 ; GENERIC: add  d[[REG3:[0-9]+]], d[[REG]], d1
12 ; GENERIC: sub  d[[REG2:[0-9]+]], d[[REG]], d1
13   %add = add <2 x i64> %a, %b
14   %vgetq_lane = extractelement <2 x i64> %add, i32 0
15   %vgetq_lane2 = extractelement <2 x i64> %b, i32 0
16   %add3 = add i64 %vgetq_lane, %vgetq_lane2
17   %sub = sub i64 %vgetq_lane, %vgetq_lane2
18   %vecinit = insertelement <2 x i64> undef, i64 %add3, i32 0
19   %vecinit8 = insertelement <2 x i64> %vecinit, i64 %sub, i32 1
20   ret <2 x i64> %vecinit8
21 }
22
23 define double @subdd_su64(<2 x i64> %a, <2 x i64> %b) nounwind readnone {
24 ; CHECK-LABEL: subdd_su64:
25 ; CHECK: sub d0, d1, d0
26 ; CHECK-NEXT: ret
27 ; GENERIC-LABEL: subdd_su64:
28 ; GENERIC: sub d0, d1, d0
29 ; GENERIC-NEXT: ret
30   %vecext = extractelement <2 x i64> %a, i32 0
31   %vecext1 = extractelement <2 x i64> %b, i32 0
32   %sub.i = sub nsw i64 %vecext1, %vecext
33   %retval = bitcast i64 %sub.i to double
34   ret double %retval
35 }
36
37 define double @vaddd_su64(<2 x i64> %a, <2 x i64> %b) nounwind readnone {
38 ; CHECK-LABEL: vaddd_su64:
39 ; CHECK: add d0, d1, d0
40 ; CHECK-NEXT: ret
41 ; GENERIC-LABEL: vaddd_su64:
42 ; GENERIC: add d0, d1, d0
43 ; GENERIC-NEXT: ret
44   %vecext = extractelement <2 x i64> %a, i32 0
45   %vecext1 = extractelement <2 x i64> %b, i32 0
46   %add.i = add nsw i64 %vecext1, %vecext
47   %retval = bitcast i64 %add.i to double
48   ret double %retval
49 }
50
51 ; sub MI doesn't access dsub register.
52 define double @add_sub_su64(<2 x i64> %a, <2 x i64> %b) nounwind readnone {
53 ; CHECK-LABEL: add_sub_su64:
54 ; CHECK: add d0, d1, d0
55 ; CHECK: sub d0, {{d[0-9]+}}, d0
56 ; CHECK-NEXT: ret
57 ; GENERIC-LABEL: add_sub_su64:
58 ; GENERIC: add d0, d1, d0
59 ; GENERIC: sub d0, {{d[0-9]+}}, d0
60 ; GENERIC-NEXT: ret
61   %vecext = extractelement <2 x i64> %a, i32 0
62   %vecext1 = extractelement <2 x i64> %b, i32 0
63   %add.i = add i64 %vecext1, %vecext
64   %sub.i = sub i64 0, %add.i
65   %retval = bitcast i64 %sub.i to double
66   ret double %retval
67 }
68 define double @and_su64(<2 x i64> %a, <2 x i64> %b) nounwind readnone {
69 ; CHECK-LABEL: and_su64:
70 ; CHECK: and.8b v0, v1, v0
71 ; CHECK-NEXT: ret
72 ; GENERIC-LABEL: and_su64:
73 ; GENERIC: and v0.8b, v1.8b, v0.8b
74 ; GENERIC-NEXT: ret
75   %vecext = extractelement <2 x i64> %a, i32 0
76   %vecext1 = extractelement <2 x i64> %b, i32 0
77   %or.i = and i64 %vecext1, %vecext
78   %retval = bitcast i64 %or.i to double
79   ret double %retval
80 }
81
82 define double @orr_su64(<2 x i64> %a, <2 x i64> %b) nounwind readnone {
83 ; CHECK-LABEL: orr_su64:
84 ; CHECK: orr.8b v0, v1, v0
85 ; CHECK-NEXT: ret
86 ; GENERIC-LABEL: orr_su64:
87 ; GENERIC: orr v0.8b, v1.8b, v0.8b
88 ; GENERIC-NEXT: ret
89   %vecext = extractelement <2 x i64> %a, i32 0
90   %vecext1 = extractelement <2 x i64> %b, i32 0
91   %or.i = or i64 %vecext1, %vecext
92   %retval = bitcast i64 %or.i to double
93   ret double %retval
94 }
95
96 define double @xorr_su64(<2 x i64> %a, <2 x i64> %b) nounwind readnone {
97 ; CHECK-LABEL: xorr_su64:
98 ; CHECK: eor.8b v0, v1, v0
99 ; CHECK-NEXT: ret
100 ; GENERIC-LABEL: xorr_su64:
101 ; GENERIC: eor v0.8b, v1.8b, v0.8b
102 ; GENERIC-NEXT: ret
103   %vecext = extractelement <2 x i64> %a, i32 0
104   %vecext1 = extractelement <2 x i64> %b, i32 0
105   %xor.i = xor i64 %vecext1, %vecext
106   %retval = bitcast i64 %xor.i to double
107   ret double %retval
108 }