[ARM] Enable DP copy, load and store instructions for FPv4-SP
[oota-llvm.git] / test / CodeGen / Thumb2 / float-intrinsics-float.ll
1 ; RUN: llc < %s -mtriple=thumbv7-none-eabi   -mcpu=cortex-m3 | FileCheck %s -check-prefix=CHECK -check-prefix=SOFT -check-prefix=NONE
2 ; RUN: llc < %s -mtriple=thumbv7-none-eabihf -mcpu=cortex-m4 | FileCheck %s -check-prefix=CHECK -check-prefix=HARD -check-prefix=SP
3 ; RUN: llc < %s -mtriple=thumbv7-none-eabihf -mcpu=cortex-a7 | FileCheck %s -check-prefix=CHECK -check-prefix=HARD -check-prefix=DP
4
5 declare float     @llvm.sqrt.f32(float %Val)
6 define float @sqrt_f(float %a) {
7 ; CHECK-LABEL: sqrt_f:
8 ; SOFT: bl sqrtf
9 ; HARD: vsqrt.f32 s0, s0
10   %1 = call float @llvm.sqrt.f32(float %a)
11   ret float %1
12 }
13
14 declare float     @llvm.powi.f32(float %Val, i32 %power)
15 define float @powi_f(float %a, i32 %b) {
16 ; CHECK-LABEL: powi_f:
17 ; SOFT: bl __powisf2
18 ; HARD: b __powisf2
19   %1 = call float @llvm.powi.f32(float %a, i32 %b)
20   ret float %1
21 }
22
23 declare float     @llvm.sin.f32(float %Val)
24 define float @sin_f(float %a) {
25 ; CHECK-LABEL: sin_f:
26 ; SOFT: bl sinf
27 ; HARD: b sinf
28   %1 = call float @llvm.sin.f32(float %a)
29   ret float %1
30 }
31
32 declare float     @llvm.cos.f32(float %Val)
33 define float @cos_f(float %a) {
34 ; CHECK-LABEL: cos_f:
35 ; SOFT: bl cosf
36 ; HARD: b cosf
37   %1 = call float @llvm.cos.f32(float %a)
38   ret float %1
39 }
40
41 declare float     @llvm.pow.f32(float %Val, float %power)
42 define float @pow_f(float %a, float %b) {
43 ; CHECK-LABEL: pow_f:
44 ; SOFT: bl powf
45 ; HARD: b powf
46   %1 = call float @llvm.pow.f32(float %a, float %b)
47   ret float %1
48 }
49
50 declare float     @llvm.exp.f32(float %Val)
51 define float @exp_f(float %a) {
52 ; CHECK-LABEL: exp_f:
53 ; SOFT: bl expf
54 ; HARD: b expf
55   %1 = call float @llvm.exp.f32(float %a)
56   ret float %1
57 }
58
59 declare float     @llvm.exp2.f32(float %Val)
60 define float @exp2_f(float %a) {
61 ; CHECK-LABEL: exp2_f:
62 ; SOFT: bl exp2f
63 ; HARD: b exp2f
64   %1 = call float @llvm.exp2.f32(float %a)
65   ret float %1
66 }
67
68 declare float     @llvm.log.f32(float %Val)
69 define float @log_f(float %a) {
70 ; CHECK-LABEL: log_f:
71 ; SOFT: bl logf
72 ; HARD: b logf
73   %1 = call float @llvm.log.f32(float %a)
74   ret float %1
75 }
76
77 declare float     @llvm.log10.f32(float %Val)
78 define float @log10_f(float %a) {
79 ; CHECK-LABEL: log10_f:
80 ; SOFT: bl log10f
81 ; HARD: b log10f
82   %1 = call float @llvm.log10.f32(float %a)
83   ret float %1
84 }
85
86 declare float     @llvm.log2.f32(float %Val)
87 define float @log2_f(float %a) {
88 ; CHECK-LABEL: log2_f:
89 ; SOFT: bl log2f
90 ; HARD: b log2f
91   %1 = call float @llvm.log2.f32(float %a)
92   ret float %1
93 }
94
95 declare float     @llvm.fma.f32(float %a, float %b, float %c)
96 define float @fma_f(float %a, float %b, float %c) {
97 ; CHECK-LABEL: fma_f:
98 ; SOFT: bl fmaf
99 ; HARD: vfma.f32
100   %1 = call float @llvm.fma.f32(float %a, float %b, float %c)
101   ret float %1
102 }
103
104 declare float     @llvm.fabs.f32(float %Val)
105 define float @abs_f(float %a) {
106 ; CHECK-LABEL: abs_f:
107 ; SOFT: bic r0, r0, #-2147483648
108 ; HARD: vabs.f32
109   %1 = call float @llvm.fabs.f32(float %a)
110   ret float %1
111 }
112
113 declare float     @llvm.copysign.f32(float  %Mag, float  %Sgn)
114 define float @copysign_f(float %a, float %b) {
115 ; CHECK-LABEL: copysign_f:
116 ; NONE: lsrs [[REG:r[0-9]+]], r{{[0-9]+}}, #31
117 ; NONE: bfi r{{[0-9]+}}, [[REG]], #31, #1
118 ; SP: lsrs [[REG:r[0-9]+]], r{{[0-9]+}}, #31
119 ; SP: bfi r{{[0-9]+}}, [[REG]], #31, #1
120 ; DP: vmov.i32 [[REG:d[0-9]+]], #0x80000000
121 ; DP: vbsl [[REG]], d
122   %1 = call float @llvm.copysign.f32(float %a, float %b)
123   ret float %1
124 }
125
126 declare float     @llvm.floor.f32(float %Val)
127 define float @floor_f(float %a) {
128 ; CHECK-LABEL: floor_f:
129 ; SOFT: bl floorf
130 ; HARD: b floorf
131   %1 = call float @llvm.floor.f32(float %a)
132   ret float %1
133 }
134
135 declare float     @llvm.ceil.f32(float %Val)
136 define float @ceil_f(float %a) {
137 ; CHECK-LABEL: ceil_f:
138 ; SOFT: bl ceilf
139 ; HARD: b ceilf
140   %1 = call float @llvm.ceil.f32(float %a)
141   ret float %1
142 }
143
144 declare float     @llvm.trunc.f32(float %Val)
145 define float @trunc_f(float %a) {
146 ; CHECK-LABEL: trunc_f:
147 ; SOFT: bl truncf
148 ; HARD: b truncf
149   %1 = call float @llvm.trunc.f32(float %a)
150   ret float %1
151 }
152
153 declare float     @llvm.rint.f32(float %Val)
154 define float @rint_f(float %a) {
155 ; CHECK-LABEL: rint_f:
156 ; SOFT: bl rintf
157 ; HARD: b rintf
158   %1 = call float @llvm.rint.f32(float %a)
159   ret float %1
160 }
161
162 declare float     @llvm.nearbyint.f32(float %Val)
163 define float @nearbyint_f(float %a) {
164 ; CHECK-LABEL: nearbyint_f:
165 ; SOFT: bl nearbyintf
166 ; HARD: b nearbyintf
167   %1 = call float @llvm.nearbyint.f32(float %a)
168   ret float %1
169 }
170
171 declare float     @llvm.round.f32(float %Val)
172 define float @round_f(float %a) {
173 ; CHECK-LABEL: round_f:
174 ; SOFT: bl roundf
175 ; HARD: b roundf
176   %1 = call float @llvm.round.f32(float %a)
177   ret float %1
178 }
179
180 ; FIXME: why does cortex-m4 use vmla, while cortex-a7 uses vmul+vadd?
181 ; (these should be equivalent, even the rounding is the same)
182 declare float     @llvm.fmuladd.f32(float %a, float %b, float %c)
183 define float @fmuladd_f(float %a, float %b, float %c) {
184 ; CHECK-LABEL: fmuladd_f:
185 ; SOFT: bl __aeabi_fmul
186 ; SOFT: bl __aeabi_fadd
187 ; SP: vmla.f32
188 ; DP: vmul.f32
189 ; DP: vadd.f32
190   %1 = call float @llvm.fmuladd.f32(float %a, float %b, float %c)
191   ret float %1
192 }
193
194 declare i16 @llvm.convert.to.fp16.f32(float %a)
195 define i16 @f_to_h(float %a) {
196 ; CHECK-LABEL: f_to_h:
197 ; SOFT: bl __gnu_f2h_ieee
198 ; HARD: vcvtb.f16.f32
199   %1 = call i16 @llvm.convert.to.fp16.f32(float %a)
200   ret i16 %1
201 }
202
203 declare float @llvm.convert.from.fp16.f32(i16 %a)
204 define float @h_to_f(i16 %a) {
205 ; CHECK-LABEL: h_to_f:
206 ; SOFT: bl __gnu_h2f_ieee
207 ; HARD: vcvtb.f32.f16
208   %1 = call float @llvm.convert.from.fp16.f32(i16 %a)
209   ret float %1
210 }