test/CodeGen/AArch64/fp16-v4-instructions.ll

   1 ; RUN: llc < %s -mtriple=aarch64-none-eabi | FileCheck %s
   2
   3 define <4 x half> @add_h(<4 x half> %a, <4 x half> %b) {
   4 entry:
   5 ; CHECK-LABEL: add_h:
   6 ; CHECK-DAG: fcvtl [[OP1:v[0-9]+\.4s]], v0.4h
   7 ; CHECK-DAG: fcvtl [[OP2:v[0-9]+\.4s]], v1.4h
   8 ; CHECK: fadd [[RES:v[0-9]+.4s]], [[OP1]], [[OP2]]
   9 ; CHECK: fcvtn v0.4h, [[RES]]
  10   %0 = fadd <4 x half> %a, %b
  11   ret <4 x half> %0
  12 }
  13
  14
  15 define <4 x half> @build_h4(<4 x half> %a) {
  16 entry:
  17 ; CHECK-LABEL: build_h4:
  18 ; CHECK: movz [[GPR:w[0-9]+]], #0x3ccd
  19 ; CHECK: dup v0.4h, [[GPR]]
  20   ret <4 x half> <half 0xH3CCD, half 0xH3CCD, half 0xH3CCD, half 0xH3CCD>
  21 }
  22
  23
  24 define <4 x half> @sub_h(<4 x half> %a, <4 x half> %b) {
  25 entry:
  26 ; CHECK-LABEL: sub_h:
  27 ; CHECK-DAG: fcvtl [[OP1:v[0-9]+\.4s]], v0.4h
  28 ; CHECK-DAG: fcvtl [[OP2:v[0-9]+\.4s]], v1.4h
  29 ; CHECK: fsub [[RES:v[0-9]+.4s]], [[OP1]], [[OP2]]
  30 ; CHECK: fcvtn v0.4h, [[RES]]
  31   %0 = fsub <4 x half> %a, %b
  32   ret <4 x half> %0
  33 }
  34
  35
  36 define <4 x half> @mul_h(<4 x half> %a, <4 x half> %b) {
  37 entry:
  38 ; CHECK-LABEL: mul_h:
  39 ; CHECK-DAG: fcvtl [[OP1:v[0-9]+\.4s]], v0.4h
  40 ; CHECK-DAG: fcvtl [[OP2:v[0-9]+\.4s]], v1.4h
  41 ; CHECK: fmul [[RES:v[0-9]+.4s]], [[OP1]], [[OP2]]
  42 ; CHECK: fcvtn v0.4h, [[RES]]
  43   %0 = fmul <4 x half> %a, %b
  44   ret <4 x half> %0
  45 }
  46
  47
  48 define <4 x half> @div_h(<4 x half> %a, <4 x half> %b) {
  49 entry:
  50 ; CHECK-LABEL: div_h:
  51 ; CHECK-DAG: fcvtl [[OP1:v[0-9]+\.4s]], v0.4h
  52 ; CHECK-DAG: fcvtl [[OP2:v[0-9]+\.4s]], v1.4h
  53 ; CHECK: fdiv [[RES:v[0-9]+.4s]], [[OP1]], [[OP2]]
  54 ; CHECK: fcvtn v0.4h, [[RES]]
  55   %0 = fdiv <4 x half> %a, %b
  56   ret <4 x half> %0
  57 }
  58
  59
  60 define <4 x half> @load_h(<4 x half>* %a) {
  61 entry:
  62 ; CHECK-LABEL: load_h:
  63 ; CHECK: ldr d0, [x0]
  64   %0 = load <4 x half>, <4 x half>* %a, align 4
  65   ret <4 x half> %0
  66 }
  67
  68
  69 define void @store_h(<4 x half>* %a, <4 x half> %b) {
  70 entry:
  71 ; CHECK-LABEL: store_h:
  72 ; CHECK: str d0, [x0]
  73   store <4 x half> %b, <4 x half>* %a, align 4
  74   ret void
  75 }
  76
  77 define <4 x half> @s_to_h(<4 x float> %a) {
  78 ; CHECK-LABEL: s_to_h:
  79 ; CHECK: fcvtn v0.4h, v0.4s
  80   %1 = fptrunc <4 x float> %a to <4 x half>
  81   ret <4 x half> %1
  82 }
  83
  84 define <4 x half> @d_to_h(<4 x double> %a) {
  85 ; CHECK-LABEL: d_to_h:
  86 ; CHECK-DAG: fcvt
  87 ; CHECK-DAG: fcvt
  88 ; CHECK-DAG: fcvt
  89 ; CHECK-DAG: fcvt
  90 ; CHECK-DAG: ins
  91 ; CHECK-DAG: ins
  92 ; CHECK-DAG: ins
  93 ; CHECK-DAG: ins
  94   %1 = fptrunc <4 x double> %a to <4 x half>
  95   ret <4 x half> %1
  96 }
  97
  98 define <4 x float> @h_to_s(<4 x half> %a) {
  99 ; CHECK-LABEL: h_to_s:
 100 ; CHECK: fcvtl v0.4s, v0.4h
 101   %1 = fpext <4 x half> %a to <4 x float>
 102   ret <4 x float> %1
 103 }
 104
 105 define <4 x double> @h_to_d(<4 x half> %a) {
 106 ; CHECK-LABEL: h_to_d:
 107 ; CHECK-DAG: fcvt
 108 ; CHECK-DAG: fcvt
 109 ; CHECK-DAG: fcvt
 110 ; CHECK-DAG: fcvt
 111 ; CHECK-DAG: ins
 112 ; CHECK-DAG: ins
 113 ; CHECK-DAG: ins
 114 ; CHECK-DAG: ins
 115   %1 = fpext <4 x half> %a to <4 x double>
 116   ret <4 x double> %1
 117 }
 118
 119 define <4 x half> @bitcast_i_to_h(float, <4 x i16> %a) {
 120 ; CHECK-LABEL: bitcast_i_to_h:
 121 ; CHECK: mov v0.16b, v1.16b
 122   %2 = bitcast <4 x i16> %a to <4 x half>
 123   ret <4 x half> %2
 124 }
 125
 126 define <4 x i16> @bitcast_h_to_i(float, <4 x half> %a) {
 127 ; CHECK-LABEL: bitcast_h_to_i:
 128 ; CHECK: mov v0.16b, v1.16b
 129   %2 = bitcast <4 x half> %a to <4 x i16>
 130   ret <4 x i16> %2
 131 }