test/CodeGen/AArch64/arm64-AdvSIMD-Scalar.ll

   1 ; RUN: llc < %s -march=arm64 -aarch64-neon-syntax=apple -aarch64-simd-scalar=true -asm-verbose=false | FileCheck %s
   2 ; RUN: llc < %s -march=arm64 -aarch64-neon-syntax=generic -aarch64-simd-scalar=true -asm-verbose=false | FileCheck %s -check-prefix=GENERIC
   3
   4 define <2 x i64> @bar(<2 x i64> %a, <2 x i64> %b) nounwind readnone {
   5 ; CHECK-LABEL: bar:
   6 ; CHECK: add.2d v[[REG:[0-9]+]], v0, v1
   7 ; CHECK: add    d[[REG3:[0-9]+]], d[[REG]], d1
   8 ; CHECK: sub    d[[REG2:[0-9]+]], d[[REG]], d1
   9 ; GENERIC-LABEL: bar:
  10 ; GENERIC: add  v[[REG:[0-9]+]].2d, v0.2d, v1.2d
  11 ; GENERIC: add  d[[REG3:[0-9]+]], d[[REG]], d1
  12 ; GENERIC: sub  d[[REG2:[0-9]+]], d[[REG]], d1
  13   %add = add <2 x i64> %a, %b
  14   %vgetq_lane = extractelement <2 x i64> %add, i32 0
  15   %vgetq_lane2 = extractelement <2 x i64> %b, i32 0
  16   %add3 = add i64 %vgetq_lane, %vgetq_lane2
  17   %sub = sub i64 %vgetq_lane, %vgetq_lane2
  18   %vecinit = insertelement <2 x i64> undef, i64 %add3, i32 0
  19   %vecinit8 = insertelement <2 x i64> %vecinit, i64 %sub, i32 1
  20   ret <2 x i64> %vecinit8
  21 }
  22
  23 define double @subdd_su64(<2 x i64> %a, <2 x i64> %b) nounwind readnone {
  24 ; CHECK-LABEL: subdd_su64:
  25 ; CHECK: sub d0, d1, d0
  26 ; CHECK-NEXT: ret
  27 ; GENERIC-LABEL: subdd_su64:
  28 ; GENERIC: sub d0, d1, d0
  29 ; GENERIC-NEXT: ret
  30   %vecext = extractelement <2 x i64> %a, i32 0
  31   %vecext1 = extractelement <2 x i64> %b, i32 0
  32   %sub.i = sub nsw i64 %vecext1, %vecext
  33   %retval = bitcast i64 %sub.i to double
  34   ret double %retval
  35 }
  36
  37 define double @vaddd_su64(<2 x i64> %a, <2 x i64> %b) nounwind readnone {
  38 ; CHECK-LABEL: vaddd_su64:
  39 ; CHECK: add d0, d1, d0
  40 ; CHECK-NEXT: ret
  41 ; GENERIC-LABEL: vaddd_su64:
  42 ; GENERIC: add d0, d1, d0
  43 ; GENERIC-NEXT: ret
  44   %vecext = extractelement <2 x i64> %a, i32 0
  45   %vecext1 = extractelement <2 x i64> %b, i32 0
  46   %add.i = add nsw i64 %vecext1, %vecext
  47   %retval = bitcast i64 %add.i to double
  48   ret double %retval
  49 }
  50
  51 ; sub MI doesn't access dsub register.
  52 define double @add_sub_su64(<2 x i64> %a, <2 x i64> %b) nounwind readnone {
  53 ; CHECK-LABEL: add_sub_su64:
  54 ; CHECK: add d0, d1, d0
  55 ; CHECK: sub d0, {{d[0-9]+}}, d0
  56 ; CHECK-NEXT: ret
  57 ; GENERIC-LABEL: add_sub_su64:
  58 ; GENERIC: add d0, d1, d0
  59 ; GENERIC: sub d0, {{d[0-9]+}}, d0
  60 ; GENERIC-NEXT: ret
  61   %vecext = extractelement <2 x i64> %a, i32 0
  62   %vecext1 = extractelement <2 x i64> %b, i32 0
  63   %add.i = add i64 %vecext1, %vecext
  64   %sub.i = sub i64 0, %add.i
  65   %retval = bitcast i64 %sub.i to double
  66   ret double %retval
  67 }
  68 define double @and_su64(<2 x i64> %a, <2 x i64> %b) nounwind readnone {
  69 ; CHECK-LABEL: and_su64:
  70 ; CHECK: and.8b v0, v1, v0
  71 ; CHECK-NEXT: ret
  72 ; GENERIC-LABEL: and_su64:
  73 ; GENERIC: and v0.8b, v1.8b, v0.8b
  74 ; GENERIC-NEXT: ret
  75   %vecext = extractelement <2 x i64> %a, i32 0
  76   %vecext1 = extractelement <2 x i64> %b, i32 0
  77   %or.i = and i64 %vecext1, %vecext
  78   %retval = bitcast i64 %or.i to double
  79   ret double %retval
  80 }
  81
  82 define double @orr_su64(<2 x i64> %a, <2 x i64> %b) nounwind readnone {
  83 ; CHECK-LABEL: orr_su64:
  84 ; CHECK: orr.8b v0, v1, v0
  85 ; CHECK-NEXT: ret
  86 ; GENERIC-LABEL: orr_su64:
  87 ; GENERIC: orr v0.8b, v1.8b, v0.8b
  88 ; GENERIC-NEXT: ret
  89   %vecext = extractelement <2 x i64> %a, i32 0
  90   %vecext1 = extractelement <2 x i64> %b, i32 0
  91   %or.i = or i64 %vecext1, %vecext
  92   %retval = bitcast i64 %or.i to double
  93   ret double %retval
  94 }
  95
  96 define double @xorr_su64(<2 x i64> %a, <2 x i64> %b) nounwind readnone {
  97 ; CHECK-LABEL: xorr_su64:
  98 ; CHECK: eor.8b v0, v1, v0
  99 ; CHECK-NEXT: ret
 100 ; GENERIC-LABEL: xorr_su64:
 101 ; GENERIC: eor v0.8b, v1.8b, v0.8b
 102 ; GENERIC-NEXT: ret
 103   %vecext = extractelement <2 x i64> %a, i32 0
 104   %vecext1 = extractelement <2 x i64> %b, i32 0
 105   %xor.i = xor i64 %vecext1, %vecext
 106   %retval = bitcast i64 %xor.i to double
 107   ret double %retval
 108 }