Merge alignment of common GlobalValue.

[oota-llvm.git] / lib / Target / ARM / ARMInstrInfo.td
diff --git a/lib/Target/ARM/ARMInstrInfo.td b/lib/Target/ARM/ARMInstrInfo.td

index 718d5da9d05a67e73cd323cc29fb353ad7e356a0..1c2f1900bcb0526daa4312334c8e32bc5d5fe68f 100644 (file)
--- a/lib/Target/ARM/ARMInstrInfo.td
+++ b/lib/Target/ARM/ARMInstrInfo.td
@@ -241,6 +241,9 @@ def HasDB            : Predicate<"Subtarget->hasDataBarrier()">,
  def HasMP            : Predicate<"Subtarget->hasMPExtension()">,
                                   AssemblerPredicate<"FeatureMP",
                                                      "mp-extensions">;
+def HasVirtualization: Predicate<"false">,
+                                 AssemblerPredicate<"FeatureVirtualization",
+                                                   "virtualization-extensions">;
  def HasTrustZone     : Predicate<"Subtarget->hasTrustZone()">,
                                   AssemblerPredicate<"FeatureTrustZone",
                                                      "TrustZone">;
@@ -270,8 +273,8 @@ def UseNaClTrap      : Predicate<"Subtarget->useNaClTrap()">,
  def DontUseNaClTrap  : Predicate<"!Subtarget->useNaClTrap()">;
  
  // FIXME: Eventually this will be just "hasV6T2Ops".
-def UseMovt          : Predicate<"Subtarget->useMovt()">;
-def DontUseMovt      : Predicate<"!Subtarget->useMovt()">;
+def UseMovt          : Predicate<"Subtarget->useMovt(*MF)">;
+def DontUseMovt      : Predicate<"!Subtarget->useMovt(*MF)">;
  def UseFPVMLx        : Predicate<"Subtarget->useFPVMLx()">;
  def UseMulOps        : Predicate<"Subtarget->useMulOps()">;
  
@@ -493,7 +496,7 @@ def neon_vcvt_imm32 : Operand<i32> {
  // rot_imm: An integer that encodes a rotate amount. Must be 8, 16, or 24.
  def rot_imm_XFORM: SDNodeXForm<imm, [{
    switch (N->getZExtValue()){
-  default: assert(0);
+  default: llvm_unreachable(nullptr);
    case 0:  return CurDAG->getTargetConstant(0, MVT::i32);
    case 8:  return CurDAG->getTargetConstant(1, MVT::i32);
    case 16: return CurDAG->getTargetConstant(2, MVT::i32);
@@ -594,7 +597,7 @@ def so_imm2part : PatLeaf<(imm), [{
  /// arm_i32imm - True for +V6T2, or true only if so_imm2part is true.
  ///
  def arm_i32imm : PatLeaf<(imm), [{
-  if (Subtarget->useMovt())
+  if (Subtarget->useMovt(*MF))
      return true;
    return ARM_AM::isSOImmTwoPartVal((unsigned)N->getZExtValue());
  }]>;
@@ -633,6 +636,8 @@ def imm32 : Operand<i32>, ImmLeaf<i32, [{ return Imm == 32; }]> {
    let ParserMatchClass = Imm32AsmOperand;
  }
  
+def imm8_or_16 : ImmLeaf<i32, [{ return Imm == 8 || Imm == 16;}]>;
+
  /// imm1_7 predicate - Immediate in the range [1,7].
  def Imm1_7AsmOperand: ImmAsmOperand { let Name = "Imm1_7"; }
  def imm1_7 : Operand<i32>, ImmLeaf<i32, [{ return Imm > 0 && Imm < 8; }]> {
@@ -1961,7 +1966,7 @@ def SETEND : AXI<(outs), (ins setend_op:$end), MiscFrm, NoItinerary,
  }
  
  def DBG : AI<(outs), (ins imm0_15:$opt), MiscFrm, NoItinerary, "dbg", "\t$opt",
-             []>, Requires<[IsARM, HasV7]> {
+             [(int_arm_dbg imm0_15:$opt)]>, Requires<[IsARM, HasV7]> {
    bits<4> opt;
    let Inst{27-4} = 0b001100100000111100001111;
    let Inst{3-0} = opt;
@@ -2708,7 +2713,8 @@ multiclass AI2_stridx<bit isByte, string opc,
    def _PRE_IMM : AI2ldstidx<0, isByte, 1, (outs GPR:$Rn_wb),
                              (ins GPR:$Rt, addrmode_imm12_pre:$addr), IndexModePre,
                              StFrm, iii,
-                            opc, "\t$Rt, $addr!", "$addr.base = $Rn_wb", []> {
+                            opc, "\t$Rt, $addr!",
+                            "$addr.base = $Rn_wb,@earlyclobber $Rn_wb", []> {
      bits<17> addr;
      let Inst{25} = 0;
      let Inst{23}    = addr{12};     // U (add = ('U' == 1))
@@ -2720,7 +2726,8 @@ multiclass AI2_stridx<bit isByte, string opc,
    def _PRE_REG  : AI2ldstidx<0, isByte, 1, (outs GPR:$Rn_wb),
                        (ins GPR:$Rt, ldst_so_reg:$addr),
                        IndexModePre, StFrm, iir,
-                      opc, "\t$Rt, $addr!", "$addr.base = $Rn_wb", []> {
+                      opc, "\t$Rt, $addr!",
+                      "$addr.base = $Rn_wb,@earlyclobber $Rn_wb", []> {
      bits<17> addr;
      let Inst{25} = 1;
      let Inst{23}    = addr{12};    // U (add = ('U' == 1))
@@ -2733,7 +2740,7 @@ multiclass AI2_stridx<bit isByte, string opc,
                  (ins GPR:$Rt, addr_offset_none:$addr, am2offset_reg:$offset),
                  IndexModePost, StFrm, iir,
                  opc, "\t$Rt, $addr, $offset",
-                "$addr.base = $Rn_wb", []> {
+                "$addr.base = $Rn_wb,@earlyclobber $Rn_wb", []> {
       // {12}     isAdd
       // {11-0}   imm12/Rm
       bits<14> offset;
@@ -2751,7 +2758,7 @@ multiclass AI2_stridx<bit isByte, string opc,
                  (ins GPR:$Rt, addr_offset_none:$addr, am2offset_imm:$offset),
                  IndexModePost, StFrm, iii,
                  opc, "\t$Rt, $addr, $offset",
-                "$addr.base = $Rn_wb", []> {
+                "$addr.base = $Rn_wb,@earlyclobber $Rn_wb", []> {
      // {12}     isAdd
      // {11-0}   imm12/Rm
      bits<14> offset;
@@ -2828,7 +2835,8 @@ def STRH_preidx: ARMPseudoInst<(outs GPR:$Rn_wb),
  def STRH_PRE  : AI3ldstidx<0b1011, 0, 1, (outs GPR:$Rn_wb),
                             (ins GPR:$Rt, addrmode3_pre:$addr), IndexModePre,
                             StMiscFrm, IIC_iStore_bh_ru,
-                           "strh", "\t$Rt, $addr!", "$addr.base = $Rn_wb", []> {
+                           "strh", "\t$Rt, $addr!",
+                           "$addr.base = $Rn_wb,@earlyclobber $Rn_wb", []> {
    bits<14> addr;
    let Inst{23}    = addr{8};      // U bit
    let Inst{22}    = addr{13};     // 1 == imm8, 0 == Rm
@@ -2841,7 +2849,8 @@ def STRH_PRE  : AI3ldstidx<0b1011, 0, 1, (outs GPR:$Rn_wb),
  def STRH_POST : AI3ldstidx<0b1011, 0, 0, (outs GPR:$Rn_wb),
                         (ins GPR:$Rt, addr_offset_none:$addr, am3offset:$offset),
                         IndexModePost, StMiscFrm, IIC_iStore_bh_ru,
-                       "strh", "\t$Rt, $addr, $offset", "$addr.base = $Rn_wb",
+                       "strh", "\t$Rt, $addr, $offset",
+                       "$addr.base = $Rn_wb,@earlyclobber $Rn_wb",
                     [(set GPR:$Rn_wb, (post_truncsti16 GPR:$Rt,
                                                        addr_offset_none:$addr,
                                                        am3offset:$offset))]> {
@@ -3334,8 +3343,8 @@ def SBFX  : I<(outs GPRnopc:$Rd),
    let Inst{3-0}   = Rn;
  }
  
-def UBFX  : I<(outs GPR:$Rd),
-              (ins GPR:$Rn, imm0_31:$lsb, imm1_32:$width),
+def UBFX  : I<(outs GPRnopc:$Rd),
+              (ins GPRnopc:$Rn, imm0_31:$lsb, imm1_32:$width),
                 AddrMode1, 4, IndexModeNone, DPFrm, IIC_iUNAsi,
                 "ubfx", "\t$Rd, $Rn, $lsb, $width", "", []>,
                 Requires<[IsARM, HasV6T2]> {
@@ -3417,7 +3426,8 @@ def : ARMPat<(ARMaddc GPR:$src, imm0_65535_neg:$imm),
  def : ARMPat<(ARMadde GPR:$src, so_imm_not:$imm, CPSR),
               (SBCri   GPR:$src, so_imm_not:$imm)>;
  def : ARMPat<(ARMadde GPR:$src, imm0_65535_neg:$imm, CPSR),
-             (SBCrr   GPR:$src, (MOVi16 (imm_not_XFORM imm:$imm)))>;
+             (SBCrr   GPR:$src, (MOVi16 (imm_not_XFORM imm:$imm)))>,
+             Requires<[IsARM, HasV6T2]>;
  
  // Note: These are implemented in C++ code, because they have to generate
  // ADD/SUBrs instructions, which use a complex pattern that a xform function
@@ -4111,7 +4121,7 @@ def UDIV : ADivA1I<0b011, (outs GPR:$Rd), (ins GPR:$Rn, GPR:$Rm), IIC_iDIV,
  //  Misc. Arithmetic Instructions.
  //
  
-def CLZ  : AMiscA1I<0b000010110, 0b0001, (outs GPR:$Rd), (ins GPR:$Rm),
+def CLZ  : AMiscA1I<0b00010110, 0b0001, (outs GPR:$Rd), (ins GPR:$Rm),
                IIC_iUNAr, "clz", "\t$Rd, $Rm",
                [(set GPR:$Rd, (ctlz GPR:$Rm))]>, Requires<[IsARM, HasV5T]>,
             Sched<[WriteALU]>;
@@ -4443,7 +4453,7 @@ def instsyncb_opt : Operand<i32> {
    let DecoderMethod = "DecodeInstSyncBarrierOption";
  }
  
-// memory barriers protect the atomic sequences
+// Memory barriers protect the atomic sequences
  let hasSideEffects = 1 in {
  def DMB : AInoP<(outs), (ins memb_opt:$opt), MiscFrm, NoItinerary,
                  "dmb", "\t$opt", [(int_arm_dmb (i32 imm0_15:$opt))]>,
@@ -4452,7 +4462,6 @@ def DMB : AInoP<(outs), (ins memb_opt:$opt), MiscFrm, NoItinerary,
    let Inst{31-4} = 0xf57ff05;
    let Inst{3-0} = opt;
  }
-}
  
  def DSB : AInoP<(outs), (ins memb_opt:$opt), MiscFrm, NoItinerary,
                  "dsb", "\t$opt", [(int_arm_dsb (i32 imm0_15:$opt))]>,
@@ -4464,12 +4473,13 @@ def DSB : AInoP<(outs), (ins memb_opt:$opt), MiscFrm, NoItinerary,
  
  // ISB has only full system option
  def ISB : AInoP<(outs), (ins instsyncb_opt:$opt), MiscFrm, NoItinerary,
-                "isb", "\t$opt", []>,
+                "isb", "\t$opt", [(int_arm_isb (i32 imm0_15:$opt))]>,
                  Requires<[IsARM, HasDB]> {
    bits<4> opt;
    let Inst{31-4} = 0xf57ff06;
    let Inst{3-0} = opt;
  }
+}
  
  let usesCustomInserter = 1, Defs = [CPSR] in {
  
@@ -4629,7 +4639,7 @@ def : ARMPat<(stlex_2 (and GPR:$Rt, 0xffff), addr_offset_none:$addr),
  class acquiring_load<PatFrag base>
    : PatFrag<(ops node:$ptr), (base node:$ptr), [{
    AtomicOrdering Ordering = cast<AtomicSDNode>(N)->getOrdering();
-  return Ordering == Acquire || Ordering == SequentiallyConsistent;
+  return isAtLeastAcquire(Ordering);
  }]>;
  
  def atomic_load_acquire_8  : acquiring_load<atomic_load_8>;
@@ -4639,7 +4649,7 @@ def atomic_load_acquire_32 : acquiring_load<atomic_load_32>;
  class releasing_store<PatFrag base>
    : PatFrag<(ops node:$ptr, node:$val), (base node:$ptr, node:$val), [{
    AtomicOrdering Ordering = cast<AtomicSDNode>(N)->getOrdering();
-  return Ordering == Release || Ordering == SequentiallyConsistent;
+  return isAtLeastRelease(Ordering);
  }]>;
  
  def atomic_store_release_8  : releasing_store<atomic_store_8>;
@@ -5060,12 +5070,31 @@ def MRSsys : ABI<0b0001, (outs GPRnopc:$Rd), (ins), NoItinerary,
    let Unpredictable{11-0} = 0b110100001111;
  }
  
+// However, the MRS (banked register) system instruction (ARMv7VE) *does* have a
+// separate encoding (distinguished by bit 5.
+def MRSbanked : ABI<0b0001, (outs GPRnopc:$Rd), (ins banked_reg:$banked),
+                    NoItinerary, "mrs", "\t$Rd, $banked", []>,
+                Requires<[IsARM, HasVirtualization]> {
+  bits<6> banked;
+  bits<4> Rd;
+
+  let Inst{23} = 0;
+  let Inst{22} = banked{5}; // R bit
+  let Inst{21-20} = 0b10;
+  let Inst{19-16} = banked{3-0};
+  let Inst{15-12} = Rd;
+  let Inst{11-9} = 0b001;
+  let Inst{8} = banked{4};
+  let Inst{7-0} = 0b00000000;
+}
+
  // Move from ARM core register to Special Register
  //
-// No need to have both system and application versions, the encodings are the
-// same and the assembly parser has no way to distinguish between them. The mask
-// operand contains the special register (R Bit) in bit 4 and bits 3-0 contains
-// the mask with the fields to be accessed in the special register.
+// No need to have both system and application versions of MSR (immediate) or
+// MSR (register), the encodings are the same and the assembly parser has no way
+// to distinguish between them. The mask operand contains the special register
+// (R Bit) in bit 4 and bits 3-0 contains the mask with the fields to be
+// accessed in the special register.
  def MSR : ABI<0b0001, (outs), (ins msr_mask:$mask, GPR:$Rn), NoItinerary,
                "msr", "\t$mask, $Rn", []> {
    bits<5> mask;
@@ -5093,6 +5122,38 @@ def MSRi : ABI<0b0011, (outs), (ins msr_mask:$mask,  so_imm:$a), NoItinerary,
    let Inst{11-0} = a;
  }
  
+// However, the MSR (banked register) system instruction (ARMv7VE) *does* have a
+// separate encoding (distinguished by bit 5.
+def MSRbanked : ABI<0b0001, (outs), (ins banked_reg:$banked, GPRnopc:$Rn),
+                    NoItinerary, "msr", "\t$banked, $Rn", []>,
+                Requires<[IsARM, HasVirtualization]> {
+  bits<6> banked;
+  bits<4> Rn;
+
+  let Inst{23} = 0;
+  let Inst{22} = banked{5}; // R bit
+  let Inst{21-20} = 0b10;
+  let Inst{19-16} = banked{3-0};
+  let Inst{15-12} = 0b1111;
+  let Inst{11-9} = 0b001;
+  let Inst{8} = banked{4};
+  let Inst{7-4} = 0b0000;
+  let Inst{3-0} = Rn;
+}
+
+// Dynamic stack allocation yields a _chkstk for Windows targets.  These calls
+// are needed to probe the stack when allocating more than
+// 4k bytes in one go. Touching the stack at 4K increments is necessary to
+// ensure that the guard pages used by the OS virtual memory manager are
+// allocated in correct sequence.
+// The main point of having separate instruction are extra unmodelled effects
+// (compared to ordinary calls) like stack pointer change.
+
+def win__chkstk : SDNode<"ARMISD::WIN__CHKSTK", SDTNone,
+                      [SDNPHasChain, SDNPSideEffect]>;
+let usesCustomInserter = 1, Uses = [R4], Defs = [R4, SP] in
+  def WIN__CHKSTK : PseudoInst<(outs), (ins), NoItinerary, [(win__chkstk)]>;
+
  //===----------------------------------------------------------------------===//
  // TLS Instructions
  //
@@ -5100,9 +5161,11 @@ def MSRi : ABI<0b0011, (outs), (ins msr_mask:$mask,  so_imm:$a), NoItinerary,
  // __aeabi_read_tp preserves the registers r1-r3.
  // This is a pseudo inst so that we can get the encoding right,
  // complete with fixup for the aeabi_read_tp function.
+// TPsoft is valid for ARM mode only, in case of Thumb mode a tTPsoft pattern
+// is defined in "ARMInstrThumb.td".
  let isCall = 1,
    Defs = [R0, R12, LR, CPSR], Uses = [SP] in {
-  def TPsoft : PseudoInst<(outs), (ins), IIC_Br,
+  def TPsoft : ARMPseudoInst<(outs), (ins), 4, IIC_Br,
                 [(set R0, ARMthread_pointer)]>, Sched<[WriteBr]>;
  }