[ARM64-BE] Fix fast-isel, and add appropriate RUN lines to appropriate tests.

[oota-llvm.git] / lib / Target / ARM64 / ARM64FastISel.cpp
diff --git a/lib/Target/ARM64/ARM64FastISel.cpp b/lib/Target/ARM64/ARM64FastISel.cpp

index 51b0f7613ff9ed941b3ff572a3e3738274746f89..78cde1c22c99ec1801382b7cc1c93df4db8c91b6 100644 (file)
--- a/lib/Target/ARM64/ARM64FastISel.cpp
+++ b/lib/Target/ARM64/ARM64FastISel.cpp
@@ -147,8 +147,8 @@ private:
  
  public:
    // Backend specific FastISel code.
-  virtual unsigned TargetMaterializeAlloca(const AllocaInst *AI);
-  virtual unsigned TargetMaterializeConstant(const Constant *C);
+  unsigned TargetMaterializeAlloca(const AllocaInst *AI) override;
+  unsigned TargetMaterializeConstant(const Constant *C) override;
  
    explicit ARM64FastISel(FunctionLoweringInfo &funcInfo,
                           const TargetLibraryInfo *libInfo)
@@ -157,7 +157,7 @@ public:
      Context = &funcInfo.Fn->getContext();
    }
  
-  virtual bool TargetSelectInstruction(const Instruction *I);
+  bool TargetSelectInstruction(const Instruction *I) override;
  
  #include "ARM64GenFastISel.inc"
  };
@@ -197,6 +197,9 @@ unsigned ARM64FastISel::TargetMaterializeAlloca(const AllocaInst *AI) {
  }
  
  unsigned ARM64FastISel::ARM64MaterializeFP(const ConstantFP *CFP, MVT VT) {
+  if (VT != MVT::f32 && VT != MVT::f64)
+    return 0;
+
    const APFloat Val = CFP->getValueAPF();
    bool is64bit = (VT == MVT::f64);
  
@@ -225,7 +228,7 @@ unsigned ARM64FastISel::ARM64MaterializeFP(const ConstantFP *CFP, MVT VT) {
      Align = DL.getTypeAllocSize(CFP->getType());
  
    unsigned Idx = MCP.getConstantPoolIndex(cast<Constant>(CFP), Align);
-  unsigned ADRPReg = createResultReg(&ARM64::GPR64RegClass);
+  unsigned ADRPReg = createResultReg(&ARM64::GPR64commonRegClass);
    BuildMI(*FuncInfo.MBB, FuncInfo.InsertPt, DbgLoc, TII.get(ARM64::ADRP),
            ADRPReg).addConstantPoolIndex(Idx, 0, ARM64II::MO_PAGE);
  
@@ -253,25 +256,28 @@ unsigned ARM64FastISel::ARM64MaterializeGV(const GlobalValue *GV) {
    EVT DestEVT = TLI.getValueType(GV->getType(), true);
    if (!DestEVT.isSimple())
      return 0;
-  MVT DestVT = DestEVT.getSimpleVT();
  
-  unsigned ADRPReg = createResultReg(&ARM64::GPR64RegClass);
-  unsigned ResultReg = createResultReg(TLI.getRegClassFor(DestVT));
+  unsigned ADRPReg = createResultReg(&ARM64::GPR64commonRegClass);
+  unsigned ResultReg;
  
    if (OpFlags & ARM64II::MO_GOT) {
      // ADRP + LDRX
      BuildMI(*FuncInfo.MBB, FuncInfo.InsertPt, DbgLoc, TII.get(ARM64::ADRP),
              ADRPReg)
          .addGlobalAddress(GV, 0, ARM64II::MO_GOT | ARM64II::MO_PAGE);
+
+    ResultReg = createResultReg(&ARM64::GPR64RegClass);
      BuildMI(*FuncInfo.MBB, FuncInfo.InsertPt, DbgLoc, TII.get(ARM64::LDRXui),
              ResultReg)
          .addReg(ADRPReg)
          .addGlobalAddress(GV, 0, ARM64II::MO_GOT | ARM64II::MO_PAGEOFF |
-                                     ARM64II::MO_NC);
+                          ARM64II::MO_NC);
    } else {
      // ADRP + ADDX
      BuildMI(*FuncInfo.MBB, FuncInfo.InsertPt, DbgLoc, TII.get(ARM64::ADRP),
              ADRPReg).addGlobalAddress(GV, 0, ARM64II::MO_PAGE);
+
+    ResultReg = createResultReg(&ARM64::GPR64spRegClass);
      BuildMI(*FuncInfo.MBB, FuncInfo.InsertPt, DbgLoc, TII.get(ARM64::ADDXri),
              ResultReg)
          .addReg(ADRPReg)
@@ -300,7 +306,7 @@ unsigned ARM64FastISel::TargetMaterializeConstant(const Constant *C) {
  
  // Computes the address to get to an object.
  bool ARM64FastISel::ComputeAddress(const Value *Obj, Address &Addr) {
-  const User *U = NULL;
+  const User *U = nullptr;
    unsigned Opcode = Instruction::UserOp1;
    if (const Instruction *I = dyn_cast<Instruction>(Obj)) {
      // Don't walk into other basic blocks unless the object is an alloca from
@@ -415,7 +421,11 @@ bool ARM64FastISel::isTypeLegal(Type *Ty, MVT &VT) {
      return false;
    VT = evt.getSimpleVT();
  
-  // Handle all legal types, i.e. a register that will directly hold this
+  // This is a legal type, but it's not something we handle in fast-isel.
+  if (VT == MVT::f128)
+    return false;
+
+  // Handle all other legal types, i.e. a register that will directly hold this
    // value.
    return TLI.isTypeLegal(VT);
  }
@@ -567,7 +577,8 @@ bool ARM64FastISel::EmitLoad(MVT VT, unsigned &ResultReg, Address Addr,
  
    // Loading an i1 requires special handling.
    if (VTIsi1) {
-    unsigned ANDReg = createResultReg(&ARM64::GPR32RegClass);
+    MRI.constrainRegClass(ResultReg, &ARM64::GPR32RegClass);
+    unsigned ANDReg = createResultReg(&ARM64::GPR32spRegClass);
      BuildMI(*FuncInfo.MBB, FuncInfo.InsertPt, DbgLoc, TII.get(ARM64::ANDWri),
              ANDReg)
          .addReg(ResultReg)
@@ -655,7 +666,8 @@ bool ARM64FastISel::EmitStore(MVT VT, unsigned SrcReg, Address Addr,
  
    // Storing an i1 requires special handling.
    if (VTIsi1) {
-    unsigned ANDReg = createResultReg(&ARM64::GPR32RegClass);
+    MRI.constrainRegClass(SrcReg, &ARM64::GPR32RegClass);
+    unsigned ANDReg = createResultReg(&ARM64::GPR32spRegClass);
      BuildMI(*FuncInfo.MBB, FuncInfo.InsertPt, DbgLoc, TII.get(ARM64::ANDWri),
              ANDReg)
          .addReg(SrcReg)
@@ -734,9 +746,9 @@ static ARM64CC::CondCode getCompareCC(CmpInst::Predicate Pred) {
    case CmpInst::ICMP_NE:
      return ARM64CC::NE;
    case CmpInst::ICMP_UGE:
-    return ARM64CC::CS;
+    return ARM64CC::HS;
    case CmpInst::ICMP_ULT:
-    return ARM64CC::CC;
+    return ARM64CC::LO;
    }
  }
  
@@ -778,7 +790,8 @@ bool ARM64FastISel::SelectBranch(const Instruction *I) {
          CondReg = FastEmitInst_extractsubreg(MVT::i32, CondReg, /*Kill=*/true,
                                               ARM64::sub_32);
  
-      unsigned ANDReg = createResultReg(&ARM64::GPR32RegClass);
+      MRI.constrainRegClass(CondReg, &ARM64::GPR32RegClass);
+      unsigned ANDReg = createResultReg(&ARM64::GPR32spRegClass);
        BuildMI(*FuncInfo.MBB, FuncInfo.InsertPt, DbgLoc, TII.get(ARM64::ANDWri),
                ANDReg)
            .addReg(CondReg)
@@ -1020,7 +1033,9 @@ bool ARM64FastISel::SelectSelect(const Instruction *I) {
    if (FalseReg == 0)
      return false;
  
-  unsigned ANDReg = createResultReg(&ARM64::GPR32RegClass);
+
+  MRI.constrainRegClass(CondReg, &ARM64::GPR32RegClass);
+  unsigned ANDReg = createResultReg(&ARM64::GPR32spRegClass);
    BuildMI(*FuncInfo.MBB, FuncInfo.InsertPt, DbgLoc, TII.get(ARM64::ANDWri),
            ANDReg)
        .addReg(CondReg)
@@ -1104,6 +1119,8 @@ bool ARM64FastISel::SelectFPToInt(const Instruction *I, bool Signed) {
      return false;
  
    EVT SrcVT = TLI.getValueType(I->getOperand(0)->getType(), true);
+  if (SrcVT == MVT::f128)
+    return false;
  
    unsigned Opc;
    if (SrcVT == MVT::f64) {
@@ -1117,7 +1134,8 @@ bool ARM64FastISel::SelectFPToInt(const Instruction *I, bool Signed) {
      else
        Opc = (DestVT == MVT::i32) ? ARM64::FCVTZUUWSr : ARM64::FCVTZUUXSr;
    }
-  unsigned ResultReg = createResultReg(TLI.getRegClassFor(DestVT));
+  unsigned ResultReg = createResultReg(
+      DestVT == MVT::i32 ? &ARM64::GPR32RegClass : &ARM64::GPR64RegClass);
    BuildMI(*FuncInfo.MBB, FuncInfo.InsertPt, DbgLoc, TII.get(Opc), ResultReg)
        .addReg(SrcReg);
    UpdateValueMap(I, ResultReg);
@@ -1128,6 +1146,8 @@ bool ARM64FastISel::SelectIntToFP(const Instruction *I, bool Signed) {
    MVT DestVT;
    if (!isTypeLegal(I->getType(), DestVT) || DestVT.isVector())
      return false;
+  assert ((DestVT == MVT::f32 || DestVT == MVT::f64) &&
+          "Unexpected value type.");
  
    unsigned SrcReg = getRegForValue(I->getOperand(0));
    if (SrcReg == 0)
@@ -1143,6 +1163,9 @@ bool ARM64FastISel::SelectIntToFP(const Instruction *I, bool Signed) {
        return false;
    }
  
+  MRI.constrainRegClass(SrcReg, SrcVT == MVT::i64 ? &ARM64::GPR64RegClass
+                                                  : &ARM64::GPR32RegClass);
+
    unsigned Opc;
    if (SrcVT == MVT::i64) {
      if (Signed)
@@ -1274,7 +1297,7 @@ bool ARM64FastISel::FinishCall(MVT RetVT, SmallVectorImpl<unsigned> &UsedRegs,
  }
  
  bool ARM64FastISel::SelectCall(const Instruction *I,
-                               const char *IntrMemName = 0) {
+                               const char *IntrMemName = nullptr) {
    const CallInst *CI = cast<CallInst>(I);
    const Value *Callee = CI->getCalledValue();
  
@@ -1570,7 +1593,14 @@ bool ARM64FastISel::SelectRet(const Instruction *I) {
      EVT RVEVT = TLI.getValueType(RV->getType());
      if (!RVEVT.isSimple())
        return false;
+
+    // Vectors (of > 1 lane) in big endian need tricky handling.
+    if (RVEVT.isVector() && RVEVT.getVectorNumElements() > 1)
+      return false;
+
      MVT RVVT = RVEVT.getSimpleVT();
+    if (RVVT == MVT::f128)
+      return false;
      MVT DestVT = VA.getValVT();
      // Special handling for extended integers.
      if (RVVT != DestVT) {
@@ -1649,8 +1679,9 @@ bool ARM64FastISel::SelectTrunc(const Instruction *I) {
      // Issue an extract_subreg to get the lower 32-bits.
      unsigned Reg32 = FastEmitInst_extractsubreg(MVT::i32, SrcReg, /*Kill=*/true,
                                                  ARM64::sub_32);
+    MRI.constrainRegClass(Reg32, &ARM64::GPR32RegClass);
      // Create the AND instruction which performs the actual truncation.
-    unsigned ANDReg = createResultReg(&ARM64::GPR32RegClass);
+    unsigned ANDReg = createResultReg(&ARM64::GPR32spRegClass);
      BuildMI(*FuncInfo.MBB, FuncInfo.InsertPt, DbgLoc, TII.get(ARM64::ANDWri),
              ANDReg)
          .addReg(Reg32)
@@ -1671,7 +1702,8 @@ unsigned ARM64FastISel::Emiti1Ext(unsigned SrcReg, MVT DestVT, bool isZExt) {
      DestVT = MVT::i32;
  
    if (isZExt) {
-    unsigned ResultReg = createResultReg(&ARM64::GPR32RegClass);
+    MRI.constrainRegClass(SrcReg, &ARM64::GPR32RegClass);
+    unsigned ResultReg = createResultReg(&ARM64::GPR32spRegClass);
      BuildMI(*FuncInfo.MBB, FuncInfo.InsertPt, DbgLoc, TII.get(ARM64::ANDWri),
              ResultReg)
          .addReg(SrcReg)
@@ -1739,6 +1771,15 @@ unsigned ARM64FastISel::EmitIntExt(MVT SrcVT, unsigned SrcReg, MVT DestVT,
    // Handle i8 and i16 as i32.
    if (DestVT == MVT::i8 || DestVT == MVT::i16)
      DestVT = MVT::i32;
+  else if (DestVT == MVT::i64) {
+    unsigned Src64 = MRI.createVirtualRegister(&ARM64::GPR64RegClass);
+    BuildMI(*FuncInfo.MBB, FuncInfo.InsertPt, DbgLoc,
+            TII.get(ARM64::SUBREG_TO_REG), Src64)
+        .addImm(0)
+        .addReg(SrcReg)
+        .addImm(ARM64::sub_32);
+    SrcReg = Src64;
+  }
  
    unsigned ResultReg = createResultReg(TLI.getRegClassFor(DestVT));
    BuildMI(*FuncInfo.MBB, FuncInfo.InsertPt, DbgLoc, TII.get(Opc), ResultReg)
@@ -1812,7 +1853,7 @@ bool ARM64FastISel::SelectRem(const Instruction *I, unsigned ISDOpcode) {
    BuildMI(*FuncInfo.MBB, FuncInfo.InsertPt, DbgLoc, TII.get(DivOpc), ResultReg)
        .addReg(Src0Reg)
        .addReg(Src1Reg);
-  // The remainder is computed as numerator – (quotient * denominator) using the
+  // The remainder is computed as numerator - (quotient * denominator) using the
    // MSUB instruction.
    BuildMI(*FuncInfo.MBB, FuncInfo.InsertPt, DbgLoc, TII.get(MSubOpc), ResultReg)
        .addReg(ResultReg)