ARM parsing for VLD1 two register all lanes, no writeback.

[oota-llvm.git] / lib / Target / ARM / AsmParser / ARMAsmParser.cpp
diff --git a/lib/Target/ARM/AsmParser/ARMAsmParser.cpp b/lib/Target/ARM/AsmParser/ARMAsmParser.cpp

index 10d7bf286b0acb4a52cbbdc90214b2fb329e2d21..c24335ca353c26a8bd24a10acdfdf80e492d9413 100644 (file)
--- a/lib/Target/ARM/AsmParser/ARMAsmParser.cpp
+++ b/lib/Target/ARM/AsmParser/ARMAsmParser.cpp
@@ -39,6 +39,8 @@ namespace {
  
  class ARMOperand;
  
+enum VectorLaneTy { NoLanes, AllLanes };
+
  class ARMAsmParser : public MCTargetAsmParser {
    MCSubtargetInfo &STI;
    MCAsmParser &Parser;
@@ -161,6 +163,7 @@ class ARMAsmParser : public MCTargetAsmParser {
    OperandMatchResultTy parseAM3Offset(SmallVectorImpl<MCParsedAsmOperand*>&);
    OperandMatchResultTy parseFPImm(SmallVectorImpl<MCParsedAsmOperand*>&);
    OperandMatchResultTy parseVectorList(SmallVectorImpl<MCParsedAsmOperand*>&);
+  OperandMatchResultTy parseVectorLane(VectorLaneTy &LaneKind);
  
    // Asm Match Converter Methods
    bool cvtT2LdrdPre(MCInst &Inst, unsigned Opcode,
@@ -271,6 +274,7 @@ class ARMOperand : public MCParsedAsmOperand {
      k_DPRRegisterList,
      k_SPRRegisterList,
      k_VectorList,
+    k_VectorListAllLanes,
      k_ShiftedRegister,
      k_ShiftedImmediate,
      k_ShifterImmediate,
@@ -409,6 +413,7 @@ public:
        Registers = o.Registers;
        break;
      case k_VectorList:
+    case k_VectorListAllLanes:
        VectorList = o.VectorList;
        break;
      case k_CoprocNum:
@@ -714,7 +719,7 @@ public:
    bool isBitfield() const { return Kind == k_BitfieldDescriptor; }
    bool isPostIdxRegShifted() const { return Kind == k_PostIndexRegister; }
    bool isPostIdxReg() const {
-    return Kind == k_PostIndexRegister && PostIdxReg.ShiftTy == ARM_AM::no_shift;
+    return Kind == k_PostIndexRegister && PostIdxReg.ShiftTy ==ARM_AM::no_shift;
    }
    bool isMemNoOffset(bool alignOK = false) const {
      if (!isMemory())
@@ -967,6 +972,16 @@ public:
      return VectorList.Count == 2 && false;
    }
  
+  bool isVecListOneDAllLanes() const {
+    if (Kind != k_VectorListAllLanes) return false;
+    return VectorList.Count == 1;
+  }
+
+  bool isVecListTwoDAllLanes() const {
+    if (Kind != k_VectorListAllLanes) return false;
+    return VectorList.Count == 2;
+  }
+
    bool isVectorIndex8() const {
      if (Kind != k_VectorIndex) return false;
      return VectorIndex.Val < 8;
@@ -1101,7 +1116,8 @@ public:
  
    void addRegShiftedRegOperands(MCInst &Inst, unsigned N) const {
      assert(N == 3 && "Invalid number of operands!");
-    assert(isRegShiftedReg() && "addRegShiftedRegOperands() on non RegShiftedReg!");
+    assert(isRegShiftedReg() &&
+           "addRegShiftedRegOperands() on non RegShiftedReg!");
      Inst.addOperand(MCOperand::CreateReg(RegShiftedReg.SrcReg));
      Inst.addOperand(MCOperand::CreateReg(RegShiftedReg.ShiftReg));
      Inst.addOperand(MCOperand::CreateImm(
@@ -1110,7 +1126,8 @@ public:
  
    void addRegShiftedImmOperands(MCInst &Inst, unsigned N) const {
      assert(N == 2 && "Invalid number of operands!");
-    assert(isRegShiftedImm() && "addRegShiftedImmOperands() on non RegShiftedImm!");
+    assert(isRegShiftedImm() &&
+           "addRegShiftedImmOperands() on non RegShiftedImm!");
      Inst.addOperand(MCOperand::CreateReg(RegShiftedImm.SrcReg));
      Inst.addOperand(MCOperand::CreateImm(
        ARM_AM::getSORegOpc(RegShiftedImm.ShiftTy, RegShiftedImm.ShiftImm)));
@@ -1189,26 +1206,6 @@ public:
      Inst.addOperand(MCOperand::CreateImm(CE->getValue() / 4));
    }
  
-  void addImm0_255Operands(MCInst &Inst, unsigned N) const {
-    assert(N == 1 && "Invalid number of operands!");
-    addExpr(Inst, getImm());
-  }
-
-  void addImm0_7Operands(MCInst &Inst, unsigned N) const {
-    assert(N == 1 && "Invalid number of operands!");
-    addExpr(Inst, getImm());
-  }
-
-  void addImm0_15Operands(MCInst &Inst, unsigned N) const {
-    assert(N == 1 && "Invalid number of operands!");
-    addExpr(Inst, getImm());
-  }
-
-  void addImm0_31Operands(MCInst &Inst, unsigned N) const {
-    assert(N == 1 && "Invalid number of operands!");
-    addExpr(Inst, getImm());
-  }
-
    void addImm1_16Operands(MCInst &Inst, unsigned N) const {
      assert(N == 1 && "Invalid number of operands!");
      // The constant encodes as the immediate-1, and we store in the instruction
@@ -1225,26 +1222,6 @@ public:
      Inst.addOperand(MCOperand::CreateImm(CE->getValue() - 1));
    }
  
-  void addImm0_32Operands(MCInst &Inst, unsigned N) const {
-    assert(N == 1 && "Invalid number of operands!");
-    addExpr(Inst, getImm());
-  }
-
-  void addImm0_65535Operands(MCInst &Inst, unsigned N) const {
-    assert(N == 1 && "Invalid number of operands!");
-    addExpr(Inst, getImm());
-  }
-
-  void addImm0_65535ExprOperands(MCInst &Inst, unsigned N) const {
-    assert(N == 1 && "Invalid number of operands!");
-    addExpr(Inst, getImm());
-  }
-
-  void addImm24bitOperands(MCInst &Inst, unsigned N) const {
-    assert(N == 1 && "Invalid number of operands!");
-    addExpr(Inst, getImm());
-  }
-
    void addImmThumbSROperands(MCInst &Inst, unsigned N) const {
      assert(N == 1 && "Invalid number of operands!");
      // The constant encodes as the immediate, except for 32, which encodes as
@@ -1254,11 +1231,6 @@ public:
      Inst.addOperand(MCOperand::CreateImm((Imm == 32 ? 0 : Imm)));
    }
  
-  void addPKHLSLImmOperands(MCInst &Inst, unsigned N) const {
-    assert(N == 1 && "Invalid number of operands!");
-    addExpr(Inst, getImm());
-  }
-
    void addPKHASRImmOperands(MCInst &Inst, unsigned N) const {
      assert(N == 1 && "Invalid number of operands!");
      // An ASR value of 32 encodes as 0, so that's how we want to add it to
@@ -1268,16 +1240,6 @@ public:
      Inst.addOperand(MCOperand::CreateImm(Val == 32 ? 0 : Val));
    }
  
-  void addARMSOImmOperands(MCInst &Inst, unsigned N) const {
-    assert(N == 1 && "Invalid number of operands!");
-    addExpr(Inst, getImm());
-  }
-
-  void addT2SOImmOperands(MCInst &Inst, unsigned N) const {
-    assert(N == 1 && "Invalid number of operands!");
-    addExpr(Inst, getImm());
-  }
-
    void addT2SOImmNotOperands(MCInst &Inst, unsigned N) const {
      assert(N == 1 && "Invalid number of operands!");
      // The operand is actually a t2_so_imm, but we have its bitwise
@@ -1294,11 +1256,6 @@ public:
      Inst.addOperand(MCOperand::CreateImm(~CE->getValue()));
    }
  
-  void addSetEndImmOperands(MCInst &Inst, unsigned N) const {
-    assert(N == 1 && "Invalid number of operands!");
-    addExpr(Inst, getImm());
-  }
-
    void addMemBarrierOptOperands(MCInst &Inst, unsigned N) const {
      assert(N == 1 && "Invalid number of operands!");
      Inst.addOperand(MCOperand::CreateImm(unsigned(getMemBarrierOpt())));
@@ -1486,8 +1443,9 @@ public:
  
    void addMemRegOffsetOperands(MCInst &Inst, unsigned N) const {
      assert(N == 3 && "Invalid number of operands!");
-    unsigned Val = ARM_AM::getAM2Opc(Memory.isNegative ? ARM_AM::sub : ARM_AM::add,
-                                     Memory.ShiftImm, Memory.ShiftType);
+    unsigned Val =
+      ARM_AM::getAM2Opc(Memory.isNegative ? ARM_AM::sub : ARM_AM::add,
+                        Memory.ShiftImm, Memory.ShiftType);
      Inst.addOperand(MCOperand::CreateReg(Memory.BaseRegNum));
      Inst.addOperand(MCOperand::CreateReg(Memory.OffsetRegNum));
      Inst.addOperand(MCOperand::CreateImm(Val));
@@ -1584,36 +1542,8 @@ public:
      Inst.addOperand(MCOperand::CreateImm(unsigned(getProcIFlags())));
    }
  
-  void addVecListOneDOperands(MCInst &Inst, unsigned N) const {
-    assert(N == 1 && "Invalid number of operands!");
-    Inst.addOperand(MCOperand::CreateReg(VectorList.RegNum));
-  }
-
-  void addVecListTwoDOperands(MCInst &Inst, unsigned N) const {
-    assert(N == 1 && "Invalid number of operands!");
-    // Only the first register actually goes on the instruction. The rest
-    // are implied by the opcode.
-    Inst.addOperand(MCOperand::CreateReg(VectorList.RegNum));
-  }
-
-  void addVecListThreeDOperands(MCInst &Inst, unsigned N) const {
-    assert(N == 1 && "Invalid number of operands!");
-    // Only the first register actually goes on the instruction. The rest
-    // are implied by the opcode.
-    Inst.addOperand(MCOperand::CreateReg(VectorList.RegNum));
-  }
-
-  void addVecListFourDOperands(MCInst &Inst, unsigned N) const {
-    assert(N == 1 && "Invalid number of operands!");
-    // Only the first register actually goes on the instruction. The rest
-    // are implied by the opcode.
-    Inst.addOperand(MCOperand::CreateReg(VectorList.RegNum));
-  }
-
-  void addVecListTwoQOperands(MCInst &Inst, unsigned N) const {
+  void addVecListOperands(MCInst &Inst, unsigned N) const {
      assert(N == 1 && "Invalid number of operands!");
-    // Only the first register actually goes on the instruction. The rest
-    // are implied by the opcode.
      Inst.addOperand(MCOperand::CreateReg(VectorList.RegNum));
    }
  
@@ -1846,6 +1776,16 @@ public:
      return Op;
    }
  
+  static ARMOperand *CreateVectorListAllLanes(unsigned RegNum, unsigned Count,
+                                              SMLoc S, SMLoc E) {
+    ARMOperand *Op = new ARMOperand(k_VectorListAllLanes);
+    Op->VectorList.RegNum = RegNum;
+    Op->VectorList.Count = Count;
+    Op->StartLoc = S;
+    Op->EndLoc = E;
+    return Op;
+  }
+
    static ARMOperand *CreateVectorIndex(unsigned Idx, SMLoc S, SMLoc E,
                                         MCContext &Ctx) {
      ARMOperand *Op = new ARMOperand(k_VectorIndex);
@@ -2003,18 +1943,15 @@ void ARMOperand::print(raw_ostream &OS) const {
      break;
    case k_ShiftedRegister:
      OS << "<so_reg_reg "
-       << RegShiftedReg.SrcReg
-       << ARM_AM::getShiftOpcStr(ARM_AM::getSORegShOp(RegShiftedReg.ShiftImm))
-       << ", " << RegShiftedReg.ShiftReg << ", "
-       << ARM_AM::getSORegOffset(RegShiftedReg.ShiftImm)
-       << ">";
+       << RegShiftedReg.SrcReg << " "
+       << ARM_AM::getShiftOpcStr(RegShiftedReg.ShiftTy)
+       << " " << RegShiftedReg.ShiftReg << ">";
      break;
    case k_ShiftedImmediate:
      OS << "<so_reg_imm "
-       << RegShiftedImm.SrcReg
-       << ARM_AM::getShiftOpcStr(ARM_AM::getSORegShOp(RegShiftedImm.ShiftImm))
-       << ", " << ARM_AM::getSORegOffset(RegShiftedImm.ShiftImm)
-       << ">";
+       << RegShiftedImm.SrcReg << " "
+       << ARM_AM::getShiftOpcStr(RegShiftedImm.ShiftTy)
+       << " #" << RegShiftedImm.ShiftImm << ">";
      break;
    case k_RotateImmediate:
      OS << "<ror " << " #" << (RotImm.Imm * 8) << ">";
@@ -2042,6 +1979,10 @@ void ARMOperand::print(raw_ostream &OS) const {
      OS << "<vector_list " << VectorList.Count << " * "
         << VectorList.RegNum << ">";
      break;
+  case k_VectorListAllLanes:
+    OS << "<vector_list(all lanes) " << VectorList.Count << " * "
+       << VectorList.RegNum << ">";
+    break;
    case k_Token:
      OS << "'" << getToken() << "'";
      break;
@@ -2423,7 +2364,7 @@ static unsigned getDRegFromQReg(unsigned QReg) {
    case ARM::Q6:  return ARM::D12;
    case ARM::Q7:  return ARM::D14;
    case ARM::Q8:  return ARM::D16;
-  case ARM::Q9:  return ARM::D19;
+  case ARM::Q9:  return ARM::D18;
    case ARM::Q10: return ARM::D20;
    case ARM::Q11: return ARM::D22;
    case ARM::Q12: return ARM::D24;
@@ -2477,7 +2418,7 @@ parseRegisterList(SmallVectorImpl<MCParsedAsmOperand*> &Operands) {
    while (Parser.getTok().is(AsmToken::Comma) ||
           Parser.getTok().is(AsmToken::Minus)) {
      if (Parser.getTok().is(AsmToken::Minus)) {
-      Parser.Lex(); // Eat the comma.
+      Parser.Lex(); // Eat the minus.
        SMLoc EndLoc = Parser.getTok().getLoc();
        int EndReg = tryParseRegister();
        if (EndReg == -1)
@@ -2541,13 +2482,82 @@ parseRegisterList(SmallVectorImpl<MCParsedAsmOperand*> &Operands) {
    return false;
  }
  
+// Helper function to parse the lane index for vector lists.
+ARMAsmParser::OperandMatchResultTy ARMAsmParser::
+parseVectorLane(VectorLaneTy &LaneKind) {
+  if (Parser.getTok().is(AsmToken::LBrac)) {
+    Parser.Lex(); // Eat the '['.
+    if (Parser.getTok().is(AsmToken::RBrac)) {
+      // "Dn[]" is the 'all lanes' syntax.
+      LaneKind = AllLanes;
+      Parser.Lex(); // Eat the ']'.
+      return MatchOperand_Success;
+    }
+    // FIXME: Other lane kinds as we add them.
+    Error(Parser.getTok().getLoc(), "FIXME: Unexpected lane kind.");
+    return MatchOperand_ParseFail;
+  }
+  LaneKind = NoLanes;
+  return MatchOperand_Success;
+}
+
  // parse a vector register list
  ARMAsmParser::OperandMatchResultTy ARMAsmParser::
  parseVectorList(SmallVectorImpl<MCParsedAsmOperand*> &Operands) {
-  if(Parser.getTok().isNot(AsmToken::LCurly))
+  VectorLaneTy LaneKind;
+  SMLoc S = Parser.getTok().getLoc();
+  // As an extension (to match gas), support a plain D register or Q register
+  // (without encosing curly braces) as a single or double entry list,
+  // respectively.
+  if (Parser.getTok().is(AsmToken::Identifier)) {
+    int Reg = tryParseRegister();
+    if (Reg == -1)
+      return MatchOperand_NoMatch;
+    SMLoc E = Parser.getTok().getLoc();
+    if (ARMMCRegisterClasses[ARM::DPRRegClassID].contains(Reg)) {
+      OperandMatchResultTy Res = parseVectorLane(LaneKind);
+      if (Res != MatchOperand_Success)
+        return Res;
+      switch (LaneKind) {
+      default:
+        assert(0 && "unexpected lane kind!");
+      case NoLanes:
+        E = Parser.getTok().getLoc();
+        Operands.push_back(ARMOperand::CreateVectorList(Reg, 1, S, E));
+        break;
+      case AllLanes:
+        E = Parser.getTok().getLoc();
+        Operands.push_back(ARMOperand::CreateVectorListAllLanes(Reg, 1, S, E));
+        break;
+      }
+      return MatchOperand_Success;
+    }
+    if (ARMMCRegisterClasses[ARM::QPRRegClassID].contains(Reg)) {
+      Reg = getDRegFromQReg(Reg);
+      OperandMatchResultTy Res = parseVectorLane(LaneKind);
+      if (Res != MatchOperand_Success)
+        return Res;
+      switch (LaneKind) {
+      default:
+        assert(0 && "unexpected lane kind!");
+      case NoLanes:
+        E = Parser.getTok().getLoc();
+        Operands.push_back(ARMOperand::CreateVectorList(Reg, 2, S, E));
+        break;
+      case AllLanes:
+        E = Parser.getTok().getLoc();
+        Operands.push_back(ARMOperand::CreateVectorListAllLanes(Reg, 2, S, E));
+        break;
+      }
+      return MatchOperand_Success;
+    }
+    Error(S, "vector register expected");
+    return MatchOperand_ParseFail;
+  }
+
+  if (Parser.getTok().isNot(AsmToken::LCurly))
      return MatchOperand_NoMatch;
  
-  SMLoc S = Parser.getTok().getLoc();
    Parser.Lex(); // Eat '{' token.
    SMLoc RegLoc = Parser.getTok().getLoc();
  
@@ -2565,8 +2575,51 @@ parseVectorList(SmallVectorImpl<MCParsedAsmOperand*> &Operands) {
      ++Reg;
      ++Count;
    }
+  if (parseVectorLane(LaneKind) != MatchOperand_Success)
+    return MatchOperand_ParseFail;
  
-  while (Parser.getTok().is(AsmToken::Comma)) {
+  while (Parser.getTok().is(AsmToken::Comma) ||
+         Parser.getTok().is(AsmToken::Minus)) {
+    if (Parser.getTok().is(AsmToken::Minus)) {
+      Parser.Lex(); // Eat the minus.
+      SMLoc EndLoc = Parser.getTok().getLoc();
+      int EndReg = tryParseRegister();
+      if (EndReg == -1) {
+        Error(EndLoc, "register expected");
+        return MatchOperand_ParseFail;
+      }
+      // Allow Q regs and just interpret them as the two D sub-registers.
+      if (ARMMCRegisterClasses[ARM::QPRRegClassID].contains(EndReg))
+        EndReg = getDRegFromQReg(EndReg) + 1;
+      // If the register is the same as the start reg, there's nothing
+      // more to do.
+      if (Reg == EndReg)
+        continue;
+      // The register must be in the same register class as the first.
+      if (!ARMMCRegisterClasses[ARM::DPRRegClassID].contains(EndReg)) {
+        Error(EndLoc, "invalid register in register list");
+        return MatchOperand_ParseFail;
+      }
+      // Ranges must go from low to high.
+      if (Reg > EndReg) {
+        Error(EndLoc, "bad range in register list");
+        return MatchOperand_ParseFail;
+      }
+      // Parse the lane specifier if present.
+      VectorLaneTy NextLaneKind;
+      if (parseVectorLane(NextLaneKind) != MatchOperand_Success)
+        return MatchOperand_ParseFail;
+      if (NextLaneKind != LaneKind) {
+        Error(EndLoc, "mismatched lane index in register list");
+        return MatchOperand_ParseFail;
+      }
+      EndLoc = Parser.getTok().getLoc();
+
+      // Add all the registers in the range to the register list.
+      Count += EndReg - Reg;
+      Reg = EndReg;
+      continue;
+    }
      Parser.Lex(); // Eat the comma.
      RegLoc = Parser.getTok().getLoc();
      int OldReg = Reg;
@@ -2589,6 +2642,15 @@ parseVectorList(SmallVectorImpl<MCParsedAsmOperand*> &Operands) {
        }
        ++Reg;
        Count += 2;
+      // Parse the lane specifier if present.
+      VectorLaneTy NextLaneKind;
+      SMLoc EndLoc = Parser.getTok().getLoc();
+      if (parseVectorLane(NextLaneKind) != MatchOperand_Success)
+        return MatchOperand_ParseFail;
+      if (NextLaneKind != LaneKind) {
+        Error(EndLoc, "mismatched lane index in register list");
+        return MatchOperand_ParseFail;
+      }
        continue;
      }
      // Normal D register. Just check that it's contiguous and keep going.
@@ -2597,6 +2659,15 @@ parseVectorList(SmallVectorImpl<MCParsedAsmOperand*> &Operands) {
        return MatchOperand_ParseFail;
      }
      ++Count;
+    // Parse the lane specifier if present.
+    VectorLaneTy NextLaneKind;
+    SMLoc EndLoc = Parser.getTok().getLoc();
+    if (parseVectorLane(NextLaneKind) != MatchOperand_Success)
+      return MatchOperand_ParseFail;
+    if (NextLaneKind != LaneKind) {
+      Error(EndLoc, "mismatched lane index in register list");
+      return MatchOperand_ParseFail;
+    }
    }
  
    SMLoc E = Parser.getTok().getLoc();
@@ -2606,7 +2677,17 @@ parseVectorList(SmallVectorImpl<MCParsedAsmOperand*> &Operands) {
    }
    Parser.Lex(); // Eat '}' token.
  
-  Operands.push_back(ARMOperand::CreateVectorList(FirstReg, Count, S, E));
+  switch (LaneKind) {
+  default:
+    assert(0 && "unexpected lane kind in register list.");
+  case NoLanes:
+    Operands.push_back(ARMOperand::CreateVectorList(FirstReg, Count, S, E));
+    break;
+  case AllLanes:
+    Operands.push_back(ARMOperand::CreateVectorListAllLanes(FirstReg, Count,
+                                                            S, E));
+    break;
+  }
    return MatchOperand_Success;
  }
  
@@ -3451,7 +3532,7 @@ bool ARMAsmParser::
  cvtVLDwbFixed(MCInst &Inst, unsigned Opcode,
                const SmallVectorImpl<MCParsedAsmOperand*> &Operands) {
    // Vd
-  ((ARMOperand*)Operands[3])->addVecListTwoDOperands(Inst, 1);
+  ((ARMOperand*)Operands[3])->addVecListOperands(Inst, 1);
    // Create a writeback register dummy placeholder.
    Inst.addOperand(MCOperand::CreateImm(0));
    // Vn
@@ -3465,7 +3546,7 @@ bool ARMAsmParser::
  cvtVLDwbRegister(MCInst &Inst, unsigned Opcode,
                   const SmallVectorImpl<MCParsedAsmOperand*> &Operands) {
    // Vd
-  ((ARMOperand*)Operands[3])->addVecListTwoDOperands(Inst, 1);
+  ((ARMOperand*)Operands[3])->addVecListOperands(Inst, 1);
    // Create a writeback register dummy placeholder.
    Inst.addOperand(MCOperand::CreateImm(0));
    // Vn
@@ -3485,7 +3566,7 @@ cvtVSTwbFixed(MCInst &Inst, unsigned Opcode,
    // Vn
    ((ARMOperand*)Operands[4])->addAlignedMemoryOperands(Inst, 2);
    // Vt
-  ((ARMOperand*)Operands[3])->addVecListTwoDOperands(Inst, 1);
+  ((ARMOperand*)Operands[3])->addVecListOperands(Inst, 1);
    // pred
    ((ARMOperand*)Operands[1])->addCondCodeOperands(Inst, 2);
    return true;
@@ -3501,7 +3582,7 @@ cvtVSTwbRegister(MCInst &Inst, unsigned Opcode,
    // Vm
    ((ARMOperand*)Operands[5])->addRegOperands(Inst, 1);
    // Vt
-  ((ARMOperand*)Operands[3])->addVecListTwoDOperands(Inst, 1);
+  ((ARMOperand*)Operands[3])->addVecListOperands(Inst, 1);
    // pred
    ((ARMOperand*)Operands[1])->addCondCodeOperands(Inst, 2);
    return true;
@@ -3595,9 +3676,12 @@ parseMemory(SmallVectorImpl<MCParsedAsmOperand*> &Operands) {
    }
  
    // If we have a '#', it's an immediate offset, else assume it's a register
-  // offset.
-  if (Parser.getTok().is(AsmToken::Hash)) {
-    Parser.Lex(); // Eat the '#'.
+  // offset. Be friendly and also accept a plain integer (without a leading
+  // hash) for gas compatibility.
+  if (Parser.getTok().is(AsmToken::Hash) ||
+      Parser.getTok().is(AsmToken::Integer)) {
+    if (Parser.getTok().is(AsmToken::Hash))
+      Parser.Lex(); // Eat the '#'.
      E = Parser.getTok().getLoc();
  
      bool isNegative = getParser().getTok().is(AsmToken::Minus);
@@ -4155,6 +4239,7 @@ bool ARMAsmParser::shouldOmitCCOutOperand(StringRef Mnemonic,
        // remove the cc_out operand.
        (!isARMLowRegister(static_cast<ARMOperand*>(Operands[3])->getReg()) ||
         !isARMLowRegister(static_cast<ARMOperand*>(Operands[4])->getReg()) ||
+       !isARMLowRegister(static_cast<ARMOperand*>(Operands[5])->getReg()) ||
         !inITBlock() ||
         (static_cast<ARMOperand*>(Operands[3])->getReg() !=
          static_cast<ARMOperand*>(Operands[5])->getReg() &&
@@ -4162,6 +4247,20 @@ bool ARMAsmParser::shouldOmitCCOutOperand(StringRef Mnemonic,
          static_cast<ARMOperand*>(Operands[4])->getReg())))
      return true;
  
+  // Also check the 'mul' syntax variant that doesn't specify an explicit
+  // destination register.
+  if (isThumbTwo() && Mnemonic == "mul" && Operands.size() == 5 &&
+      static_cast<ARMOperand*>(Operands[1])->getReg() == 0 &&
+      static_cast<ARMOperand*>(Operands[3])->isReg() &&
+      static_cast<ARMOperand*>(Operands[4])->isReg() &&
+      // If the registers aren't low regs  or the cc_out operand is zero
+      // outside of an IT block, we have to use the 32-bit encoding, so
+      // remove the cc_out operand.
+      (!isARMLowRegister(static_cast<ARMOperand*>(Operands[3])->getReg()) ||
+       !isARMLowRegister(static_cast<ARMOperand*>(Operands[4])->getReg()) ||
+       !inITBlock()))
+    return true;
+
  
  
    // Register-register 'add/sub' for thumb does not have a cc_out operand
@@ -4179,6 +4278,22 @@ bool ARMAsmParser::shouldOmitCCOutOperand(StringRef Mnemonic,
    return false;
  }
  
+static bool isDataTypeToken(StringRef Tok) {
+  return Tok == ".8" || Tok == ".16" || Tok == ".32" || Tok == ".64" ||
+    Tok == ".i8" || Tok == ".i16" || Tok == ".i32" || Tok == ".i64" ||
+    Tok == ".u8" || Tok == ".u16" || Tok == ".u32" || Tok == ".u64" ||
+    Tok == ".s8" || Tok == ".s16" || Tok == ".s32" || Tok == ".s64" ||
+    Tok == ".p8" || Tok == ".p16" || Tok == ".f32" || Tok == ".f64" ||
+    Tok == ".f" || Tok == ".d";
+}
+
+// FIXME: This bit should probably be handled via an explicit match class
+// in the .td files that matches the suffix instead of having it be
+// a literal string token the way it is now.
+static bool doesIgnoreDataTypeSuffix(StringRef Mnemonic, StringRef DT) {
+  return Mnemonic.startswith("vldm") || Mnemonic.startswith("vstm");
+}
+
  /// Parse an arm instruction mnemonic followed by its operands.
  bool ARMAsmParser::ParseInstruction(StringRef Name, SMLoc NameLoc,
                                 SmallVectorImpl<MCParsedAsmOperand*> &Operands) {
@@ -4283,9 +4398,12 @@ bool ARMAsmParser::ParseInstruction(StringRef Name, SMLoc NameLoc,
      Next = Name.find('.', Start + 1);
      StringRef ExtraToken = Name.slice(Start, Next);
  
-    // For now, we're only parsing Thumb1 (for the most part), so
-    // just ignore ".n" qualifiers. We'll use them to restrict
-    // matching when we do Thumb2.
+    // Some NEON instructions have an optional datatype suffix that is
+    // completely ignored. Check for that.
+    if (isDataTypeToken(ExtraToken) &&
+        doesIgnoreDataTypeSuffix(Mnemonic, ExtraToken))
+      continue;
+
      if (ExtraToken != ".n") {
        SMLoc Loc = SMLoc::getFromPointer(NameLoc.getPointer() + Start);
        Operands.push_back(ARMOperand::CreateToken(ExtraToken, Loc));
@@ -4580,12 +4698,37 @@ processInstruction(MCInst &Inst,
                     const SmallVectorImpl<MCParsedAsmOperand*> &Operands) {
    switch (Inst.getOpcode()) {
    // Handle the MOV complex aliases.
+  case ARM::ASRr:
+  case ARM::LSRr:
+  case ARM::LSLr:
+  case ARM::RORr: {
+    ARM_AM::ShiftOpc ShiftTy;
+    switch(Inst.getOpcode()) {
+    default: llvm_unreachable("unexpected opcode!");
+    case ARM::ASRr: ShiftTy = ARM_AM::asr; break;
+    case ARM::LSRr: ShiftTy = ARM_AM::lsr; break;
+    case ARM::LSLr: ShiftTy = ARM_AM::lsl; break;
+    case ARM::RORr: ShiftTy = ARM_AM::ror; break;
+    }
+    // A shift by zero is a plain MOVr, not a MOVsi.
+    unsigned Shifter = ARM_AM::getSORegOpc(ShiftTy, 0);
+    MCInst TmpInst;
+    TmpInst.setOpcode(ARM::MOVsr);
+    TmpInst.addOperand(Inst.getOperand(0)); // Rd
+    TmpInst.addOperand(Inst.getOperand(1)); // Rn
+    TmpInst.addOperand(Inst.getOperand(2)); // Rm
+    TmpInst.addOperand(MCOperand::CreateImm(Shifter)); // Shift value and ty
+    TmpInst.addOperand(Inst.getOperand(3)); // CondCode
+    TmpInst.addOperand(Inst.getOperand(4));
+    TmpInst.addOperand(Inst.getOperand(5)); // cc_out
+    Inst = TmpInst;
+    return true;
+  }
    case ARM::ASRi:
    case ARM::LSRi:
    case ARM::LSLi:
    case ARM::RORi: {
      ARM_AM::ShiftOpc ShiftTy;
-    unsigned Amt = Inst.getOperand(2).getImm();
      switch(Inst.getOpcode()) {
      default: llvm_unreachable("unexpected opcode!");
      case ARM::ASRi: ShiftTy = ARM_AM::asr; break;
@@ -4594,6 +4737,7 @@ processInstruction(MCInst &Inst,
      case ARM::RORi: ShiftTy = ARM_AM::ror; break;
      }
      // A shift by zero is a plain MOVr, not a MOVsi.
+    unsigned Amt = Inst.getOperand(2).getImm();
      unsigned Opc = Amt == 0 ? ARM::MOVr : ARM::MOVsi;
      unsigned Shifter = ARM_AM::getSORegOpc(ShiftTy, Amt);
      MCInst TmpInst;
@@ -4608,6 +4752,19 @@ processInstruction(MCInst &Inst,
      Inst = TmpInst;
      return true;
    }
+  case ARM::RRXi: {
+    unsigned Shifter = ARM_AM::getSORegOpc(ARM_AM::rrx, 0);
+    MCInst TmpInst;
+    TmpInst.setOpcode(ARM::MOVsi);
+    TmpInst.addOperand(Inst.getOperand(0)); // Rd
+    TmpInst.addOperand(Inst.getOperand(1)); // Rn
+    TmpInst.addOperand(MCOperand::CreateImm(Shifter)); // Shift value and ty
+    TmpInst.addOperand(Inst.getOperand(2)); // CondCode
+    TmpInst.addOperand(Inst.getOperand(3));
+    TmpInst.addOperand(Inst.getOperand(4)); // cc_out
+    Inst = TmpInst;
+    return true;
+  }
    case ARM::t2LDMIA_UPD: {
      // If this is a load of a single register, then we should use
      // a post-indexed LDR instruction instead, per the ARM ARM.