Also need to handle invalid imod values for CPS2p.

[oota-llvm.git] / lib / Target / ARM / Disassembler / ARMDisassemblerCore.cpp
diff --git a/lib/Target/ARM/Disassembler/ARMDisassemblerCore.cpp b/lib/Target/ARM/Disassembler/ARMDisassemblerCore.cpp

index c38a606c0a9c8a5a0b9b9734acd7ceaee8f629a9..ff19a385cf439b3a934c22f03462b869b34970e1 100644 (file)
--- a/lib/Target/ARM/Disassembler/ARMDisassemblerCore.cpp
+++ b/lib/Target/ARM/Disassembler/ARMDisassemblerCore.cpp
@@ -1,4 +1,4 @@
-//===- ARMDisassemblerCore.cpp - ARM disassembler helpers ----*- C++ -*-===//
+//===- ARMDisassemblerCore.cpp - ARM disassembler helpers -------*- C++ -*-===//
  //
  //                     The LLVM Compiler Infrastructure
  //
@@ -8,14 +8,19 @@
  //===----------------------------------------------------------------------===//
  //
  // This file is part of the ARM Disassembler.
-// It contains code to represent the core concepts of Builder, Builder Factory,
-// as well as the Algorithm to solve the problem of disassembling an ARM instr.
+// It contains code to represent the core concepts of Builder and DisassembleFP
+// to solve the problem of disassembling an ARM instr.
  //
  //===----------------------------------------------------------------------===//
  
-#include "ARMAddressingModes.h"
+#define DEBUG_TYPE "arm-disassembler"
+
  #include "ARMDisassemblerCore.h"
-#include <map>
+#include "ARMAddressingModes.h"
+#include "llvm/Support/Debug.h"
+#include "llvm/Support/raw_ostream.h"
+
+//#define DEBUG(X) do { X; } while (0)
  
  /// ARMGenInstrInfo.inc - ARMGenInstrInfo.inc contains the static const
  /// TargetInstrDesc ARMInsts[] definition and the TargetOperandInfo[]'s
@@ -31,7 +36,7 @@
  /// Uses and Defs by this instr.  For the Uses part, the pred:$p operand is
  /// defined with two components:
  ///
-/// def pred { // Operand PredicateOperand
+/// def pred { // Operand PredicateOperand
  ///   ValueType Type = OtherVT;
  ///   string PrintMethod = "printPredicateOperand";
  ///   string AsmOperandLowerMethod = ?;
@@ -51,7 +56,7 @@
  ///
  /// For the Defs part, in the simple case of only cc_out:$s, we have:
  ///
-/// def cc_out {       // Operand OptionalDefOperand
+/// def cc_out { // Operand OptionalDefOperand
  ///   ValueType Type = OtherVT;
  ///   string PrintMethod = "printSBitModifierOperand";
  ///   string AsmOperandLowerMethod = ?;
@@ -73,21 +78,12 @@ const char *ARMUtils::OpcodeName(unsigned Opcode) {
    return ARMInsts[Opcode].Name;
  }
  
-// There is a more efficient way than the following.  It is fragile, though.
-// See the code snippet after this function.
-static unsigned getRegisterEnum(unsigned RegClassID, unsigned RawRegister,
-                                bool DRegPair = false) {
-
-  if (DRegPair && RegClassID == ARM::QPRRegClassID) {
-    // LLVM expects { Dd, Dd+1 } to form a super register; this is not specified
-    // in the ARM Architecture Manual as far as I understand it (A8.6.307).
-    // Therefore, we morph the RegClassID to be the sub register class and don't
-    // subsequently transform the RawRegister encoding when calculating RegNum.
-    //
-    // See also ARMinstPrinter::printOperand() wrt "dregpair" modifier part
-    // where this workaround is meant for.
-    RegClassID = ARM::DPRRegClassID;
-  }
+// Return the register enum Based on RegClass and the raw register number.
+// FIXME: Auto-gened?
+static unsigned
+getRegisterEnum(BO B, unsigned RegClassID, unsigned RawRegister) {
+  // For this purpose, we can treat rGPR as if it were GPR.
+  if (RegClassID == ARM::rGPRRegClassID) RegClassID = ARM::GPRRegClassID;
  
    // See also decodeNEONRd(), decodeNEONRn(), decodeNEONRm().
    unsigned RegNum =
@@ -345,41 +341,11 @@ static unsigned getRegisterEnum(unsigned RegClassID, unsigned RawRegister,
      }
      break;
    }
-  llvm_unreachable("Invalid (RegClassID, RawRegister) combination");
-}
-
-// This is efficient but fragile.
-/*
-// See ARMGenRegisterInfo.h.inc for more info.
-static const TargetRegisterClass* const ARMRegisterClasses[] = {
-  NULL,
-  &ARM::CCRRegClass,            // CCRRegClassID = 1,
-  &ARM::DPRRegClass,            // DPRRegClassID = 2,
-  &ARM::DPR_8RegClass,          // DPR_8RegClassID = 3,
-  &ARM::DPR_VFP2RegClass,       // DPR_VFP2RegClassID = 4,
-  &ARM::GPRRegClass,            // GPRRegClassID = 5,
-  &ARM::QPRRegClass,            // QPRRegClassID = 6,
-  &ARM::QPR_8RegClass,          // QPR_8RegClassID = 7,
-  &ARM::QPR_VFP2RegClass,       // QPR_VFP2RegClassID = 8,
-  &ARM::SPRRegClass,            // SPRRegClassID = 9,
-  &ARM::SPR_8RegClass,          // SPR_8RegClassID = 10,
-  &ARM::SPR_INVALIDRegClass,    // SPR_INVALIDRegClassID = 11,
-  &ARM::tGPRRegClass,           // tGPRRegClassID = 12
-};
-
-// Return the register enum given register class id and raw register value.
-static unsigned getRegisterEnum(unsigned RegClassID, unsigned RawRegister) {
-  assert(RegClassID < array_lengthof(ARMRegisterClasses) &&
-         "Register Class ID out of range");
-  return ARMRegisterClasses[RegClassID]->getRegister(RawRegister);
+  DEBUG(errs() << "Invalid (RegClassID, RawRegister) combination\n");
+  // Encoding error.  Mark the builder with error code != 0.
+  B->SetErr(-1);
+  return 0;
  }
-*/
-
-/// DisassembleFP - DisassembleFP points to a function that disassembles an insn
-/// and builds the MCOperand list upon disassembly.  It returns false on failure
-/// or true on success.  The number of operands added is updated upon success.
-typedef bool (*DisassembleFP)(MCInst &MI, unsigned Opcode, uint32_t insn,
-    unsigned short NumOps, unsigned &NumOpsAdded);
  
  ///////////////////////////////
  //                           //
@@ -451,25 +417,17 @@ static inline unsigned getMBit(uint32_t insn) {
    return (insn >> ARMII::M_BitShift) & 1;
  }
  
-namespace {
-// Sign extend 5 bit number x to r.
-// Usage: int r = signextend<signed int, 5>(x);
-template <typename T, unsigned B> inline T signextend(const T x) {
-  struct {T x:B;} s;
-  return s.x = x;
-}
-}
-
  // See A8.4 Shifts applied to a register.
  //     A8.4.2 Register controlled shifts.
  //
  // getShiftOpcForBits - getShiftOpcForBits translates from the ARM encoding bits
-// into llvm enums for shift opcode.
+// into llvm enums for shift opcode.  The API clients should pass in the value
+// encoded with two bits, so the assert stays to signal a wrong API usage.
  //
  // A8-12: DecodeRegShift()
  static inline ARM_AM::ShiftOpc getShiftOpcForBits(unsigned bits) {
    switch (bits) {
-  default: assert(0 && "No such value");
+  default: assert(0 && "No such value"); return ARM_AM::no_shift;
    case 0:  return ARM_AM::lsl;
    case 1:  return ARM_AM::lsr;
    case 2:  return ARM_AM::asr;
@@ -485,19 +443,32 @@ static inline ARM_AM::ShiftOpc getShiftOpcForBits(unsigned bits) {
  //
  // A8-11: DecodeImmShift()
  static inline void getImmShiftSE(ARM_AM::ShiftOpc &ShOp, unsigned &ShImm) {
-  // If type == 0b11 and imm5 == 0, we have an rrx, instead.
-  if (ShOp == ARM_AM::ror && ShImm == 0)
-    ShOp = ARM_AM::rrx;
-  // If (lsr or asr) and imm5 == 0, shift amount is 32.
-  if ((ShOp == ARM_AM::lsr || ShOp == ARM_AM::asr) && ShImm == 0)
+  if (ShImm != 0)
+    return;
+  switch (ShOp) {
+  case ARM_AM::no_shift:
+  case ARM_AM::rrx:
+    break;
+  case ARM_AM::lsl:
+    ShOp = ARM_AM::no_shift;
+    break;
+  case ARM_AM::lsr:
+  case ARM_AM::asr:
      ShImm = 32;
+    break;
+  case ARM_AM::ror:
+    ShOp = ARM_AM::rrx;
+    break;
+  }
  }
  
  // getAMSubModeForBits - getAMSubModeForBits translates from the ARM encoding
-// bits Inst{24-23} (P(24) and U(23)) into llvm enums for AMSubMode.
+// bits Inst{24-23} (P(24) and U(23)) into llvm enums for AMSubMode.  The API
+// clients should pass in the value encoded with two bits, so the assert stays
+// to signal a wrong API usage.
  static inline ARM_AM::AMSubMode getAMSubModeForBits(unsigned bits) {
    switch (bits) {
-  default: assert(0 && "No such value");
+  default: assert(0 && "No such value"); return ARM_AM::bad_am_submode;
    case 1:  return ARM_AM::ia;   // P=0 U=1
    case 3:  return ARM_AM::ib;   // P=1 U=1
    case 0:  return ARM_AM::da;   // P=0 U=0
@@ -516,14 +487,11 @@ static inline ARM_AM::AMSubMode getAMSubModeForBits(unsigned bits) {
  /// followed by possible src(s).
  ///
  /// The processing of the predicate, and the 'S' modifier bit, if MI modifies
-/// the CPSR, is factored into ARMBasicMCBuilder's class method named
+/// the CPSR, is factored into ARMBasicMCBuilder's method named
  /// TryPredicateAndSBitModifier.
  
  static bool DisassemblePseudo(MCInst &MI, unsigned Opcode, uint32_t insn,
-    unsigned short NumOps, unsigned &NumOpsAdded) {
-
-  if (Opcode == ARM::Int_MemBarrierV7 || Opcode == ARM::Int_SyncBarrierV7)
-    return true;
+    unsigned short NumOps, unsigned &NumOpsAdded, BO) {
  
    assert(0 && "Unexpected pseudo instruction!");
    return false;
@@ -547,7 +515,7 @@ static bool DisassemblePseudo(MCInst &MI, unsigned Opcode, uint32_t insn,
  // Inst{3-0} => Rm
  // Inst{11-8} => Rs
  static bool DisassembleMulFrm(MCInst &MI, unsigned Opcode, uint32_t insn,
-    unsigned short NumOps, unsigned &NumOpsAdded) {
+    unsigned short NumOps, unsigned &NumOpsAdded, BO B) {
  
    const TargetInstrDesc &TID = ARMInsts[Opcode];
    unsigned short NumDefs = TID.getNumDefs();
@@ -560,31 +528,33 @@ static bool DisassembleMulFrm(MCInst &MI, unsigned Opcode, uint32_t insn,
    assert(NumOps >= 3
           && OpInfo[0].RegClass == ARM::GPRRegClassID
           && OpInfo[1].RegClass == ARM::GPRRegClassID
-         && OpInfo[2].RegClass == ARM::GPRRegClassID);
+         && OpInfo[2].RegClass == ARM::GPRRegClassID
+         && "Expect three register operands");
  
    // Instructions with two destination registers have RdLo{15-12} first.
    if (NumDefs == 2) {
-    assert(NumOps >= 4 && OpInfo[3].RegClass == ARM::GPRRegClassID);
-    MI.addOperand(MCOperand::CreateReg(getRegisterEnum(ARM::GPRRegClassID,
+    assert(NumOps >= 4 && OpInfo[3].RegClass == ARM::GPRRegClassID &&
+           "Expect 4th register operand");
+    MI.addOperand(MCOperand::CreateReg(getRegisterEnum(B, ARM::GPRRegClassID,
                                                         decodeRd(insn))));
      ++OpIdx;
    }
  
    // The destination register: RdHi{19-16} or Rd{19-16}.
-  MI.addOperand(MCOperand::CreateReg(getRegisterEnum(ARM::GPRRegClassID,
+  MI.addOperand(MCOperand::CreateReg(getRegisterEnum(B, ARM::GPRRegClassID,
                                                       decodeRn(insn))));
  
    // The two src regsiters: Rn{3-0}, then Rm{11-8}.
-  MI.addOperand(MCOperand::CreateReg(getRegisterEnum(ARM::GPRRegClassID,
+  MI.addOperand(MCOperand::CreateReg(getRegisterEnum(B, ARM::GPRRegClassID,
                                                       decodeRm(insn))));
-  MI.addOperand(MCOperand::CreateReg(getRegisterEnum(ARM::GPRRegClassID,
+  MI.addOperand(MCOperand::CreateReg(getRegisterEnum(B, ARM::GPRRegClassID,
                                                       decodeRs(insn))));
    OpIdx += 3;
  
    // Many multiply instructions (e.g., MLA) have three src registers.
    // The third register operand is Ra{15-12}.
    if (OpIdx < NumOps && OpInfo[OpIdx].RegClass == ARM::GPRRegClassID) {
-    MI.addOperand(MCOperand::CreateReg(getRegisterEnum(ARM::GPRRegClassID,
+    MI.addOperand(MCOperand::CreateReg(getRegisterEnum(B, ARM::GPRRegClassID,
                                                         decodeRd(insn))));
      ++OpIdx;
    }
@@ -646,9 +616,9 @@ static inline unsigned GetCopOpc(uint32_t insn) {
  // and friends
  //
  static bool DisassembleCoprocessor(MCInst &MI, unsigned Opcode, uint32_t insn,
-    unsigned short NumOps, unsigned &NumOpsAdded) {
+    unsigned short NumOps, unsigned &NumOpsAdded, BO B) {
  
-  assert(NumOps >= 5);
+  assert(NumOps >= 5 && "Num of operands >= 5 for coprocessor instr");
  
    unsigned &OpIdx = NumOpsAdded;
    bool OneCopOpc = (Opcode == ARM::MCRR || Opcode == ARM::MCRR2 ||
@@ -667,7 +637,7 @@ static bool DisassembleCoprocessor(MCInst &MI, unsigned Opcode, uint32_t insn,
  
      MI.addOperand(MCOperand::CreateImm(decodeRd(insn)));
  
-    MI.addOperand(MCOperand::CreateReg(getRegisterEnum(ARM::GPRRegClassID,
+    MI.addOperand(MCOperand::CreateReg(getRegisterEnum(B, ARM::GPRRegClassID,
                                                         decodeRn(insn))));
  
      if (PW) {
@@ -687,11 +657,11 @@ static bool DisassembleCoprocessor(MCInst &MI, unsigned Opcode, uint32_t insn,
  
      MI.addOperand(NoGPR ? MCOperand::CreateImm(decodeRd(insn))
                          : MCOperand::CreateReg(
-                            getRegisterEnum(ARM::GPRRegClassID,
+                            getRegisterEnum(B, ARM::GPRRegClassID,
                                              decodeRd(insn))));
  
      MI.addOperand(OneCopOpc ? MCOperand::CreateReg(
-                                getRegisterEnum(ARM::GPRRegClassID,
+                                getRegisterEnum(B, ARM::GPRRegClassID,
                                                  decodeRn(insn)))
                              : MCOperand::CreateImm(decodeRn(insn)));
  
@@ -709,8 +679,8 @@ static bool DisassembleCoprocessor(MCInst &MI, unsigned Opcode, uint32_t insn,
  }
  
  // Branch Instructions.
-// BLr9: SignExtend(Imm24:'00', 32)
-// Bcc, BLr9_pred: SignExtend(Imm24:'00', 32) Pred0 Pred1
+// BL: SignExtend(Imm24:'00', 32)
+// Bcc, BL_pred: SignExtend(Imm24:'00', 32) Pred0 Pred1
  // SMC: ZeroExtend(imm4, 32)
  // SVC: ZeroExtend(Imm24, 32)
  //
@@ -721,77 +691,80 @@ static bool DisassembleCoprocessor(MCInst &MI, unsigned Opcode, uint32_t insn,
  // MSR/MSRsys: Rm mask=Inst{19-16}
  // BXJ:        Rm
  // MSRi/MSRsysi: so_imm
-// SRSW/SRS: addrmode4:$addr mode_imm
-// RFEW/RFE: addrmode4:$addr Rn
+// SRSW/SRS: ldstm_mode:$amode mode_imm
+// RFEW/RFE: ldstm_mode:$amode Rn
  static bool DisassembleBrFrm(MCInst &MI, unsigned Opcode, uint32_t insn,
-    unsigned short NumOps, unsigned &NumOpsAdded) {
+    unsigned short NumOps, unsigned &NumOpsAdded, BO B) {
  
    if (CoprocessorOpcode(Opcode))
-    return DisassembleCoprocessor(MI, Opcode, insn, NumOps, NumOpsAdded);
+    return DisassembleCoprocessor(MI, Opcode, insn, NumOps, NumOpsAdded, B);
  
    const TargetOperandInfo *OpInfo = ARMInsts[Opcode].OpInfo;
+  if (!OpInfo) return false;
  
    // MRS and MRSsys take one GPR reg Rd.
    if (Opcode == ARM::MRS || Opcode == ARM::MRSsys) {
-    assert(NumOps >= 1 && OpInfo[0].RegClass == ARM::GPRRegClassID);
-    MI.addOperand(MCOperand::CreateReg(getRegisterEnum(ARM::GPRRegClassID,
+    assert(NumOps >= 1 && OpInfo[0].RegClass == ARM::GPRRegClassID &&
+           "Reg operand expected");
+    MI.addOperand(MCOperand::CreateReg(getRegisterEnum(B, ARM::GPRRegClassID,
                                                         decodeRd(insn))));
      NumOpsAdded = 1;
      return true;
    }
    // BXJ takes one GPR reg Rm.
    if (Opcode == ARM::BXJ) {
-    assert(NumOps >= 1 && OpInfo[0].RegClass == ARM::GPRRegClassID);
-    MI.addOperand(MCOperand::CreateReg(getRegisterEnum(ARM::GPRRegClassID,
+    assert(NumOps >= 1 && OpInfo[0].RegClass == ARM::GPRRegClassID &&
+           "Reg operand expected");
+    MI.addOperand(MCOperand::CreateReg(getRegisterEnum(B, ARM::GPRRegClassID,
                                                         decodeRm(insn))));
      NumOpsAdded = 1;
      return true;
    }
-  // MSR and MSRsys take one GPR reg Rm, followed by the mask.
-  if (Opcode == ARM::MSR || Opcode == ARM::MSRsys) {
-    assert(NumOps >= 1 && OpInfo[0].RegClass == ARM::GPRRegClassID);
-    MI.addOperand(MCOperand::CreateReg(getRegisterEnum(ARM::GPRRegClassID,
+  // MSR take a mask, followed by one GPR reg Rm. The mask contains the R Bit in
+  // bit 4, and the special register fields in bits 3-0.
+  if (Opcode == ARM::MSR) {
+    assert(NumOps >= 1 && OpInfo[1].RegClass == ARM::GPRRegClassID &&
+           "Reg operand expected");
+    MI.addOperand(MCOperand::CreateImm(slice(insn, 22, 22) << 4 /* R Bit */ |
+                                       slice(insn, 19, 16) /* Special Reg */ ));
+    MI.addOperand(MCOperand::CreateReg(getRegisterEnum(B, ARM::GPRRegClassID,
                                                         decodeRm(insn))));
-    MI.addOperand(MCOperand::CreateImm(slice(insn, 19, 16)));
      NumOpsAdded = 2;
      return true;
    }
-  // MSRi and MSRsysi take one so_imm operand, followed by the mask.
-  if (Opcode == ARM::MSRi || Opcode == ARM::MSRsysi) {
+  // MSRi take a mask, followed by one so_imm operand. The mask contains the
+  // R Bit in bit 4, and the special register fields in bits 3-0.
+  if (Opcode == ARM::MSRi) {
+    MI.addOperand(MCOperand::CreateImm(slice(insn, 22, 22) << 4 /* R Bit */ |
+                                       slice(insn, 19, 16) /* Special Reg */ ));
      // SOImm is 4-bit rotate amount in bits 11-8 with 8-bit imm in bits 7-0.
      // A5.2.4 Rotate amount is twice the numeric value of Inst{11-8}.
      // See also ARMAddressingModes.h: getSOImmValImm() and getSOImmValRot().
      unsigned Rot = (insn >> ARMII::SoRotImmShift) & 0xF;
      unsigned Imm = insn & 0xFF;
      MI.addOperand(MCOperand::CreateImm(ARM_AM::rotr32(Imm, 2*Rot)));
-    MI.addOperand(MCOperand::CreateImm(slice(insn, 19, 16)));
      NumOpsAdded = 2;
      return true;
    }
-  // SRSW and SRS requires addrmode4:$addr for ${addr:submode}, followed by the
-  // mode immediate (Inst{4-0}).
    if (Opcode == ARM::SRSW || Opcode == ARM::SRS ||
        Opcode == ARM::RFEW || Opcode == ARM::RFE) {
-    // ARMInstPrinter::printAddrMode4Operand() prints special mode string
-    // if the base register is SP; so don't set ARM::SP.
-    MI.addOperand(MCOperand::CreateReg(0));
-    bool WB = (Opcode == ARM::SRSW);
      ARM_AM::AMSubMode SubMode = getAMSubModeForBits(getPUBits(insn));
-    MI.addOperand(MCOperand::CreateImm(ARM_AM::getAM4ModeImm(SubMode, WB)));
+    MI.addOperand(MCOperand::CreateImm(ARM_AM::getAM4ModeImm(SubMode)));
  
      if (Opcode == ARM::SRSW || Opcode == ARM::SRS)
        MI.addOperand(MCOperand::CreateImm(slice(insn, 4, 0)));
      else
-      MI.addOperand(MCOperand::CreateReg(getRegisterEnum(ARM::GPRRegClassID,
+      MI.addOperand(MCOperand::CreateReg(getRegisterEnum(B, ARM::GPRRegClassID,
                                                           decodeRn(insn))));
      NumOpsAdded = 3;
      return true;
    }
  
-  assert(Opcode == ARM::Bcc || Opcode == ARM::BLr9 || Opcode == ARM::BLr9_pred
-         || Opcode == ARM::SMC || Opcode == ARM::SVC);
+  assert((Opcode == ARM::Bcc || Opcode == ARM::BL || Opcode == ARM::BL_pred
+          || Opcode == ARM::SMC || Opcode == ARM::SVC) &&
+         "Unexpected Opcode");
  
-  assert(NumOps >= 1 && OpInfo[0].RegClass == 0);
+  assert(NumOps >= 1 && OpInfo[0].RegClass < 0 && "Reg operand expected");
  
    int Imm32 = 0;
    if (Opcode == ARM::SMC) {
@@ -803,13 +776,8 @@ static bool DisassembleBrFrm(MCInst &MI, unsigned Opcode, uint32_t insn,
    } else {
      // SignExtend(imm24:'00', 32) where imm24 = Inst{23-0}.
      unsigned Imm26 = slice(insn, 23, 0) << 2;
-    Imm32 = signextend<signed int, 26>(Imm26);
-
-    // When executing an ARM instruction, PC reads as the address of the current
-    // instruction plus 8.  The assembler subtracts 8 from the difference
-    // between the branch instruction and the target address, disassembler has
-    // to add 8 to compensate.
-    Imm32 += 8;
+    //Imm32 = signextend<signed int, 26>(Imm26);
+    Imm32 = SignExtend32<26>(Imm26);
    }
  
    MI.addOperand(MCOperand::CreateImm(Imm32));
@@ -819,143 +787,56 @@ static bool DisassembleBrFrm(MCInst &MI, unsigned Opcode, uint32_t insn,
  }
  
  // Misc. Branch Instructions.
-// BR_JTadd, BR_JTr, BR_JTm
-// BLXr9, BXr9
-// BRIND, BX_RET
+// BLX, BX
+// BX, BX_RET
  static bool DisassembleBrMiscFrm(MCInst &MI, unsigned Opcode, uint32_t insn,
-    unsigned short NumOps, unsigned &NumOpsAdded) {
+    unsigned short NumOps, unsigned &NumOpsAdded, BO B) {
  
    const TargetOperandInfo *OpInfo = ARMInsts[Opcode].OpInfo;
+  if (!OpInfo) return false;
+
    unsigned &OpIdx = NumOpsAdded;
  
    OpIdx = 0;
  
-  // BX_RET has only two predicate operands, do an early return.
-  if (Opcode == ARM::BX_RET)
+  // BX_RET and MOVPCLR have only two predicate operands; do an early return.
+  if (Opcode == ARM::BX_RET || Opcode == ARM::MOVPCLR)
      return true;
  
-  // BLXr9 and BRIND take one GPR reg.
-  if (Opcode == ARM::BLXr9 || Opcode == ARM::BRIND) {
-    assert(NumOps >= 1 && OpInfo[OpIdx].RegClass == ARM::GPRRegClassID);
-    MI.addOperand(MCOperand::CreateReg(getRegisterEnum(ARM::GPRRegClassID,
+  // BLX and BX take one GPR reg.
+  if (Opcode == ARM::BLX || Opcode == ARM::BLX_pred ||
+      Opcode == ARM::BX) {
+    assert(NumOps >= 1 && OpInfo[OpIdx].RegClass == ARM::GPRRegClassID &&
+           "Reg operand expected");
+    MI.addOperand(MCOperand::CreateReg(getRegisterEnum(B, ARM::GPRRegClassID,
                                                         decodeRm(insn))));
      OpIdx = 1;
      return true;
    }
  
-  // BR_JTadd is an ADD with Rd = PC, (Rn, Rm) as the target and index regs.
-  if (Opcode == ARM::BR_JTadd) {
-    // InOperandList with GPR:$target and GPR:$idx regs.
-
-    assert(NumOps == 4);
-    MI.addOperand(MCOperand::CreateReg(getRegisterEnum(ARM::GPRRegClassID,
-                                                       decodeRn(insn))));
-    MI.addOperand(MCOperand::CreateReg(getRegisterEnum(ARM::GPRRegClassID,
-                                                       decodeRm(insn))));
-
-    // Fill in the two remaining imm operands to signify build completion.
-    MI.addOperand(MCOperand::CreateImm(0));
-    MI.addOperand(MCOperand::CreateImm(0));
-
-    OpIdx = 4;
-    return true;
-  }
-
-  // BR_JTr is a MOV with Rd = PC, and Rm as the source register.
-  if (Opcode == ARM::BR_JTr) {
-    // InOperandList with GPR::$target reg.
-
-    assert(NumOps == 3);
-    MI.addOperand(MCOperand::CreateReg(getRegisterEnum(ARM::GPRRegClassID,
-                                                       decodeRm(insn))));
-
-    // Fill in the two remaining imm operands to signify build completion.
-    MI.addOperand(MCOperand::CreateImm(0));
-    MI.addOperand(MCOperand::CreateImm(0));
-
-    OpIdx = 3;
-    return true;
-  }
-
-  // BR_JTm is an LDR with Rt = PC.
-  if (Opcode == ARM::BR_JTm) {
-    // This is the reg/reg form, with base reg followed by +/- reg shop imm.
-    // See also ARMAddressingModes.h (Addressing Mode #2).
-
-    assert(NumOps == 5 && getIBit(insn) == 1);
-    MI.addOperand(MCOperand::CreateReg(getRegisterEnum(ARM::GPRRegClassID,
-                                                       decodeRn(insn))));
-
-    ARM_AM::AddrOpc AddrOpcode = getUBit(insn) ? ARM_AM::add : ARM_AM::sub;
-
-    // Disassemble the offset reg (Rm), shift type, and immediate shift length.
-    MI.addOperand(MCOperand::CreateReg(getRegisterEnum(ARM::GPRRegClassID,
-                                                       decodeRm(insn))));
-    // Inst{6-5} encodes the shift opcode.
-    ARM_AM::ShiftOpc ShOp = getShiftOpcForBits(slice(insn, 6, 5));
-    // Inst{11-7} encodes the imm5 shift amount.
-    unsigned ShImm = slice(insn, 11, 7);
-
-    // A8.4.1.  Possible rrx or shift amount of 32...
-    getImmShiftSE(ShOp, ShImm);
-    MI.addOperand(MCOperand::CreateImm(
-                    ARM_AM::getAM2Opc(AddrOpcode, ShImm, ShOp)));
-
-    // Fill in the two remaining imm operands to signify build completion.
-    MI.addOperand(MCOperand::CreateImm(0));
-    MI.addOperand(MCOperand::CreateImm(0));
-
-    OpIdx = 5;
-    return true;
-  }
-
-  assert(0 && "Unexpected BrMiscFrm Opcode");
    return false;
  }
  
-static inline uint32_t getBFCInvMask(uint32_t insn) {
+static inline bool getBFCInvMask(uint32_t insn, uint32_t &mask) {
    uint32_t lsb = slice(insn, 11, 7);
    uint32_t msb = slice(insn, 20, 16);
    uint32_t Val = 0;
-  assert(lsb <= msb && "Encoding error: lsb > msb");
-  for (uint32_t i = lsb; i <= msb; ++i)
-    Val |= (1 << i);
-  return ~Val;
-}
-
-static inline bool SaturateOpcode(unsigned Opcode) {
-  switch (Opcode) {
-  case ARM::SSATlsl: case ARM::SSATasr: case ARM::SSAT16:
-  case ARM::USATlsl: case ARM::USATasr: case ARM::USAT16:
-    return true;
-  default:
+  if (msb < lsb) {
+    DEBUG(errs() << "Encoding error: msb < lsb\n");
      return false;
    }
-}
  
-static inline unsigned decodeSaturatePos(unsigned Opcode, uint32_t insn) {
-  switch (Opcode) {
-  case ARM::SSATlsl:
-  case ARM::SSATasr:
-    return slice(insn, 20, 16) + 1;
-  case ARM::SSAT16:
-    return slice(insn, 19, 16) + 1;
-  case ARM::USATlsl:
-  case ARM::USATasr:
-    return slice(insn, 20, 16);
-  case ARM::USAT16:
-    return slice(insn, 19, 16);
-  default:
-    llvm_unreachable("Invalid opcode passed in");
-    return 0;
-  }
+  for (uint32_t i = lsb; i <= msb; ++i)
+    Val |= (1 << i);
+  mask = ~Val;
+  return true;
  }
  
  // A major complication is the fact that some of the saturating add/subtract
  // operations have Rd Rm Rn, instead of the "normal" Rd Rn Rm.
  // They are QADD, QDADD, QDSUB, and QSUB.
  static bool DisassembleDPFrm(MCInst &MI, unsigned Opcode, uint32_t insn,
-    unsigned short NumOps, unsigned &NumOpsAdded) {
+    unsigned short NumOps, unsigned &NumOpsAdded, BO B) {
  
    const TargetInstrDesc &TID = ARMInsts[Opcode];
    unsigned short NumDefs = TID.getNumDefs();
@@ -967,7 +848,7 @@ static bool DisassembleDPFrm(MCInst &MI, unsigned Opcode, uint32_t insn,
  
    // Disassemble register def if there is one.
    if (NumDefs && (OpInfo[OpIdx].RegClass == ARM::GPRRegClassID)) {
-    MI.addOperand(MCOperand::CreateReg(getRegisterEnum(ARM::GPRRegClassID,
+    MI.addOperand(MCOperand::CreateReg(getRegisterEnum(B, ARM::GPRRegClassID,
                                                         decodeRd(insn))));
      ++OpIdx;
    }
@@ -976,46 +857,24 @@ static bool DisassembleDPFrm(MCInst &MI, unsigned Opcode, uint32_t insn,
    if (OpIdx >= NumOps)
      return false;
  
-  // SSAT/SSAT16/USAT/USAT16 has imm operand after Rd.
-  if (SaturateOpcode(Opcode)) {
-    MI.addOperand(MCOperand::CreateImm(decodeSaturatePos(Opcode, insn)));
-
-    MI.addOperand(MCOperand::CreateReg(getRegisterEnum(ARM::GPRRegClassID,
-                                                       decodeRm(insn))));
-
-    if (Opcode == ARM::SSAT16 || Opcode == ARM::USAT16) {
-      OpIdx += 2;
-      return true;
-    }
-
-    // For SSAT operand reg (Rm) has been disassembled above.
-    // Now disassemble the shift amount.
-
-    // Inst{11-7} encodes the imm5 shift amount.
-    unsigned ShAmt = slice(insn, 11, 7);
-
-    // A8.6.183.  Possible ASR shift amount of 32...
-    if (Opcode == ARM::SSATasr && ShAmt == 0)
-      ShAmt = 32;
-
-    MI.addOperand(MCOperand::CreateImm(ShAmt));
-
-    OpIdx += 3;
-    return true;
-  }
-
    // Special-case handling of BFC/BFI/SBFX/UBFX.
    if (Opcode == ARM::BFC || Opcode == ARM::BFI) {
-    // TIED_TO operand skipped for BFC and Inst{3-0} (Reg) for BFI.
-    MI.addOperand(MCOperand::CreateReg(Opcode == ARM::BFC ? 0
-                                       : getRegisterEnum(ARM::GPRRegClassID,
+    MI.addOperand(MCOperand::CreateReg(0));
+    if (Opcode == ARM::BFI) {
+      MI.addOperand(MCOperand::CreateReg(getRegisterEnum(B, ARM::GPRRegClassID,
                                                           decodeRm(insn))));
-    MI.addOperand(MCOperand::CreateImm(getBFCInvMask(insn)));
+      ++OpIdx;
+    }
+    uint32_t mask = 0;
+    if (!getBFCInvMask(insn, mask))
+      return false;
+
+    MI.addOperand(MCOperand::CreateImm(mask));
      OpIdx += 2;
      return true;
    }
    if (Opcode == ARM::SBFX || Opcode == ARM::UBFX) {
-    MI.addOperand(MCOperand::CreateReg(getRegisterEnum(ARM::GPRRegClassID,
+    MI.addOperand(MCOperand::CreateReg(getRegisterEnum(B, ARM::GPRRegClassID,
                                                         decodeRm(insn))));
      MI.addOperand(MCOperand::CreateImm(slice(insn, 11, 7)));
      MI.addOperand(MCOperand::CreateImm(slice(insn, 20, 16) + 1));
@@ -1028,9 +887,10 @@ static bool DisassembleDPFrm(MCInst &MI, unsigned Opcode, uint32_t insn,
  
    // BinaryDP has an Rn operand.
    if (!isUnary) {
-    assert(OpInfo[OpIdx].RegClass == ARM::GPRRegClassID);
+    assert(OpInfo[OpIdx].RegClass == ARM::GPRRegClassID &&
+           "Reg operand expected");
      MI.addOperand(MCOperand::CreateReg(
-                    getRegisterEnum(ARM::GPRRegClassID,
+                    getRegisterEnum(B, ARM::GPRRegClassID,
                                      RmRn ? decodeRm(insn) : decodeRn(insn))));
      ++OpIdx;
    }
@@ -1051,7 +911,7 @@ static bool DisassembleDPFrm(MCInst &MI, unsigned Opcode, uint32_t insn,
      // routed here as well.
      // assert(getIBit(insn) == 0 && "I_Bit != '0' reg/reg form");
      MI.addOperand(MCOperand::CreateReg(
-                    getRegisterEnum(ARM::GPRRegClassID,
+                    getRegisterEnum(B, ARM::GPRRegClassID,
                                      RmRn? decodeRn(insn) : decodeRm(insn))));
      ++OpIdx;
    } else if (Opcode == ARM::MOVi16 || Opcode == ARM::MOVTi16) {
@@ -1076,7 +936,7 @@ static bool DisassembleDPFrm(MCInst &MI, unsigned Opcode, uint32_t insn,
  }
  
  static bool DisassembleDPSoRegFrm(MCInst &MI, unsigned Opcode, uint32_t insn,
-    unsigned short NumOps, unsigned &NumOpsAdded) {
+    unsigned short NumOps, unsigned &NumOpsAdded, BO B) {
  
    const TargetInstrDesc &TID = ARMInsts[Opcode];
    unsigned short NumDefs = TID.getNumDefs();
@@ -1088,7 +948,7 @@ static bool DisassembleDPSoRegFrm(MCInst &MI, unsigned Opcode, uint32_t insn,
  
    // Disassemble register def if there is one.
    if (NumDefs && (OpInfo[OpIdx].RegClass == ARM::GPRRegClassID)) {
-    MI.addOperand(MCOperand::CreateReg(getRegisterEnum(ARM::GPRRegClassID,
+    MI.addOperand(MCOperand::CreateReg(getRegisterEnum(B, ARM::GPRRegClassID,
                                                         decodeRd(insn))));
      ++OpIdx;
    }
@@ -1099,8 +959,9 @@ static bool DisassembleDPSoRegFrm(MCInst &MI, unsigned Opcode, uint32_t insn,
  
    // BinaryDP has an Rn operand.
    if (!isUnary) {
-    assert(OpInfo[OpIdx].RegClass == ARM::GPRRegClassID);
-    MI.addOperand(MCOperand::CreateReg(getRegisterEnum(ARM::GPRRegClassID,
+    assert(OpInfo[OpIdx].RegClass == ARM::GPRRegClassID &&
+           "Reg operand expected");
+    MI.addOperand(MCOperand::CreateReg(getRegisterEnum(B, ARM::GPRRegClassID,
                                                         decodeRn(insn))));
      ++OpIdx;
    }
@@ -1117,16 +978,17 @@ static bool DisassembleDPSoRegFrm(MCInst &MI, unsigned Opcode, uint32_t insn,
  
    assert((OpInfo[OpIdx].RegClass == ARM::GPRRegClassID) &&
           (OpInfo[OpIdx+1].RegClass == ARM::GPRRegClassID) &&
-         (OpInfo[OpIdx+2].RegClass == 0));
+         (OpInfo[OpIdx+2].RegClass < 0) &&
+         "Expect 3 reg operands");
  
    // Register-controlled shifts have Inst{7} = 0 and Inst{4} = 1.
    unsigned Rs = slice(insn, 4, 4);
  
-  MI.addOperand(MCOperand::CreateReg(getRegisterEnum(ARM::GPRRegClassID,
+  MI.addOperand(MCOperand::CreateReg(getRegisterEnum(B, ARM::GPRRegClassID,
                                                       decodeRm(insn))));
    if (Rs) {
      // Register-controlled shifts: [Rm, Rs, shift].
-    MI.addOperand(MCOperand::CreateReg(getRegisterEnum(ARM::GPRRegClassID,
+    MI.addOperand(MCOperand::CreateReg(getRegisterEnum(B, ARM::GPRRegClassID,
                                                         decodeRs(insn))));
      // Inst{6-5} encodes the shift opcode.
      ARM_AM::ShiftOpc ShOp = getShiftOpcForBits(slice(insn, 6, 5));
@@ -1149,22 +1011,26 @@ static bool DisassembleDPSoRegFrm(MCInst &MI, unsigned Opcode, uint32_t insn,
  }
  
  static bool DisassembleLdStFrm(MCInst &MI, unsigned Opcode, uint32_t insn,
-    unsigned short NumOps, unsigned &NumOpsAdded, bool isStore) {
+    unsigned short NumOps, unsigned &NumOpsAdded, bool isStore, BO B) {
  
    const TargetInstrDesc &TID = ARMInsts[Opcode];
-  unsigned short NumDefs = TID.getNumDefs();
    bool isPrePost = isPrePostLdSt(TID.TSFlags);
    const TargetOperandInfo *OpInfo = TID.OpInfo;
+  if (!OpInfo) return false;
+
    unsigned &OpIdx = NumOpsAdded;
  
    OpIdx = 0;
  
-  assert((!isStore && NumDefs > 0) || (isStore && (NumDefs == 0 || isPrePost)));
+  assert(((!isStore && TID.getNumDefs() > 0) ||
+          (isStore && (TID.getNumDefs() == 0 || isPrePost)))
+         && "Invalid arguments");
  
    // Operand 0 of a pre- and post-indexed store is the address base writeback.
    if (isPrePost && isStore) {
-    assert(OpInfo[OpIdx].RegClass == ARM::GPRRegClassID);
-    MI.addOperand(MCOperand::CreateReg(getRegisterEnum(ARM::GPRRegClassID,
+    assert(OpInfo[OpIdx].RegClass == ARM::GPRRegClassID &&
+           "Reg operand expected");
+    MI.addOperand(MCOperand::CreateReg(getRegisterEnum(B, ARM::GPRRegClassID,
                                                         decodeRn(insn))));
      ++OpIdx;
    }
@@ -1173,15 +1039,17 @@ static bool DisassembleLdStFrm(MCInst &MI, unsigned Opcode, uint32_t insn,
    if (OpIdx >= NumOps)
      return false;
  
-  assert(OpInfo[OpIdx].RegClass == ARM::GPRRegClassID);
-  MI.addOperand(MCOperand::CreateReg(getRegisterEnum(ARM::GPRRegClassID,
+  assert(OpInfo[OpIdx].RegClass == ARM::GPRRegClassID &&
+         "Reg operand expected");
+  MI.addOperand(MCOperand::CreateReg(getRegisterEnum(B, ARM::GPRRegClassID,
                                                       decodeRd(insn))));
    ++OpIdx;
  
    // After dst of a pre- and post-indexed load is the address base writeback.
    if (isPrePost && !isStore) {
-    assert(OpInfo[OpIdx].RegClass == ARM::GPRRegClassID);
-    MI.addOperand(MCOperand::CreateReg(getRegisterEnum(ARM::GPRRegClassID,
+    assert(OpInfo[OpIdx].RegClass == ARM::GPRRegClassID &&
+           "Reg operand expected");
+    MI.addOperand(MCOperand::CreateReg(getRegisterEnum(B, ARM::GPRRegClassID,
                                                         decodeRn(insn))));
      ++OpIdx;
    }
@@ -1190,9 +1058,11 @@ static bool DisassembleLdStFrm(MCInst &MI, unsigned Opcode, uint32_t insn,
    if (OpIdx >= NumOps)
      return false;
  
-  assert(OpInfo[OpIdx].RegClass == ARM::GPRRegClassID);
-  assert(!isPrePost || (TID.getOperandConstraint(OpIdx, TOI::TIED_TO) != -1));
-  MI.addOperand(MCOperand::CreateReg(getRegisterEnum(ARM::GPRRegClassID,
+  assert(OpInfo[OpIdx].RegClass == ARM::GPRRegClassID &&
+         "Reg operand expected");
+  assert((!isPrePost || (TID.getOperandConstraint(OpIdx, TOI::TIED_TO) != -1))
+         && "Index mode or tied_to operand expected");
+  MI.addOperand(MCOperand::CreateReg(getRegisterEnum(B, ARM::GPRRegClassID,
                                                       decodeRn(insn))));
    ++OpIdx;
  
@@ -1202,20 +1072,24 @@ static bool DisassembleLdStFrm(MCInst &MI, unsigned Opcode, uint32_t insn,
    if (OpIdx + 1 >= NumOps)
      return false;
  
-  assert((OpInfo[OpIdx].RegClass == ARM::GPRRegClassID) &&
-         (OpInfo[OpIdx+1].RegClass == 0));
-
    ARM_AM::AddrOpc AddrOpcode = getUBit(insn) ? ARM_AM::add : ARM_AM::sub;
    if (getIBit(insn) == 0) {
-    MI.addOperand(MCOperand::CreateReg(0));
+    // For pre- and post-indexed case, add a reg0 operand (Addressing Mode #2).
+    // Otherwise, skip the reg operand since for addrmode_imm12, Rn has already
+    // been populated.
+    if (isPrePost) {
+      MI.addOperand(MCOperand::CreateReg(0));
+      OpIdx += 1;
+    }
  
      // Disassemble the 12-bit immediate offset.
      unsigned Imm12 = slice(insn, 11, 0);
      unsigned Offset = ARM_AM::getAM2Opc(AddrOpcode, Imm12, ARM_AM::no_shift);
      MI.addOperand(MCOperand::CreateImm(Offset));
+    OpIdx += 1;
    } else {
      // Disassemble the offset reg (Rm), shift type, and immediate shift length.
-    MI.addOperand(MCOperand::CreateReg(getRegisterEnum(ARM::GPRRegClassID,
+    MI.addOperand(MCOperand::CreateReg(getRegisterEnum(B, ARM::GPRRegClassID,
                                                         decodeRm(insn))));
      // Inst{6-5} encodes the shift opcode.
      ARM_AM::ShiftOpc ShOp = getShiftOpcForBits(slice(insn, 6, 5));
@@ -1226,20 +1100,20 @@ static bool DisassembleLdStFrm(MCInst &MI, unsigned Opcode, uint32_t insn,
      getImmShiftSE(ShOp, ShImm);
      MI.addOperand(MCOperand::CreateImm(
                      ARM_AM::getAM2Opc(AddrOpcode, ShImm, ShOp)));
+    OpIdx += 2;
    }
-  OpIdx += 2;
  
    return true;
  }
  
  static bool DisassembleLdFrm(MCInst &MI, unsigned Opcode, uint32_t insn,
-    unsigned short NumOps, unsigned &NumOpsAdded) {
-  return DisassembleLdStFrm(MI, Opcode, insn, NumOps, NumOpsAdded, false);
+    unsigned short NumOps, unsigned &NumOpsAdded, BO B) {
+  return DisassembleLdStFrm(MI, Opcode, insn, NumOps, NumOpsAdded, false, B);
  }
  
  static bool DisassembleStFrm(MCInst &MI, unsigned Opcode, uint32_t insn,
-    unsigned short NumOps, unsigned &NumOpsAdded) {
-  return DisassembleLdStFrm(MI, Opcode, insn, NumOps, NumOpsAdded, true);
+    unsigned short NumOps, unsigned &NumOpsAdded, BO B) {
+  return DisassembleLdStFrm(MI, Opcode, insn, NumOps, NumOpsAdded, true, B);
  }
  
  static bool HasDualReg(unsigned Opcode) {
@@ -1253,22 +1127,26 @@ static bool HasDualReg(unsigned Opcode) {
  }
  
  static bool DisassembleLdStMiscFrm(MCInst &MI, unsigned Opcode, uint32_t insn,
-    unsigned short NumOps, unsigned &NumOpsAdded, bool isStore) {
+    unsigned short NumOps, unsigned &NumOpsAdded, bool isStore, BO B) {
  
    const TargetInstrDesc &TID = ARMInsts[Opcode];
-  unsigned short NumDefs = TID.getNumDefs();
    bool isPrePost = isPrePostLdSt(TID.TSFlags);
    const TargetOperandInfo *OpInfo = TID.OpInfo;
+  if (!OpInfo) return false;
+
    unsigned &OpIdx = NumOpsAdded;
  
    OpIdx = 0;
  
-  assert((!isStore && NumDefs > 0) || (isStore && (NumDefs == 0 || isPrePost)));
+  assert(((!isStore && TID.getNumDefs() > 0) ||
+          (isStore && (TID.getNumDefs() == 0 || isPrePost)))
+         && "Invalid arguments");
  
    // Operand 0 of a pre- and post-indexed store is the address base writeback.
    if (isPrePost && isStore) {
-    assert(OpInfo[OpIdx].RegClass == ARM::GPRRegClassID);
-    MI.addOperand(MCOperand::CreateReg(getRegisterEnum(ARM::GPRRegClassID,
+    assert(OpInfo[OpIdx].RegClass == ARM::GPRRegClassID &&
+           "Reg operand expected");
+    MI.addOperand(MCOperand::CreateReg(getRegisterEnum(B, ARM::GPRRegClassID,
                                                         decodeRn(insn))));
      ++OpIdx;
    }
@@ -1279,22 +1157,25 @@ static bool DisassembleLdStMiscFrm(MCInst &MI, unsigned Opcode, uint32_t insn,
    if (OpIdx >= NumOps)
      return false;
  
-  assert(OpInfo[OpIdx].RegClass == ARM::GPRRegClassID);
-  MI.addOperand(MCOperand::CreateReg(getRegisterEnum(ARM::GPRRegClassID,
+  assert(OpInfo[OpIdx].RegClass == ARM::GPRRegClassID &&
+         "Reg operand expected");
+  MI.addOperand(MCOperand::CreateReg(getRegisterEnum(B, ARM::GPRRegClassID,
                                                       decodeRd(insn))));
    ++OpIdx;
  
-  // Fill in LDRD and STRD's second operand.
-  if (DualReg) {
-    MI.addOperand(MCOperand::CreateReg(getRegisterEnum(ARM::GPRRegClassID,
+  // Fill in LDRD and STRD's second operand, but only if it's offset mode OR we
+  // have a pre-or-post-indexed store operation.
+  if (DualReg && (!isPrePost || isStore)) {
+    MI.addOperand(MCOperand::CreateReg(getRegisterEnum(B, ARM::GPRRegClassID,
                                                         decodeRd(insn) + 1)));
      ++OpIdx;
    }
  
    // After dst of a pre- and post-indexed load is the address base writeback.
    if (isPrePost && !isStore) {
-    assert(OpInfo[OpIdx].RegClass == ARM::GPRRegClassID);
-    MI.addOperand(MCOperand::CreateReg(getRegisterEnum(ARM::GPRRegClassID,
+    assert(OpInfo[OpIdx].RegClass == ARM::GPRRegClassID &&
+           "Reg operand expected");
+    MI.addOperand(MCOperand::CreateReg(getRegisterEnum(B, ARM::GPRRegClassID,
                                                         decodeRn(insn))));
      ++OpIdx;
    }
@@ -1303,9 +1184,11 @@ static bool DisassembleLdStMiscFrm(MCInst &MI, unsigned Opcode, uint32_t insn,
    if (OpIdx >= NumOps)
      return false;
  
-  assert(OpInfo[OpIdx].RegClass == ARM::GPRRegClassID);
-  assert(!isPrePost || (TID.getOperandConstraint(OpIdx, TOI::TIED_TO) != -1));
-  MI.addOperand(MCOperand::CreateReg(getRegisterEnum(ARM::GPRRegClassID,
+  assert(OpInfo[OpIdx].RegClass == ARM::GPRRegClassID &&
+         "Reg operand expected");
+  assert((!isPrePost || (TID.getOperandConstraint(OpIdx, TOI::TIED_TO) != -1))
+         && "Offset mode or tied_to operand expected");
+  MI.addOperand(MCOperand::CreateReg(getRegisterEnum(B, ARM::GPRRegClassID,
                                                       decodeRn(insn))));
    ++OpIdx;
  
@@ -1316,7 +1199,8 @@ static bool DisassembleLdStMiscFrm(MCInst &MI, unsigned Opcode, uint32_t insn,
      return false;
  
    assert((OpInfo[OpIdx].RegClass == ARM::GPRRegClassID) &&
-         (OpInfo[OpIdx+1].RegClass == 0));
+         (OpInfo[OpIdx+1].RegClass < 0) &&
+         "Expect 1 reg operand followed by 1 imm operand");
  
    ARM_AM::AddrOpc AddrOpcode = getUBit(insn) ? ARM_AM::add : ARM_AM::sub;
    if (getAM3IBit(insn) == 1) {
@@ -1329,7 +1213,7 @@ static bool DisassembleLdStMiscFrm(MCInst &MI, unsigned Opcode, uint32_t insn,
      MI.addOperand(MCOperand::CreateImm(Offset));
    } else {
      // Disassemble the offset reg (Rm).
-    MI.addOperand(MCOperand::CreateReg(getRegisterEnum(ARM::GPRRegClassID,
+    MI.addOperand(MCOperand::CreateReg(getRegisterEnum(B, ARM::GPRRegClassID,
                                                         decodeRm(insn))));
      unsigned Offset = ARM_AM::getAM3Opc(AddrOpcode, 0);
      MI.addOperand(MCOperand::CreateImm(Offset));
@@ -1340,47 +1224,54 @@ static bool DisassembleLdStMiscFrm(MCInst &MI, unsigned Opcode, uint32_t insn,
  }
  
  static bool DisassembleLdMiscFrm(MCInst &MI, unsigned Opcode, uint32_t insn,
-    unsigned short NumOps, unsigned &NumOpsAdded) {
-  return DisassembleLdStMiscFrm(MI, Opcode, insn, NumOps, NumOpsAdded, false);
+    unsigned short NumOps, unsigned &NumOpsAdded, BO B) {
+  return DisassembleLdStMiscFrm(MI, Opcode, insn, NumOps, NumOpsAdded, false,
+                                B);
  }
  
  static bool DisassembleStMiscFrm(MCInst &MI, unsigned Opcode, uint32_t insn,
-    unsigned short NumOps, unsigned &NumOpsAdded) {
-  return DisassembleLdStMiscFrm(MI, Opcode, insn, NumOps, NumOpsAdded, true);
+    unsigned short NumOps, unsigned &NumOpsAdded, BO B) {
+  return DisassembleLdStMiscFrm(MI, Opcode, insn, NumOps, NumOpsAdded, true, B);
  }
  
  // The algorithm for disassembly of LdStMulFrm is different from others because
-// it explicitly populates the two predicate operands after operand 0 (the base)
-// and operand 1 (the AM4 mode imm).  After operand 3, we need to populate the
-// reglist with each affected register encoded as an MCOperand.
+// it explicitly populates the two predicate operands after the base register.
+// After that, we need to populate the reglist with each affected register
+// encoded as an MCOperand.
  static bool DisassembleLdStMulFrm(MCInst &MI, unsigned Opcode, uint32_t insn,
-    unsigned short NumOps, unsigned &NumOpsAdded) {
+    unsigned short NumOps, unsigned &NumOpsAdded, BO B) {
  
-  assert(NumOps == 5 && "LdStMulFrm expects NumOps of 5");
+  assert(NumOps >= 4 && "LdStMulFrm expects NumOps >= 4");
+  NumOpsAdded = 0;
  
-  unsigned &OpIdx = NumOpsAdded;
+  unsigned Base = getRegisterEnum(B, ARM::GPRRegClassID, decodeRn(insn));
  
-  unsigned Base = getRegisterEnum(ARM::GPRRegClassID, decodeRn(insn));
-  MI.addOperand(MCOperand::CreateReg(Base));
+  // Writeback to base, if necessary.
+  if (Opcode == ARM::LDMIA_UPD || Opcode == ARM::STMIA_UPD ||
+      Opcode == ARM::LDMDA_UPD || Opcode == ARM::STMDA_UPD ||
+      Opcode == ARM::LDMDB_UPD || Opcode == ARM::STMDB_UPD ||
+      Opcode == ARM::LDMIB_UPD || Opcode == ARM::STMIB_UPD) {
+    MI.addOperand(MCOperand::CreateReg(Base));
+    ++NumOpsAdded;
+  }
  
-  ARM_AM::AMSubMode SubMode = getAMSubModeForBits(getPUBits(insn));
-  bool WB = getWBit(insn) == 1;
-  MI.addOperand(MCOperand::CreateImm(ARM_AM::getAM4ModeImm(SubMode, WB)));
+  // Add the base register operand.
+  MI.addOperand(MCOperand::CreateReg(Base));
  
    // Handling the two predicate operands before the reglist.
    int64_t CondVal = insn >> ARMII::CondShift;
    MI.addOperand(MCOperand::CreateImm(CondVal == 0xF ? 0xE : CondVal));
    MI.addOperand(MCOperand::CreateReg(ARM::CPSR));
  
-  OpIdx = 4;
+  NumOpsAdded += 3;
  
    // Fill the variadic part of reglist.
    unsigned RegListBits = insn & ((1 << 16) - 1);
    for (unsigned i = 0; i < 16; ++i) {
      if ((RegListBits >> i) & 1) {
-      MI.addOperand(MCOperand::CreateReg(getRegisterEnum(ARM::GPRRegClassID,
+      MI.addOperand(MCOperand::CreateReg(getRegisterEnum(B, ARM::GPRRegClassID,
                                                           i)));
-      ++OpIdx;
+      ++NumOpsAdded;
      }
    }
  
@@ -1394,44 +1285,47 @@ static bool DisassembleLdStMulFrm(MCInst &MI, unsigned Opcode, uint32_t insn,
  //
  // SWP, SWPB:             Rd Rm Rn
  static bool DisassembleLdStExFrm(MCInst &MI, unsigned Opcode, uint32_t insn,
-    unsigned short NumOps, unsigned &NumOpsAdded) {
+    unsigned short NumOps, unsigned &NumOpsAdded, BO B) {
  
    const TargetOperandInfo *OpInfo = ARMInsts[Opcode].OpInfo;
+  if (!OpInfo) return false;
+
    unsigned &OpIdx = NumOpsAdded;
  
    OpIdx = 0;
  
    assert(NumOps >= 2
           && OpInfo[0].RegClass == ARM::GPRRegClassID
-         && OpInfo[1].RegClass == ARM::GPRRegClassID);
+         && OpInfo[1].RegClass == ARM::GPRRegClassID
+         && "Expect 2 reg operands");
  
    bool isStore = slice(insn, 20, 20) == 0;
    bool isDW = (Opcode == ARM::LDREXD || Opcode == ARM::STREXD);
  
    // Add the destination operand.
-  MI.addOperand(MCOperand::CreateReg(getRegisterEnum(ARM::GPRRegClassID,
+  MI.addOperand(MCOperand::CreateReg(getRegisterEnum(B, ARM::GPRRegClassID,
                                                       decodeRd(insn))));
    ++OpIdx;
  
    // Store register Exclusive needs a source operand.
    if (isStore) {
-    MI.addOperand(MCOperand::CreateReg(getRegisterEnum(ARM::GPRRegClassID,
+    MI.addOperand(MCOperand::CreateReg(getRegisterEnum(B, ARM::GPRRegClassID,
                                                         decodeRm(insn))));
      ++OpIdx;
  
      if (isDW) {
-      MI.addOperand(MCOperand::CreateReg(getRegisterEnum(ARM::GPRRegClassID,
+      MI.addOperand(MCOperand::CreateReg(getRegisterEnum(B, ARM::GPRRegClassID,
                                                           decodeRm(insn)+1)));
        ++OpIdx;
      }
    } else if (isDW) {
-    MI.addOperand(MCOperand::CreateReg(getRegisterEnum(ARM::GPRRegClassID,
+    MI.addOperand(MCOperand::CreateReg(getRegisterEnum(B, ARM::GPRRegClassID,
                                                         decodeRd(insn)+1)));
      ++OpIdx;
    }
  
    // Finally add the pointer operand.
-  MI.addOperand(MCOperand::CreateReg(getRegisterEnum(ARM::GPRRegClassID,
+  MI.addOperand(MCOperand::CreateReg(getRegisterEnum(B, ARM::GPRRegClassID,
                                                       decodeRn(insn))));
    ++OpIdx;
  
@@ -1443,7 +1337,7 @@ static bool DisassembleLdStExFrm(MCInst &MI, unsigned Opcode, uint32_t insn,
  // PKHBT, PKHTB: Rd Rn Rm , LSL/ASR #imm5
  // RBIT, REV, REV16, REVSH: Rd Rm
  static bool DisassembleArithMiscFrm(MCInst &MI, unsigned Opcode, uint32_t insn,
-    unsigned short NumOps, unsigned &NumOpsAdded) {
+    unsigned short NumOps, unsigned &NumOpsAdded, BO B) {
  
    const TargetOperandInfo *OpInfo = ARMInsts[Opcode].OpInfo;
    unsigned &OpIdx = NumOpsAdded;
@@ -1452,44 +1346,87 @@ static bool DisassembleArithMiscFrm(MCInst &MI, unsigned Opcode, uint32_t insn,
  
    assert(NumOps >= 2
           && OpInfo[0].RegClass == ARM::GPRRegClassID
-         && OpInfo[1].RegClass == ARM::GPRRegClassID);
+         && OpInfo[1].RegClass == ARM::GPRRegClassID
+         && "Expect 2 reg operands");
  
    bool ThreeReg = NumOps > 2 && OpInfo[2].RegClass == ARM::GPRRegClassID;
  
-  MI.addOperand(MCOperand::CreateReg(getRegisterEnum(ARM::GPRRegClassID,
+  MI.addOperand(MCOperand::CreateReg(getRegisterEnum(B, ARM::GPRRegClassID,
                                                       decodeRd(insn))));
    ++OpIdx;
  
    if (ThreeReg) {
-    assert(NumOps >= 4);
-    MI.addOperand(MCOperand::CreateReg(getRegisterEnum(ARM::GPRRegClassID,
+    assert(NumOps >= 4 && "Expect >= 4 operands");
+    MI.addOperand(MCOperand::CreateReg(getRegisterEnum(B, ARM::GPRRegClassID,
                                                         decodeRn(insn))));
      ++OpIdx;
    }
  
-  MI.addOperand(MCOperand::CreateReg(getRegisterEnum(ARM::GPRRegClassID,
+  MI.addOperand(MCOperand::CreateReg(getRegisterEnum(B, ARM::GPRRegClassID,
                                                       decodeRm(insn))));
    ++OpIdx;
  
    // If there is still an operand info left which is an immediate operand, add
    // an additional imm5 LSL/ASR operand.
-  if (ThreeReg && OpInfo[OpIdx].RegClass == 0
+  if (ThreeReg && OpInfo[OpIdx].RegClass < 0
        && !OpInfo[OpIdx].isPredicate() && !OpInfo[OpIdx].isOptionalDef()) {
      // Extract the 5-bit immediate field Inst{11-7}.
      unsigned ShiftAmt = (insn >> ARMII::ShiftShift) & 0x1F;
-    MI.addOperand(MCOperand::CreateImm(ShiftAmt));
+    ARM_AM::ShiftOpc Opc = ARM_AM::no_shift;
+    if (Opcode == ARM::PKHBT)
+      Opc = ARM_AM::lsl;
+    else if (Opcode == ARM::PKHBT)
+      Opc = ARM_AM::asr;
+    getImmShiftSE(Opc, ShiftAmt);
+    MI.addOperand(MCOperand::CreateImm(ARM_AM::getSORegOpc(Opc, ShiftAmt)));
      ++OpIdx;
    }
  
    return true;
  }
  
+/// DisassembleSatFrm - Disassemble saturate instructions:
+/// SSAT, SSAT16, USAT, and USAT16.
+static bool DisassembleSatFrm(MCInst &MI, unsigned Opcode, uint32_t insn,
+    unsigned short NumOps, unsigned &NumOpsAdded, BO B) {
+
+  const TargetInstrDesc &TID = ARMInsts[Opcode];
+  NumOpsAdded = TID.getNumOperands() - 2; // ignore predicate operands
+
+  // Disassemble register def.
+  MI.addOperand(MCOperand::CreateReg(getRegisterEnum(B, ARM::GPRRegClassID,
+                                                     decodeRd(insn))));
+
+  unsigned Pos = slice(insn, 20, 16);
+  if (Opcode == ARM::SSAT || Opcode == ARM::SSAT16)
+    Pos += 1;
+  MI.addOperand(MCOperand::CreateImm(Pos));
+
+  MI.addOperand(MCOperand::CreateReg(getRegisterEnum(B, ARM::GPRRegClassID,
+                                                     decodeRm(insn))));
+
+  if (NumOpsAdded == 4) {
+    ARM_AM::ShiftOpc Opc = (slice(insn, 6, 6) != 0 ? ARM_AM::asr : ARM_AM::lsl);
+    // Inst{11-7} encodes the imm5 shift amount.
+    unsigned ShAmt = slice(insn, 11, 7);
+    if (ShAmt == 0) {
+      // A8.6.183.  Possible ASR shift amount of 32...
+      if (Opc == ARM_AM::asr)
+        ShAmt = 32;
+      else
+        Opc = ARM_AM::no_shift;
+    }
+    MI.addOperand(MCOperand::CreateImm(ARM_AM::getSORegOpc(Opc, ShAmt)));
+  }
+  return true;
+}
+
  // Extend instructions.
  // SXT* and UXT*: Rd [Rn] Rm [rot_imm].
  // The 2nd operand register is Rn and the 3rd operand regsiter is Rm for the
  // three register operand form.  Otherwise, Rn=0b1111 and only Rm is used.
  static bool DisassembleExtFrm(MCInst &MI, unsigned Opcode, uint32_t insn,
-    unsigned short NumOps, unsigned &NumOpsAdded) {
+    unsigned short NumOps, unsigned &NumOpsAdded, BO B) {
  
    const TargetOperandInfo *OpInfo = ARMInsts[Opcode].OpInfo;
    unsigned &OpIdx = NumOpsAdded;
@@ -1498,27 +1435,28 @@ static bool DisassembleExtFrm(MCInst &MI, unsigned Opcode, uint32_t insn,
  
    assert(NumOps >= 2
           && OpInfo[0].RegClass == ARM::GPRRegClassID
-         && OpInfo[1].RegClass == ARM::GPRRegClassID);
+         && OpInfo[1].RegClass == ARM::GPRRegClassID
+         && "Expect 2 reg operands");
  
    bool ThreeReg = NumOps > 2 && OpInfo[2].RegClass == ARM::GPRRegClassID;
  
-  MI.addOperand(MCOperand::CreateReg(getRegisterEnum(ARM::GPRRegClassID,
+  MI.addOperand(MCOperand::CreateReg(getRegisterEnum(B, ARM::GPRRegClassID,
                                                       decodeRd(insn))));
    ++OpIdx;
  
    if (ThreeReg) {
-    MI.addOperand(MCOperand::CreateReg(getRegisterEnum(ARM::GPRRegClassID,
+    MI.addOperand(MCOperand::CreateReg(getRegisterEnum(B, ARM::GPRRegClassID,
                                                         decodeRn(insn))));
      ++OpIdx;
    }
  
-  MI.addOperand(MCOperand::CreateReg(getRegisterEnum(ARM::GPRRegClassID,
+  MI.addOperand(MCOperand::CreateReg(getRegisterEnum(B, ARM::GPRRegClassID,
                                                       decodeRm(insn))));
    ++OpIdx;
  
    // If there is still an operand info left which is an immediate operand, add
    // an additional rotate immediate operand.
-  if (OpIdx < NumOps && OpInfo[OpIdx].RegClass == 0
+  if (OpIdx < NumOps && OpInfo[OpIdx].RegClass < 0
        && !OpInfo[OpIdx].isPredicate() && !OpInfo[OpIdx].isOptionalDef()) {
      // Extract the 2-bit rotate field Inst{11-10}.
      unsigned rot = (insn >> ARMII::ExtRotImmShift) & 3;
@@ -1564,8 +1502,7 @@ static unsigned decodeVFPRm(uint32_t insn, bool isSPVFP) {
  }
  
  // A7.5.1
-#if 0
-static uint64_t VFPExpandImm(unsigned char byte, unsigned N) {
+static APInt VFPExpandImm(unsigned char byte, unsigned N) {
    assert(N == 32 || N == 64);
  
    uint64_t Result;
@@ -1580,13 +1517,12 @@ static uint64_t VFPExpandImm(unsigned char byte, unsigned N) {
      Result = (uint64_t)slice(byte, 7, 7) << 63 |
               (uint64_t)slice(byte, 5, 0) << 48;
      if (bit6)
-      Result |= 0xffL << 54;
+      Result |= 0xffULL << 54;
      else
-      Result |= 0x1L << 62;
+      Result |= 0x1ULL << 62;
    }
-  return Result;
+  return APInt(N, Result);
  }
-#endif
  
  // VFP Unary Format Instructions:
  //
@@ -1594,7 +1530,7 @@ static uint64_t VFPExpandImm(unsigned char byte, unsigned N) {
  // VCVTDS, VCVTSD: converts between double-precision and single-precision
  // The rest of the instructions have homogeneous [VFP]Rd and [VFP]Rm registers.
  static bool DisassembleVFPUnaryFrm(MCInst &MI, unsigned Opcode, uint32_t insn,
-    unsigned short NumOps, unsigned &NumOpsAdded) {
+    unsigned short NumOps, unsigned &NumOpsAdded, BO B) {
  
    assert(NumOps >= 1 && "VFPUnaryFrm expects NumOps >= 1");
  
@@ -1604,11 +1540,12 @@ static bool DisassembleVFPUnaryFrm(MCInst &MI, unsigned Opcode, uint32_t insn,
    OpIdx = 0;
  
    unsigned RegClass = OpInfo[OpIdx].RegClass;
-  assert(RegClass == ARM::SPRRegClassID || RegClass == ARM::DPRRegClassID);
+  assert((RegClass == ARM::SPRRegClassID || RegClass == ARM::DPRRegClassID) &&
+         "Reg operand expected");
    bool isSP = (RegClass == ARM::SPRRegClassID);
  
    MI.addOperand(MCOperand::CreateReg(
-                  getRegisterEnum(RegClass, decodeVFPRd(insn, isSP))));
+                  getRegisterEnum(B, RegClass, decodeVFPRd(insn, isSP))));
    ++OpIdx;
  
    // Early return for compare with zero instructions.
@@ -1617,11 +1554,12 @@ static bool DisassembleVFPUnaryFrm(MCInst &MI, unsigned Opcode, uint32_t insn,
      return true;
  
    RegClass = OpInfo[OpIdx].RegClass;
-  assert(RegClass == ARM::SPRRegClassID || RegClass == ARM::DPRRegClassID);
+  assert((RegClass == ARM::SPRRegClassID || RegClass == ARM::DPRRegClassID) &&
+         "Reg operand expected");
    isSP = (RegClass == ARM::SPRRegClassID);
  
    MI.addOperand(MCOperand::CreateReg(
-                  getRegisterEnum(RegClass, decodeVFPRm(insn, isSP))));
+                  getRegisterEnum(B, RegClass, decodeVFPRm(insn, isSP))));
    ++OpIdx;
  
    return true;
@@ -1632,7 +1570,7 @@ static bool DisassembleVFPUnaryFrm(MCInst &MI, unsigned Opcode, uint32_t insn,
  // InOperandList to that of the dst.  As far as asm printing is concerned, this
  // tied_to operand is simply skipped.
  static bool DisassembleVFPBinaryFrm(MCInst &MI, unsigned Opcode, uint32_t insn,
-    unsigned short NumOps, unsigned &NumOpsAdded) {
+    unsigned short NumOps, unsigned &NumOpsAdded, BO B) {
  
    assert(NumOps >= 3 && "VFPBinaryFrm expects NumOps >= 3");
  
@@ -1643,26 +1581,27 @@ static bool DisassembleVFPBinaryFrm(MCInst &MI, unsigned Opcode, uint32_t insn,
    OpIdx = 0;
  
    unsigned RegClass = OpInfo[OpIdx].RegClass;
-  assert(RegClass == ARM::SPRRegClassID || RegClass == ARM::DPRRegClassID);
+  assert((RegClass == ARM::SPRRegClassID || RegClass == ARM::DPRRegClassID) &&
+         "Reg operand expected");
    bool isSP = (RegClass == ARM::SPRRegClassID);
  
    MI.addOperand(MCOperand::CreateReg(
-                  getRegisterEnum(RegClass, decodeVFPRd(insn, isSP))));
+                  getRegisterEnum(B, RegClass, decodeVFPRd(insn, isSP))));
    ++OpIdx;
  
    // Skip tied_to operand constraint.
    if (TID.getOperandConstraint(OpIdx, TOI::TIED_TO) != -1) {
-    assert(NumOps >= 4);
+    assert(NumOps >= 4 && "Expect >=4 operands");
      MI.addOperand(MCOperand::CreateReg(0));
      ++OpIdx;
    }
  
    MI.addOperand(MCOperand::CreateReg(
-                  getRegisterEnum(RegClass, decodeVFPRn(insn, isSP))));
+                  getRegisterEnum(B, RegClass, decodeVFPRn(insn, isSP))));
    ++OpIdx;
  
    MI.addOperand(MCOperand::CreateReg(
-                  getRegisterEnum(RegClass, decodeVFPRm(insn, isSP))));
+                  getRegisterEnum(B, RegClass, decodeVFPRm(insn, isSP))));
    ++OpIdx;
  
    return true;
@@ -1675,12 +1614,13 @@ static bool DisassembleVFPBinaryFrm(MCInst &MI, unsigned Opcode, uint32_t insn,
  // A8.6.297 vcvt (floating-point and fixed-point)
  // Dd|Sd Dd|Sd(TIED_TO) #fbits(= 16|32 - UInt(imm4:i))
  static bool DisassembleVFPConv1Frm(MCInst &MI, unsigned Opcode, uint32_t insn,
-    unsigned short NumOps, unsigned &NumOpsAdded) {
+    unsigned short NumOps, unsigned &NumOpsAdded, BO B) {
  
    assert(NumOps >= 2 && "VFPConv1Frm expects NumOps >= 2");
  
    const TargetInstrDesc &TID = ARMInsts[Opcode];
    const TargetOperandInfo *OpInfo = TID.OpInfo;
+  if (!OpInfo) return false;
  
    bool SP = slice(insn, 8, 8) == 0; // A8.6.295 & A8.6.297
    bool fixed_point = slice(insn, 17, 17) == 1; // A8.6.297
@@ -1688,18 +1628,19 @@ static bool DisassembleVFPConv1Frm(MCInst &MI, unsigned Opcode, uint32_t insn,
  
    if (fixed_point) {
      // A8.6.297
-    assert(NumOps >= 3);
+    assert(NumOps >= 3 && "Expect >= 3 operands");
      int size = slice(insn, 7, 7) == 0 ? 16 : 32;
      int fbits = size - (slice(insn,3,0) << 1 | slice(insn,5,5));
      MI.addOperand(MCOperand::CreateReg(
-                    getRegisterEnum(RegClassID,
+                    getRegisterEnum(B, RegClassID,
                                      decodeVFPRd(insn, SP))));
  
-    assert(TID.getOperandConstraint(1, TOI::TIED_TO) != -1);
+    assert(TID.getOperandConstraint(1, TOI::TIED_TO) != -1 &&
+           "Tied to operand expected");
      MI.addOperand(MI.getOperand(0));
  
-    assert(OpInfo[2].RegClass == 0 && !OpInfo[2].isPredicate() &&
-           !OpInfo[2].isOptionalDef());
+    assert(OpInfo[2].RegClass < 0 && !OpInfo[2].isPredicate() &&
+           !OpInfo[2].isOptionalDef() && "Imm operand expected");
      MI.addOperand(MCOperand::CreateImm(fbits));
  
      NumOpsAdded = 3;
@@ -1711,15 +1652,15 @@ static bool DisassembleVFPConv1Frm(MCInst &MI, unsigned Opcode, uint32_t insn,
      if (slice(insn, 18, 18) == 1) { // to_integer operation
        d = decodeVFPRd(insn, true /* Is Single Precision */);
        MI.addOperand(MCOperand::CreateReg(
-                      getRegisterEnum(ARM::SPRRegClassID, d)));
+                      getRegisterEnum(B, ARM::SPRRegClassID, d)));
        m = decodeVFPRm(insn, SP);
-      MI.addOperand(MCOperand::CreateReg(getRegisterEnum(RegClassID, m)));
+      MI.addOperand(MCOperand::CreateReg(getRegisterEnum(B, RegClassID, m)));
      } else {
        d = decodeVFPRd(insn, SP);
-      MI.addOperand(MCOperand::CreateReg(getRegisterEnum(RegClassID, d)));
+      MI.addOperand(MCOperand::CreateReg(getRegisterEnum(B, RegClassID, d)));
        m = decodeVFPRm(insn, true /* Is Single Precision */);
        MI.addOperand(MCOperand::CreateReg(
-                      getRegisterEnum(ARM::SPRRegClassID, m)));
+                      getRegisterEnum(B, ARM::SPRRegClassID, m)));
      }
      NumOpsAdded = 2;
    }
@@ -1730,13 +1671,13 @@ static bool DisassembleVFPConv1Frm(MCInst &MI, unsigned Opcode, uint32_t insn,
  // VMOVRS - A8.6.330
  // Rt => Rd; Sn => UInt(Vn:N)
  static bool DisassembleVFPConv2Frm(MCInst &MI, unsigned Opcode, uint32_t insn,
-    unsigned short NumOps, unsigned &NumOpsAdded) {
+    unsigned short NumOps, unsigned &NumOpsAdded, BO B) {
  
    assert(NumOps >= 2 && "VFPConv2Frm expects NumOps >= 2");
  
-  MI.addOperand(MCOperand::CreateReg(getRegisterEnum(ARM::GPRRegClassID,
+  MI.addOperand(MCOperand::CreateReg(getRegisterEnum(B, ARM::GPRRegClassID,
                                                       decodeRd(insn))));
-  MI.addOperand(MCOperand::CreateReg(getRegisterEnum(ARM::SPRRegClassID,
+  MI.addOperand(MCOperand::CreateReg(getRegisterEnum(B, ARM::SPRRegClassID,
                                                       decodeVFPRn(insn, true))));
    NumOpsAdded = 2;
    return true;
@@ -1748,29 +1689,29 @@ static bool DisassembleVFPConv2Frm(MCInst &MI, unsigned Opcode, uint32_t insn,
  // VMOVRRS - A8.6.331
  // Rt => Rd; Rt2 => Rn; Sm => UInt(Vm:M); Sm1 = Sm+1
  static bool DisassembleVFPConv3Frm(MCInst &MI, unsigned Opcode, uint32_t insn,
-    unsigned short NumOps, unsigned &NumOpsAdded) {
+    unsigned short NumOps, unsigned &NumOpsAdded, BO B) {
  
    assert(NumOps >= 3 && "VFPConv3Frm expects NumOps >= 3");
  
    const TargetOperandInfo *OpInfo = ARMInsts[Opcode].OpInfo;
    unsigned &OpIdx = NumOpsAdded;
  
-  MI.addOperand(MCOperand::CreateReg(getRegisterEnum(ARM::GPRRegClassID,
+  MI.addOperand(MCOperand::CreateReg(getRegisterEnum(B, ARM::GPRRegClassID,
                                                       decodeRd(insn))));
-  MI.addOperand(MCOperand::CreateReg(getRegisterEnum(ARM::GPRRegClassID,
+  MI.addOperand(MCOperand::CreateReg(getRegisterEnum(B, ARM::GPRRegClassID,
                                                       decodeRn(insn))));
    OpIdx = 2;
  
    if (OpInfo[OpIdx].RegClass == ARM::SPRRegClassID) {
      unsigned Sm = decodeVFPRm(insn, true);
-    MI.addOperand(MCOperand::CreateReg(getRegisterEnum(ARM::SPRRegClassID,
+    MI.addOperand(MCOperand::CreateReg(getRegisterEnum(B, ARM::SPRRegClassID,
                                                         Sm)));
-    MI.addOperand(MCOperand::CreateReg(getRegisterEnum(ARM::SPRRegClassID,
+    MI.addOperand(MCOperand::CreateReg(getRegisterEnum(B, ARM::SPRRegClassID,
                                                         Sm+1)));
      OpIdx += 2;
    } else {
      MI.addOperand(MCOperand::CreateReg(
-                    getRegisterEnum(ARM::DPRRegClassID,
+                    getRegisterEnum(B, ARM::DPRRegClassID,
                                      decodeVFPRm(insn, false))));
      ++OpIdx;
    }
@@ -1780,13 +1721,13 @@ static bool DisassembleVFPConv3Frm(MCInst &MI, unsigned Opcode, uint32_t insn,
  // VMOVSR - A8.6.330
  // Rt => Rd; Sn => UInt(Vn:N)
  static bool DisassembleVFPConv4Frm(MCInst &MI, unsigned Opcode, uint32_t insn,
-    unsigned short NumOps, unsigned &NumOpsAdded) {
+    unsigned short NumOps, unsigned &NumOpsAdded, BO B) {
  
    assert(NumOps >= 2 && "VFPConv4Frm expects NumOps >= 2");
  
-  MI.addOperand(MCOperand::CreateReg(getRegisterEnum(ARM::SPRRegClassID,
+  MI.addOperand(MCOperand::CreateReg(getRegisterEnum(B, ARM::SPRRegClassID,
                                                       decodeVFPRn(insn, true))));
-  MI.addOperand(MCOperand::CreateReg(getRegisterEnum(ARM::GPRRegClassID,
+  MI.addOperand(MCOperand::CreateReg(getRegisterEnum(B, ARM::GPRRegClassID,
                                                       decodeRd(insn))));
    NumOpsAdded = 2;
    return true;
@@ -1798,7 +1739,7 @@ static bool DisassembleVFPConv4Frm(MCInst &MI, unsigned Opcode, uint32_t insn,
  // VMOVRRS - A8.6.331
  // Rt => Rd; Rt2 => Rn; Sm => UInt(Vm:M); Sm1 = Sm+1
  static bool DisassembleVFPConv5Frm(MCInst &MI, unsigned Opcode, uint32_t insn,
-    unsigned short NumOps, unsigned &NumOpsAdded) {
+    unsigned short NumOps, unsigned &NumOpsAdded, BO B) {
  
    assert(NumOps >= 3 && "VFPConv5Frm expects NumOps >= 3");
  
@@ -1809,21 +1750,21 @@ static bool DisassembleVFPConv5Frm(MCInst &MI, unsigned Opcode, uint32_t insn,
  
    if (OpInfo[OpIdx].RegClass == ARM::SPRRegClassID) {
      unsigned Sm = decodeVFPRm(insn, true);
-    MI.addOperand(MCOperand::CreateReg(getRegisterEnum(ARM::SPRRegClassID,
+    MI.addOperand(MCOperand::CreateReg(getRegisterEnum(B, ARM::SPRRegClassID,
                                                         Sm)));
-    MI.addOperand(MCOperand::CreateReg(getRegisterEnum(ARM::SPRRegClassID,
+    MI.addOperand(MCOperand::CreateReg(getRegisterEnum(B, ARM::SPRRegClassID,
                                                         Sm+1)));
      OpIdx += 2;
    } else {
      MI.addOperand(MCOperand::CreateReg(
-                    getRegisterEnum(ARM::DPRRegClassID,
+                    getRegisterEnum(B, ARM::DPRRegClassID,
                                      decodeVFPRm(insn, false))));
      ++OpIdx;
    }
  
-  MI.addOperand(MCOperand::CreateReg(getRegisterEnum(ARM::GPRRegClassID,
+  MI.addOperand(MCOperand::CreateReg(getRegisterEnum(B, ARM::GPRRegClassID,
                                                       decodeRd(insn))));
-  MI.addOperand(MCOperand::CreateReg(getRegisterEnum(ARM::GPRRegClassID,
+  MI.addOperand(MCOperand::CreateReg(getRegisterEnum(B, ARM::GPRRegClassID,
                                                       decodeRn(insn))));
    OpIdx += 2;
    return true;
@@ -1832,19 +1773,19 @@ static bool DisassembleVFPConv5Frm(MCInst &MI, unsigned Opcode, uint32_t insn,
  // VFP Load/Store Instructions.
  // VLDRD, VLDRS, VSTRD, VSTRS
  static bool DisassembleVFPLdStFrm(MCInst &MI, unsigned Opcode, uint32_t insn,
-    unsigned short NumOps, unsigned &NumOpsAdded) {
+    unsigned short NumOps, unsigned &NumOpsAdded, BO B) {
  
    assert(NumOps >= 3 && "VFPLdStFrm expects NumOps >= 3");
  
-  bool isSPVFP = (Opcode == ARM::VLDRS || Opcode == ARM::VSTRS) ? true : false;
+  bool isSPVFP = (Opcode == ARM::VLDRS || Opcode == ARM::VSTRS);
    unsigned RegClassID = isSPVFP ? ARM::SPRRegClassID : ARM::DPRRegClassID;
  
    // Extract Dd/Sd for operand 0.
    unsigned RegD = decodeVFPRd(insn, isSPVFP);
  
-  MI.addOperand(MCOperand::CreateReg(getRegisterEnum(RegClassID, RegD)));
+  MI.addOperand(MCOperand::CreateReg(getRegisterEnum(B, RegClassID, RegD)));
  
-  unsigned Base = getRegisterEnum(ARM::GPRRegClassID, decodeRn(insn));
+  unsigned Base = getRegisterEnum(B, ARM::GPRRegClassID, decodeRn(insn));
    MI.addOperand(MCOperand::CreateReg(Base));
  
    // Next comes the AM5 Opcode.
@@ -1858,44 +1799,58 @@ static bool DisassembleVFPLdStFrm(MCInst &MI, unsigned Opcode, uint32_t insn,
  }
  
  // VFP Load/Store Multiple Instructions.
-// This is similar to the algorithm for LDM/STM in that operand 0 (the base) and
-// operand 1 (the AM5 mode imm) is followed by two predicate operands.  It is
-// followed by a reglist of either DPR(s) or SPR(s).
+// We have an optional write back reg, the base, and two predicate operands.
+// It is then followed by a reglist of either DPR(s) or SPR(s).
  //
-// VLDMD, VLDMS, VSTMD, VSTMS
+// VLDMD[_UPD], VLDMS[_UPD], VSTMD[_UPD], VSTMS[_UPD]
  static bool DisassembleVFPLdStMulFrm(MCInst &MI, unsigned Opcode, uint32_t insn,
-    unsigned short NumOps, unsigned &NumOpsAdded) {
+    unsigned short NumOps, unsigned &NumOpsAdded, BO B) {
  
-  assert(NumOps == 5 && "VFPLdStMulFrm expects NumOps of 5");
+  assert(NumOps >= 4 && "VFPLdStMulFrm expects NumOps >= 4");
  
    unsigned &OpIdx = NumOpsAdded;
  
-  unsigned Base = getRegisterEnum(ARM::GPRRegClassID, decodeRn(insn));
-  MI.addOperand(MCOperand::CreateReg(Base));
+  OpIdx = 0;
  
-  // Next comes the AM5 Opcode.
-  ARM_AM::AMSubMode SubMode = getAMSubModeForBits(getPUBits(insn));
-  bool WB = getWBit(insn) == 1;
-  unsigned char Imm8 = insn & 0xFF;
-  MI.addOperand(MCOperand::CreateImm(ARM_AM::getAM5Opc(SubMode, WB, Imm8)));
+  unsigned Base = getRegisterEnum(B, ARM::GPRRegClassID, decodeRn(insn));
+
+  // Writeback to base, if necessary.
+  if (Opcode == ARM::VLDMDIA_UPD || Opcode == ARM::VLDMSIA_UPD ||
+      Opcode == ARM::VLDMDDB_UPD || Opcode == ARM::VLDMSDB_UPD ||
+      Opcode == ARM::VSTMDIA_UPD || Opcode == ARM::VSTMSIA_UPD ||
+      Opcode == ARM::VSTMDDB_UPD || Opcode == ARM::VSTMSDB_UPD) {
+    MI.addOperand(MCOperand::CreateReg(Base));
+    ++OpIdx;
+  }
+
+  MI.addOperand(MCOperand::CreateReg(Base));
  
    // Handling the two predicate operands before the reglist.
    int64_t CondVal = insn >> ARMII::CondShift;
    MI.addOperand(MCOperand::CreateImm(CondVal == 0xF ? 0xE : CondVal));
    MI.addOperand(MCOperand::CreateReg(ARM::CPSR));
  
-  OpIdx = 4;
+  OpIdx += 3;
  
-  bool isSPVFP = (Opcode == ARM::VLDMS || Opcode == ARM::VSTMS) ? true : false;
+  bool isSPVFP = (Opcode == ARM::VLDMSIA     || Opcode == ARM::VLDMSDB     ||
+                  Opcode == ARM::VLDMSIA_UPD || Opcode == ARM::VLDMSDB_UPD ||
+                  Opcode == ARM::VSTMSIA     || Opcode == ARM::VSTMSDB     ||
+                  Opcode == ARM::VSTMSIA_UPD || Opcode == ARM::VSTMSDB_UPD);
    unsigned RegClassID = isSPVFP ? ARM::SPRRegClassID : ARM::DPRRegClassID;
  
    // Extract Dd/Sd.
    unsigned RegD = decodeVFPRd(insn, isSPVFP);
  
    // Fill the variadic part of reglist.
+  unsigned char Imm8 = insn & 0xFF;
    unsigned Regs = isSPVFP ? Imm8 : Imm8/2;
+
+  // Apply some sanity checks before proceeding.
+  if (Regs == 0 || (RegD + Regs) > 32 || (!isSPVFP && Regs > 16))
+    return false;
+  
    for (unsigned i = 0; i < Regs; ++i) {
-    MI.addOperand(MCOperand::CreateReg(getRegisterEnum(RegClassID,
+    MI.addOperand(MCOperand::CreateReg(getRegisterEnum(B, RegClassID,
                                                         RegD + i)));
      ++OpIdx;
    }
@@ -1909,7 +1864,7 @@ static bool DisassembleVFPLdStMulFrm(MCInst &MI, unsigned Opcode, uint32_t insn,
  // FCONSTS (SPR and a VFPf32Imm operand)
  // VMRS/VMSR (GPR operand)
  static bool DisassembleVFPMiscFrm(MCInst &MI, unsigned Opcode, uint32_t insn,
-    unsigned short NumOps, unsigned &NumOpsAdded) {
+    unsigned short NumOps, unsigned &NumOpsAdded, BO B) {
  
    const TargetOperandInfo *OpInfo = ARMInsts[Opcode].OpInfo;
    unsigned &OpIdx = NumOpsAdded;
@@ -1919,41 +1874,46 @@ static bool DisassembleVFPMiscFrm(MCInst &MI, unsigned Opcode, uint32_t insn,
    if (Opcode == ARM::FMSTAT)
      return true;
  
-  assert(NumOps >= 2);
+  assert(NumOps >= 2 && "VFPMiscFrm expects >=2 operands");
  
    unsigned RegEnum = 0;
    switch (OpInfo[0].RegClass) {
    case ARM::DPRRegClassID:
-    RegEnum = getRegisterEnum(ARM::DPRRegClassID, decodeVFPRd(insn, false));
+    RegEnum = getRegisterEnum(B, ARM::DPRRegClassID, decodeVFPRd(insn, false));
      break;
    case ARM::SPRRegClassID:
-    RegEnum = getRegisterEnum(ARM::SPRRegClassID, decodeVFPRd(insn, true));
+    RegEnum = getRegisterEnum(B, ARM::SPRRegClassID, decodeVFPRd(insn, true));
      break;
    case ARM::GPRRegClassID:
-    RegEnum = getRegisterEnum(ARM::GPRRegClassID, decodeRd(insn));
+    RegEnum = getRegisterEnum(B, ARM::GPRRegClassID, decodeRd(insn));
      break;
    default:
-    llvm_unreachable("Invalid reg class id");
+    assert(0 && "Invalid reg class id");
+    return false;
    }
  
    MI.addOperand(MCOperand::CreateReg(RegEnum));
    ++OpIdx;
  
    // Extract/decode the f64/f32 immediate.
-  if (OpIdx < NumOps && OpInfo[OpIdx].RegClass == 0
+  if (OpIdx < NumOps && OpInfo[OpIdx].RegClass < 0
          && !OpInfo[OpIdx].isPredicate() && !OpInfo[OpIdx].isOptionalDef()) {
-    // The asm syntax specifies the before-expanded <imm>.
-    // Not VFPExpandImm(slice(insn,19,16) << 4 | slice(insn, 3, 0),
-    //                  Opcode == ARM::FCONSTD ? 64 : 32)
-    MI.addOperand(MCOperand::CreateImm(slice(insn,19,16)<<4 | slice(insn,3,0)));
+    // The asm syntax specifies the floating point value, not the 8-bit literal.
+    APInt immRaw = VFPExpandImm(slice(insn,19,16) << 4 | slice(insn, 3, 0),
+                             Opcode == ARM::FCONSTD ? 64 : 32);
+    APFloat immFP = APFloat(immRaw, true);
+    double imm = Opcode == ARM::FCONSTD ? immFP.convertToDouble() :
+      immFP.convertToFloat();
+    MI.addOperand(MCOperand::CreateFPImm(imm));
+
      ++OpIdx;
    }
  
    return true;
  }
  
-// DisassembleThumbFrm() is defined in ThumbDisassemblerCore.cpp.inc file.
-#include "ThumbDisassemblerCore.cpp.inc"
+// DisassembleThumbFrm() is defined in ThumbDisassemblerCore.h file.
+#include "ThumbDisassemblerCore.h"
  
  /////////////////////////////////////////////////////
  //                                                 //
@@ -1974,7 +1934,7 @@ static bool DisassembleVFPMiscFrm(MCInst &MI, unsigned Opcode, uint32_t insn,
  // D = Inst{22}, Vd = Inst{15-12}
  static unsigned decodeNEONRd(uint32_t insn) {
    return ((insn >> ARMII::NEON_D_BitShift) & 1) << 4
-    | (insn >> ARMII::NEON_RegRdShift) & ARMII::NEONRegMask;
+    | ((insn >> ARMII::NEON_RegRdShift) & ARMII::NEONRegMask);
  }
  
  // Extract/Decode NEON N/Vn:
@@ -1985,7 +1945,7 @@ static unsigned decodeNEONRd(uint32_t insn) {
  // N = Inst{7}, Vn = Inst{19-16}
  static unsigned decodeNEONRn(uint32_t insn) {
    return ((insn >> ARMII::NEON_N_BitShift) & 1) << 4
-    | (insn >> ARMII::NEON_RegRnShift) & ARMII::NEONRegMask;
+    | ((insn >> ARMII::NEON_RegRnShift) & ARMII::NEONRegMask);
  }
  
  // Extract/Decode NEON M/Vm:
@@ -1996,7 +1956,7 @@ static unsigned decodeNEONRn(uint32_t insn) {
  // M = Inst{5}, Vm = Inst{3-0}
  static unsigned decodeNEONRm(uint32_t insn) {
    return ((insn >> ARMII::NEON_M_BitShift) & 1) << 4
-    | (insn >> ARMII::NEON_RegRmShift) & ARMII::NEONRegMask;
+    | ((insn >> ARMII::NEON_RegRmShift) & ARMII::NEONRegMask);
  }
  
  namespace {
@@ -2020,7 +1980,8 @@ enum ElemSize {
  // Ref: A8.6.317 VLD4 (single 4-element structure to one lane).
  static unsigned decodeLaneIndex(uint32_t insn) {
    unsigned size = insn >> 10 & 3;
-  assert(size == 0 || size == 1 || size == 2);
+  assert((size == 0 || size == 1 || size == 2) &&
+         "Encoding error: size should be either 0, 1, or 2");
  
    unsigned index_align = insn >> 4 & 0xF;
    return (index_align >> 1) >> size;
@@ -2032,42 +1993,12 @@ static unsigned decodeLaneIndex(uint32_t insn) {
  // imm3 = Inst{18-16}, imm4 = Inst{3-0}
  // Ref: Table A7-15 Modified immediate values for Advanced SIMD instructions.
  static uint64_t decodeN1VImm(uint32_t insn, ElemSize esize) {
+  unsigned char op = (insn >> 5) & 1;
    unsigned char cmode = (insn >> 8) & 0xF;
    unsigned char Imm8 = ((insn >> 24) & 1) << 7 |
                         ((insn >> 16) & 7) << 4 |
                         (insn & 0xF);
-  uint64_t Imm64 = 0;
-
-  switch (esize) {
-  case ESize8:
-    Imm64 = Imm8;
-    break;
-  case ESize16:
-    Imm64 = Imm8 << 8*(cmode >> 1 & 1);
-    break;
-  case ESize32: {
-    if (cmode == 12)
-      Imm64 = (Imm8 << 8) | 0xFF;
-    else if (cmode == 13)
-      Imm64 = (Imm8 << 16) | 0xFFFF;
-    else {
-      // Imm8 to be shifted left by how many bytes...
-      Imm64 = Imm8 << 8*(cmode >> 1 & 3);
-    }
-    break;
-  }
-  case ESize64: {
-    for (unsigned i = 0; i < 8; ++i)
-      if ((Imm8 >> i) & 1)
-        Imm64 |= 0xFF << 8*i;
-    break;
-  }
-  default:
-    assert(0 && "Unreachable code!");
-    return 0;
-  }
-
-  return Imm64;
+  return (op << 12) | (cmode << 8) | Imm8;
  }
  
  // A8.6.339 VMUL, VMULL (by scalar)
@@ -2145,21 +2076,21 @@ static unsigned decodeNVLaneOpIndex(uint32_t insn, ElemSize esize) {
  
  // Imm6 = Inst{21-16}, L = Inst{7}
  //
-// NormalShift == true (A8.6.376 VRSHR, A8.6.368 VQSHRN):
-// case L:imm6 of
-//   '0001xxx' => esize = 8; shift_amount = 16 - imm6
-//   '001xxxx' => esize = 16; shift_amount = 32 - imm6
-//   '01xxxxx' => esize = 32; shift_amount = 64 - imm6
-//   '1xxxxxx' => esize = 64; shift_amount = 64 - imm6
-//
-// NormalShift == false (A8.6.367 VQSHL, A8.6.387 VSLI):
+// LeftShift == true (A8.6.367 VQSHL, A8.6.387 VSLI):
  // case L:imm6 of
  //   '0001xxx' => esize = 8; shift_amount = imm6 - 8
  //   '001xxxx' => esize = 16; shift_amount = imm6 - 16
  //   '01xxxxx' => esize = 32; shift_amount = imm6 - 32
  //   '1xxxxxx' => esize = 64; shift_amount = imm6
  //
-static unsigned decodeNVSAmt(uint32_t insn, bool NormalShift) {
+// LeftShift == false (A8.6.376 VRSHR, A8.6.368 VQSHRN):
+// case L:imm6 of
+//   '0001xxx' => esize = 8; shift_amount = 16 - imm6
+//   '001xxxx' => esize = 16; shift_amount = 32 - imm6
+//   '01xxxxx' => esize = 32; shift_amount = 64 - imm6
+//   '1xxxxxx' => esize = 64; shift_amount = 64 - imm6
+//
+static unsigned decodeNVSAmt(uint32_t insn, bool LeftShift) {
    ElemSize esize = ESizeNA;
    unsigned L = (insn >> 7) & 1;
    unsigned imm6 = (insn >> 16) & 0x3F;
@@ -2175,10 +2106,10 @@ static unsigned decodeNVSAmt(uint32_t insn, bool NormalShift) {
    } else
      esize = ESize64;
  
-  if (NormalShift)
-    return esize == ESize64 ? (esize - imm6) : (2*esize - imm6);
-  else
+  if (LeftShift)
      return esize == ESize64 ? imm6 : (imm6 - esize);
+  else
+    return esize == ESize64 ? (esize - imm6) : (2*esize - imm6);
  }
  
  // A8.6.305 VEXT
@@ -2187,30 +2118,25 @@ static unsigned decodeN3VImm(uint32_t insn) {
    return (insn >> 8) & 0xF;
  }
  
-static bool DisassembleNSFormatNone(MCInst &MI, unsigned Opcode, uint32_t insn,
-    unsigned short NumOps, unsigned &NumOpsAdded) {
-  assert(0 && "Unexpected NEON Sub-Format of NSFormatNone");
-  return false;
-}
-
  // VLD*
-//   D[d] D[d2] ... R[addr] [TIED_TO] R[update] AM6 align(ignored)
+//   D[d] D[d2] ... Rn [TIED_TO Rn] align [Rm]
  // VLD*LN*
-//   D[d] D[d2] ... R[addr] R[update] AM6 align(ignored) TIED_TO ... imm(idx)
+//   D[d] D[d2] ... Rn [TIED_TO Rn] align [Rm] TIED_TO ... imm(idx)
  // VST*
-//   R[addr] [TIED_TO] R[update] AM6 align(ignored) D[d] D[d2] ...
+//   Rn [TIED_TO Rn] align [Rm] D[d] D[d2] ...
  // VST*LN*
-//   R[addr] R[update] AM6 align(ignored) D[d] D[d2] ... [imm(idx)]
+//   Rn [TIED_TO Rn] align [Rm] D[d] D[d2] ... [imm(idx)]
  //
  // Correctly set VLD*/VST*'s TIED_TO GPR, as the asm printer needs it.
-static bool DisassembleVLDSTLane0(MCInst &MI, unsigned Opcode, uint32_t insn,
-    unsigned short NumOps, unsigned &NumOpsAdded, bool Store, bool DblSpaced) {
+static bool DisassembleNLdSt0(MCInst &MI, unsigned Opcode, uint32_t insn,
+    unsigned short NumOps, unsigned &NumOpsAdded, bool Store, bool DblSpaced,
+    BO B) {
  
    const TargetInstrDesc &TID = ARMInsts[Opcode];
    const TargetOperandInfo *OpInfo = TID.OpInfo;
  
    // At least one DPR register plus addressing mode #6.
-  assert(NumOps >= 5);
+  assert(NumOps >= 3 && "Expect >= 3 operands");
  
    unsigned &OpIdx = NumOpsAdded;
  
@@ -2232,157 +2158,155 @@ static bool DisassembleVLDSTLane0(MCInst &MI, unsigned Opcode, uint32_t insn,
    // LLVM Addressing Mode #6.
    unsigned RmEnum = 0;
    if (WB && Rm != 13)
-    RmEnum = getRegisterEnum(ARM::GPRRegClassID, Rm);
+    RmEnum = getRegisterEnum(B, ARM::GPRRegClassID, Rm);
  
    if (Store) {
-    // Consume AddrMode6 (possible TIED_TO Rn), the DPR/QPR's, then possible
-    // lane index.
-    assert(OpIdx < NumOps && OpInfo[0].RegClass == ARM::GPRRegClassID);
-    MI.addOperand(MCOperand::CreateReg(getRegisterEnum(ARM::GPRRegClassID,
-                                                       Rn)));
-    ++OpIdx;
-    if (TID.getOperandConstraint(OpIdx, TOI::TIED_TO) != -1) {
-      // TIED_TO operand.
-      MI.addOperand(MCOperand::CreateReg(getRegisterEnum(ARM::GPRRegClassID,
+    // Consume possible WB, AddrMode6, possible increment reg, the DPR/QPR's,
+    // then possible lane index.
+    assert(OpIdx < NumOps && OpInfo[0].RegClass == ARM::GPRRegClassID &&
+           "Reg operand expected");
+
+    if (WB) {
+      MI.addOperand(MCOperand::CreateReg(getRegisterEnum(B, ARM::GPRRegClassID,
                                                           Rn)));
        ++OpIdx;
      }
  
-    assert(OpIdx < NumOps && OpInfo[OpIdx].RegClass == ARM::GPRRegClassID);
-    MI.addOperand(MCOperand::CreateReg(RmEnum));
-    ++OpIdx;
-    assert(OpIdx < NumOps &&
-           OpInfo[OpIdx].RegClass == 0 && OpInfo[OpIdx+1].RegClass == 0);
-    MI.addOperand(MCOperand::CreateImm(ARM_AM::getAM6Opc(WB)));
+    assert((OpIdx+1) < NumOps && OpInfo[OpIdx].RegClass == ARM::GPRRegClassID &&
+           OpInfo[OpIdx + 1].RegClass < 0 && "Addrmode #6 Operands expected");
+    MI.addOperand(MCOperand::CreateReg(getRegisterEnum(B, ARM::GPRRegClassID,
+                                                       Rn)));
      MI.addOperand(MCOperand::CreateImm(0)); // Alignment ignored?
      OpIdx += 2;
  
+    if (WB) {
+      MI.addOperand(MCOperand::CreateReg(RmEnum));
+      ++OpIdx;
+    }
+
      assert(OpIdx < NumOps &&
             (OpInfo[OpIdx].RegClass == ARM::DPRRegClassID ||
-            OpInfo[OpIdx].RegClass == ARM::QPRRegClassID));
+            OpInfo[OpIdx].RegClass == ARM::QPRRegClassID) &&
+           "Reg operand expected");
  
      RegClass = OpInfo[OpIdx].RegClass;
-    while (OpIdx < NumOps && OpInfo[OpIdx].RegClass == RegClass) {
-      if (Opcode >= ARM::VST1q16 && Opcode <= ARM::VST1q8)
-        MI.addOperand(MCOperand::CreateReg(getRegisterEnum(RegClass,Rd,true)));
-      else
-        MI.addOperand(MCOperand::CreateReg(getRegisterEnum(RegClass,Rd)));
+    while (OpIdx < NumOps && (unsigned)OpInfo[OpIdx].RegClass == RegClass) {
+      MI.addOperand(MCOperand::CreateReg(
+                      getRegisterEnum(B, RegClass, Rd)));
        Rd += Inc;
        ++OpIdx;
      }
  
      // Handle possible lane index.
-    if (OpIdx < NumOps && OpInfo[OpIdx].RegClass == 0
+    if (OpIdx < NumOps && OpInfo[OpIdx].RegClass < 0
          && !OpInfo[OpIdx].isPredicate() && !OpInfo[OpIdx].isOptionalDef()) {
        MI.addOperand(MCOperand::CreateImm(decodeLaneIndex(insn)));
        ++OpIdx;
      }
  
    } else {
-    // Consume the DPR/QPR's, AddrMode6 (possible TIED_TO Rn), possible TIED_TO
-    // DPR/QPR's (ignored), then possible lane index.
+    // Consume the DPR/QPR's, possible WB, AddrMode6, possible incrment reg,
+    // possible TIED_TO DPR/QPR's (ignored), then possible lane index.
      RegClass = OpInfo[0].RegClass;
  
-    while (OpIdx < NumOps && OpInfo[OpIdx].RegClass == RegClass) {
-      if (Opcode >= ARM::VLD1q16 && Opcode <= ARM::VLD1q8)
-        MI.addOperand(MCOperand::CreateReg(getRegisterEnum(RegClass,Rd,true)));
-      else
-        MI.addOperand(MCOperand::CreateReg(getRegisterEnum(RegClass,Rd)));
+    while (OpIdx < NumOps && (unsigned)OpInfo[OpIdx].RegClass == RegClass) {
+      MI.addOperand(MCOperand::CreateReg(
+                      getRegisterEnum(B, RegClass, Rd)));
        Rd += Inc;
        ++OpIdx;
      }
  
-    assert(OpIdx < NumOps && OpInfo[OpIdx].RegClass == ARM::GPRRegClassID);
-    MI.addOperand(MCOperand::CreateReg(getRegisterEnum(ARM::GPRRegClassID,
-                                                       Rn)));
-    ++OpIdx;
-    if (TID.getOperandConstraint(OpIdx, TOI::TIED_TO) != -1) {
-      // TIED_TO operand.
-      MI.addOperand(MCOperand::CreateReg(getRegisterEnum(ARM::GPRRegClassID,
+    if (WB) {
+      MI.addOperand(MCOperand::CreateReg(getRegisterEnum(B, ARM::GPRRegClassID,
                                                           Rn)));
        ++OpIdx;
      }
  
-    assert(OpIdx < NumOps && OpInfo[OpIdx].RegClass == ARM::GPRRegClassID);
-    MI.addOperand(MCOperand::CreateReg(RmEnum));
-    ++OpIdx;
-    assert(OpIdx < NumOps &&
-           OpInfo[OpIdx].RegClass == 0 && OpInfo[OpIdx+1].RegClass == 0);
-    MI.addOperand(MCOperand::CreateImm(ARM_AM::getAM6Opc(WB)));
+    assert((OpIdx+1) < NumOps && OpInfo[OpIdx].RegClass == ARM::GPRRegClassID &&
+           OpInfo[OpIdx + 1].RegClass < 0 && "Addrmode #6 Operands expected");
+    MI.addOperand(MCOperand::CreateReg(getRegisterEnum(B, ARM::GPRRegClassID,
+                                                       Rn)));
      MI.addOperand(MCOperand::CreateImm(0)); // Alignment ignored?
      OpIdx += 2;
  
-    while (OpIdx < NumOps && OpInfo[OpIdx].RegClass == RegClass) {
-      assert(TID.getOperandConstraint(OpIdx, TOI::TIED_TO) != -1);
+    if (WB) {
+      MI.addOperand(MCOperand::CreateReg(RmEnum));
+      ++OpIdx;
+    }
+
+    while (OpIdx < NumOps && (unsigned)OpInfo[OpIdx].RegClass == RegClass) {
+      assert(TID.getOperandConstraint(OpIdx, TOI::TIED_TO) != -1 &&
+             "Tied to operand expected");
        MI.addOperand(MCOperand::CreateReg(0));
        ++OpIdx;
      }
  
      // Handle possible lane index.
-    if (OpIdx < NumOps && OpInfo[OpIdx].RegClass == 0
+    if (OpIdx < NumOps && OpInfo[OpIdx].RegClass < 0
          && !OpInfo[OpIdx].isPredicate() && !OpInfo[OpIdx].isOptionalDef()) {
        MI.addOperand(MCOperand::CreateImm(decodeLaneIndex(insn)));
        ++OpIdx;
      }
    }
  
+  // Accessing registers past the end of the NEON register file is not
+  // defined.
+  if (Rd > 32)
+    return false;
+
    return true;
  }
  
  // A7.7
  // If L (Inst{21}) == 0, store instructions.
-// DblSpaced = false.
-static bool DisassembleVLDSTLane(MCInst &MI, unsigned Opcode, uint32_t insn,
-    unsigned short NumOps, unsigned &NumOpsAdded) {
+// Find out about double-spaced-ness of the Opcode and pass it on to
+// DisassembleNLdSt0().
+static bool DisassembleNLdSt(MCInst &MI, unsigned Opcode, uint32_t insn,
+    unsigned short NumOps, unsigned &NumOpsAdded, BO B) {
  
-  return DisassembleVLDSTLane0(MI, Opcode, insn, NumOps, NumOpsAdded,
-                               slice(insn, 21, 21) == 0, false);
-}
-// A7.7
-// If L (Inst{21}) == 0, store instructions.
-// DblSpaced = true.
-static bool DisassembleVLDSTLaneDbl(MCInst &MI, unsigned Opcode, uint32_t insn,
-    unsigned short NumOps, unsigned &NumOpsAdded) {
+  const StringRef Name = ARMInsts[Opcode].Name;
+  bool DblSpaced = false;
  
-  return DisassembleVLDSTLane0(MI, Opcode, insn, NumOps, NumOpsAdded,
-                               slice(insn, 21, 21) == 0, true);
-}
-
-// VLDRQ (vldmia), VSTRQ (vstmia)
-//   Qd Rn imm (AM4)
-static bool DisassembleVLDSTRQ(MCInst &MI, unsigned Opcode, uint32_t insn,
-    unsigned short NumOps, unsigned &NumOpsAdded) {
-
-  const TargetOperandInfo *OpInfo = ARMInsts[Opcode].OpInfo;
-
-  assert(NumOps >= 3 &&
-         OpInfo[0].RegClass == ARM::QPRRegClassID &&
-         OpInfo[1].RegClass == ARM::GPRRegClassID &&
-         OpInfo[2].RegClass == 0);
+  if (Name.find("LN") != std::string::npos) {
+    // To one lane instructions.
+    // See, for example, 8.6.317 VLD4 (single 4-element structure to one lane).
  
-  // Qd = Inst{22:15-12} => NEON Rd
-  MI.addOperand(MCOperand::CreateReg(
-                  getRegisterEnum(ARM::QPRRegClassID,
-                                  decodeNEONRd(insn), true)));
+    // <size> == 16 && Inst{5} == 1 --> DblSpaced = true
+    if (Name.endswith("16") || Name.endswith("16_UPD"))
+      DblSpaced = slice(insn, 5, 5) == 1;
  
-  // Rn = Inst{19-16} => ARM Rn
-  MI.addOperand(MCOperand::CreateReg(getRegisterEnum(ARM::GPRRegClassID,
-                                                     decodeRn(insn))));
+    // <size> == 32 && Inst{6} == 1 --> DblSpaced = true
+    if (Name.endswith("32") || Name.endswith("32_UPD"))
+      DblSpaced = slice(insn, 6, 6) == 1;
  
-  // Next comes the AM4 Opcode.
-  assert(Opcode == ARM::VLDRQ || Opcode == ARM::VSTRQ);
-  ARM_AM::AMSubMode SubMode = getAMSubModeForBits(getPUBits(insn));
-  bool WB = getWBit(insn) == 1;
-  MI.addOperand(MCOperand::CreateImm(ARM_AM::getAM4ModeImm(SubMode, WB)));
+  } else {
+    // Multiple n-element structures with type encoded as Inst{11-8}.
+    // See, for example, A8.6.316 VLD4 (multiple 4-element structures).
  
-  NumOpsAdded = 3;
-  return true;
+    // n == 2 && type == 0b1001 -> DblSpaced = true
+    if (Name.startswith("VST2") || Name.startswith("VLD2"))
+      DblSpaced = slice(insn, 11, 8) == 9;
+    
+    // n == 3 && type == 0b0101 -> DblSpaced = true
+    if (Name.startswith("VST3") || Name.startswith("VLD3"))
+      DblSpaced = slice(insn, 11, 8) == 5;
+    
+    // n == 4 && type == 0b0001 -> DblSpaced = true
+    if (Name.startswith("VST4") || Name.startswith("VLD4"))
+      DblSpaced = slice(insn, 11, 8) == 1;
+    
+  }
+  return DisassembleNLdSt0(MI, Opcode, insn, NumOps, NumOpsAdded,
+                           slice(insn, 21, 21) == 0, DblSpaced, B);
  }
  
  // VMOV (immediate)
  //   Qd/Dd imm
-static bool DisassembleNVdImm(MCInst &MI, unsigned Opcode, uint32_t insn,
-    unsigned short NumOps, unsigned &NumOpsAdded) {
+// VBIC (immediate)
+// VORR (immediate)
+//   Qd/Dd imm src(=Qd/Dd)
+static bool DisassembleN1RegModImmFrm(MCInst &MI, unsigned Opcode,
+    uint32_t insn, unsigned short NumOps, unsigned &NumOpsAdded, BO B) {
  
    const TargetInstrDesc &TID = ARMInsts[Opcode];
    const TargetOperandInfo *OpInfo = TID.OpInfo;
@@ -2390,10 +2314,11 @@ static bool DisassembleNVdImm(MCInst &MI, unsigned Opcode, uint32_t insn,
    assert(NumOps >= 2 &&
           (OpInfo[0].RegClass == ARM::DPRRegClassID ||
            OpInfo[0].RegClass == ARM::QPRRegClassID) &&
-         (OpInfo[1].RegClass == 0));
+         (OpInfo[1].RegClass < 0) &&
+         "Expect 1 reg operand followed by 1 imm operand");
  
    // Qd/Dd = Inst{22:15-12} => NEON Rd
-  MI.addOperand(MCOperand::CreateReg(getRegisterEnum(OpInfo[0].RegClass,
+  MI.addOperand(MCOperand::CreateReg(getRegisterEnum(B, OpInfo[0].RegClass,
                                                       decodeNEONRd(insn))));
  
    ElemSize esize = ESizeNA;
@@ -2404,17 +2329,30 @@ static bool DisassembleNVdImm(MCInst &MI, unsigned Opcode, uint32_t insn,
      break;
    case ARM::VMOVv4i16:
    case ARM::VMOVv8i16:
+  case ARM::VMVNv4i16:
+  case ARM::VMVNv8i16:
+  case ARM::VBICiv4i16:
+  case ARM::VBICiv8i16:
+  case ARM::VORRiv4i16:
+  case ARM::VORRiv8i16:
      esize = ESize16;
      break;
    case ARM::VMOVv2i32:
    case ARM::VMOVv4i32:
+  case ARM::VMVNv2i32:
+  case ARM::VMVNv4i32:
+  case ARM::VBICiv2i32:
+  case ARM::VBICiv4i32:
+  case ARM::VORRiv2i32:
+  case ARM::VORRiv4i32:
      esize = ESize32;
      break;
    case ARM::VMOVv1i64:
    case ARM::VMOVv2i64:
      esize = ESize64;
+    break;
    default:
-    assert(0 && "Unreachable code!");
+    assert(0 && "Unexpected opcode!");
      return false;
    }
  
@@ -2423,6 +2361,16 @@ static bool DisassembleNVdImm(MCInst &MI, unsigned Opcode, uint32_t insn,
    MI.addOperand(MCOperand::CreateImm(decodeN1VImm(insn, esize)));
  
    NumOpsAdded = 2;
+
+  // VBIC/VORRiv*i* variants have an extra $src = $Vd to be filled in.
+  if (NumOps >= 3 &&
+      (OpInfo[2].RegClass == ARM::DPRRegClassID ||
+       OpInfo[2].RegClass == ARM::QPRRegClassID)) {
+    MI.addOperand(MCOperand::CreateReg(getRegisterEnum(B, OpInfo[0].RegClass,
+                                                     decodeNEONRd(insn))));
+    NumOpsAdded += 1;
+  }
+
    return true;
  }
  
@@ -2430,7 +2378,6 @@ namespace {
  enum N2VFlag {
    N2V_None,
    N2V_VectorDupLane,
-  N2V_VectorShiftLeftLong,
    N2V_VectorConvert_Between_Float_Fixed
  };
  } // End of unnamed namespace
@@ -2442,9 +2389,6 @@ enum N2VFlag {
  // VDUPLN16d, VDUPLN16q, VDUPLN32d, VDUPLN32q, VDUPLN8d, VDUPLN8q:
  //   Qd/Dd Dm index
  //
-// Vector Shift Left Long (with maximum shift count) Instructions.
-// VSHLLi16, VSHLLi32, VSHLLi8: Qd Dm imm (== size)
-//
  // Vector Move Long:
  //   Qd Dm
  // 
@@ -2452,8 +2396,8 @@ enum N2VFlag {
  //   Dd Qm
  //
  // Others
-static bool DisassembleNVdVmImm0(MCInst &MI, unsigned Opc, uint32_t insn,
-    unsigned short NumOps, unsigned &NumOpsAdded, N2VFlag Flag = N2V_None) {
+static bool DisassembleNVdVmOptImm(MCInst &MI, unsigned Opc, uint32_t insn,
+    unsigned short NumOps, unsigned &NumOpsAdded, N2VFlag Flag, BO B) {
  
    const TargetInstrDesc &TID = ARMInsts[Opc];
    const TargetOperandInfo *OpInfo = TID.OpInfo;
@@ -2462,30 +2406,25 @@ static bool DisassembleNVdVmImm0(MCInst &MI, unsigned Opc, uint32_t insn,
           (OpInfo[0].RegClass == ARM::DPRRegClassID ||
            OpInfo[0].RegClass == ARM::QPRRegClassID) &&
           (OpInfo[1].RegClass == ARM::DPRRegClassID ||
-          OpInfo[1].RegClass == ARM::QPRRegClassID));
+          OpInfo[1].RegClass == ARM::QPRRegClassID) &&
+         "Expect >= 2 operands and first 2 as reg operands");
  
    unsigned &OpIdx = NumOpsAdded;
  
    OpIdx = 0;
  
    ElemSize esize = ESizeNA;
-  if (Flag == N2V_VectorShiftLeftLong) {
-    // VSHLL has maximum shift count as the imm, inferred from its size.
-    assert(Opc == ARM::VSHLLi16 || Opc == ARM::VSHLLi32 || Opc == ARM::VSHLLi8);
-    esize = Opc == ARM::VSHLLi8 ? ESize8
-                                : (Opc == ARM::VSHLLi16 ? ESize16
-                                                        : ESize32);
-  }
    if (Flag == N2V_VectorDupLane) {
      // VDUPLN has its index embedded.  Its size can be inferred from the Opcode.
-    assert(Opc >= ARM::VDUPLN16d && Opc <= ARM::VDUPLN8q);
+    assert(Opc >= ARM::VDUPLN16d && Opc <= ARM::VDUPLN8q &&
+           "Unexpected Opcode");
      esize = (Opc == ARM::VDUPLN8d || Opc == ARM::VDUPLN8q) ? ESize8
         : ((Opc == ARM::VDUPLN16d || Opc == ARM::VDUPLN16q) ? ESize16
                                                             : ESize32);
    }
  
    // Qd/Dd = Inst{22:15-12} => NEON Rd
-  MI.addOperand(MCOperand::CreateReg(getRegisterEnum(OpInfo[OpIdx].RegClass,
+  MI.addOperand(MCOperand::CreateReg(getRegisterEnum(B, OpInfo[OpIdx].RegClass,
                                                       decodeNEONRd(insn))));
    ++OpIdx;
  
@@ -2497,24 +2436,31 @@ static bool DisassembleNVdVmImm0(MCInst &MI, unsigned Opc, uint32_t insn,
    }
  
    // Dm = Inst{5:3-0} => NEON Rm
-  MI.addOperand(MCOperand::CreateReg(getRegisterEnum(OpInfo[OpIdx].RegClass,
+  MI.addOperand(MCOperand::CreateReg(getRegisterEnum(B, OpInfo[OpIdx].RegClass,
                                                       decodeNEONRm(insn))));
    ++OpIdx;
  
+  // VZIP and others have two TIED_TO reg operands.
+  int Idx;
+  while (OpIdx < NumOps &&
+         (Idx = TID.getOperandConstraint(OpIdx, TOI::TIED_TO)) != -1) {
+    // Add TIED_TO operand.
+    MI.addOperand(MI.getOperand(Idx));
+    ++OpIdx;
+  }
+
    // Add the imm operand, if required.
-  if (OpIdx < NumOps && OpInfo[OpIdx].RegClass == 0
+  if (OpIdx < NumOps && OpInfo[OpIdx].RegClass < 0
        && !OpInfo[OpIdx].isPredicate() && !OpInfo[OpIdx].isOptionalDef()) {
  
      unsigned imm = 0xFFFFFFFF;
  
-    if (Flag == N2V_VectorShiftLeftLong)
-      imm = static_cast<unsigned>(esize);
      if (Flag == N2V_VectorDupLane)
        imm = decodeNVLaneDupIndex(insn, esize);
      if (Flag == N2V_VectorConvert_Between_Float_Fixed)
        imm = decodeVCVTFractionBits(insn);
  
-    assert(imm != 0xFFFFFFFF);
+    assert(imm != 0xFFFFFFFF && "Internal error");
      MI.addOperand(MCOperand::CreateImm(imm));
      ++OpIdx;
    }
@@ -2522,75 +2468,33 @@ static bool DisassembleNVdVmImm0(MCInst &MI, unsigned Opc, uint32_t insn,
    return true;
  }
  
-static bool DisassembleNVdVmImm(MCInst &MI, unsigned Opc, uint32_t insn,
-    unsigned short NumOps, unsigned &NumOpsAdded) {
+static bool DisassembleN2RegFrm(MCInst &MI, unsigned Opc, uint32_t insn,
+    unsigned short NumOps, unsigned &NumOpsAdded, BO B) {
  
-  return DisassembleNVdVmImm0(MI, Opc, insn, NumOps, NumOpsAdded);
+  return DisassembleNVdVmOptImm(MI, Opc, insn, NumOps, NumOpsAdded,
+                                N2V_None, B);
  }
-static bool DisassembleNVdVmImmVCVT(MCInst &MI, unsigned Opc, uint32_t insn,
-    unsigned short NumOps, unsigned &NumOpsAdded) {
+static bool DisassembleNVCVTFrm(MCInst &MI, unsigned Opc, uint32_t insn,
+    unsigned short NumOps, unsigned &NumOpsAdded, BO B) {
  
-  return DisassembleNVdVmImm0(MI, Opc, insn, NumOps, NumOpsAdded,
-                              N2V_VectorConvert_Between_Float_Fixed);
+  return DisassembleNVdVmOptImm(MI, Opc, insn, NumOps, NumOpsAdded,
+                                N2V_VectorConvert_Between_Float_Fixed, B);
  }
-static bool DisassembleNVdVmImmVDupLane(MCInst &MI, unsigned Opc, uint32_t insn,
-    unsigned short NumOps, unsigned &NumOpsAdded) {
+static bool DisassembleNVecDupLnFrm(MCInst &MI, unsigned Opc, uint32_t insn,
+    unsigned short NumOps, unsigned &NumOpsAdded, BO B) {
  
-  return DisassembleNVdVmImm0(MI, Opc, insn, NumOps, NumOpsAdded,
-                              N2V_VectorDupLane);
-}
-static bool DisassembleNVdVmImmVSHLL(MCInst &MI, unsigned Opc, uint32_t insn,
-    unsigned short NumOps, unsigned &NumOpsAdded) {
-
-  return DisassembleNVdVmImm0(MI, Opc, insn, NumOps, NumOpsAdded,
-                              N2V_VectorShiftLeftLong);
-}
-
-// Vector Transpose/Unzip/Zip Instructions
-//   Qd/Dd Qm/Dm [Qd/Dd (TIED_TO)] [Qm/Dm (TIED_TO)]
-static bool DisassembleNVectorShuffle(MCInst &MI,unsigned Opcode,uint32_t insn,
-    unsigned short NumOps, unsigned &NumOpsAdded) {
-
-  const TargetInstrDesc &TID = ARMInsts[Opcode];
-  const TargetOperandInfo *OpInfo = TID.OpInfo;
-
-  assert(NumOps >= 4 &&
-         (OpInfo[0].RegClass == ARM::DPRRegClassID ||
-          OpInfo[0].RegClass == ARM::QPRRegClassID) &&
-         (OpInfo[1].RegClass == ARM::DPRRegClassID ||
-          OpInfo[1].RegClass == ARM::QPRRegClassID) &&
-         (OpInfo[2].RegClass == ARM::DPRRegClassID ||
-          OpInfo[2].RegClass == ARM::QPRRegClassID) &&
-         (OpInfo[3].RegClass == ARM::DPRRegClassID ||
-          OpInfo[3].RegClass == ARM::QPRRegClassID));
-
-  unsigned &OpIdx = NumOpsAdded;
-
-  OpIdx = 0;
-
-  // Qd/Dd = Inst{22:15-12} => NEON Rd
-  MI.addOperand(MCOperand::CreateReg(getRegisterEnum(OpInfo[OpIdx].RegClass,
-                                                     decodeNEONRd(insn))));
-  ++OpIdx;
-
-  // Dm = Inst{5:3-0} => NEON Rm
-  MI.addOperand(MCOperand::CreateReg(getRegisterEnum(OpInfo[OpIdx].RegClass,
-                                                     decodeNEONRm(insn))));
-  ++OpIdx;
-
-  assert(TID.getOperandConstraint(OpIdx, TOI::TIED_TO) != -1 &&
-         TID.getOperandConstraint(OpIdx+1, TOI::TIED_TO) != -1);
-
-  MI.addOperand(MCOperand::CreateReg(0)); ++OpIdx;
-  MI.addOperand(MCOperand::CreateReg(0)); ++OpIdx;
-
-  return true;
+  return DisassembleNVdVmOptImm(MI, Opc, insn, NumOps, NumOpsAdded,
+                                N2V_VectorDupLane, B);
  }
  
  // Vector Shift [Accumulate] Instructions.
  // Qd/Dd [Qd/Dd (TIED_TO)] Qm/Dm ShiftAmt
-static bool DisassembleNVectorShift0(MCInst &MI, unsigned Opcode, uint32_t insn,
-    unsigned short NumOps, unsigned &NumOpsAdded, bool NormalShift = true) {
+//
+// Vector Shift Left Long (with maximum shift count) Instructions.
+// VSHLLi16, VSHLLi32, VSHLLi8: Qd Dm imm (== size)
+//
+static bool DisassembleNVectorShift(MCInst &MI, unsigned Opcode, uint32_t insn,
+    unsigned short NumOps, unsigned &NumOpsAdded, bool LeftShift, BO B) {
  
    const TargetInstrDesc &TID = ARMInsts[Opcode];
    const TargetOperandInfo *OpInfo = TID.OpInfo;
@@ -2599,14 +2503,15 @@ static bool DisassembleNVectorShift0(MCInst &MI, unsigned Opcode, uint32_t insn,
           (OpInfo[0].RegClass == ARM::DPRRegClassID ||
            OpInfo[0].RegClass == ARM::QPRRegClassID) &&
           (OpInfo[1].RegClass == ARM::DPRRegClassID ||
-          OpInfo[1].RegClass == ARM::QPRRegClassID));
+          OpInfo[1].RegClass == ARM::QPRRegClassID) &&
+         "Expect >= 3 operands and first 2 as reg operands");
  
    unsigned &OpIdx = NumOpsAdded;
  
    OpIdx = 0;
  
    // Qd/Dd = Inst{22:15-12} => NEON Rd
-  MI.addOperand(MCOperand::CreateReg(getRegisterEnum(OpInfo[OpIdx].RegClass,
+  MI.addOperand(MCOperand::CreateReg(getRegisterEnum(B, OpInfo[OpIdx].RegClass,
                                                       decodeNEONRd(insn))));
    ++OpIdx;
  
@@ -2616,34 +2521,54 @@ static bool DisassembleNVectorShift0(MCInst &MI, unsigned Opcode, uint32_t insn,
      ++OpIdx;
    }
  
-  assert(OpInfo[OpIdx].RegClass == ARM::DPRRegClassID ||
-         OpInfo[OpIdx].RegClass == ARM::QPRRegClassID);
+  assert((OpInfo[OpIdx].RegClass == ARM::DPRRegClassID ||
+          OpInfo[OpIdx].RegClass == ARM::QPRRegClassID) &&
+         "Reg operand expected");
  
    // Qm/Dm = Inst{5:3-0} => NEON Rm
-  MI.addOperand(MCOperand::CreateReg(getRegisterEnum(OpInfo[OpIdx].RegClass,
+  MI.addOperand(MCOperand::CreateReg(getRegisterEnum(B, OpInfo[OpIdx].RegClass,
                                                       decodeNEONRm(insn))));
    ++OpIdx;
  
-  assert(OpInfo[OpIdx].RegClass == 0);
+  assert(OpInfo[OpIdx].RegClass < 0 && "Imm operand expected");
  
    // Add the imm operand.
-  MI.addOperand(MCOperand::CreateImm(decodeNVSAmt(insn, NormalShift)));
+  
+  // VSHLL has maximum shift count as the imm, inferred from its size.
+  unsigned Imm;
+  switch (Opcode) {
+  default:
+    Imm = decodeNVSAmt(insn, LeftShift);
+    break;
+  case ARM::VSHLLi8:
+    Imm = 8;
+    break;
+  case ARM::VSHLLi16:
+    Imm = 16;
+    break;
+  case ARM::VSHLLi32:
+    Imm = 32;
+    break;
+  }
+  MI.addOperand(MCOperand::CreateImm(Imm));
    ++OpIdx;
  
    return true;
  }
  
-// Normal shift amount interpretation.
-static bool DisassembleNVectorShift(MCInst &MI, unsigned Opcode, uint32_t insn,
-    unsigned short NumOps, unsigned &NumOpsAdded) {
+// Left shift instructions.
+static bool DisassembleN2RegVecShLFrm(MCInst &MI, unsigned Opcode,
+    uint32_t insn, unsigned short NumOps, unsigned &NumOpsAdded, BO B) {
  
-  return DisassembleNVectorShift0(MI, Opcode, insn, NumOps, NumOpsAdded, true);
+  return DisassembleNVectorShift(MI, Opcode, insn, NumOps, NumOpsAdded, true,
+                                 B);
  }
-// Different shift amount interpretation.
-static bool DisassembleNVectorShift2(MCInst &MI, unsigned Opcode, uint32_t insn,
-    unsigned short NumOps, unsigned &NumOpsAdded) {
+// Right shift instructions have different shift amount interpretation.
+static bool DisassembleN2RegVecShRFrm(MCInst &MI, unsigned Opcode,
+    uint32_t insn, unsigned short NumOps, unsigned &NumOpsAdded, BO B) {
  
-  return DisassembleNVectorShift0(MI, Opcode, insn, NumOps, NumOpsAdded, false);
+  return DisassembleNVectorShift(MI, Opcode, insn, NumOps, NumOpsAdded, false,
+                                 B);
  }
  
  namespace {
@@ -2667,18 +2592,19 @@ enum N3VFlag {
  // Qd/Dd Qn/Dn RestrictedDm index
  //
  // Others
-static bool DisassembleNVdVnVmImm0(MCInst &MI, unsigned Opcode, uint32_t insn,
-    unsigned short NumOps, unsigned &NumOpsAdded, N3VFlag Flag = N3V_None) {
+static bool DisassembleNVdVnVmOptImm(MCInst &MI, unsigned Opcode, uint32_t insn,
+    unsigned short NumOps, unsigned &NumOpsAdded, N3VFlag Flag, BO B) {
  
    const TargetInstrDesc &TID = ARMInsts[Opcode];
    const TargetOperandInfo *OpInfo = TID.OpInfo;
  
+  // No checking for OpInfo[2] because of MOVDneon/MOVQ with only two regs.
    assert(NumOps >= 3 &&
           (OpInfo[0].RegClass == ARM::DPRRegClassID ||
            OpInfo[0].RegClass == ARM::QPRRegClassID) &&
           (OpInfo[1].RegClass == ARM::DPRRegClassID ||
            OpInfo[1].RegClass == ARM::QPRRegClassID) &&
-         (OpInfo[2].RegClass != 0));
+         "Expect >= 3 operands and first 2 as reg operands");
  
    unsigned &OpIdx = NumOpsAdded;
  
@@ -2696,7 +2622,7 @@ static bool DisassembleNVdVnVmImm0(MCInst &MI, unsigned Opcode, uint32_t insn,
    }
  
    // Qd/Dd = Inst{22:15-12} => NEON Rd
-  MI.addOperand(MCOperand::CreateReg(getRegisterEnum(OpInfo[OpIdx].RegClass,
+  MI.addOperand(MCOperand::CreateReg(getRegisterEnum(B, OpInfo[OpIdx].RegClass,
                                                       decodeNEONRd(insn))));
    ++OpIdx;
  
@@ -2711,11 +2637,16 @@ static bool DisassembleNVdVnVmImm0(MCInst &MI, unsigned Opcode, uint32_t insn,
    // or
    // Dm = Inst{5:3-0} => NEON Rm
    MI.addOperand(MCOperand::CreateReg(
-                  getRegisterEnum(OpInfo[OpIdx].RegClass,
+                  getRegisterEnum(B, OpInfo[OpIdx].RegClass,
                                    VdVnVm ? decodeNEONRn(insn)
                                           : decodeNEONRm(insn))));
    ++OpIdx;
  
+  // Special case handling for VMOVDneon and VMOVQ because they are marked as
+  // N3RegFrm.
+  if (Opcode == ARM::VMOVDneon || Opcode == ARM::VMOVQ)
+    return true;
+  
    // Dm = Inst{5:3-0} => NEON Rm
    // or
    // Dm is restricted to D0-D7 if size is 16, D0-D15 otherwise
@@ -2726,10 +2657,10 @@ static bool DisassembleNVdVnVmImm0(MCInst &MI, unsigned Opcode, uint32_t insn,
                        : decodeNEONRn(insn);
  
    MI.addOperand(MCOperand::CreateReg(
-                  getRegisterEnum(OpInfo[OpIdx].RegClass, m)));
+                  getRegisterEnum(B, OpInfo[OpIdx].RegClass, m)));
    ++OpIdx;
  
-  if (OpIdx < NumOps && OpInfo[OpIdx].RegClass == 0
+  if (OpIdx < NumOps && OpInfo[OpIdx].RegClass < 0
        && !OpInfo[OpIdx].isPredicate() && !OpInfo[OpIdx].isOptionalDef()) {
      // Add the imm operand.
      unsigned Imm = 0;
@@ -2737,8 +2668,10 @@ static bool DisassembleNVdVnVmImm0(MCInst &MI, unsigned Opcode, uint32_t insn,
        Imm = decodeN3VImm(insn);
      else if (IsDmRestricted)
        Imm = decodeRestrictedDmIndex(insn, esize);
-    else
+    else {
        assert(0 && "Internal error: unreachable code!");
+      return false;
+    }
  
      MI.addOperand(MCOperand::CreateImm(Imm));
      ++OpIdx;
@@ -2747,28 +2680,29 @@ static bool DisassembleNVdVnVmImm0(MCInst &MI, unsigned Opcode, uint32_t insn,
    return true;
  }
  
-static bool DisassembleNVdVnVmImm(MCInst &MI, unsigned Opcode, uint32_t insn,
-    unsigned short NumOps, unsigned &NumOpsAdded) {
+static bool DisassembleN3RegFrm(MCInst &MI, unsigned Opcode, uint32_t insn,
+    unsigned short NumOps, unsigned &NumOpsAdded, BO B) {
  
-  return DisassembleNVdVnVmImm0(MI, Opcode, insn, NumOps, NumOpsAdded);
+  return DisassembleNVdVnVmOptImm(MI, Opcode, insn, NumOps, NumOpsAdded,
+                                  N3V_None, B);
  }
-static bool DisassembleNVdVnVmImmVectorShift(MCInst &MI, unsigned Opcode,
-    uint32_t insn, unsigned short NumOps, unsigned &NumOpsAdded) {
+static bool DisassembleN3RegVecShFrm(MCInst &MI, unsigned Opcode,
+    uint32_t insn, unsigned short NumOps, unsigned &NumOpsAdded, BO B) {
  
-  return DisassembleNVdVnVmImm0(MI, Opcode, insn, NumOps, NumOpsAdded,
-                                N3V_VectorShift);
+  return DisassembleNVdVnVmOptImm(MI, Opcode, insn, NumOps, NumOpsAdded,
+                                  N3V_VectorShift, B);
  }
-static bool DisassembleNVdVnVmImmVectorExtract(MCInst &MI, unsigned Opcode,
-    uint32_t insn, unsigned short NumOps, unsigned &NumOpsAdded) {
+static bool DisassembleNVecExtractFrm(MCInst &MI, unsigned Opcode,
+    uint32_t insn, unsigned short NumOps, unsigned &NumOpsAdded, BO B) {
  
-  return DisassembleNVdVnVmImm0(MI, Opcode, insn, NumOps, NumOpsAdded,
-                                N3V_VectorExtract);
+  return DisassembleNVdVnVmOptImm(MI, Opcode, insn, NumOps, NumOpsAdded,
+                                  N3V_VectorExtract, B);
  }
-static bool DisassembleNVdVnVmImmMulScalar(MCInst &MI, unsigned Opcode,
-    uint32_t insn, unsigned short NumOps, unsigned &NumOpsAdded) {
+static bool DisassembleNVecMulScalarFrm(MCInst &MI, unsigned Opcode,
+    uint32_t insn, unsigned short NumOps, unsigned &NumOpsAdded, BO B) {
  
-  return DisassembleNVdVnVmImm0(MI, Opcode, insn, NumOps, NumOpsAdded,
-                                N3V_Multiply_By_Scalar);
+  return DisassembleNVdVnVmOptImm(MI, Opcode, insn, NumOps, NumOpsAdded,
+                                  N3V_Multiply_By_Scalar, B);
  }
  
  // Vector Table Lookup
@@ -2777,16 +2711,18 @@ static bool DisassembleNVdVnVmImmMulScalar(MCInst &MI, unsigned Opcode,
  // VTBL2, VTBX2: Dd [Dd(TIED_TO)] Dn Dn+1 Dm
  // VTBL3, VTBX3: Dd [Dd(TIED_TO)] Dn Dn+1 Dn+2 Dm
  // VTBL4, VTBX4: Dd [Dd(TIED_TO)] Dn Dn+1 Dn+2 Dn+3 Dm
-static bool DisassembleVTBL(MCInst &MI, unsigned Opcode, uint32_t insn,
-    unsigned short NumOps, unsigned &NumOpsAdded) {
+static bool DisassembleNVTBLFrm(MCInst &MI, unsigned Opcode, uint32_t insn,
+    unsigned short NumOps, unsigned &NumOpsAdded, BO B) {
  
    const TargetInstrDesc &TID = ARMInsts[Opcode];
    const TargetOperandInfo *OpInfo = TID.OpInfo;
+  if (!OpInfo) return false;
  
    assert(NumOps >= 3 &&
           OpInfo[0].RegClass == ARM::DPRRegClassID &&
           OpInfo[1].RegClass == ARM::DPRRegClassID &&
-         OpInfo[2].RegClass == ARM::DPRRegClassID);
+         OpInfo[2].RegClass == ARM::DPRRegClassID &&
+         "Expect >= 3 operands and first 3 as reg operands");
  
    unsigned &OpIdx = NumOpsAdded;
  
@@ -2801,7 +2737,7 @@ static bool DisassembleVTBL(MCInst &MI, unsigned Opcode, uint32_t insn,
    unsigned Len = slice(insn, 9, 8) + 1;
  
    // Dd (the destination vector)
-  MI.addOperand(MCOperand::CreateReg(getRegisterEnum(ARM::DPRRegClassID,
+  MI.addOperand(MCOperand::CreateReg(getRegisterEnum(B, ARM::DPRRegClassID,
                                                       decodeNEONRd(insn))));
    ++OpIdx;
  
@@ -2814,105 +2750,37 @@ static bool DisassembleVTBL(MCInst &MI, unsigned Opcode, uint32_t insn,
  
    // Do the <list> now.
    for (unsigned i = 0; i < Len; ++i) {
-    assert(OpIdx < NumOps && OpInfo[OpIdx].RegClass == ARM::DPRRegClassID);
-    MI.addOperand(MCOperand::CreateReg(getRegisterEnum(ARM::DPRRegClassID,
+    assert(OpIdx < NumOps && OpInfo[OpIdx].RegClass == ARM::DPRRegClassID &&
+           "Reg operand expected");
+    MI.addOperand(MCOperand::CreateReg(getRegisterEnum(B, ARM::DPRRegClassID,
                                                         Rn + i)));
      ++OpIdx;
    }
  
    // Dm (the index vector)
-  assert(OpIdx < NumOps && OpInfo[OpIdx].RegClass == ARM::DPRRegClassID);
-  MI.addOperand(MCOperand::CreateReg(getRegisterEnum(ARM::DPRRegClassID,
+  assert(OpIdx < NumOps && OpInfo[OpIdx].RegClass == ARM::DPRRegClassID &&
+         "Reg operand (index vector) expected");
+  MI.addOperand(MCOperand::CreateReg(getRegisterEnum(B, ARM::DPRRegClassID,
                                                       decodeNEONRm(insn))));
    ++OpIdx;
  
    return true;
  }
  
-/// NEONFuncPtrs - NEONFuncPtrs maps NSFormat to corresponding DisassembleFP.
-/// We divide the disassembly task into different categories, with each one
-/// corresponding to a specific instruction encoding format.  There could be
-/// exceptions when handling a specific format, and that is why the Opcode is
-/// also present in the function prototype.
-static const DisassembleFP NEONFuncPtrs[] = {
-  // This will assert().
-  &DisassembleNSFormatNone,
-
-  // VLD and VST (including one lane) Instructions.
-  &DisassembleVLDSTLane,
-
-  // VLD and VST (including one lane) Double-Spaced Instructions.
-  &DisassembleVLDSTLaneDbl,
-
-  // A8.6.319 VLDM & A8.6.399 VSTM
-  // LLVM defines VLDRQ/VSTRQ to load/store a Q register as a D register pair.
-  &DisassembleVLDSTRQ,
-
-  // A7.4.6 One register and a modified immediate value
-  // 1-Register Instructions with imm.
-  // LLVM only defines VMOVv instructions.
-  &DisassembleNVdImm,
-
-  // 2-Register Instructions with no imm.
-  &DisassembleNVdVmImm,
-
-  // 2-Register Instructions with imm (vector convert float/fixed point).
-  &DisassembleNVdVmImmVCVT,
-
-  // 2-Register Instructions with imm (vector dup lane).
-  &DisassembleNVdVmImmVDupLane,
-
-  // 2-Register Instructions with imm (vector shift left long).
-  &DisassembleNVdVmImmVSHLL,
-
-  // Vector Transpose/Unzip/Zip Instructions.
-  &DisassembleNVectorShuffle,
-
-  // Vector Shift [Narrow Accumulate] Instructions.
-  &DisassembleNVectorShift,
-
-  // Vector Shift Instructions with different interpretation of shift amount.
-  &DisassembleNVectorShift2,
-
-  // 3-Register Data-Processing Instructions.
-  &DisassembleNVdVnVmImm,
-
-  // Vector Shift (Register) Instructions.
-  // D:Vd M:Vm N:Vn (notice that M:Vm is the first operand)
-  &DisassembleNVdVnVmImmVectorShift,
-
-  // Vector Extract Instructions.
-  &DisassembleNVdVnVmImmVectorExtract,
-
-  // Vector [Saturating Rounding Doubling] Multiply [Accumulate/Subtract] [Long]
-  // By Scalar Instructions.
-  &DisassembleNVdVnVmImmMulScalar,
-
-  // Vector Table Lookup uses byte indexes in a control vector to look up byte
-  // values in a table and generate a new vector.
-  &DisassembleVTBL,
-  NULL,
-};
-
-static bool DisassembleNEONFrm(MCInst &MI, unsigned Opcode, uint32_t insn,
-    unsigned short NumOps, unsigned &NumOpsAdded) {
-  assert(0 && "Code is not reachable");
-  return false;
-}
-
  // Vector Get Lane (move scalar to ARM core register) Instructions.
  // VGETLNi32, VGETLNs16, VGETLNs8, VGETLNu16, VGETLNu8: Rt Dn index
-static bool DisassembleNEONGetLnFrm(MCInst &MI, unsigned Opcode, uint32_t insn,
-    unsigned short NumOps, unsigned &NumOpsAdded) {
+static bool DisassembleNGetLnFrm(MCInst &MI, unsigned Opcode, uint32_t insn,
+    unsigned short NumOps, unsigned &NumOpsAdded, BO B) {
  
    const TargetInstrDesc &TID = ARMInsts[Opcode];
-  unsigned short NumDefs = TID.getNumDefs();
    const TargetOperandInfo *OpInfo = TID.OpInfo;
+  if (!OpInfo) return false;
  
-  assert(NumDefs == 1 && NumOps >= 3 &&
+  assert(TID.getNumDefs() == 1 && NumOps >= 3 &&
           OpInfo[0].RegClass == ARM::GPRRegClassID &&
           OpInfo[1].RegClass == ARM::DPRRegClassID &&
-         OpInfo[2].RegClass == 0);
+         OpInfo[2].RegClass < 0 &&
+         "Expect >= 3 operands with one dst operand");
  
    ElemSize esize =
      Opcode == ARM::VGETLNi32 ? ESize32
@@ -2920,11 +2788,11 @@ static bool DisassembleNEONGetLnFrm(MCInst &MI, unsigned Opcode, uint32_t insn,
                                                                  : ESize32);
  
    // Rt = Inst{15-12} => ARM Rd
-  MI.addOperand(MCOperand::CreateReg(getRegisterEnum(ARM::GPRRegClassID,
+  MI.addOperand(MCOperand::CreateReg(getRegisterEnum(B, ARM::GPRRegClassID,
                                                       decodeRd(insn))));
  
    // Dn = Inst{7:19-16} => NEON Rn
-  MI.addOperand(MCOperand::CreateReg(getRegisterEnum(ARM::DPRRegClassID,
+  MI.addOperand(MCOperand::CreateReg(getRegisterEnum(B, ARM::DPRRegClassID,
                                                       decodeNEONRn(insn))));
  
    MI.addOperand(MCOperand::CreateImm(decodeNVLaneOpIndex(insn, esize)));
@@ -2935,19 +2803,20 @@ static bool DisassembleNEONGetLnFrm(MCInst &MI, unsigned Opcode, uint32_t insn,
  
  // Vector Set Lane (move ARM core register to scalar) Instructions.
  // VSETLNi16, VSETLNi32, VSETLNi8: Dd Dd (TIED_TO) Rt index
-static bool DisassembleNEONSetLnFrm(MCInst &MI, unsigned Opcode, uint32_t insn,
-    unsigned short NumOps, unsigned &NumOpsAdded) {
+static bool DisassembleNSetLnFrm(MCInst &MI, unsigned Opcode, uint32_t insn,
+    unsigned short NumOps, unsigned &NumOpsAdded, BO B) {
  
    const TargetInstrDesc &TID = ARMInsts[Opcode];
-  unsigned short NumDefs = TID.getNumDefs();
    const TargetOperandInfo *OpInfo = TID.OpInfo;
+  if (!OpInfo) return false;
  
-  assert(NumDefs == 1 && NumOps >= 3 &&
+  assert(TID.getNumDefs() == 1 && NumOps >= 3 &&
           OpInfo[0].RegClass == ARM::DPRRegClassID &&
           OpInfo[1].RegClass == ARM::DPRRegClassID &&
           TID.getOperandConstraint(1, TOI::TIED_TO) != -1 &&
           OpInfo[2].RegClass == ARM::GPRRegClassID &&
-         OpInfo[3].RegClass == 0);
+         OpInfo[3].RegClass < 0 &&
+         "Expect >= 3 operands with one dst operand");
  
    ElemSize esize =
      Opcode == ARM::VSETLNi8 ? ESize8
@@ -2955,14 +2824,14 @@ static bool DisassembleNEONSetLnFrm(MCInst &MI, unsigned Opcode, uint32_t insn,
                                                          : ESize32);
  
    // Dd = Inst{7:19-16} => NEON Rn
-  MI.addOperand(MCOperand::CreateReg(getRegisterEnum(ARM::DPRRegClassID,
+  MI.addOperand(MCOperand::CreateReg(getRegisterEnum(B, ARM::DPRRegClassID,
                                                       decodeNEONRn(insn))));
  
    // TIED_TO operand.
    MI.addOperand(MCOperand::CreateReg(0));
  
    // Rt = Inst{15-12} => ARM Rd
-  MI.addOperand(MCOperand::CreateReg(getRegisterEnum(ARM::GPRRegClassID,
+  MI.addOperand(MCOperand::CreateReg(getRegisterEnum(B, ARM::GPRRegClassID,
                                                       decodeRd(insn))));
  
    MI.addOperand(MCOperand::CreateImm(decodeNVLaneOpIndex(insn, esize)));
@@ -2973,24 +2842,25 @@ static bool DisassembleNEONSetLnFrm(MCInst &MI, unsigned Opcode, uint32_t insn,
  
  // Vector Duplicate Instructions (from ARM core register to all elements).
  // VDUP8d, VDUP16d, VDUP32d, VDUP8q, VDUP16q, VDUP32q: Qd/Dd Rt
-static bool DisassembleNEONDupFrm(MCInst &MI, unsigned Opcode, uint32_t insn,
-    unsigned short NumOps, unsigned &NumOpsAdded) {
+static bool DisassembleNDupFrm(MCInst &MI, unsigned Opcode, uint32_t insn,
+    unsigned short NumOps, unsigned &NumOpsAdded, BO B) {
  
    const TargetOperandInfo *OpInfo = ARMInsts[Opcode].OpInfo;
  
    assert(NumOps >= 2 &&
           (OpInfo[0].RegClass == ARM::DPRRegClassID ||
            OpInfo[0].RegClass == ARM::QPRRegClassID) &&
-         OpInfo[1].RegClass == ARM::GPRRegClassID);
+         OpInfo[1].RegClass == ARM::GPRRegClassID &&
+         "Expect >= 2 operands and first 2 as reg operand");
  
    unsigned RegClass = OpInfo[0].RegClass;
  
    // Qd/Dd = Inst{7:19-16} => NEON Rn
-  MI.addOperand(MCOperand::CreateReg(getRegisterEnum(RegClass,
+  MI.addOperand(MCOperand::CreateReg(getRegisterEnum(B, RegClass,
                                                       decodeNEONRn(insn))));
  
    // Rt = Inst{15-12} => ARM Rd
-  MI.addOperand(MCOperand::CreateReg(getRegisterEnum(ARM::GPRRegClassID,
+  MI.addOperand(MCOperand::CreateReg(getRegisterEnum(B, ARM::GPRRegClassID,
                                                       decodeRd(insn))));
  
    NumOpsAdded = 2;
@@ -3002,7 +2872,7 @@ static bool DisassembleNEONDupFrm(MCInst &MI, unsigned Opcode, uint32_t insn,
  // A8.6.49 ISB
  static inline bool MemBarrierInstr(uint32_t insn) {
    unsigned op7_4 = slice(insn, 7, 4);
-  if (slice(insn, 31, 20) == 0xf57 && (op7_4 >= 4 && op7_4 <= 6))
+  if (slice(insn, 31, 8) == 0xf57ff0 && (op7_4 >= 4 && op7_4 <= 6))
      return true;
  
    return false;
@@ -3010,9 +2880,9 @@ static inline bool MemBarrierInstr(uint32_t insn) {
  
  static inline bool PreLoadOpcode(unsigned Opcode) {
    switch(Opcode) {
-  case ARM::PLDi:  case ARM::PLDr:
-  case ARM::PLDWi: case ARM::PLDWr:
-  case ARM::PLIi:  case ARM::PLIr:
+  case ARM::PLDi12:  case ARM::PLDrs:
+  case ARM::PLDWi12: case ARM::PLDWrs:
+  case ARM::PLIi12:  case ARM::PLIrs:
      return true;
    default:
      return false;
@@ -3020,23 +2890,26 @@ static inline bool PreLoadOpcode(unsigned Opcode) {
  }
  
  static bool DisassemblePreLoadFrm(MCInst &MI, unsigned Opcode, uint32_t insn,
-    unsigned short NumOps, unsigned &NumOpsAdded) {
+    unsigned short NumOps, unsigned &NumOpsAdded, BO B) {
  
-  // Preload Data/Instruction requires either 2 or 4 operands.
-  // PLDi, PLDWi, PLIi:                Rn [+/-]imm12 add = (U == '1')
-  // PLDr[a|m], PLDWr[a|m], PLIr[a|m]: Rn Rm addrmode2_opc
+  // Preload Data/Instruction requires either 2 or 3 operands.
+  // PLDi, PLDWi, PLIi:                addrmode_imm12
+  // PLDr[a|m], PLDWr[a|m], PLIr[a|m]: ldst_so_reg
  
-  MI.addOperand(MCOperand::CreateReg(getRegisterEnum(ARM::GPRRegClassID,
+  MI.addOperand(MCOperand::CreateReg(getRegisterEnum(B, ARM::GPRRegClassID,
                                                       decodeRn(insn))));
  
-  if (Opcode == ARM::PLDi || Opcode == ARM::PLDWi || Opcode == ARM::PLIi) {
+  if (Opcode == ARM::PLDi12 || Opcode == ARM::PLDWi12
+      || Opcode == ARM::PLIi12) {
      unsigned Imm12 = slice(insn, 11, 0);
      bool Negative = getUBit(insn) == 0;
-    int Offset = Negative ? -1 - Imm12 : 1 * Imm12;
-    MI.addOperand(MCOperand::CreateImm(Offset));
+    // -0 is represented specially. All other values are as normal.
+    if (Imm12 == 0 && Negative)
+      Imm12 = INT32_MIN;
+    MI.addOperand(MCOperand::CreateImm(Imm12));
      NumOpsAdded = 2;
    } else {
-    MI.addOperand(MCOperand::CreateReg(getRegisterEnum(ARM::GPRRegClassID,
+    MI.addOperand(MCOperand::CreateReg(getRegisterEnum(B, ARM::GPRRegClassID,
                                                         decodeRm(insn))));
  
      ARM_AM::AddrOpc AddrOpcode = getUBit(insn) ? ARM_AM::add : ARM_AM::sub;
@@ -3057,10 +2930,17 @@ static bool DisassemblePreLoadFrm(MCInst &MI, unsigned Opcode, uint32_t insn,
  }
  
  static bool DisassembleMiscFrm(MCInst &MI, unsigned Opcode, uint32_t insn,
-    unsigned short NumOps, unsigned &NumOpsAdded) {
+    unsigned short NumOps, unsigned &NumOpsAdded, BO B) {
  
-  if (MemBarrierInstr(insn))
+  if (MemBarrierInstr(insn)) {
+    // DMBsy, DSBsy, and ISBsy instructions have zero operand and are taken care
+    // of within the generic ARMBasicMCBuilder::BuildIt() method.
+    //
+    // Inst{3-0} encodes the memory barrier option for the variants.
+    MI.addOperand(MCOperand::CreateImm(slice(insn, 3, 0)));
+    NumOpsAdded = 1;
      return true;
+  }
  
    switch (Opcode) {
    case ARM::CLREX:
@@ -3070,22 +2950,48 @@ static bool DisassembleMiscFrm(MCInst &MI, unsigned Opcode, uint32_t insn,
    case ARM::WFE:
    case ARM::WFI:
    case ARM::SEV:
-  case ARM::SETENDBE:
-  case ARM::SETENDLE:
      return true;
    default:
      break;
    }
  
-  // CPS has a singleton $opt operand that contains the following information:
-  // opt{4-0} = mode from Inst{4-0}
-  // opt{5} = changemode from Inst{17}
-  // opt{8-6} = AIF from Inst{8-6}
-  // opt{10-9} = imod from Inst{19-18} with 0b10 as enable and 0b11 as disable
-  if (Opcode == ARM::CPS) {
-    unsigned Option = slice(insn, 4, 0) | slice(insn, 17, 17) << 5 |
-      slice(insn, 8, 6) << 6 | slice(insn, 19, 18) << 9;
-    MI.addOperand(MCOperand::CreateImm(Option));
+  if (Opcode == ARM::SETEND) {
+    NumOpsAdded = 1;
+    MI.addOperand(MCOperand::CreateImm(slice(insn, 9, 9)));
+    return true;
+  }
+
+  // FIXME: To enable correct asm parsing and disasm of CPS we need 3 different
+  // opcodes which match the same real instruction. This is needed since there's
+  // no current handling of optional arguments. Fix here when a better handling
+  // of optional arguments is implemented.
+  if (Opcode == ARM::CPS3p) {   // M = 1
+    // Let's reject these impossible imod values by returning false:
+    // 1. (imod=0b01)
+    //
+    // AsmPrinter cannot handle imod=0b00, plus (imod=0b00,M=1,iflags!=0) is an
+    // invalid combination, so we just check for imod=0b00 here.
+    if (slice(insn, 19, 18) == 0 || slice(insn, 19, 18) == 1)
+      return false;
+    MI.addOperand(MCOperand::CreateImm(slice(insn, 19, 18))); // imod
+    MI.addOperand(MCOperand::CreateImm(slice(insn, 8, 6)));   // iflags
+    MI.addOperand(MCOperand::CreateImm(slice(insn, 4, 0)));   // mode
+    NumOpsAdded = 3;
+    return true;
+  }
+  if (Opcode == ARM::CPS2p) { // mode = 0, M = 0
+    // Let's reject these impossible imod values by returning false:
+    // 1. (imod=0b00,M=0)
+    // 2. (imod=0b01)
+    if (slice(insn, 19, 18) == 0 || slice(insn, 19, 18) == 1)
+      return false;
+    MI.addOperand(MCOperand::CreateImm(slice(insn, 19, 18))); // imod
+    MI.addOperand(MCOperand::CreateImm(slice(insn, 8, 6)));   // iflags
+    NumOpsAdded = 2;
+    return true;
+  }
+  if (Opcode == ARM::CPS1p) { // imod = 0, iflags = 0, M = 1
+    MI.addOperand(MCOperand::CreateImm(slice(insn, 4, 0))); // mode
      NumOpsAdded = 1;
      return true;
    }
@@ -3106,19 +3012,12 @@ static bool DisassembleMiscFrm(MCInst &MI, unsigned Opcode, uint32_t insn,
    }
  
    if (PreLoadOpcode(Opcode))
-    return DisassemblePreLoadFrm(MI, Opcode, insn, NumOps, NumOpsAdded);
+    return DisassemblePreLoadFrm(MI, Opcode, insn, NumOps, NumOpsAdded, B);
  
    assert(0 && "Unexpected misc instruction!");
    return false;
  }
  
-static bool DisassembleThumbMiscFrm(MCInst &MI, unsigned Opcode, uint32_t insn,
-    unsigned short NumOps, unsigned &NumOpsAdded) {
-
-  assert(0 && "Unexpected thumb misc. instruction!");
-  return false;
-}
-
  /// FuncPtrs - FuncPtrs maps ARMFormat to its corresponding DisassembleFP.
  /// We divide the disassembly task into different categories, with each one
  /// corresponding to a specific instruction encoding format.  There could be
@@ -3136,7 +3035,9 @@ static const DisassembleFP FuncPtrs[] = {
    &DisassembleLdMiscFrm,
    &DisassembleStMiscFrm,
    &DisassembleLdStMulFrm,
+  &DisassembleLdStExFrm,
    &DisassembleArithMiscFrm,
+  &DisassembleSatFrm,
    &DisassembleExtFrm,
    &DisassembleVFPUnaryFrm,
    &DisassembleVFPBinaryFrm,
@@ -3149,100 +3050,62 @@ static const DisassembleFP FuncPtrs[] = {
    &DisassembleVFPLdStMulFrm,
    &DisassembleVFPMiscFrm,
    &DisassembleThumbFrm,
-  &DisassembleNEONFrm,
-  &DisassembleNEONGetLnFrm,
-  &DisassembleNEONSetLnFrm,
-  &DisassembleNEONDupFrm,
-  &DisassembleLdStExFrm,
    &DisassembleMiscFrm,
-  &DisassembleThumbMiscFrm,
-  NULL,
-};
+  &DisassembleNGetLnFrm,
+  &DisassembleNSetLnFrm,
+  &DisassembleNDupFrm,
  
-/// ARMAlgorithm - ARMAlgorithm implements ARMDisassemblyAlgorithm for solving
-/// the problem of building the MCOperands of an MCInst.  Construction of
-/// ARMAlgorithm requires passing in a function pointer with the DisassembleFP
-/// data type.
-class ARMAlgorithm : public ARMDisassemblyAlgorithm {
-  /// Algorithms - Algorithms stores a map from Format to ARMAlgorithm*.
-  static std::vector<ARMAlgorithm*> Algorithms;
-  /// NSAlgorithms - NSAlgorithms stores a map from NSFormat to ARMAlgorithm*.
-  static std::vector<ARMAlgorithm*> NSAlgorithms;
-
-  DisassembleFP Disassemble;
-
-public:
-  /// GetInstance - GetInstance returns an instance of ARMAlgorithm given the
-  /// encoding Format.  API clients should not free up the returned instance.
-  static ARMAlgorithm *GetInstance(ARMFormat Format, NSFormat NSF) {
-    /// Init the first time.
-    if (Algorithms.size() == 0) {
-      Algorithms.resize(array_lengthof(FuncPtrs));
-      for (unsigned i = 0, num = array_lengthof(FuncPtrs); i < num; ++i)
-        if (FuncPtrs[i])
-          Algorithms[i] = new ARMAlgorithm(FuncPtrs[i]);
-        else
-          Algorithms[i] = NULL;
-    }
-    if (NSAlgorithms.size() == 0) {
-      NSAlgorithms.resize(array_lengthof(NEONFuncPtrs));
-      for (unsigned i = 0, num = array_lengthof(NEONFuncPtrs); i < num; ++i)
-        if (NEONFuncPtrs[i])
-          NSAlgorithms[i] = new ARMAlgorithm(NEONFuncPtrs[i]);
-        else
-          NSAlgorithms[i] = NULL;
-    }
-    
-    if (Format != ARM_FORMAT_NEONFRM)
-      return Algorithms[Format];
-    else
-      return NSAlgorithms[NSF];
-  }
+  // VLD and VST (including one lane) Instructions.
+  &DisassembleNLdSt,
  
-  virtual bool Solve(MCInst &MI, unsigned Opcode, uint32_t insn,
-      unsigned short NumOps, unsigned &NumOpsAdded) const {
-    if (Disassemble == NULL)
-      return false;
+  // A7.4.6 One register and a modified immediate value
+  // 1-Register Instructions with imm.
+  // LLVM only defines VMOVv instructions.
+  &DisassembleN1RegModImmFrm,
  
-    return (*Disassemble)(MI, Opcode, insn, NumOps, NumOpsAdded);
-  }
+  // 2-Register Instructions with no imm.
+  &DisassembleN2RegFrm,
  
-private:
-  ARMAlgorithm(DisassembleFP fp) :
-    ARMDisassemblyAlgorithm(), Disassemble(fp) {}
+  // 2-Register Instructions with imm (vector convert float/fixed point).
+  &DisassembleNVCVTFrm,
  
-  ARMAlgorithm(ARMAlgorithm &AA) :
-    ARMDisassemblyAlgorithm(), Disassemble(AA.Disassemble) {}
+  // 2-Register Instructions with imm (vector dup lane).
+  &DisassembleNVecDupLnFrm,
  
-  virtual ~ARMAlgorithm() {}
-};
+  // Vector Shift Left Instructions.
+  &DisassembleN2RegVecShLFrm,
  
-// Define the symbol here.
-std::vector<ARMAlgorithm*> ARMAlgorithm::Algorithms;
+  // Vector Shift Righ Instructions, which has different interpretation of the
+  // shift amount from the imm6 field.
+  &DisassembleN2RegVecShRFrm,
  
-// Define the symbol here.
-std::vector<ARMAlgorithm*> ARMAlgorithm::NSAlgorithms;
+  // 3-Register Data-Processing Instructions.
+  &DisassembleN3RegFrm,
  
-// Define the symbol here.
-unsigned ARMBasicMCBuilder::ITCounter = 0;
+  // Vector Shift (Register) Instructions.
+  // D:Vd M:Vm N:Vn (notice that M:Vm is the first operand)
+  &DisassembleN3RegVecShFrm,
  
-// Define the symbol here.
-unsigned ARMBasicMCBuilder::ITState = 0;
+  // Vector Extract Instructions.
+  &DisassembleNVecExtractFrm,
  
-// A8.6.50
-static unsigned short CountITSize(unsigned ITMask) {
-  // First count the trailing zeros of the IT mask.
-  unsigned TZ = CountTrailingZeros_32(ITMask);
-  assert(TZ <= 3);
-  return (4 - TZ);
-}
+  // Vector [Saturating Rounding Doubling] Multiply [Accumulate/Subtract] [Long]
+  // By Scalar Instructions.
+  &DisassembleNVecMulScalarFrm,
+
+  // Vector Table Lookup uses byte indexes in a control vector to look up byte
+  // values in a table and generate a new vector.
+  &DisassembleNVTBLFrm,
+
+  NULL
+};
  
  /// BuildIt - BuildIt performs the build step for this ARM Basic MC Builder.
  /// The general idea is to set the Opcode for the MCInst, followed by adding
  /// the appropriate MCOperands to the MCInst.  ARM Basic MC Builder delegates
-/// to the Algo (ARM Disassemble Algorithm) object to perform Format-specific
-/// disassembly, followed by class method TryPredicateAndSBitModifier() to do
-/// PredicateOperand and OptionalDefOperand which follow the Dst/Src Operands.
+/// to the Format-specific disassemble function for disassembly, followed by
+/// TryPredicateAndSBitModifier() to do PredicateOperand and OptionalDefOperand
+/// which follow the Dst/Src Operands.
  bool ARMBasicMCBuilder::BuildIt(MCInst &MI, uint32_t insn) {
    // Stage 1 sets the Opcode.
    MI.setOpcode(Opcode);
@@ -3250,11 +3113,14 @@ bool ARMBasicMCBuilder::BuildIt(MCInst &MI, uint32_t insn) {
    if (NumOps == 0)
      return true;
  
-  // Stage 2 calls the ARM Disassembly Algorithm to build the operand list.
+  // Stage 2 calls the format-specific disassemble function to build the operand
+  // list.
+  if (Disasm == NULL)
+    return false;
    unsigned NumOpsAdded = 0;
-  bool OK = Algo.Solve(MI, Opcode, insn, NumOps, NumOpsAdded);
+  bool OK = (*Disasm)(MI, Opcode, insn, NumOps, NumOpsAdded, this);
  
-  if (!OK) return false;
+  if (!OK || this->Err != 0) return false;
    if (NumOpsAdded >= NumOps)
      return true;
  
@@ -3263,10 +3129,54 @@ bool ARMBasicMCBuilder::BuildIt(MCInst &MI, uint32_t insn) {
    return TryPredicateAndSBitModifier(MI, Opcode, insn, NumOps - NumOpsAdded);
  }
  
+// A8.3 Conditional execution
+// A8.3.1 Pseudocode details of conditional execution
+// Condition bits '111x' indicate the instruction is always executed.
+static uint32_t CondCode(uint32_t CondField) {
+  if (CondField == 0xF)
+    return ARMCC::AL;
+  return CondField;
+}
+
+/// DoPredicateOperands - DoPredicateOperands process the predicate operands
+/// of some Thumb instructions which come before the reglist operands.  It
+/// returns true if the two predicate operands have been processed.
+bool ARMBasicMCBuilder::DoPredicateOperands(MCInst& MI, unsigned Opcode,
+    uint32_t /* insn */, unsigned short NumOpsRemaining) {
+
+  assert(NumOpsRemaining > 0 && "Invalid argument");
+
+  const TargetOperandInfo *OpInfo = ARMInsts[Opcode].OpInfo;
+  unsigned Idx = MI.getNumOperands();
+
+  // First, we check whether this instr specifies the PredicateOperand through
+  // a pair of TargetOperandInfos with isPredicate() property.
+  if (NumOpsRemaining >= 2 &&
+      OpInfo[Idx].isPredicate() && OpInfo[Idx+1].isPredicate() &&
+      OpInfo[Idx].RegClass < 0 &&
+      OpInfo[Idx+1].RegClass == ARM::CCRRegClassID)
+  {
+    // If we are inside an IT block, get the IT condition bits maintained via
+    // ARMBasicMCBuilder::ITState[7:0], through ARMBasicMCBuilder::GetITCond().
+    // See also A2.5.2.
+    if (InITBlock())
+      MI.addOperand(MCOperand::CreateImm(GetITCond()));
+    else
+      MI.addOperand(MCOperand::CreateImm(ARMCC::AL));
+    MI.addOperand(MCOperand::CreateReg(ARM::CPSR));
+    return true;
+  }
+
+  return false;
+}
+  
+/// TryPredicateAndSBitModifier - TryPredicateAndSBitModifier tries to process
+/// the possible Predicate and SBitModifier, to build the remaining MCOperand
+/// constituents.
  bool ARMBasicMCBuilder::TryPredicateAndSBitModifier(MCInst& MI, unsigned Opcode,
      uint32_t insn, unsigned short NumOpsRemaining) {
  
-  assert(NumOpsRemaining > 0);
+  assert(NumOpsRemaining > 0 && "Invalid argument");
  
    const TargetOperandInfo *OpInfo = ARMInsts[Opcode].OpInfo;
    const std::string &Name = ARMInsts[Opcode].Name;
@@ -3276,7 +3186,8 @@ bool ARMBasicMCBuilder::TryPredicateAndSBitModifier(MCInst& MI, unsigned Opcode,
    // a pair of TargetOperandInfos with isPredicate() property.
    if (NumOpsRemaining >= 2 &&
        OpInfo[Idx].isPredicate() && OpInfo[Idx+1].isPredicate() &&
-      OpInfo[Idx].RegClass == 0 && OpInfo[Idx+1].RegClass == ARM::CCRRegClassID)
+      OpInfo[Idx].RegClass < 0 &&
+      OpInfo[Idx+1].RegClass == ARM::CCRRegClassID)
    {
      // If we are inside an IT block, get the IT condition bits maintained via
      // ARMBasicMCBuilder::ITState[7:0], through ARMBasicMCBuilder::GetITCond().
@@ -3290,28 +3201,23 @@ bool ARMBasicMCBuilder::TryPredicateAndSBitModifier(MCInst& MI, unsigned Opcode,
          //
          // A8.6.16 B
          if (Name == "t2Bcc")
-          MI.addOperand(MCOperand::CreateImm(slice(insn, 25, 22)));
+          MI.addOperand(MCOperand::CreateImm(CondCode(slice(insn, 25, 22))));
          else if (Name == "tBcc")
-          MI.addOperand(MCOperand::CreateImm(slice(insn, 11, 8)));
+          MI.addOperand(MCOperand::CreateImm(CondCode(slice(insn, 11, 8))));
          else
            MI.addOperand(MCOperand::CreateImm(ARMCC::AL));
        } else {
-        // ARM Instructions.  Check condition field.
-        int64_t CondVal = getCondField(insn);
-        if (CondVal == 0xF)
-          MI.addOperand(MCOperand::CreateImm(ARMCC::AL));
-        else
-          MI.addOperand(MCOperand::CreateImm(CondVal));
+        // ARM instructions get their condition field from Inst{31-28}.
+        MI.addOperand(MCOperand::CreateImm(CondCode(getCondField(insn))));
        }
      }
      MI.addOperand(MCOperand::CreateReg(ARM::CPSR));
      Idx += 2;
      NumOpsRemaining -= 2;
-    if (NumOpsRemaining == 0)
-      return true;
    }
  
-  assert(NumOpsRemaining > 0);
+  if (NumOpsRemaining == 0)
+    return true;
  
    // Next, if OptionalDefOperand exists, we check whether the 'S' bit is set.
    if (OpInfo[Idx].isOptionalDef() && OpInfo[Idx].RegClass==ARM::CCRRegClassID) {
@@ -3330,22 +3236,37 @@ bool ARMBasicMCBuilder::TryPredicateAndSBitModifier(MCInst& MI, unsigned Opcode,
  bool ARMBasicMCBuilder::RunBuildAfterHook(bool Status, MCInst &MI,
      uint32_t insn) {
  
-  if (Opcode == ARM::t2IT) {
-    ARMBasicMCBuilder::ITCounter = CountITSize(slice(insn, 3, 0));
-    ARMBasicMCBuilder::InitITState(slice(insn, 7, 0));
-  } else if (InITBlock())
-    ARMBasicMCBuilder::UpdateITState();
+  if (!SP) return Status;
+
+  if (Opcode == ARM::t2IT)
+    Status = SP->InitIT(slice(insn, 7, 0)) ? Status : false;
+  else if (InITBlock())
+    SP->UpdateIT();
  
    return Status;
  }
  
-AbstractARMMCBuilder *ARMMCBuilderFactory::CreateMCBuilder(unsigned Opcode,
-    ARMFormat Format, NSFormat NSF) {
-
-  ARMAlgorithm *Algo = ARMAlgorithm::GetInstance(Format, NSF);
-  if (!Algo)
-    return NULL;
+/// Opcode, Format, and NumOperands make up an ARM Basic MCBuilder.
+ARMBasicMCBuilder::ARMBasicMCBuilder(unsigned opc, ARMFormat format,
+                                     unsigned short num)
+  : Opcode(opc), Format(format), NumOps(num), SP(0), Err(0) {
+  unsigned Idx = (unsigned)format;
+  assert(Idx < (array_lengthof(FuncPtrs) - 1) && "Unknown format");
+  Disasm = FuncPtrs[Idx];
+}
+
+/// CreateMCBuilder - Return an ARMBasicMCBuilder that can build up the MC
+/// infrastructure of an MCInst given the Opcode and Format of the instr.
+/// Return NULL if it fails to create/return a proper builder.  API clients
+/// are responsible for freeing up of the allocated memory.  Cacheing can be
+/// performed by the API clients to improve performance.
+ARMBasicMCBuilder *llvm::CreateMCBuilder(unsigned Opcode, ARMFormat Format) {
+  // For "Unknown format", fail by returning a NULL pointer.
+  if ((unsigned)Format >= (array_lengthof(FuncPtrs) - 1)) {
+    DEBUG(errs() << "Unknown format\n");
+    return 0;
+  }
  
-  return new ARMBasicMCBuilder(Opcode, Format, NSF,
-                               ARMInsts[Opcode].getNumOperands(), *Algo);
+  return new ARMBasicMCBuilder(Opcode, Format,
+                               ARMInsts[Opcode].getNumOperands());
  }