Reduce the size of MCRelaxableFragment.

[oota-llvm.git] / lib / Target / AMDGPU / AsmParser / AMDGPUAsmParser.cpp
diff --git a/lib/Target/AMDGPU/AsmParser/AMDGPUAsmParser.cpp b/lib/Target/AMDGPU/AsmParser/AMDGPUAsmParser.cpp

index ad50003213d73ecdf17076ce2892ffc214e30b7a..db5cebf6e42c13a9e566ff8751aa90b30601eb99 100644 (file)
--- a/lib/Target/AMDGPU/AsmParser/AMDGPUAsmParser.cpp
+++ b/lib/Target/AMDGPU/AsmParser/AMDGPUAsmParser.cpp
@@ -28,7 +28,9 @@
  #include "llvm/MC/MCRegisterInfo.h"
  #include "llvm/MC/MCStreamer.h"
  #include "llvm/MC/MCSubtargetInfo.h"
+#include "llvm/MC/MCSymbolELF.h"
  #include "llvm/MC/MCTargetAsmParser.h"
+#include "llvm/Support/ELF.h"
  #include "llvm/Support/SourceMgr.h"
  #include "llvm/Support/TargetRegistry.h"
  #include "llvm/Support/raw_ostream.h"
@@ -258,7 +260,7 @@ public:
    void print(raw_ostream &OS) const override {
      switch (Kind) {
      case Register:
-      OS << "<register " << getReg() << '>';
+      OS << "<register " << getReg() << " mods: " << Reg.Modifiers << '>';
        break;
      case Immediate:
        OS << getImm();
@@ -325,11 +327,19 @@ public:
  };
  
  class AMDGPUAsmParser : public MCTargetAsmParser {
-  MCSubtargetInfo &STI;
    const MCInstrInfo &MII;
    MCAsmParser &Parser;
  
    unsigned ForcedEncodingSize;
+
+  bool isVI() const {
+    return getSTI().getFeatureBits()[AMDGPU::FeatureVolcanicIslands];
+  }
+
+  bool hasSGPR102_SGPR103() const {
+    return !isVI();
+  }
+
    /// @name Auto-generated Match Functions
    /// {
  
@@ -345,6 +355,8 @@ private:
    bool ParseAMDKernelCodeTValue(StringRef ID, amd_kernel_code_t &Header);
    bool ParseDirectiveAMDKernelCodeT();
    bool ParseSectionDirectiveHSAText();
+  bool subtargetHasRegister(const MCRegisterInfo &MRI, unsigned RegNo) const;
+  bool ParseDirectiveAMDGPUHsaKernel();
  
  public:
  public:
@@ -352,18 +364,19 @@ public:
      Match_PreferE32 = FIRST_TARGET_MATCH_RESULT_TY
    };
  
-  AMDGPUAsmParser(MCSubtargetInfo &STI, MCAsmParser &_Parser,
+  AMDGPUAsmParser(const MCSubtargetInfo &STI, MCAsmParser &_Parser,
                 const MCInstrInfo &MII,
                 const MCTargetOptions &Options)
-      : MCTargetAsmParser(Options), STI(STI), MII(MII), Parser(_Parser),
-        ForcedEncodingSize(0){
+      : MCTargetAsmParser(Options, STI), MII(MII), Parser(_Parser),
+        ForcedEncodingSize(0) {
+    MCAsmParserExtension::Initialize(Parser);
  
-    if (STI.getFeatureBits().none()) {
+    if (getSTI().getFeatureBits().none()) {
        // Set default features.
-      STI.ToggleFeature("SOUTHERN_ISLANDS");
+      copySTI().ToggleFeature("SOUTHERN_ISLANDS");
      }
  
-    setAvailableFeatures(ComputeAvailableFeatures(STI.getFeatureBits()));
+    setAvailableFeatures(ComputeAvailableFeatures(getSTI().getFeatureBits()));
    }
  
    AMDGPUTargetStreamer &getTargetStreamer() {
@@ -447,10 +460,10 @@ struct OptionalOperand {
  
  }
  
-static unsigned getRegClass(bool IsVgpr, unsigned RegWidth) {
+static int getRegClass(bool IsVgpr, unsigned RegWidth) {
    if (IsVgpr) {
      switch (RegWidth) {
-      default: llvm_unreachable("Unknown register width");
+      default: return -1;
        case 1: return AMDGPU::VGPR_32RegClassID;
        case 2: return AMDGPU::VReg_64RegClassID;
        case 3: return AMDGPU::VReg_96RegClassID;
@@ -461,7 +474,7 @@ static unsigned getRegClass(bool IsVgpr, unsigned RegWidth) {
    }
  
    switch (RegWidth) {
-    default: llvm_unreachable("Unknown register width");
+    default: return -1;
      case 1: return AMDGPU::SGPR_32RegClassID;
      case 2: return AMDGPU::SGPR_64RegClassID;
      case 4: return AMDGPU::SReg_128RegClassID;
@@ -475,11 +488,11 @@ static unsigned getRegForName(StringRef RegName) {
    return StringSwitch<unsigned>(RegName)
      .Case("exec", AMDGPU::EXEC)
      .Case("vcc", AMDGPU::VCC)
-    .Case("flat_scr", AMDGPU::FLAT_SCR)
+    .Case("flat_scratch", AMDGPU::FLAT_SCR)
      .Case("m0", AMDGPU::M0)
      .Case("scc", AMDGPU::SCC)
-    .Case("flat_scr_lo", AMDGPU::FLAT_SCR_LO)
-    .Case("flat_scr_hi", AMDGPU::FLAT_SCR_HI)
+    .Case("flat_scratch_lo", AMDGPU::FLAT_SCR_LO)
+    .Case("flat_scratch_hi", AMDGPU::FLAT_SCR_HI)
      .Case("vcc_lo", AMDGPU::VCC_LO)
      .Case("vcc_hi", AMDGPU::VCC_HI)
      .Case("exec_lo", AMDGPU::EXEC_LO)
@@ -541,16 +554,25 @@ bool AMDGPUAsmParser::ParseRegister(unsigned &RegNo, SMLoc &StartLoc, SMLoc &End
        RegIndexInClass = RegLo;
      } else {
        // SGPR registers are aligned.  Max alignment is 4 dwords.
-      RegIndexInClass = RegLo / std::min(RegWidth, 4u);
+      unsigned Size = std::min(RegWidth, 4u);
+      if (RegLo % Size != 0)
+        return true;
+
+      RegIndexInClass = RegLo / Size;
      }
    }
  
-  const MCRegisterInfo *TRC = getContext().getRegisterInfo();
-  unsigned RC = getRegClass(IsVgpr, RegWidth);
-  if (RegIndexInClass > TRC->getRegClass(RC).getNumRegs())
+  const MCRegisterInfo *TRI = getContext().getRegisterInfo();
+  int RCID = getRegClass(IsVgpr, RegWidth);
+  if (RCID == -1)
      return true;
-  RegNo = TRC->getRegClass(RC).getRegister(RegIndexInClass);
-  return false;
+
+  const MCRegisterClass RC = TRI->getRegClass(RCID);
+  if (RegIndexInClass >= RC.getNumRegs())
+    return true;
+
+  RegNo = RC.getRegister(RegIndexInClass);
+  return !subtargetHasRegister(*TRI, RegNo);
  }
  
  unsigned AMDGPUAsmParser::checkTargetMatchPredicate(MCInst &Inst) {
@@ -581,7 +603,7 @@ bool AMDGPUAsmParser::MatchAndEmitInstruction(SMLoc IDLoc, unsigned &Opcode,
      default: break;
      case Match_Success:
        Inst.setLoc(IDLoc);
-      Out.EmitInstruction(Inst, STI);
+      Out.EmitInstruction(Inst, getSTI());
        return false;
      case Match_MissingFeature:
        return Error(IDLoc, "instruction not supported on this GPU");
@@ -675,7 +697,7 @@ bool AMDGPUAsmParser::ParseDirectiveHSACodeObjectISA() {
    // If this directive has no arguments, then use the ISA version for the
    // targeted GPU.
    if (getLexer().is(AsmToken::EndOfStatement)) {
-    AMDGPU::IsaVersion Isa = AMDGPU::getIsaVersion(STI.getFeatureBits());
+    AMDGPU::IsaVersion Isa = AMDGPU::getIsaVersion(getSTI().getFeatureBits());
      getTargetStreamer().EmitDirectiveHSACodeObjectISA(Isa.Major, Isa.Minor,
                                                        Isa.Stepping,
                                                        "AMD", "AMDGPU");
@@ -887,7 +909,7 @@ bool AMDGPUAsmParser::ParseAMDKernelCodeTValue(StringRef ID,
  bool AMDGPUAsmParser::ParseDirectiveAMDKernelCodeT() {
  
    amd_kernel_code_t Header;
-  AMDGPU::initDefaultAMDKernelCodeT(Header, STI.getFeatureBits());
+  AMDGPU::initDefaultAMDKernelCodeT(Header, getSTI().getFeatureBits());
  
    while (true) {
  
@@ -923,6 +945,18 @@ bool AMDGPUAsmParser::ParseSectionDirectiveHSAText() {
    return false;
  }
  
+bool AMDGPUAsmParser::ParseDirectiveAMDGPUHsaKernel() {
+  if (getLexer().isNot(AsmToken::Identifier))
+    return TokError("expected symbol name");
+
+  StringRef KernelName = Parser.getTok().getString();
+
+  getTargetStreamer().EmitAMDGPUSymbolType(KernelName,
+                                           ELF::STT_AMDGPU_HSA_KERNEL);
+  Lex();
+  return false;
+}
+
  bool AMDGPUAsmParser::ParseDirective(AsmToken DirectiveID) {
    StringRef IDVal = DirectiveID.getString();
  
@@ -938,6 +972,25 @@ bool AMDGPUAsmParser::ParseDirective(AsmToken DirectiveID) {
    if (IDVal == ".hsatext" || IDVal == ".text")
      return ParseSectionDirectiveHSAText();
  
+  if (IDVal == ".amdgpu_hsa_kernel")
+    return ParseDirectiveAMDGPUHsaKernel();
+
+  return true;
+}
+
+bool AMDGPUAsmParser::subtargetHasRegister(const MCRegisterInfo &MRI,
+                                           unsigned RegNo) const {
+  if (!isVI())
+    return true;
+
+  // VI only has 102 SGPRs, so make sure we aren't trying to use the 2 more that
+  // SI/CI have.
+  for (MCRegAliasIterator R(AMDGPU::SGPR102_SGPR103, &MRI, true);
+       R.isValid(); ++R) {
+    if (*R == RegNo)
+      return false;
+  }
+
    return true;
  }
  
@@ -987,13 +1040,11 @@ AMDGPUAsmParser::parseOperand(OperandVector &Operands, StringRef Mnemonic) {
        int64_t IntVal;
        if (getParser().parseAbsoluteExpression(IntVal))
          return MatchOperand_ParseFail;
-      APInt IntVal32(32, IntVal);
-      if (IntVal32.getSExtValue() != IntVal) {
+      if (!isInt<32>(IntVal) && !isUInt<32>(IntVal)) {
          Error(S, "invalid immediate: only 32-bit values are legal");
          return MatchOperand_ParseFail;
        }
  
-      IntVal = IntVal32.getSExtValue();
        if (Negate)
          IntVal *= -1;
        Operands.push_back(AMDGPUOperand::CreateImm(IntVal, S));