Merging r260427:

[oota-llvm.git] / lib / Target / AMDGPU / SIRegisterInfo.cpp
diff --git a/lib/Target/AMDGPU/SIRegisterInfo.cpp b/lib/Target/AMDGPU/SIRegisterInfo.cpp

index 2d68b8b5df0e2e9c4fe2eb69e93ff234a58a6b96..025ed2b5b76b458df154764b6c4edfc3d787691b 100644 (file)
--- a/lib/Target/AMDGPU/SIRegisterInfo.cpp
+++ b/lib/Target/AMDGPU/SIRegisterInfo.cpp
@@ -23,7 +23,20 @@
  
  using namespace llvm;
  
-SIRegisterInfo::SIRegisterInfo() : AMDGPURegisterInfo() {}
+SIRegisterInfo::SIRegisterInfo() : AMDGPURegisterInfo() {
+  unsigned NumRegPressureSets = getNumRegPressureSets();
+
+  SGPR32SetID = NumRegPressureSets;
+  VGPR32SetID = NumRegPressureSets;
+  for (unsigned i = 0; i < NumRegPressureSets; ++i) {
+    if (strncmp("SGPR_32", getRegPressureSetName(i), 7) == 0)
+      SGPR32SetID = i;
+    else if (strncmp("VGPR_32", getRegPressureSetName(i), 7) == 0)
+      VGPR32SetID = i;
+  }
+  assert(SGPR32SetID < NumRegPressureSets &&
+         VGPR32SetID < NumRegPressureSets);
+}
  
  void SIRegisterInfo::reserveRegisterTuples(BitVector &Reserved, unsigned Reg) const {
    MCRegAliasIterator R(Reg, this, true);
@@ -221,6 +234,7 @@ void SIRegisterInfo::buildScratchLoadStore(MachineBasicBlock::iterator MI,
    bool IsLoad = TII->get(LoadStoreOp).mayLoad();
  
    bool RanOutOfSGPRs = false;
+  bool Scavenged = false;
    unsigned SOffset = ScratchOffset;
  
    unsigned NumSubRegs = getNumSubRegsForSpillOp(MI->getOpcode());
@@ -231,6 +245,8 @@ void SIRegisterInfo::buildScratchLoadStore(MachineBasicBlock::iterator MI,
      if (SOffset == AMDGPU::NoRegister) {
        RanOutOfSGPRs = true;
        SOffset = AMDGPU::SGPR0;
+    } else {
+      Scavenged = true;
      }
      BuildMI(*MBB, MI, DL, TII->get(AMDGPU::S_ADD_U32), SOffset)
              .addReg(ScratchOffset)
@@ -246,10 +262,14 @@ void SIRegisterInfo::buildScratchLoadStore(MachineBasicBlock::iterator MI,
          getPhysRegSubReg(Value, &AMDGPU::VGPR_32RegClass, i) :
          Value;
  
+    unsigned SOffsetRegState = 0;
+    if (i + 1 == e && Scavenged)
+      SOffsetRegState |= RegState::Kill;
+
      BuildMI(*MBB, MI, DL, TII->get(LoadStoreOp))
        .addReg(SubReg, getDefRegState(IsLoad))
        .addReg(ScratchRsrcReg)
-      .addReg(SOffset)
+      .addReg(SOffset, SOffsetRegState)
        .addImm(Offset)
        .addImm(0) // glc
        .addImm(0) // slc