[X86] Combine (cmov (and/or (setcc) (setcc))) into (cmov (cmov)).

[oota-llvm.git] / lib / Target / NVPTX / NVPTXAsmPrinter.cpp
diff --git a/lib/Target/NVPTX/NVPTXAsmPrinter.cpp b/lib/Target/NVPTX/NVPTXAsmPrinter.cpp

index 92e5a58372ff18eb9ce6fbe3cc2414ec0cfe7833..833db04bec8324ce23dc7f947e4bba54b1d60cc1 100644 (file)
--- a/lib/Target/NVPTX/NVPTXAsmPrinter.cpp
+++ b/lib/Target/NVPTX/NVPTXAsmPrinter.cpp
@@ -164,7 +164,7 @@ void NVPTXAsmPrinter::emitLineNumberAsDotLoc(const MachineInstr &MI) {
  void NVPTXAsmPrinter::EmitInstruction(const MachineInstr *MI) {
    SmallString<128> Str;
    raw_svector_ostream OS(Str);
-  if (nvptxSubtarget.getDrvInterface() == NVPTX::CUDA)
+  if (static_cast<NVPTXTargetMachine &>(TM).getDrvInterface() == NVPTX::CUDA)
      emitLineNumberAsDotLoc(*MI);
  
    MCInst Inst;
@@ -237,8 +237,6 @@ void NVPTXAsmPrinter::lowerImageHandleSymbol(unsigned Index, MCOperand &MCOp) {
  
  void NVPTXAsmPrinter::lowerToMCInst(const MachineInstr *MI, MCInst &OutMI) {
    OutMI.setOpcode(MI->getOpcode());
-  const NVPTXSubtarget &ST = TM.getSubtarget<NVPTXSubtarget>();
-
    // Special: Do not mangle symbol operand of CALL_PROTOTYPE
    if (MI->getOpcode() == NVPTX::CALL_PROTOTYPE) {
      const MachineOperand &MO = MI->getOperand(0);
@@ -251,7 +249,7 @@ void NVPTXAsmPrinter::lowerToMCInst(const MachineInstr *MI, MCInst &OutMI) {
      const MachineOperand &MO = MI->getOperand(i);
  
      MCOperand MCOp;
-    if (!ST.hasImageHandles()) {
+    if (!nvptxSubtarget->hasImageHandles()) {
        if (lowerImageHandleOperand(MI, i, MCOp)) {
          OutMI.addOperand(MCOp);
          continue;
@@ -349,11 +347,11 @@ MCOperand NVPTXAsmPrinter::GetSymbolRef(const MCSymbol *Symbol) {
  
  void NVPTXAsmPrinter::printReturnValStr(const Function *F, raw_ostream &O) {
    const DataLayout *TD = TM.getDataLayout();
-  const TargetLowering *TLI = TM.getSubtargetImpl()->getTargetLowering();
+  const TargetLowering *TLI = nvptxSubtarget->getTargetLowering();
  
    Type *Ty = F->getReturnType();
  
-  bool isABI = (nvptxSubtarget.getSmVersion() >= 20);
+  bool isABI = (nvptxSubtarget->getSmVersion() >= 20);
  
    if (Ty->getTypeID() == Type::VoidTyID)
      return;
@@ -422,12 +420,11 @@ void NVPTXAsmPrinter::printReturnValStr(const MachineFunction &MF,
  
  // Return true if MBB is the header of a loop marked with
  // llvm.loop.unroll.disable.
-// TODO(jingyue): consider "#pragma unroll 1" which is equivalent to "#pragma
-// nounroll".
+// TODO: consider "#pragma unroll 1" which is equivalent to "#pragma nounroll".
  bool NVPTXAsmPrinter::isLoopHeaderOfNoUnroll(
      const MachineBasicBlock &MBB) const {
    MachineLoopInfo &LI = getAnalysis<MachineLoopInfo>();
-  // TODO(jingyue): isLoopHeader() should take "const MachineBasicBlock *".
+  // TODO: isLoopHeader() should take "const MachineBasicBlock *".
    // We insert .pragma "nounroll" only to the loop header.
    if (!LI.isLoopHeader(const_cast<MachineBasicBlock *>(&MBB)))
      return false;
@@ -442,8 +439,7 @@ bool NVPTXAsmPrinter::isLoopHeaderOfNoUnroll(
        continue;
      }
      if (const BasicBlock *PBB = PMBB->getBasicBlock()) {
-      if (const MDNode *LoopID =
-              PBB->getTerminator()->getMetadata("llvm.loop")) {
+      if (MDNode *LoopID = PBB->getTerminator()->getMetadata("llvm.loop")) {
          if (GetUnrollMetadata(LoopID, "llvm.loop.unroll.disable"))
            return true;
        }
@@ -508,14 +504,13 @@ void NVPTXAsmPrinter::EmitFunctionBodyEnd() {
  
  void NVPTXAsmPrinter::emitImplicitDef(const MachineInstr *MI) const {
    unsigned RegNo = MI->getOperand(0).getReg();
-  const TargetRegisterInfo *TRI = TM.getSubtargetImpl()->getRegisterInfo();
+  const TargetRegisterInfo *TRI = nvptxSubtarget->getRegisterInfo();
    if (TRI->isVirtualRegister(RegNo)) {
      OutStreamer.AddComment(Twine("implicit-def: ") +
                             getVirtualRegisterName(RegNo));
    } else {
-    OutStreamer.AddComment(
-        Twine("implicit-def: ") +
-        TM.getSubtargetImpl()->getRegisterInfo()->getName(RegNo));
+    OutStreamer.AddComment(Twine("implicit-def: ") +
+                           nvptxSubtarget->getRegisterInfo()->getName(RegNo));
    }
    OutStreamer.AddBlankLine();
  }
@@ -817,6 +812,14 @@ void NVPTXAsmPrinter::recordAndEmitFilenames(Module &M) {
  }
  
  bool NVPTXAsmPrinter::doInitialization(Module &M) {
+  // Construct a default subtarget off of the TargetMachine defaults. The
+  // rest of NVPTX isn't friendly to change subtargets per function and
+  // so the default TargetMachine will have all of the options.
+  StringRef TT = TM.getTargetTriple();
+  StringRef CPU = TM.getTargetCPU();
+  StringRef FS = TM.getTargetFeatureString();
+  const NVPTXTargetMachine &NTM = static_cast<const NVPTXTargetMachine &>(TM);
+  const NVPTXSubtarget STI(TT, CPU, FS, NTM);
  
    SmallString<128> Str1;
    raw_svector_ostream OS1(Str1);
@@ -834,7 +837,7 @@ bool NVPTXAsmPrinter::doInitialization(Module &M) {
    Mang = new Mangler(TM.getDataLayout());
  
    // Emit header before any dwarf directives are emitted below.
-  emitHeader(M, OS1);
+  emitHeader(M, OS1, STI);
    OutStreamer.EmitRawText(OS1.str());
  
    // Already commented out
@@ -850,7 +853,8 @@ bool NVPTXAsmPrinter::doInitialization(Module &M) {
      OutStreamer.AddBlankLine();
    }
  
-  if (nvptxSubtarget.getDrvInterface() == NVPTX::CUDA)
+  // If we're not NVCL we're CUDA, go ahead and emit filenames.
+  if (Triple(TM.getTargetTriple()).getOS() != Triple::NVCL)
      recordAndEmitFilenames(M);
  
    GlobalsEmitted = false;
@@ -891,22 +895,24 @@ void NVPTXAsmPrinter::emitGlobals(const Module &M) {
    OutStreamer.EmitRawText(OS2.str());
  }
  
-void NVPTXAsmPrinter::emitHeader(Module &M, raw_ostream &O) {
+void NVPTXAsmPrinter::emitHeader(Module &M, raw_ostream &O,
+                                 const NVPTXSubtarget &STI) {
    O << "//\n";
    O << "// Generated by LLVM NVPTX Back-End\n";
    O << "//\n";
    O << "\n";
  
-  unsigned PTXVersion = nvptxSubtarget.getPTXVersion();
+  unsigned PTXVersion = STI.getPTXVersion();
    O << ".version " << (PTXVersion / 10) << "." << (PTXVersion % 10) << "\n";
  
    O << ".target ";
-  O << nvptxSubtarget.getTargetName();
+  O << STI.getTargetName();
  
-  if (nvptxSubtarget.getDrvInterface() == NVPTX::NVCL)
+  const NVPTXTargetMachine &NTM = static_cast<const NVPTXTargetMachine &>(TM);
+  if (NTM.getDrvInterface() == NVPTX::NVCL)
      O << ", texmode_independent";
-  if (nvptxSubtarget.getDrvInterface() == NVPTX::CUDA) {
-    if (!nvptxSubtarget.hasDouble())
+  else {
+    if (!STI.hasDouble())
        O << ", map_f64_to_f32";
    }
  
@@ -916,7 +922,7 @@ void NVPTXAsmPrinter::emitHeader(Module &M, raw_ostream &O) {
    O << "\n";
  
    O << ".address_size ";
-  if (nvptxSubtarget.is64Bit())
+  if (NTM.is64Bit())
      O << "64";
    else
      O << "32";
@@ -926,7 +932,6 @@ void NVPTXAsmPrinter::emitHeader(Module &M, raw_ostream &O) {
  }
  
  bool NVPTXAsmPrinter::doFinalization(Module &M) {
-
    // If we did not emit any functions, then the global declarations have not
    // yet been emitted.
    if (!GlobalsEmitted) {
@@ -988,7 +993,7 @@ bool NVPTXAsmPrinter::doFinalization(Module &M) {
  
  void NVPTXAsmPrinter::emitLinkageDirective(const GlobalValue *V,
                                             raw_ostream &O) {
-  if (nvptxSubtarget.getDrvInterface() == NVPTX::CUDA) {
+  if (static_cast<NVPTXTargetMachine &>(TM).getDrvInterface() == NVPTX::CUDA) {
      if (V->hasExternalLinkage()) {
        if (isa<GlobalVariable>(V)) {
          const GlobalVariable *GVar = cast<GlobalVariable>(V);
@@ -1220,7 +1225,7 @@ void NVPTXAsmPrinter::printModuleLevelGV(const GlobalVariable *GVar,
            AggBuffer aggBuffer(ElementSize, O, *this);
            bufferAggregateConstant(Initializer, &aggBuffer);
            if (aggBuffer.numSymbols) {
-            if (nvptxSubtarget.is64Bit()) {
+            if (static_cast<const NVPTXTargetMachine &>(TM).is64Bit()) {
                O << " .u64 " << *getSymbol(GVar) << "[";
                O << ElementSize / 8;
              } else {
@@ -1318,7 +1323,7 @@ NVPTXAsmPrinter::getPTXFundamentalTypeStr(const Type *Ty, bool useB4PTR) const {
    case Type::DoubleTyID:
      return "f64";
    case Type::PointerTyID:
-    if (nvptxSubtarget.is64Bit())
+    if (static_cast<const NVPTXTargetMachine &>(TM).is64Bit())
        if (useB4PTR)
          return "b64";
        else
@@ -1409,50 +1414,22 @@ static unsigned int getOpenCLAlignment(const DataLayout *TD, Type *Ty) {
  
  void NVPTXAsmPrinter::printParamName(Function::const_arg_iterator I,
                                       int paramIndex, raw_ostream &O) {
-  if ((nvptxSubtarget.getDrvInterface() == NVPTX::NVCL) ||
-      (nvptxSubtarget.getDrvInterface() == NVPTX::CUDA))
-    O << *getSymbol(I->getParent()) << "_param_" << paramIndex;
-  else {
-    std::string argName = I->getName();
-    const char *p = argName.c_str();
-    while (*p) {
-      if (*p == '.')
-        O << "_";
-      else
-        O << *p;
-      p++;
-    }
-  }
+  O << *getSymbol(I->getParent()) << "_param_" << paramIndex;
  }
  
  void NVPTXAsmPrinter::printParamName(int paramIndex, raw_ostream &O) {
-  Function::const_arg_iterator I, E;
-  int i = 0;
-
-  if ((nvptxSubtarget.getDrvInterface() == NVPTX::NVCL) ||
-      (nvptxSubtarget.getDrvInterface() == NVPTX::CUDA)) {
-    O << *CurrentFnSym << "_param_" << paramIndex;
-    return;
-  }
-
-  for (I = F->arg_begin(), E = F->arg_end(); I != E; ++I, i++) {
-    if (i == paramIndex) {
-      printParamName(I, paramIndex, O);
-      return;
-    }
-  }
-  llvm_unreachable("paramIndex out of bound");
+  O << *CurrentFnSym << "_param_" << paramIndex;
  }
  
  void NVPTXAsmPrinter::emitFunctionParamList(const Function *F, raw_ostream &O) {
    const DataLayout *TD = TM.getDataLayout();
    const AttributeSet &PAL = F->getAttributes();
-  const TargetLowering *TLI = TM.getSubtargetImpl()->getTargetLowering();
+  const TargetLowering *TLI = nvptxSubtarget->getTargetLowering();
    Function::const_arg_iterator I, E;
    unsigned paramIndex = 0;
    bool first = true;
    bool isKernelFunc = llvm::isKernelFunction(*F);
-  bool isABI = (nvptxSubtarget.getSmVersion() >= 20);
+  bool isABI = (nvptxSubtarget->getSmVersion() >= 20);
    MVT thePointerTy = TLI->getPointerTy();
  
    O << "(\n";
@@ -1471,21 +1448,21 @@ void NVPTXAsmPrinter::emitFunctionParamList(const Function *F, raw_ostream &O) {
          if (isImage(*I)) {
            std::string sname = I->getName();
            if (isImageWriteOnly(*I) || isImageReadWrite(*I)) {
-            if (nvptxSubtarget.hasImageHandles())
+            if (nvptxSubtarget->hasImageHandles())
                O << "\t.param .u64 .ptr .surfref ";
              else
                O << "\t.param .surfref ";
              O << *CurrentFnSym << "_param_" << paramIndex;
            }
            else { // Default image is read_only
-            if (nvptxSubtarget.hasImageHandles())
+            if (nvptxSubtarget->hasImageHandles())
                O << "\t.param .u64 .ptr .texref ";
              else
                O << "\t.param .texref ";
              O << *CurrentFnSym << "_param_" << paramIndex;
            }
          } else {
-          if (nvptxSubtarget.hasImageHandles())
+          if (nvptxSubtarget->hasImageHandles())
              O << "\t.param .u64 .ptr .samplerref ";
            else
              O << "\t.param .samplerref ";
@@ -1518,7 +1495,8 @@ void NVPTXAsmPrinter::emitFunctionParamList(const Function *F, raw_ostream &O) {
            // Special handling for pointer arguments to kernel
            O << "\t.param .u" << thePointerTy.getSizeInBits() << " ";
  
-          if (nvptxSubtarget.getDrvInterface() != NVPTX::CUDA) {
+          if (static_cast<NVPTXTargetMachine &>(TM).getDrvInterface() !=
+              NVPTX::CUDA) {
              Type *ETy = PTy->getElementType();
              int addrSpace = PTy->getAddressSpace();
              switch (addrSpace) {
@@ -1647,7 +1625,7 @@ void NVPTXAsmPrinter::setAndEmitFunctionVirtualRegisters(
    if (NumBytes) {
      O << "\t.local .align " << MFI->getMaxAlignment() << " .b8 \t" << DEPOTNAME
        << getFunctionNumber() << "[" << NumBytes << "];\n";
-    if (nvptxSubtarget.is64Bit()) {
+    if (static_cast<const NVPTXTargetMachine &>(MF.getTarget()).is64Bit()) {
        O << "\t.reg .b64 \t%SP;\n";
        O << "\t.reg .b64 \t%SPL;\n";
      } else {