Use twines to simplify calls to report_fatal_error. For code size and readability.

[oota-llvm.git] / lib / Target / CellSPU / SPUISelLowering.cpp
diff --git a/lib/Target/CellSPU/SPUISelLowering.cpp b/lib/Target/CellSPU/SPUISelLowering.cpp

index edbceddaedae0ac250ffd3533d5c0ee47a723e73..286e9ab837f0e37a41d27063ac4f1d73a7c3cacb 100644 (file)
--- a/lib/Target/CellSPU/SPUISelLowering.cpp
+++ b/lib/Target/CellSPU/SPUISelLowering.cpp
@@ -25,7 +25,7 @@
  #include "llvm/CodeGen/MachineInstrBuilder.h"
  #include "llvm/CodeGen/MachineRegisterInfo.h"
  #include "llvm/CodeGen/SelectionDAG.h"
-#include "llvm/Target/TargetLoweringObjectFile.h"
+#include "llvm/CodeGen/TargetLoweringObjectFileImpl.h"
  #include "llvm/Target/TargetOptions.h"
  #include "llvm/ADT/VectorExtras.h"
  #include "llvm/Support/Debug.h"
@@ -42,8 +42,8 @@ namespace {
  
    //! EVT mapping to useful data for Cell SPU
    struct valtype_map_s {
-    const EVT   valtype;
-    const int   prefslot_byte;
+    EVT   valtype;
+    int   prefslot_byte;
    };
  
    const valtype_map_s valtype_map[] = {
@@ -71,11 +71,8 @@ namespace {
  
  #ifndef NDEBUG
      if (retval == 0) {
-      std::string msg;
-      raw_string_ostream Msg(msg);
-      Msg << "getValueTypeMapEntry returns NULL for "
-           << VT.getEVTString();
-      llvm_report_error(Msg.str());
+      report_fatal_error("getValueTypeMapEntry returns NULL for " +
+                         Twine(VT.getEVTString()));
      }
  #endif
  
@@ -118,8 +115,7 @@ namespace {
              TLI.LowerCallTo(InChain, RetTy, isSigned, !isSigned, false, false,
                              0, TLI.getLibcallCallingConv(LC), false,
                              /*isReturnValueUsed=*/true,
-                            Callee, Args, DAG,
-                            Op.getDebugLoc());
+                            Callee, Args, DAG, Op.getDebugLoc());
  
      return CallInfo.first;
    }
@@ -350,7 +346,7 @@ SPUTargetLowering::SPUTargetLowering(SPUTargetMachine &TM)
    // Custom lower i128 -> i64 truncates
    setOperationAction(ISD::TRUNCATE, MVT::i64, Custom);
  
-  // Custom lower i64 -> i128 sign extend
+  // Custom lower i32/i64 -> i128 sign extend
    setOperationAction(ISD::SIGN_EXTEND, MVT::i128, Custom);
  
    setOperationAction(ISD::FP_TO_SINT, MVT::i8, Promote);
@@ -387,10 +383,6 @@ SPUTargetLowering::SPUTargetLowering(SPUTargetMachine &TM)
    // We cannot sextinreg(i1).  Expand to shifts.
    setOperationAction(ISD::SIGN_EXTEND_INREG, MVT::i1, Expand);
  
-  // Support label based line numbers.
-  setOperationAction(ISD::DBG_STOPPOINT, MVT::Other, Expand);
-  setOperationAction(ISD::DEBUG_LOC, MVT::Other, Expand);
-
    // We want to legalize GlobalAddress and ConstantPool nodes into the
    // appropriate instructions to materialize the address.
    for (unsigned sctype = (unsigned) MVT::i8; sctype < (unsigned) MVT::f128;
@@ -673,7 +665,7 @@ LowerLOAD(SDValue Op, SelectionDAG &DAG, const SPUSubtarget *ST) {
      // Re-emit as a v16i8 vector load
      result = DAG.getLoad(MVT::v16i8, dl, the_chain, basePtr,
                           LN->getSrcValue(), LN->getSrcValueOffset(),
-                         LN->isVolatile(), 16);
+                         LN->isVolatile(), LN->isNonTemporal(), 16);
  
      // Update the chain
      the_chain = result.getValue(1);
@@ -719,12 +711,9 @@ LowerLOAD(SDValue Op, SelectionDAG &DAG, const SPUSubtarget *ST) {
    case ISD::POST_DEC:
    case ISD::LAST_INDEXED_MODE:
      {
-      std::string msg;
-      raw_string_ostream Msg(msg);
-      Msg << "LowerLOAD: Got a LoadSDNode with an addr mode other than "
-            "UNINDEXED\n";
-      Msg << (unsigned) LN->getAddressingMode();
-      llvm_report_error(Msg.str());
+      report_fatal_error("LowerLOAD: Got a LoadSDNode with an addr mode other "
+                         "than UNINDEXED\n" +
+                         Twine((unsigned)LN->getAddressingMode()));
        /*NOTREACHED*/
      }
    }
@@ -752,9 +741,7 @@ LowerSTORE(SDValue Op, SelectionDAG &DAG, const SPUSubtarget *ST) {
    case ISD::UNINDEXED: {
      // The vector type we really want to load from the 16-byte chunk.
      EVT vecVT = EVT::getVectorVT(*DAG.getContext(),
-                                 VT, (128 / VT.getSizeInBits())),
-        stVecVT = EVT::getVectorVT(*DAG.getContext(),
-                                   StVT, (128 / StVT.getSizeInBits()));
+                                 VT, (128 / VT.getSizeInBits()));
  
      SDValue alignLoadVec;
      SDValue basePtr = SN->getBasePtr();
@@ -826,7 +813,7 @@ LowerSTORE(SDValue Op, SelectionDAG &DAG, const SPUSubtarget *ST) {
      // Re-emit as a v16i8 vector load
      alignLoadVec = DAG.getLoad(MVT::v16i8, dl, the_chain, basePtr,
                                 SN->getSrcValue(), SN->getSrcValueOffset(),
-                               SN->isVolatile(), 16);
+                               SN->isVolatile(), SN->isNonTemporal(), 16);
  
      // Update the chain
      the_chain = alignLoadVec.getValue(1);
@@ -867,7 +854,8 @@ LowerSTORE(SDValue Op, SelectionDAG &DAG, const SPUSubtarget *ST) {
  
      result = DAG.getStore(the_chain, dl, result, basePtr,
                            LN->getSrcValue(), LN->getSrcValueOffset(),
-                          LN->isVolatile(), LN->getAlignment());
+                          LN->isVolatile(), LN->isNonTemporal(),
+                          LN->getAlignment());
  
  #if 0 && !defined(NDEBUG)
      if (DebugFlag && isCurrentDebugType(DEBUG_TYPE)) {
@@ -890,12 +878,9 @@ LowerSTORE(SDValue Op, SelectionDAG &DAG, const SPUSubtarget *ST) {
    case ISD::POST_DEC:
    case ISD::LAST_INDEXED_MODE:
      {
-      std::string msg;
-      raw_string_ostream Msg(msg);
-      Msg << "LowerLOAD: Got a LoadSDNode with an addr mode other than "
-            "UNINDEXED\n";
-      Msg << (unsigned) SN->getAddressingMode();
-      llvm_report_error(Msg.str());
+      report_fatal_error("LowerLOAD: Got a LoadSDNode with an addr mode other "
+                         "than UNINDEXED\n" +
+                         Twine((unsigned)SN->getAddressingMode()));
        /*NOTREACHED*/
      }
    }
@@ -982,7 +967,7 @@ LowerGlobalAddress(SDValue Op, SelectionDAG &DAG, const SPUSubtarget *ST) {
        return DAG.getNode(SPUISD::IndirectAddr, dl, PtrVT, Hi, Lo);
      }
    } else {
-    llvm_report_error("LowerGlobalAddress: Relocation model other than static"
+    report_fatal_error("LowerGlobalAddress: Relocation model other than static"
                        "not supported.");
      /*NOTREACHED*/
    }
@@ -1015,7 +1000,7 @@ LowerConstantFP(SDValue Op, SelectionDAG &DAG) {
  
  SDValue
  SPUTargetLowering::LowerFormalArguments(SDValue Chain,
-                                        unsigned CallConv, bool isVarArg,
+                                        CallingConv::ID CallConv, bool isVarArg,
                                          const SmallVectorImpl<ISD::InputArg>
                                            &Ins,
                                          DebugLoc dl, SelectionDAG &DAG,
@@ -1044,13 +1029,9 @@ SPUTargetLowering::LowerFormalArguments(SDValue Chain,
        const TargetRegisterClass *ArgRegClass;
  
        switch (ObjectVT.getSimpleVT().SimpleTy) {
-      default: {
-        std::string msg;
-        raw_string_ostream Msg(msg);
-        Msg << "LowerFormalArguments Unhandled argument type: "
-             << ObjectVT.getEVTString();
-        llvm_report_error(Msg.str());
-      }
+      default:
+        report_fatal_error("LowerFormalArguments Unhandled argument type: " +
+                           Twine(ObjectVT.getEVTString()));
        case MVT::i8:
          ArgRegClass = &SPU::R8CRegClass;
          break;
@@ -1090,9 +1071,9 @@ SPUTargetLowering::LowerFormalArguments(SDValue Chain,
        // We need to load the argument to a virtual register if we determined
        // above that we ran out of physical registers of the appropriate type
        // or we're forced to do vararg
-      int FI = MFI->CreateFixedObject(ObjSize, ArgOffset);
+      int FI = MFI->CreateFixedObject(ObjSize, ArgOffset, true, false);
        SDValue FIN = DAG.getFrameIndex(FI, PtrVT);
-      ArgVal = DAG.getLoad(ObjectVT, dl, Chain, FIN, NULL, 0);
+      ArgVal = DAG.getLoad(ObjectVT, dl, Chain, FIN, NULL, 0, false, false, 0);
        ArgOffset += StackSlotSize;
      }
  
@@ -1110,10 +1091,13 @@ SPUTargetLowering::LowerFormalArguments(SDValue Chain,
      // Create the frame slot
  
      for (; ArgRegIdx != NumArgRegs; ++ArgRegIdx) {
-      VarArgsFrameIndex = MFI->CreateFixedObject(StackSlotSize, ArgOffset);
+      VarArgsFrameIndex = MFI->CreateFixedObject(StackSlotSize, ArgOffset,
+                                                 true, false);
        SDValue FIN = DAG.getFrameIndex(VarArgsFrameIndex, PtrVT);
-      SDValue ArgVal = DAG.getRegister(ArgRegs[ArgRegIdx], MVT::v16i8);
-      SDValue Store = DAG.getStore(Chain, dl, ArgVal, FIN, NULL, 0);
+      unsigned VReg = MF.addLiveIn(ArgRegs[ArgRegIdx], &SPU::R32CRegClass);
+      SDValue ArgVal = DAG.getRegister(VReg, MVT::v16i8);
+      SDValue Store = DAG.getStore(Chain, dl, ArgVal, FIN, NULL, 0,
+                                   false, false, 0);
        Chain = Store.getOperand(0);
        MemOps.push_back(Store);
  
@@ -1144,12 +1128,14 @@ static SDNode *isLSAAddress(SDValue Op, SelectionDAG &DAG) {
  
  SDValue
  SPUTargetLowering::LowerCall(SDValue Chain, SDValue Callee,
-                             unsigned CallConv, bool isVarArg,
-                             bool isTailCall,
+                             CallingConv::ID CallConv, bool isVarArg,
+                             bool &isTailCall,
                               const SmallVectorImpl<ISD::OutputArg> &Outs,
                               const SmallVectorImpl<ISD::InputArg> &Ins,
                               DebugLoc dl, SelectionDAG &DAG,
                               SmallVectorImpl<SDValue> &InVals) {
+  // CellSPU target does not yet support tail call optimization.
+  isTailCall = false;
  
    const SPUSubtarget *ST = SPUTM.getSubtargetImpl();
    unsigned NumOps     = Outs.size();
@@ -1160,11 +1146,6 @@ SPUTargetLowering::LowerCall(SDValue Chain, SDValue Callee,
    // Handy pointer type
    EVT PtrVT = DAG.getTargetLoweringInfo().getPointerTy();
  
-  // Accumulate how many bytes are to be pushed on the stack, including the
-  // linkage area, and parameter passing area.  According to the SPU ABI,
-  // we minimally need space for [LR] and [SP]
-  unsigned NumStackBytes = SPUFrameInfo::minStackSize();
-
    // Set up a copy of the stack pointer for use loading and storing any
    // arguments that may not fit in the registers available for argument
    // passing.
@@ -1198,7 +1179,8 @@ SPUTargetLowering::LowerCall(SDValue Chain, SDValue Callee,
        if (ArgRegIdx != NumArgRegs) {
          RegsToPass.push_back(std::make_pair(ArgRegs[ArgRegIdx++], Arg));
        } else {
-        MemOpChains.push_back(DAG.getStore(Chain, dl, Arg, PtrOff, NULL, 0));
+        MemOpChains.push_back(DAG.getStore(Chain, dl, Arg, PtrOff, NULL, 0,
+                                           false, false, 0));
          ArgOffset += StackSlotSize;
        }
        break;
@@ -1207,7 +1189,8 @@ SPUTargetLowering::LowerCall(SDValue Chain, SDValue Callee,
        if (ArgRegIdx != NumArgRegs) {
          RegsToPass.push_back(std::make_pair(ArgRegs[ArgRegIdx++], Arg));
        } else {
-        MemOpChains.push_back(DAG.getStore(Chain, dl, Arg, PtrOff, NULL, 0));
+        MemOpChains.push_back(DAG.getStore(Chain, dl, Arg, PtrOff, NULL, 0,
+                                           false, false, 0));
          ArgOffset += StackSlotSize;
        }
        break;
@@ -1220,15 +1203,20 @@ SPUTargetLowering::LowerCall(SDValue Chain, SDValue Callee,
        if (ArgRegIdx != NumArgRegs) {
          RegsToPass.push_back(std::make_pair(ArgRegs[ArgRegIdx++], Arg));
        } else {
-        MemOpChains.push_back(DAG.getStore(Chain, dl, Arg, PtrOff, NULL, 0));
+        MemOpChains.push_back(DAG.getStore(Chain, dl, Arg, PtrOff, NULL, 0,
+                                           false, false, 0));
          ArgOffset += StackSlotSize;
        }
        break;
      }
    }
  
-  // Update number of stack bytes actually used, insert a call sequence start
-  NumStackBytes = (ArgOffset - SPUFrameInfo::minStackSize());
+  // Accumulate how many bytes are to be pushed on the stack, including the
+  // linkage area, and parameter passing area.  According to the SPU ABI,
+  // we minimally need space for [LR] and [SP].
+  unsigned NumStackBytes = ArgOffset - SPUFrameInfo::minStackSize();
+
+  // Insert a call sequence start
    Chain = DAG.getCALLSEQ_START(Chain, DAG.getIntPtrConstant(NumStackBytes,
                                                              true));
  
@@ -1371,7 +1359,7 @@ SPUTargetLowering::LowerCall(SDValue Chain, SDValue Callee,
  
  SDValue
  SPUTargetLowering::LowerReturn(SDValue Chain,
-                               unsigned CallConv, bool isVarArg,
+                               CallingConv::ID CallConv, bool isVarArg,
                                 const SmallVectorImpl<ISD::OutputArg> &Outs,
                                 DebugLoc dl, SelectionDAG &DAG) {
  
@@ -1491,7 +1479,7 @@ SDValue SPU::get_vec_i10imm(SDNode *N, SelectionDAG &DAG,
          return SDValue();
        Value = Value >> 32;
      }
-    if (isS10Constant(Value))
+    if (isInt<10>(Value))
        return DAG.getTargetConstant(Value, ValueType);
    }
  
@@ -1580,14 +1568,10 @@ LowerBUILD_VECTOR(SDValue Op, SelectionDAG &DAG) {
    uint64_t SplatBits = APSplatBits.getZExtValue();
  
    switch (VT.getSimpleVT().SimpleTy) {
-  default: {
-    std::string msg;
-    raw_string_ostream Msg(msg);
-    Msg << "CellSPU: Unhandled VT in LowerBUILD_VECTOR, VT = "
-         << VT.getEVTString();
-    llvm_report_error(Msg.str());
+  default:
+    report_fatal_error("CellSPU: Unhandled VT in LowerBUILD_VECTOR, VT = " +
+                       Twine(VT.getEVTString()));
      /*NOTREACHED*/
-  }
    case MVT::v4f32: {
      uint32_t Value32 = uint32_t(SplatBits);
      assert(SplatBitSize == 32
@@ -2003,7 +1987,7 @@ static SDValue LowerEXTRACT_VECTOR_ELT(SDValue Op, SelectionDAG &DAG) {
      // slot 0 across the vector
      EVT VecVT = N.getValueType();
      if (!VecVT.isSimple() || !VecVT.isVector() || !VecVT.is128BitVector()) {
-      llvm_report_error("LowerEXTRACT_VECTOR_ELT: Must have a simple, 128-bit"
+      report_fatal_error("LowerEXTRACT_VECTOR_ELT: Must have a simple, 128-bit"
                          "vector type!");
      }
  
@@ -2031,7 +2015,7 @@ static SDValue LowerEXTRACT_VECTOR_ELT(SDValue Op, SelectionDAG &DAG) {
  
      switch (VT.getSimpleVT().SimpleTy) {
      default:
-      llvm_report_error("LowerEXTRACT_VECTOR_ELT(varable): Unhandled vector"
+      report_fatal_error("LowerEXTRACT_VECTOR_ELT(varable): Unhandled vector"
                          "type");
        /*NOTREACHED*/
      case MVT::i8: {
@@ -2514,7 +2498,7 @@ static SDValue LowerSETCC(SDValue Op, SelectionDAG &DAG,
    case ISD::SETONE:
      compareOp = ISD::SETNE; break;
    default:
-    llvm_report_error("CellSPU ISel Select: unimplemented f64 condition");
+    report_fatal_error("CellSPU ISel Select: unimplemented f64 condition");
    }
  
    SDValue result =
@@ -2610,41 +2594,55 @@ static SDValue LowerTRUNCATE(SDValue Op, SelectionDAG &DAG)
    return SDValue();             // Leave the truncate unmolested
  }
  
-//! Custom lower ISD::SIGN_EXTEND
+/*!
+ * Emit the instruction sequence for i64/i32 -> i128 sign extend. The basic
+ * algorithm is to duplicate the sign bit using rotmai to generate at
+ * least one byte full of sign bits. Then propagate the "sign-byte" into
+ * the leftmost words and the i64/i32 into the rightmost words using shufb.
+ *
+ * @param Op The sext operand
+ * @param DAG The current DAG
+ * @return The SDValue with the entire instruction sequence
+ */
  static SDValue LowerSIGN_EXTEND(SDValue Op, SelectionDAG &DAG)
  {
-  // Type to extend to
-  EVT VT = Op.getValueType();
    DebugLoc dl = Op.getDebugLoc();
  
+  // Type to extend to
+  MVT OpVT = Op.getValueType().getSimpleVT();
+
    // Type to extend from
    SDValue Op0 = Op.getOperand(0);
-  EVT Op0VT = Op0.getValueType();
+  MVT Op0VT = Op0.getValueType().getSimpleVT();
  
-  assert((VT == MVT::i128 && Op0VT == MVT::i64) &&
+  // The type to extend to needs to be a i128 and
+  // the type to extend from needs to be i64 or i32.
+  assert((OpVT == MVT::i128 && (Op0VT == MVT::i64 || Op0VT == MVT::i32)) &&
            "LowerSIGN_EXTEND: input and/or output operand have wrong size");
  
    // Create shuffle mask
-  unsigned mask1 = 0x10101010; // byte  0 -  3 and 4 - 7
-  unsigned mask2 = 0x01020304; // byte  8 - 11
-  unsigned mask3 = 0x05060708; // byte 12 - 15
+  unsigned mask1 = 0x10101010; // byte 0 - 3 and 4 - 7
+  unsigned mask2 = Op0VT == MVT::i64 ? 0x00010203 : 0x10101010; // byte  8 - 11
+  unsigned mask3 = Op0VT == MVT::i64 ? 0x04050607 : 0x00010203; // byte 12 - 15
    SDValue shufMask = DAG.getNode(ISD::BUILD_VECTOR, dl, MVT::v4i32,
                                   DAG.getConstant(mask1, MVT::i32),
                                   DAG.getConstant(mask1, MVT::i32),
                                   DAG.getConstant(mask2, MVT::i32),
                                   DAG.getConstant(mask3, MVT::i32));
  
-  // Word wise arithmetic right shift to generate a byte that contains sign bits
+  // Word wise arithmetic right shift to generate at least one byte
+  // that contains sign bits.
+  MVT mvt = Op0VT == MVT::i64 ? MVT::v2i64 : MVT::v4i32;
    SDValue sraVal = DAG.getNode(ISD::SRA,
                   dl,
-                 MVT::v2i64,
-                 DAG.getNode(SPUISD::PREFSLOT2VEC, dl, MVT::v2i64, Op0, Op0),
+                 mvt,
+                 DAG.getNode(SPUISD::PREFSLOT2VEC, dl, mvt, Op0, Op0),
                   DAG.getConstant(31, MVT::i32));
  
-  // shuffle bytes - copies the sign bits into the upper 64 bits
-  // and the input value into the lower 64 bits
-  SDValue extShuffle = DAG.getNode(SPUISD::SHUFB, dl, MVT::v2i64,
-                                       Op0, sraVal, shufMask);
+  // Shuffle bytes - Copy the sign bits into the upper 64 bits
+  // and the input value into the lower 64 bits.
+  SDValue extShuffle = DAG.getNode(SPUISD::SHUFB, dl, mvt,
+      DAG.getNode(ISD::ANY_EXTEND, dl, MVT::i128, Op0), sraVal, shufMask);
  
    return DAG.getNode(ISD::BIT_CONVERT, dl, MVT::i128, extShuffle);
  }