Remove variable_ops from call instructions in most targets.

[oota-llvm.git] / lib / Target / CellSPU / SPUISelLowering.cpp
diff --git a/lib/Target/CellSPU/SPUISelLowering.cpp b/lib/Target/CellSPU/SPUISelLowering.cpp

index 256f1f0f9c2ff7190dd1a745a86347153802583a..fba0ebfbcf486ebc4be7920c2d8d2ae183737d3e 100644 (file)
--- a/lib/Target/CellSPU/SPUISelLowering.cpp
+++ b/lib/Target/CellSPU/SPUISelLowering.cpp
@@ -1,4 +1,3 @@
-//
  //===-- SPUISelLowering.cpp - Cell SPU DAG Lowering Implementation --------===//
  //                     The LLVM Compiler Infrastructure
  //
@@ -11,10 +10,9 @@
  //
  //===----------------------------------------------------------------------===//
  
-#include "SPURegisterNames.h"
  #include "SPUISelLowering.h"
  #include "SPUTargetMachine.h"
-#include "SPUFrameInfo.h"
+#include "SPUFrameLowering.h"
  #include "SPUMachineFunction.h"
  #include "llvm/Constants.h"
  #include "llvm/Function.h"
@@ -29,25 +27,20 @@
  #include "llvm/CodeGen/SelectionDAG.h"
  #include "llvm/CodeGen/TargetLoweringObjectFileImpl.h"
  #include "llvm/Target/TargetOptions.h"
-#include "llvm/ADT/VectorExtras.h"
  #include "llvm/Support/Debug.h"
  #include "llvm/Support/ErrorHandling.h"
  #include "llvm/Support/MathExtras.h"
  #include "llvm/Support/raw_ostream.h"
-#include <map>
  
  using namespace llvm;
  
-// Used in getTargetNodeName() below
  namespace {
-  std::map<unsigned, const char *> node_names;
-
    // Byte offset of the preferred slot (counted from the MSB)
    int prefslotOffset(EVT VT) {
      int retval=0;
-    if (VT==MVT::i1) retval=3; 
-    if (VT==MVT::i8) retval=3; 
-    if (VT==MVT::i16) retval=2; 
+    if (VT==MVT::i1) retval=3;
+    if (VT==MVT::i8) retval=3;
+    if (VT==MVT::i16) retval=2;
  
      return retval;
    }
@@ -71,7 +64,7 @@ namespace {
      TargetLowering::ArgListEntry Entry;
      for (unsigned i = 0, e = Op.getNumOperands(); i != e; ++i) {
        EVT ArgVT = Op.getOperand(i).getValueType();
-      const Type *ArgTy = ArgVT.getTypeForEVT(*DAG.getContext());
+      Type *ArgTy = ArgVT.getTypeForEVT(*DAG.getContext());
        Entry.Node = Op.getOperand(i);
        Entry.Ty = ArgTy;
        Entry.isSExt = isSigned;
@@ -82,13 +75,16 @@ namespace {
                                             TLI.getPointerTy());
  
      // Splice the libcall in wherever FindInputOutputChains tells us to.
-    const Type *RetTy =
+    Type *RetTy =
                  Op.getNode()->getValueType(0).getTypeForEVT(*DAG.getContext());
-    std::pair<SDValue, SDValue> CallInfo =
-            TLI.LowerCallTo(InChain, RetTy, isSigned, !isSigned, false, false,
-                            0, TLI.getLibcallCallingConv(LC), false,
-                            /*isReturnValueUsed=*/true,
+    TargetLowering::CallLoweringInfo CLI(InChain, RetTy, isSigned, !isSigned,
+                                         false, false,
+                            0, TLI.getLibcallCallingConv(LC),
+                            /*isTailCall=*/false,
+                                         /*doesNotRet=*/false,
+                                         /*isReturnValueUsed=*/true,
                              Callee, Args, DAG, Op.getDebugLoc());
+    std::pair<SDValue, SDValue> CallInfo = TLI.LowerCallTo(CLI);
  
      return CallInfo.first;
    }
@@ -97,8 +93,6 @@ namespace {
  SPUTargetLowering::SPUTargetLowering(SPUTargetMachine &TM)
    : TargetLowering(TM, new TargetLoweringObjectFileELF()),
      SPUTM(TM) {
-  // Fold away setcc operations if possible.
-  setPow2DivIsCheap();
  
    // Use _setjmp/_longjmp instead of setjmp/longjmp.
    setUseUnderscoreSetJmp(true);
@@ -108,13 +102,13 @@ SPUTargetLowering::SPUTargetLowering(SPUTargetMachine &TM)
    setLibcallName(RTLIB::DIV_F64, "__fast_divdf3");
  
    // Set up the SPU's register classes:
-  addRegisterClass(MVT::i8,   SPU::R8CRegisterClass);
-  addRegisterClass(MVT::i16,  SPU::R16CRegisterClass);
-  addRegisterClass(MVT::i32,  SPU::R32CRegisterClass);
-  addRegisterClass(MVT::i64,  SPU::R64CRegisterClass);
-  addRegisterClass(MVT::f32,  SPU::R32FPRegisterClass);
-  addRegisterClass(MVT::f64,  SPU::R64FPRegisterClass);
-  addRegisterClass(MVT::i128, SPU::GPRCRegisterClass);
+  addRegisterClass(MVT::i8,   &SPU::R8CRegClass);
+  addRegisterClass(MVT::i16,  &SPU::R16CRegClass);
+  addRegisterClass(MVT::i32,  &SPU::R32CRegClass);
+  addRegisterClass(MVT::i64,  &SPU::R64CRegClass);
+  addRegisterClass(MVT::f32,  &SPU::R32FPRegClass);
+  addRegisterClass(MVT::f64,  &SPU::R64FPRegClass);
+  addRegisterClass(MVT::i128, &SPU::GPRCRegClass);
  
    // SPU has no sign or zero extended loads for i1, i8, i16:
    setLoadExtAction(ISD::EXTLOAD,  MVT::i1, Promote);
@@ -178,6 +172,7 @@ SPUTargetLowering::SPUTargetLowering(SPUTargetMachine &TM)
  
    // SPU has no intrinsics for these particular operations:
    setOperationAction(ISD::MEMBARRIER, MVT::Other, Expand);
+  setOperationAction(ISD::ATOMIC_FENCE, MVT::Other, Expand);
  
    // SPU has no division/remainder instructions
    setOperationAction(ISD::SREM,    MVT::i8,   Expand);
@@ -224,6 +219,9 @@ SPUTargetLowering::SPUTargetLowering(SPUTargetMachine &TM)
    setOperationAction(ISD::FSQRT, MVT::f64, Expand);
    setOperationAction(ISD::FSQRT, MVT::f32, Expand);
  
+  setOperationAction(ISD::FMA, MVT::f64, Expand);
+  setOperationAction(ISD::FMA, MVT::f32, Expand);
+
    setOperationAction(ISD::FCOPYSIGN, MVT::f64, Expand);
    setOperationAction(ISD::FCOPYSIGN, MVT::f32, Expand);
  
@@ -296,12 +294,22 @@ SPUTargetLowering::SPUTargetLowering(SPUTargetMachine &TM)
    setOperationAction(ISD::CTTZ , MVT::i32,   Expand);
    setOperationAction(ISD::CTTZ , MVT::i64,   Expand);
    setOperationAction(ISD::CTTZ , MVT::i128,  Expand);
+  setOperationAction(ISD::CTTZ_ZERO_UNDEF, MVT::i8,    Expand);
+  setOperationAction(ISD::CTTZ_ZERO_UNDEF, MVT::i16,   Expand);
+  setOperationAction(ISD::CTTZ_ZERO_UNDEF, MVT::i32,   Expand);
+  setOperationAction(ISD::CTTZ_ZERO_UNDEF, MVT::i64,   Expand);
+  setOperationAction(ISD::CTTZ_ZERO_UNDEF, MVT::i128,  Expand);
  
    setOperationAction(ISD::CTLZ , MVT::i8,    Promote);
    setOperationAction(ISD::CTLZ , MVT::i16,   Promote);
    setOperationAction(ISD::CTLZ , MVT::i32,   Legal);
    setOperationAction(ISD::CTLZ , MVT::i64,   Expand);
    setOperationAction(ISD::CTLZ , MVT::i128,  Expand);
+  setOperationAction(ISD::CTLZ_ZERO_UNDEF, MVT::i8,    Expand);
+  setOperationAction(ISD::CTLZ_ZERO_UNDEF, MVT::i16,   Expand);
+  setOperationAction(ISD::CTLZ_ZERO_UNDEF, MVT::i32,   Expand);
+  setOperationAction(ISD::CTLZ_ZERO_UNDEF, MVT::i64,   Expand);
+  setOperationAction(ISD::CTLZ_ZERO_UNDEF, MVT::i128,  Expand);
  
    // SPU has a version of select that implements (a&~c)|(b&c), just like
    // select ought to work:
@@ -348,10 +356,10 @@ SPUTargetLowering::SPUTargetLowering(SPUTargetMachine &TM)
    setOperationAction(ISD::SINT_TO_FP, MVT::i64, Custom);
    setOperationAction(ISD::UINT_TO_FP, MVT::i64, Custom);
  
-  setOperationAction(ISD::BIT_CONVERT, MVT::i32, Legal);
-  setOperationAction(ISD::BIT_CONVERT, MVT::f32, Legal);
-  setOperationAction(ISD::BIT_CONVERT, MVT::i64, Legal);
-  setOperationAction(ISD::BIT_CONVERT, MVT::f64, Legal);
+  setOperationAction(ISD::BITCAST, MVT::i32, Legal);
+  setOperationAction(ISD::BITCAST, MVT::f32, Legal);
+  setOperationAction(ISD::BITCAST, MVT::i64, Legal);
+  setOperationAction(ISD::BITCAST, MVT::f64, Legal);
  
    // We cannot sextinreg(i1).  Expand to shifts.
    setOperationAction(ISD::SIGN_EXTEND_INREG, MVT::i1, Expand);
@@ -391,17 +399,20 @@ SPUTargetLowering::SPUTargetLowering(SPUTargetMachine &TM)
  
    // First set operation action for all vector types to expand. Then we
    // will selectively turn on ones that can be effectively codegen'd.
-  addRegisterClass(MVT::v16i8, SPU::VECREGRegisterClass);
-  addRegisterClass(MVT::v8i16, SPU::VECREGRegisterClass);
-  addRegisterClass(MVT::v4i32, SPU::VECREGRegisterClass);
-  addRegisterClass(MVT::v2i64, SPU::VECREGRegisterClass);
-  addRegisterClass(MVT::v4f32, SPU::VECREGRegisterClass);
-  addRegisterClass(MVT::v2f64, SPU::VECREGRegisterClass);
+  addRegisterClass(MVT::v16i8, &SPU::VECREGRegClass);
+  addRegisterClass(MVT::v8i16, &SPU::VECREGRegClass);
+  addRegisterClass(MVT::v4i32, &SPU::VECREGRegClass);
+  addRegisterClass(MVT::v2i64, &SPU::VECREGRegClass);
+  addRegisterClass(MVT::v4f32, &SPU::VECREGRegClass);
+  addRegisterClass(MVT::v2f64, &SPU::VECREGRegClass);
  
    for (unsigned i = (unsigned)MVT::FIRST_VECTOR_VALUETYPE;
         i <= (unsigned)MVT::LAST_VECTOR_VALUETYPE; ++i) {
      MVT::SimpleValueType VT = (MVT::SimpleValueType)i;
  
+    // Set operation actions to legal types only.
+    if (!isTypeLegal(VT)) continue;
+
      // add/sub are legal for all supported vector VT's.
      setOperationAction(ISD::ADD,     VT, Legal);
      setOperationAction(ISD::SUB,     VT, Legal);
@@ -421,6 +432,13 @@ SPUTargetLowering::SPUTargetLowering(SPUTargetMachine &TM)
      setOperationAction(ISD::UDIV,    VT, Expand);
      setOperationAction(ISD::UREM,    VT, Expand);
  
+    // Expand all trunc stores
+    for (unsigned j = (unsigned)MVT::FIRST_VECTOR_VALUETYPE;
+         j <= (unsigned)MVT::LAST_VECTOR_VALUETYPE; ++j) {
+      MVT::SimpleValueType TargetVT = (MVT::SimpleValueType)j;
+    setTruncStoreAction(VT, TargetVT, Expand);
+    }
+
      // Custom lower build_vector, constant pool spills, insert and
      // extract vector elements:
      setOperationAction(ISD::BUILD_VECTOR, VT, Custom);
@@ -431,6 +449,8 @@ SPUTargetLowering::SPUTargetLowering(SPUTargetMachine &TM)
      setOperationAction(ISD::VECTOR_SHUFFLE, VT, Custom);
    }
  
+  setOperationAction(ISD::SHL, MVT::v2i64, Expand);
+
    setOperationAction(ISD::AND, MVT::v16i8, Custom);
    setOperationAction(ISD::OR,  MVT::v16i8, Custom);
    setOperationAction(ISD::XOR, MVT::v16i8, Custom);
@@ -438,8 +458,8 @@ SPUTargetLowering::SPUTargetLowering(SPUTargetMachine &TM)
  
    setOperationAction(ISD::FDIV, MVT::v4f32, Legal);
  
-  setShiftAmountType(MVT::i32);
    setBooleanContents(ZeroOrNegativeOneBooleanContent);
+  setBooleanVectorContents(ZeroOrNegativeOneBooleanContent); // FIXME: Is this correct?
  
    setStackPointerRegisterToSaveRestore(SPU::R1);
  
@@ -449,6 +469,8 @@ SPUTargetLowering::SPUTargetLowering(SPUTargetMachine &TM)
    setTargetDAGCombine(ISD::SIGN_EXTEND);
    setTargetDAGCombine(ISD::ANY_EXTEND);
  
+  setMinFunctionAlignment(3);
+
    computeRegisterProperties();
  
    // Set pre-RA register scheduler default to BURR, which produces slightly
@@ -457,56 +479,55 @@ SPUTargetLowering::SPUTargetLowering(SPUTargetMachine &TM)
    setSchedulingPreference(Sched::RegPressure);
  }
  
-const char *
-SPUTargetLowering::getTargetNodeName(unsigned Opcode) const
-{
-  if (node_names.empty()) {
-    node_names[(unsigned) SPUISD::RET_FLAG] = "SPUISD::RET_FLAG";
-    node_names[(unsigned) SPUISD::Hi] = "SPUISD::Hi";
-    node_names[(unsigned) SPUISD::Lo] = "SPUISD::Lo";
-    node_names[(unsigned) SPUISD::PCRelAddr] = "SPUISD::PCRelAddr";
-    node_names[(unsigned) SPUISD::AFormAddr] = "SPUISD::AFormAddr";
-    node_names[(unsigned) SPUISD::IndirectAddr] = "SPUISD::IndirectAddr";
-    node_names[(unsigned) SPUISD::LDRESULT] = "SPUISD::LDRESULT";
-    node_names[(unsigned) SPUISD::CALL] = "SPUISD::CALL";
-    node_names[(unsigned) SPUISD::SHUFB] = "SPUISD::SHUFB";
-    node_names[(unsigned) SPUISD::SHUFFLE_MASK] = "SPUISD::SHUFFLE_MASK";
-    node_names[(unsigned) SPUISD::CNTB] = "SPUISD::CNTB";
-    node_names[(unsigned) SPUISD::PREFSLOT2VEC] = "SPUISD::PREFSLOT2VEC";
-    node_names[(unsigned) SPUISD::VEC2PREFSLOT] = "SPUISD::VEC2PREFSLOT";
-    node_names[(unsigned) SPUISD::SHL_BITS] = "SPUISD::SHL_BITS";
-    node_names[(unsigned) SPUISD::SHL_BYTES] = "SPUISD::SHL_BYTES";
-    node_names[(unsigned) SPUISD::VEC_ROTL] = "SPUISD::VEC_ROTL";
-    node_names[(unsigned) SPUISD::VEC_ROTR] = "SPUISD::VEC_ROTR";
-    node_names[(unsigned) SPUISD::ROTBYTES_LEFT] = "SPUISD::ROTBYTES_LEFT";
-    node_names[(unsigned) SPUISD::ROTBYTES_LEFT_BITS] =
-            "SPUISD::ROTBYTES_LEFT_BITS";
-    node_names[(unsigned) SPUISD::SELECT_MASK] = "SPUISD::SELECT_MASK";
-    node_names[(unsigned) SPUISD::SELB] = "SPUISD::SELB";
-    node_names[(unsigned) SPUISD::ADD64_MARKER] = "SPUISD::ADD64_MARKER";
-    node_names[(unsigned) SPUISD::SUB64_MARKER] = "SPUISD::SUB64_MARKER";
-    node_names[(unsigned) SPUISD::MUL64_MARKER] = "SPUISD::MUL64_MARKER";
-  }
-
-  std::map<unsigned, const char *>::iterator i = node_names.find(Opcode);
-
-  return ((i != node_names.end()) ? i->second : 0);
-}
-
-/// getFunctionAlignment - Return the Log2 alignment of this function.
-unsigned SPUTargetLowering::getFunctionAlignment(const Function *) const {
-  return 3;
+const char *SPUTargetLowering::getTargetNodeName(unsigned Opcode) const {
+  switch (Opcode) {
+  default: return 0;
+  case SPUISD::RET_FLAG: return "SPUISD::RET_FLAG";
+  case SPUISD::Hi: return "SPUISD::Hi";
+  case SPUISD::Lo: return "SPUISD::Lo";
+  case SPUISD::PCRelAddr: return "SPUISD::PCRelAddr";
+  case SPUISD::AFormAddr: return "SPUISD::AFormAddr";
+  case SPUISD::IndirectAddr: return "SPUISD::IndirectAddr";
+  case SPUISD::LDRESULT: return "SPUISD::LDRESULT";
+  case SPUISD::CALL: return "SPUISD::CALL";
+  case SPUISD::SHUFB: return "SPUISD::SHUFB";
+  case SPUISD::SHUFFLE_MASK: return "SPUISD::SHUFFLE_MASK";
+  case SPUISD::CNTB: return "SPUISD::CNTB";
+  case SPUISD::PREFSLOT2VEC: return "SPUISD::PREFSLOT2VEC";
+  case SPUISD::VEC2PREFSLOT: return "SPUISD::VEC2PREFSLOT";
+  case SPUISD::SHL_BITS: return "SPUISD::SHL_BITS";
+  case SPUISD::SHL_BYTES: return "SPUISD::SHL_BYTES";
+  case SPUISD::VEC_ROTL: return "SPUISD::VEC_ROTL";
+  case SPUISD::VEC_ROTR: return "SPUISD::VEC_ROTR";
+  case SPUISD::ROTBYTES_LEFT: return "SPUISD::ROTBYTES_LEFT";
+  case SPUISD::ROTBYTES_LEFT_BITS: return "SPUISD::ROTBYTES_LEFT_BITS";
+  case SPUISD::SELECT_MASK: return "SPUISD::SELECT_MASK";
+  case SPUISD::SELB: return "SPUISD::SELB";
+  case SPUISD::ADD64_MARKER: return "SPUISD::ADD64_MARKER";
+  case SPUISD::SUB64_MARKER: return "SPUISD::SUB64_MARKER";
+  case SPUISD::MUL64_MARKER: return "SPUISD::MUL64_MARKER";
+  }
  }
  
  //===----------------------------------------------------------------------===//
  // Return the Cell SPU's SETCC result type
  //===----------------------------------------------------------------------===//
  
-MVT::SimpleValueType SPUTargetLowering::getSetCCResultType(EVT VT) const {
-  // i16 and i32 are valid SETCC result types
-  return ((VT == MVT::i8 || VT == MVT::i16 || VT == MVT::i32) ?
-    VT.getSimpleVT().SimpleTy :
-    MVT::i32);
+EVT SPUTargetLowering::getSetCCResultType(EVT VT) const {
+  // i8, i16 and i32 are valid SETCC result types
+  MVT::SimpleValueType retval;
+
+  switch(VT.getSimpleVT().SimpleTy){
+    case MVT::i1:
+    case MVT::i8:
+      retval = MVT::i8; break;
+    case MVT::i16:
+      retval = MVT::i16; break;
+    case MVT::i32:
+    default:
+      retval = MVT::i32;
+  }
+  return retval;
  }
  
  //===----------------------------------------------------------------------===//
@@ -550,13 +571,13 @@ LowerLOAD(SDValue Op, SelectionDAG &DAG, const SPUSubtarget *ST) {
                                                    (128 / InVT.getSizeInBits()));
  
    // two sanity checks
-  assert( LN->getAddressingMode() == ISD::UNINDEXED  
+  assert( LN->getAddressingMode() == ISD::UNINDEXED
            && "we should get only UNINDEXED adresses");
    // clean aligned loads can be selected as-is
-  if (InVT.getSizeInBits() == 128 && alignment == 16)
+  if (InVT.getSizeInBits() == 128 && (alignment%16) == 0)
      return SDValue();
  
-  // Get pointerinfos to the memory chunk(s) that contain the data to load 
+  // Get pointerinfos to the memory chunk(s) that contain the data to load
    uint64_t mpi_offset = LN->getPointerInfo().Offset;
    mpi_offset -= mpi_offset%16;
    MachinePointerInfo lowMemPtr(LN->getPointerInfo().V, mpi_offset);
@@ -566,7 +587,7 @@ LowerLOAD(SDValue Op, SelectionDAG &DAG, const SPUSubtarget *ST) {
    SDValue basePtr = LN->getBasePtr();
    SDValue rotate;
  
-  if (alignment == 16) {
+  if ((alignment%16) == 0) {
      ConstantSDNode *CN;
  
      // Special cases for a known aligned load to simplify the base pointer
@@ -648,8 +669,8 @@ LowerLOAD(SDValue Op, SelectionDAG &DAG, const SPUSubtarget *ST) {
    // Do the load as a i128 to allow possible shifting
    SDValue low = DAG.getLoad(MVT::i128, dl, the_chain, basePtr,
                         lowMemPtr,
-                       LN->isVolatile(), LN->isNonTemporal(), 16);
- 
+                       LN->isVolatile(), LN->isNonTemporal(), false, 16);
+
    // When the size is not greater than alignment we get all data with just
    // one load
    if (alignment >= InVT.getSizeInBits()/8) {
@@ -662,53 +683,50 @@ LowerLOAD(SDValue Op, SelectionDAG &DAG, const SPUSubtarget *ST) {
  
      // Convert the loaded v16i8 vector to the appropriate vector type
      // specified by the operand:
-    EVT vecVT = EVT::getVectorVT(*DAG.getContext(), 
+    EVT vecVT = EVT::getVectorVT(*DAG.getContext(),
                                   InVT, (128 / InVT.getSizeInBits()));
      result = DAG.getNode(SPUISD::VEC2PREFSLOT, dl, InVT,
-                         DAG.getNode(ISD::BIT_CONVERT, dl, vecVT, result));
+                         DAG.getNode(ISD::BITCAST, dl, vecVT, result));
    }
    // When alignment is less than the size, we might need (known only at
    // run-time) two loads
-  // TODO: if the memory address is composed only from constants, we have 
+  // TODO: if the memory address is composed only from constants, we have
    // extra kowledge, and might avoid the second load
    else {
      // storage position offset from lower 16 byte aligned memory chunk
-    SDValue offset = DAG.getNode(ISD::AND, dl, MVT::i32, 
+    SDValue offset = DAG.getNode(ISD::AND, dl, MVT::i32,
                                    basePtr, DAG.getConstant( 0xf, MVT::i32 ) );
-    // 16 - offset
-    SDValue offset_compl = DAG.getNode(ISD::SUB, dl, MVT::i32, 
-                                        DAG.getConstant( 16, MVT::i32),
-                                        offset );
-    // get a registerfull of ones. (this implementation is a workaround: LLVM 
+    // get a registerfull of ones. (this implementation is a workaround: LLVM
      // cannot handle 128 bit signed int constants)
      SDValue ones = DAG.getConstant(-1, MVT::v4i32 );
-    ones = DAG.getNode(ISD::BIT_CONVERT, dl, MVT::i128, ones);
+    ones = DAG.getNode(ISD::BITCAST, dl, MVT::i128, ones);
  
      SDValue high = DAG.getLoad(MVT::i128, dl, the_chain,
-                               DAG.getNode(ISD::ADD, dl, PtrVT, 
+                               DAG.getNode(ISD::ADD, dl, PtrVT,
                                             basePtr,
                                             DAG.getConstant(16, PtrVT)),
                                 highMemPtr,
-                               LN->isVolatile(), LN->isNonTemporal(), 16);
+                               LN->isVolatile(), LN->isNonTemporal(), false, 
+                               16);
  
      the_chain = DAG.getNode(ISD::TokenFactor, dl, MVT::Other, low.getValue(1),
                                                                high.getValue(1));
  
      // Shift the (possible) high part right to compensate the misalignemnt.
-    // if there is no highpart (i.e. value is i64 and offset is 4), this 
+    // if there is no highpart (i.e. value is i64 and offset is 4), this
      // will zero out the high value.
-    high = DAG.getNode(SPUISD::SRL_BYTES, dl, MVT::i128, high, 
+    high = DAG.getNode(SPUISD::SRL_BYTES, dl, MVT::i128, high,
                                       DAG.getNode(ISD::SUB, dl, MVT::i32,
                                                   DAG.getConstant( 16, MVT::i32),
                                                   offset
                                                  ));
-   
-    // Shift the low similarily
+
+    // Shift the low similarly
      // TODO: add SPUISD::SHL_BYTES
      low = DAG.getNode(SPUISD::SHL_BYTES, dl, MVT::i128, low, offset );
  
      // Merge the two parts
-    result = DAG.getNode(ISD::BIT_CONVERT, dl, vecVT,
+    result = DAG.getNode(ISD::BITCAST, dl, vecVT,
                            DAG.getNode(ISD::OR, dl, MVT::i128, low, high));
  
      if (!InVT.isVector()) {
@@ -759,7 +777,7 @@ LowerSTORE(SDValue Op, SelectionDAG &DAG, const SPUSubtarget *ST) {
    SDValue result;
    EVT vecVT = StVT.isVector()? StVT: EVT::getVectorVT(*DAG.getContext(), StVT,
                                                   (128 / StVT.getSizeInBits()));
-  // Get pointerinfos to the memory chunk(s) that contain the data to load 
+  // Get pointerinfos to the memory chunk(s) that contain the data to load
    uint64_t mpi_offset = SN->getPointerInfo().Offset;
    mpi_offset -= mpi_offset%16;
    MachinePointerInfo lowMemPtr(SN->getPointerInfo().V, mpi_offset);
@@ -767,10 +785,10 @@ LowerSTORE(SDValue Op, SelectionDAG &DAG, const SPUSubtarget *ST) {
  
  
    // two sanity checks
-  assert( SN->getAddressingMode() == ISD::UNINDEXED  
+  assert( SN->getAddressingMode() == ISD::UNINDEXED
            && "we should get only UNINDEXED adresses");
    // clean aligned loads can be selected as-is
-  if (StVT.getSizeInBits() == 128 && alignment == 16)
+  if (StVT.getSizeInBits() == 128 && (alignment%16) == 0)
      return SDValue();
  
    SDValue alignLoadVec;
@@ -778,7 +796,7 @@ LowerSTORE(SDValue Op, SelectionDAG &DAG, const SPUSubtarget *ST) {
    SDValue the_chain = SN->getChain();
    SDValue insertEltOffs;
  
-  if (alignment == 16) {
+  if ((alignment%16) == 0) {
      ConstantSDNode *CN;
      // Special cases for a known aligned load to simplify the base pointer
      // and insertion byte:
@@ -844,7 +862,8 @@ LowerSTORE(SDValue Op, SelectionDAG &DAG, const SPUSubtarget *ST) {
  
    // Load the lower part of the memory to which to store.
    SDValue low = DAG.getLoad(vecVT, dl, the_chain, basePtr,
-                          lowMemPtr, SN->isVolatile(), SN->isNonTemporal(), 16);
+                          lowMemPtr, SN->isVolatile(), SN->isNonTemporal(),
+                            false, 16);
  
    // if we don't need to store over the 16 byte boundary, one store suffices
    if (alignment >= StVT.getSizeInBits()/8) {
@@ -876,12 +895,12 @@ LowerSTORE(SDValue Op, SelectionDAG &DAG, const SPUSubtarget *ST) {
  
      SDValue insertEltOp = DAG.getNode(SPUISD::SHUFFLE_MASK, dl, vecVT,
                                        insertEltOffs);
-    SDValue vectorizeOp = DAG.getNode(ISD::SCALAR_TO_VECTOR, dl, vecVT, 
+    SDValue vectorizeOp = DAG.getNode(ISD::SCALAR_TO_VECTOR, dl, vecVT,
                                        theValue);
  
      result = DAG.getNode(SPUISD::SHUFB, dl, vecVT,
                           vectorizeOp, low,
-                         DAG.getNode(ISD::BIT_CONVERT, dl,
+                         DAG.getNode(ISD::BITCAST, dl,
                                       MVT::v4i32, insertEltOp));
  
      result = DAG.getStore(the_chain, dl, result, basePtr,
@@ -892,100 +911,97 @@ LowerSTORE(SDValue Op, SelectionDAG &DAG, const SPUSubtarget *ST) {
    }
    // do the store when it might cross the 16 byte memory access boundary.
    else {
-    // TODO issue a warning if SN->isVolatile()== true? This is likely not 
+    // TODO issue a warning if SN->isVolatile()== true? This is likely not
      // what the user wanted.
-    
+
      // address offset from nearest lower 16byte alinged address
-    SDValue offset = DAG.getNode(ISD::AND, dl, MVT::i32, 
-                                    SN->getBasePtr(), 
+    SDValue offset = DAG.getNode(ISD::AND, dl, MVT::i32,
+                                    SN->getBasePtr(),
                                      DAG.getConstant(0xf, MVT::i32));
      // 16 - offset
-    SDValue offset_compl = DAG.getNode(ISD::SUB, dl, MVT::i32, 
+    SDValue offset_compl = DAG.getNode(ISD::SUB, dl, MVT::i32,
                                             DAG.getConstant( 16, MVT::i32),
                                             offset);
-    SDValue hi_shift = DAG.getNode(ISD::SUB, dl, MVT::i32, 
-                                      DAG.getConstant( VT.getSizeInBits()/8,
-                                                       MVT::i32),
-                                      offset_compl);
      // 16 - sizeof(Value)
-    SDValue surplus = DAG.getNode(ISD::SUB, dl, MVT::i32, 
+    SDValue surplus = DAG.getNode(ISD::SUB, dl, MVT::i32,
                                       DAG.getConstant( 16, MVT::i32),
                                       DAG.getConstant( VT.getSizeInBits()/8,
                                                        MVT::i32));
-    // get a registerfull of ones 
+    // get a registerfull of ones
      SDValue ones = DAG.getConstant(-1, MVT::v4i32);
-    ones = DAG.getNode(ISD::BIT_CONVERT, dl, MVT::i128, ones);
+    ones = DAG.getNode(ISD::BITCAST, dl, MVT::i128, ones);
  
      // Create the 128 bit masks that have ones where the data to store is
      // located.
-    SDValue lowmask, himask; 
-    // if the value to store don't fill up the an entire 128 bits, zero 
+    SDValue lowmask, himask;
+    // if the value to store don't fill up the an entire 128 bits, zero
      // out the last bits of the mask so that only the value we want to store
-    // is masked. 
+    // is masked.
      // this is e.g. in the case of store i32, align 2
      if (!VT.isVector()){
        Value = DAG.getNode(SPUISD::PREFSLOT2VEC, dl, vecVT, Value);
        lowmask = DAG.getNode(SPUISD::SRL_BYTES, dl, MVT::i128, ones, surplus);
-      lowmask = DAG.getNode(SPUISD::SHL_BYTES, dl, MVT::i128, lowmask, 
+      lowmask = DAG.getNode(SPUISD::SHL_BYTES, dl, MVT::i128, lowmask,
                                                                 surplus);
-      Value = DAG.getNode(ISD::BIT_CONVERT, dl, MVT::i128, Value);
+      Value = DAG.getNode(ISD::BITCAST, dl, MVT::i128, Value);
        Value = DAG.getNode(ISD::AND, dl, MVT::i128, Value, lowmask);
-     
+
      }
      else {
        lowmask = ones;
-      Value = DAG.getNode(ISD::BIT_CONVERT, dl, MVT::i128, Value);
+      Value = DAG.getNode(ISD::BITCAST, dl, MVT::i128, Value);
      }
-    // this will zero, if there are no data that goes to the high quad 
-    himask = DAG.getNode(SPUISD::SHL_BYTES, dl, MVT::i128, lowmask, 
+    // this will zero, if there are no data that goes to the high quad
+    himask = DAG.getNode(SPUISD::SHL_BYTES, dl, MVT::i128, lowmask,
                                                              offset_compl);
-    lowmask = DAG.getNode(SPUISD::SRL_BYTES, dl, MVT::i128, lowmask, 
+    lowmask = DAG.getNode(SPUISD::SRL_BYTES, dl, MVT::i128, lowmask,
                                                               offset);
-  
+
      // Load in the old data and zero out the parts that will be overwritten with
      // the new data to store.
-    SDValue hi = DAG.getLoad(MVT::i128, dl, the_chain, 
+    SDValue hi = DAG.getLoad(MVT::i128, dl, the_chain,
                                 DAG.getNode(ISD::ADD, dl, PtrVT, basePtr,
                                             DAG.getConstant( 16, PtrVT)),
                                 highMemPtr,
-                               SN->isVolatile(), SN->isNonTemporal(), 16);
+                               SN->isVolatile(), SN->isNonTemporal(), 
+                               false, 16);
      the_chain = DAG.getNode(ISD::TokenFactor, dl, MVT::Other, low.getValue(1),
                                                                hi.getValue(1));
  
-    low = DAG.getNode(ISD::AND, dl, MVT::i128, 
-                        DAG.getNode( ISD::BIT_CONVERT, dl, MVT::i128, low),
+    low = DAG.getNode(ISD::AND, dl, MVT::i128,
+                        DAG.getNode( ISD::BITCAST, dl, MVT::i128, low),
                          DAG.getNode( ISD::XOR, dl, MVT::i128, lowmask, ones));
-    hi = DAG.getNode(ISD::AND, dl, MVT::i128, 
-                        DAG.getNode( ISD::BIT_CONVERT, dl, MVT::i128, hi),
+    hi = DAG.getNode(ISD::AND, dl, MVT::i128,
+                        DAG.getNode( ISD::BITCAST, dl, MVT::i128, hi),
                          DAG.getNode( ISD::XOR, dl, MVT::i128, himask, ones));
  
      // Shift the Value to store into place. rlow contains the parts that go to
-    // the lower memory chunk, rhi has the parts that go to the upper one. 
+    // the lower memory chunk, rhi has the parts that go to the upper one.
      SDValue rlow = DAG.getNode(SPUISD::SRL_BYTES, dl, MVT::i128, Value, offset);
      rlow = DAG.getNode(ISD::AND, dl, MVT::i128, rlow, lowmask);
-    SDValue rhi = DAG.getNode(SPUISD::SHL_BYTES, dl, MVT::i128, Value, 
+    SDValue rhi = DAG.getNode(SPUISD::SHL_BYTES, dl, MVT::i128, Value,
                                                              offset_compl);
  
      // Merge the old data and the new data and store the results
-    // Need to convert vectors here to integer as 'OR'ing floats assert 
-    rlow = DAG.getNode(ISD::OR, dl, MVT::i128, 
-                          DAG.getNode(ISD::BIT_CONVERT, dl, MVT::i128, low),
-                          DAG.getNode(ISD::BIT_CONVERT, dl, MVT::i128, rlow));
-    rhi = DAG.getNode(ISD::OR, dl, MVT::i128, 
-                         DAG.getNode(ISD::BIT_CONVERT, dl, MVT::i128, hi),
-                         DAG.getNode(ISD::BIT_CONVERT, dl, MVT::i128, rhi));
+    // Need to convert vectors here to integer as 'OR'ing floats assert
+    rlow = DAG.getNode(ISD::OR, dl, MVT::i128,
+                          DAG.getNode(ISD::BITCAST, dl, MVT::i128, low),
+                          DAG.getNode(ISD::BITCAST, dl, MVT::i128, rlow));
+    rhi = DAG.getNode(ISD::OR, dl, MVT::i128,
+                         DAG.getNode(ISD::BITCAST, dl, MVT::i128, hi),
+                         DAG.getNode(ISD::BITCAST, dl, MVT::i128, rhi));
  
      low = DAG.getStore(the_chain, dl, rlow, basePtr,
                            lowMemPtr,
                            SN->isVolatile(), SN->isNonTemporal(), 16);
-    hi  = DAG.getStore(the_chain, dl, rhi, 
+    hi  = DAG.getStore(the_chain, dl, rhi,
                              DAG.getNode(ISD::ADD, dl, PtrVT, basePtr,
                                          DAG.getConstant( 16, PtrVT)),
                              highMemPtr,
                              SN->isVolatile(), SN->isNonTemporal(), 16);
      result = DAG.getNode(ISD::TokenFactor, dl, MVT::Other, low.getValue(0),
                                                             hi.getValue(0));
-  } 
+  }
  
    return result;
  }
@@ -1015,7 +1031,6 @@ LowerConstantPool(SDValue Op, SelectionDAG &DAG, const SPUSubtarget *ST) {
  
    llvm_unreachable("LowerConstantPool: Relocation model other than static"
                     " not supported.");
-  return SDValue();
  }
  
  //! Alternate entry point for generating the address of a constant pool entry
@@ -1046,7 +1061,6 @@ LowerJumpTable(SDValue Op, SelectionDAG &DAG, const SPUSubtarget *ST) {
  
    llvm_unreachable("LowerJumpTable: Relocation model other than static"
                     " not supported.");
-  return SDValue();
  }
  
  static SDValue
@@ -1074,8 +1088,6 @@ LowerGlobalAddress(SDValue Op, SelectionDAG &DAG, const SPUSubtarget *ST) {
                        "not supported.");
      /*NOTREACHED*/
    }
-
-  return SDValue();
  }
  
  //! Custom lower double precision floating point constants
@@ -1095,7 +1107,7 @@ LowerConstantFP(SDValue Op, SelectionDAG &DAG) {
      SDValue T = DAG.getConstant(dbits, MVT::i64);
      SDValue Tvec = DAG.getNode(ISD::BUILD_VECTOR, dl, MVT::v2i64, T, T);
      return DAG.getNode(SPUISD::VEC2PREFSLOT, dl, VT,
-                       DAG.getNode(ISD::BIT_CONVERT, dl, MVT::v2f64, Tvec));
+                       DAG.getNode(ISD::BITCAST, dl, MVT::v2f64, Tvec));
    }
  
    return SDValue();
@@ -1115,15 +1127,15 @@ SPUTargetLowering::LowerFormalArguments(SDValue Chain,
    MachineRegisterInfo &RegInfo = MF.getRegInfo();
    SPUFunctionInfo *FuncInfo = MF.getInfo<SPUFunctionInfo>();
  
-  unsigned ArgOffset = SPUFrameInfo::minStackSize();
+  unsigned ArgOffset = SPUFrameLowering::minStackSize();
    unsigned ArgRegIdx = 0;
-  unsigned StackSlotSize = SPUFrameInfo::stackSlotSize();
+  unsigned StackSlotSize = SPUFrameLowering::stackSlotSize();
  
    EVT PtrVT = DAG.getTargetLoweringInfo().getPointerTy();
  
    SmallVector<CCValAssign, 16> ArgLocs;
-  CCState CCInfo(CallConv, isVarArg, getTargetMachine(), ArgLocs,
-                 *DAG.getContext());
+  CCState CCInfo(CallConv, isVarArg, DAG.getMachineFunction(),
+                getTargetMachine(), ArgLocs, *DAG.getContext());
    // FIXME: allow for other calling conventions
    CCInfo.AnalyzeFormalArguments(Ins, CCC_SPU);
  
@@ -1183,7 +1195,7 @@ SPUTargetLowering::LowerFormalArguments(SDValue Chain,
        int FI = MFI->CreateFixedObject(ObjSize, ArgOffset, true);
        SDValue FIN = DAG.getFrameIndex(FI, PtrVT);
        ArgVal = DAG.getLoad(ObjectVT, dl, Chain, FIN, MachinePointerInfo(),
-                           false, false, 0);
+                           false, false, false, 0);
        ArgOffset += StackSlotSize;
      }
  
@@ -1194,9 +1206,9 @@ SPUTargetLowering::LowerFormalArguments(SDValue Chain,
  
    // vararg handling:
    if (isVarArg) {
-    // FIXME: we should be able to query the argument registers from 
-    //        tablegen generated code. 
-    static const unsigned ArgRegs[] = {
+    // FIXME: we should be able to query the argument registers from
+    //        tablegen generated code.
+    static const uint16_t ArgRegs[] = {
        SPU::R3,  SPU::R4,  SPU::R5,  SPU::R6,  SPU::R7,  SPU::R8,  SPU::R9,
        SPU::R10, SPU::R11, SPU::R12, SPU::R13, SPU::R14, SPU::R15, SPU::R16,
        SPU::R17, SPU::R18, SPU::R19, SPU::R20, SPU::R21, SPU::R22, SPU::R23,
@@ -1210,7 +1222,7 @@ SPUTargetLowering::LowerFormalArguments(SDValue Chain,
        SPU::R73, SPU::R74, SPU::R75, SPU::R76, SPU::R77, SPU::R78, SPU::R79
      };
      // size of ArgRegs array
-    unsigned NumArgRegs = 77;
+    const unsigned NumArgRegs = 77;
  
      // We will spill (79-3)+1 registers to the stack
      SmallVector<SDValue, 79-3+1> MemOps;
@@ -1220,7 +1232,7 @@ SPUTargetLowering::LowerFormalArguments(SDValue Chain,
        FuncInfo->setVarArgsFrameIndex(
          MFI->CreateFixedObject(StackSlotSize, ArgOffset, true));
        SDValue FIN = DAG.getFrameIndex(FuncInfo->getVarArgsFrameIndex(), PtrVT);
-      unsigned VReg = MF.addLiveIn(ArgRegs[ArgRegIdx], &SPU::R32CRegClass);
+      unsigned VReg = MF.addLiveIn(ArgRegs[ArgRegIdx], &SPU::VECREGRegClass);
        SDValue ArgVal = DAG.getRegister(VReg, MVT::v16i8);
        SDValue Store = DAG.getStore(Chain, dl, ArgVal, FIN, MachinePointerInfo(),
                                     false, false, 0);
@@ -1253,27 +1265,32 @@ static SDNode *isLSAAddress(SDValue Op, SelectionDAG &DAG) {
  }
  
  SDValue
-SPUTargetLowering::LowerCall(SDValue Chain, SDValue Callee,
-                             CallingConv::ID CallConv, bool isVarArg,
-                             bool &isTailCall,
-                             const SmallVectorImpl<ISD::OutputArg> &Outs,
-                             const SmallVectorImpl<SDValue> &OutVals,
-                             const SmallVectorImpl<ISD::InputArg> &Ins,
-                             DebugLoc dl, SelectionDAG &DAG,
+SPUTargetLowering::LowerCall(TargetLowering::CallLoweringInfo &CLI,
                               SmallVectorImpl<SDValue> &InVals) const {
+  SelectionDAG &DAG                     = CLI.DAG;
+  DebugLoc &dl                          = CLI.DL;
+  SmallVector<ISD::OutputArg, 32> &Outs = CLI.Outs;
+  SmallVector<SDValue, 32> &OutVals     = CLI.OutVals;
+  SmallVector<ISD::InputArg, 32> &Ins   = CLI.Ins;
+  SDValue Chain                         = CLI.Chain;
+  SDValue Callee                        = CLI.Callee;
+  bool &isTailCall                      = CLI.IsTailCall;
+  CallingConv::ID CallConv              = CLI.CallConv;
+  bool isVarArg                         = CLI.IsVarArg;
+
    // CellSPU target does not yet support tail call optimization.
    isTailCall = false;
  
    const SPUSubtarget *ST = SPUTM.getSubtargetImpl();
    unsigned NumOps     = Outs.size();
-  unsigned StackSlotSize = SPUFrameInfo::stackSlotSize();
+  unsigned StackSlotSize = SPUFrameLowering::stackSlotSize();
  
    SmallVector<CCValAssign, 16> ArgLocs;
-  CCState CCInfo(CallConv, isVarArg, getTargetMachine(), ArgLocs,
-                 *DAG.getContext()); 
+  CCState CCInfo(CallConv, isVarArg, DAG.getMachineFunction(),
+                getTargetMachine(), ArgLocs, *DAG.getContext());
    // FIXME: allow for other calling conventions
    CCInfo.AnalyzeCallOperands(Outs, CCC_SPU);
-  
+
    const unsigned NumArgRegs = ArgLocs.size();
  
  
@@ -1287,7 +1304,7 @@ SPUTargetLowering::LowerCall(SDValue Chain, SDValue Callee,
  
    // Figure out which arguments are going to go in registers, and which in
    // memory.
-  unsigned ArgOffset = SPUFrameInfo::minStackSize(); // Just below [LR]
+  unsigned ArgOffset = SPUFrameLowering::minStackSize(); // Just below [LR]
    unsigned ArgRegIdx = 0;
  
    // Keep track of registers passing arguments
@@ -1334,7 +1351,7 @@ SPUTargetLowering::LowerCall(SDValue Chain, SDValue Callee,
    // Accumulate how many bytes are to be pushed on the stack, including the
    // linkage area, and parameter passing area.  According to the SPU ABI,
    // we minimally need space for [LR] and [SP].
-  unsigned NumStackBytes = ArgOffset - SPUFrameInfo::minStackSize();
+  unsigned NumStackBytes = ArgOffset - SPUFrameLowering::minStackSize();
  
    // Insert a call sequence start
    Chain = DAG.getCALLSEQ_START(Chain, DAG.getIntPtrConstant(NumStackBytes,
@@ -1415,7 +1432,7 @@ SPUTargetLowering::LowerCall(SDValue Chain, SDValue Callee,
    if (InFlag.getNode())
      Ops.push_back(InFlag);
    // Returns a chain and a flag for retval copy to use.
-  Chain = DAG.getNode(CallOpc, dl, DAG.getVTList(MVT::Other, MVT::Flag),
+  Chain = DAG.getNode(CallOpc, dl, DAG.getVTList(MVT::Other, MVT::Glue),
                        &Ops[0], Ops.size());
    InFlag = Chain.getValue(1);
  
@@ -1430,15 +1447,15 @@ SPUTargetLowering::LowerCall(SDValue Chain, SDValue Callee,
  
    // Now handle the return value(s)
    SmallVector<CCValAssign, 16> RVLocs;
-  CCState CCRetInfo(CallConv, isVarArg, getTargetMachine(),
-                    RVLocs, *DAG.getContext());
+  CCState CCRetInfo(CallConv, isVarArg, DAG.getMachineFunction(),
+                   getTargetMachine(), RVLocs, *DAG.getContext());
    CCRetInfo.AnalyzeCallResult(Ins, CCC_SPU);
  
  
    // If the call has results, copy the values out of the ret val registers.
    for (unsigned i = 0; i != RVLocs.size(); ++i) {
      CCValAssign VA = RVLocs[i];
-    
+
      SDValue Val = DAG.getCopyFromReg(Chain, dl, VA.getLocReg(), VA.getLocVT(),
                                       InFlag);
      Chain = Val.getValue(1);
@@ -1457,8 +1474,8 @@ SPUTargetLowering::LowerReturn(SDValue Chain,
                                 DebugLoc dl, SelectionDAG &DAG) const {
  
    SmallVector<CCValAssign, 16> RVLocs;
-  CCState CCInfo(CallConv, isVarArg, getTargetMachine(),
-                 RVLocs, *DAG.getContext());
+  CCState CCInfo(CallConv, isVarArg, DAG.getMachineFunction(),
+                getTargetMachine(), RVLocs, *DAG.getContext());
    CCInfo.AnalyzeReturn(Outs, RetCC_SPU);
  
    // If this is the first return lowered for this function, add the regs to the
@@ -1671,9 +1688,8 @@ LowerBUILD_VECTOR(SDValue Op, SelectionDAG &DAG) {
             && "LowerBUILD_VECTOR: Unexpected floating point vector element.");
      // NOTE: pretend the constant is an integer. LLVM won't load FP constants
      SDValue T = DAG.getConstant(Value32, MVT::i32);
-    return DAG.getNode(ISD::BIT_CONVERT, dl, MVT::v4f32,
+    return DAG.getNode(ISD::BITCAST, dl, MVT::v4f32,
                         DAG.getNode(ISD::BUILD_VECTOR, dl, MVT::v4i32, T,T,T,T));
-    break;
    }
    case MVT::v2f64: {
      uint64_t f64val = uint64_t(SplatBits);
@@ -1681,9 +1697,8 @@ LowerBUILD_VECTOR(SDValue Op, SelectionDAG &DAG) {
             && "LowerBUILD_VECTOR: 64-bit float vector size > 8 bytes.");
      // NOTE: pretend the constant is an integer. LLVM won't load FP constants
      SDValue T = DAG.getConstant(f64val, MVT::i64);
-    return DAG.getNode(ISD::BIT_CONVERT, dl, MVT::v2f64,
+    return DAG.getNode(ISD::BITCAST, dl, MVT::v2f64,
                         DAG.getNode(ISD::BUILD_VECTOR, dl, MVT::v2i64, T, T));
-    break;
    }
    case MVT::v16i8: {
     // 8-bit constants have to be expanded to 16-bits
@@ -1691,7 +1706,7 @@ LowerBUILD_VECTOR(SDValue Op, SelectionDAG &DAG) {
     SmallVector<SDValue, 8> Ops;
  
     Ops.assign(8, DAG.getConstant(Value16, MVT::i16));
-   return DAG.getNode(ISD::BIT_CONVERT, dl, VT,
+   return DAG.getNode(ISD::BITCAST, dl, VT,
                        DAG.getNode(ISD::BUILD_VECTOR, dl, MVT::v8i16, &Ops[0], Ops.size()));
    }
    case MVT::v8i16: {
@@ -1710,8 +1725,6 @@ LowerBUILD_VECTOR(SDValue Op, SelectionDAG &DAG) {
      return SPU::LowerV2I64Splat(VT, DAG, SplatBits, dl);
    }
    }
-
-  return SDValue();
  }
  
  /*!
@@ -1725,7 +1738,7 @@ SPU::LowerV2I64Splat(EVT OpVT, SelectionDAG& DAG, uint64_t SplatVal,
    if (upper == lower) {
      // Magic constant that can be matched by IL, ILA, et. al.
      SDValue Val = DAG.getTargetConstant(upper, MVT::i32);
-    return DAG.getNode(ISD::BIT_CONVERT, dl, OpVT,
+    return DAG.getNode(ISD::BITCAST, dl, OpVT,
                         DAG.getNode(ISD::BUILD_VECTOR, dl, MVT::v4i32,
                                     Val, Val, Val, Val));
    } else {
@@ -1741,9 +1754,11 @@ SPU::LowerV2I64Splat(EVT OpVT, SelectionDAG& DAG, uint64_t SplatVal,
  
      // Both upper and lower are special, lower to a constant pool load:
      if (lower_special && upper_special) {
-      SDValue SplatValCN = DAG.getConstant(SplatVal, MVT::i64);
-      return DAG.getNode(ISD::BUILD_VECTOR, dl, MVT::v2i64,
-                         SplatValCN, SplatValCN);
+      SDValue UpperVal = DAG.getConstant(upper, MVT::i32);
+      SDValue LowerVal = DAG.getConstant(lower, MVT::i32);
+      SDValue BV = DAG.getNode(ISD::BUILD_VECTOR, dl, MVT::v4i32,
+                         UpperVal, LowerVal, UpperVal, LowerVal);
+      return DAG.getNode(ISD::BITCAST, dl, OpVT, BV);
      }
  
      SDValue LO32;
@@ -1754,7 +1769,7 @@ SPU::LowerV2I64Splat(EVT OpVT, SelectionDAG& DAG, uint64_t SplatVal,
      // Create lower vector if not a special pattern
      if (!lower_special) {
        SDValue LO32C = DAG.getConstant(lower, MVT::i32);
-      LO32 = DAG.getNode(ISD::BIT_CONVERT, dl, OpVT,
+      LO32 = DAG.getNode(ISD::BITCAST, dl, OpVT,
                           DAG.getNode(ISD::BUILD_VECTOR, dl, MVT::v4i32,
                                       LO32C, LO32C, LO32C, LO32C));
      }
@@ -1762,7 +1777,7 @@ SPU::LowerV2I64Splat(EVT OpVT, SelectionDAG& DAG, uint64_t SplatVal,
      // Create upper vector if not a special pattern
      if (!upper_special) {
        SDValue HI32C = DAG.getConstant(upper, MVT::i32);
-      HI32 = DAG.getNode(ISD::BIT_CONVERT, dl, OpVT,
+      HI32 = DAG.getNode(ISD::BITCAST, dl, OpVT,
                           DAG.getNode(ISD::BUILD_VECTOR, dl, MVT::v4i32,
                                       HI32C, HI32C, HI32C, HI32C));
      }
@@ -1846,7 +1861,7 @@ static SDValue LowerVECTOR_SHUFFLE(SDValue Op, SelectionDAG &DAG) {
  
    if (EltVT == MVT::i8) {
      V2EltIdx0 = 16;
-    maskVT = MVT::v16i8; 
+    maskVT = MVT::v16i8;
    } else if (EltVT == MVT::i16) {
      V2EltIdx0 = 8;
      maskVT = MVT::v8i16;
@@ -1862,7 +1877,7 @@ static SDValue LowerVECTOR_SHUFFLE(SDValue Op, SelectionDAG &DAG) {
    for (unsigned i = 0; i != MaxElts; ++i) {
      if (SVN->getMaskElt(i) < 0)
        continue;
-    
+
      unsigned SrcElt = SVN->getMaskElt(i);
  
      if (monotonic) {
@@ -1885,13 +1900,13 @@ static SDValue LowerVECTOR_SHUFFLE(SDValue Op, SelectionDAG &DAG) {
        if (PrevElt > 0 && SrcElt < MaxElts) {
          if ((PrevElt == SrcElt - 1)
              || (PrevElt == MaxElts - 1 && SrcElt == 0)) {
-          rotamt = SrcElt-i;
            PrevElt = SrcElt;
          } else {
            rotate = false;
          }
        } else if (i == 0 || (PrevElt==0 && SrcElt==1)) {
          // First time or after a "wrap around"
+        rotamt = SrcElt-i;
          PrevElt = SrcElt;
        } else {
          // This isn't a rotation, takes elements from vector 2
@@ -1909,7 +1924,7 @@ static SDValue LowerVECTOR_SHUFFLE(SDValue Op, SelectionDAG &DAG) {
      SDValue Pointer = DAG.getNode(SPUISD::IndirectAddr, dl, PtrVT,
                                  DAG.getRegister(SPU::R1, PtrVT),
                                  DAG.getConstant(V2EltOffset, MVT::i32));
-    SDValue ShufMaskOp = DAG.getNode(SPUISD::SHUFFLE_MASK, dl, 
+    SDValue ShufMaskOp = DAG.getNode(SPUISD::SHUFFLE_MASK, dl,
                                       maskVT, Pointer);
  
      // Use shuffle mask in SHUFB synthetic instruction:
@@ -1983,8 +1998,6 @@ static SDValue LowerSCALAR_TO_VECTOR(SDValue Op, SelectionDAG &DAG) {
        return DAG.getNode(SPUISD::PREFSLOT2VEC, dl, Op.getValueType(), Op0, Op0);
      }
    }
-
-  return SDValue();
  }
  
  static SDValue LowerEXTRACT_VECTOR_ELT(SDValue Op, SelectionDAG &DAG) {
@@ -2018,8 +2031,7 @@ static SDValue LowerEXTRACT_VECTOR_ELT(SDValue Op, SelectionDAG &DAG) {
      int elt_byte = EltNo * VT.getSizeInBits() / 8;
  
      switch (VT.getSimpleVT().SimpleTy) {
-    default:
-      assert(false && "Invalid value type!");
+    default: llvm_unreachable("Invalid value type!");
      case MVT::i8: {
        prefslot_begin = prefslot_end = 3;
        break;
@@ -2173,7 +2185,7 @@ static SDValue LowerINSERT_VECTOR_ELT(SDValue Op, SelectionDAG &DAG) {
                                  DAG.getRegister(SPU::R1, PtrVT),
                                  DAG.getConstant(Offset, PtrVT));
    // widen the mask when dealing with half vectors
-  EVT maskVT = EVT::getVectorVT(*(DAG.getContext()), VT.getVectorElementType(), 
+  EVT maskVT = EVT::getVectorVT(*(DAG.getContext()), VT.getVectorElementType(),
                                  128/ VT.getVectorElementType().getSizeInBits());
    SDValue ShufMask = DAG.getNode(SPUISD::SHUFFLE_MASK, dl, maskVT, Pointer);
  
@@ -2181,7 +2193,7 @@ static SDValue LowerINSERT_VECTOR_ELT(SDValue Op, SelectionDAG &DAG) {
      DAG.getNode(SPUISD::SHUFB, dl, VT,
                  DAG.getNode(ISD::SCALAR_TO_VECTOR, dl, VT, ValOp),
                  VecOp,
-                DAG.getNode(ISD::BIT_CONVERT, dl, MVT::v4i32, ShufMask));
+                DAG.getNode(ISD::BITCAST, dl, MVT::v4i32, ShufMask));
  
    return result;
  }
@@ -2191,14 +2203,12 @@ static SDValue LowerI8Math(SDValue Op, SelectionDAG &DAG, unsigned Opc,
  {
    SDValue N0 = Op.getOperand(0);      // Everything has at least one operand
    DebugLoc dl = Op.getDebugLoc();
-  EVT ShiftVT = TLI.getShiftAmountTy();
+  EVT ShiftVT = TLI.getShiftAmountTy(N0.getValueType());
  
    assert(Op.getValueType() == MVT::i8);
    switch (Opc) {
    default:
      llvm_unreachable("Unhandled i8 math operator");
-    /*NOTREACHED*/
-    break;
    case ISD::ADD: {
      // 8-bit addition: Promote the arguments up to 16-bits and truncate
      // the result:
@@ -2283,11 +2293,8 @@ static SDValue LowerI8Math(SDValue Op, SelectionDAG &DAG, unsigned Opc,
      N1 = DAG.getNode(ISD::SIGN_EXTEND, dl, MVT::i16, N1);
      return DAG.getNode(ISD::TRUNCATE, dl, MVT::i8,
                         DAG.getNode(Opc, dl, MVT::i16, N0, N1));
-    break;
    }
    }
-
-  return SDValue();
  }
  
  //! Lower byte immediate operations for v16i8 vectors:
@@ -2301,12 +2308,12 @@ LowerByteImmed(SDValue Op, SelectionDAG &DAG) {
    ConstVec = Op.getOperand(0);
    Arg = Op.getOperand(1);
    if (ConstVec.getNode()->getOpcode() != ISD::BUILD_VECTOR) {
-    if (ConstVec.getNode()->getOpcode() == ISD::BIT_CONVERT) {
+    if (ConstVec.getNode()->getOpcode() == ISD::BITCAST) {
        ConstVec = ConstVec.getOperand(0);
      } else {
        ConstVec = Op.getOperand(1);
        Arg = Op.getOperand(0);
-      if (ConstVec.getNode()->getOpcode() == ISD::BIT_CONVERT) {
+      if (ConstVec.getNode()->getOpcode() == ISD::BITCAST) {
          ConstVec = ConstVec.getOperand(0);
        }
      }
@@ -2347,13 +2354,12 @@ LowerByteImmed(SDValue Op, SelectionDAG &DAG) {
  */
  static SDValue LowerCTPOP(SDValue Op, SelectionDAG &DAG) {
    EVT VT = Op.getValueType();
-  EVT vecVT = EVT::getVectorVT(*DAG.getContext(), 
+  EVT vecVT = EVT::getVectorVT(*DAG.getContext(),
                                 VT, (128 / VT.getSizeInBits()));
    DebugLoc dl = Op.getDebugLoc();
  
    switch (VT.getSimpleVT().SimpleTy) {
-  default:
-    assert(false && "Invalid value type!");
+  default: llvm_unreachable("Invalid value type!");
    case MVT::i8: {
      SDValue N = Op.getOperand(0);
      SDValue Elt0 = DAG.getConstant(0, MVT::i32);
@@ -2523,7 +2529,7 @@ static SDValue LowerSETCC(SDValue Op, SelectionDAG &DAG,
  
    // Take advantage of the fact that (truncate (sra arg, 32)) is efficiently
    // selected to a NOP:
-  SDValue i64lhs = DAG.getNode(ISD::BIT_CONVERT, dl, IntVT, lhs);
+  SDValue i64lhs = DAG.getNode(ISD::BITCAST, dl, IntVT, lhs);
    SDValue lhsHi32 =
            DAG.getNode(ISD::TRUNCATE, dl, MVT::i32,
                        DAG.getNode(ISD::SRL, dl, IntVT,
@@ -2557,7 +2563,7 @@ static SDValue LowerSETCC(SDValue Op, SelectionDAG &DAG,
                                      ISD::SETGT));
    }
  
-  SDValue i64rhs = DAG.getNode(ISD::BIT_CONVERT, dl, IntVT, rhs);
+  SDValue i64rhs = DAG.getNode(ISD::BITCAST, dl, IntVT, rhs);
    SDValue rhsHi32 =
            DAG.getNode(ISD::TRUNCATE, dl, MVT::i32,
                        DAG.getNode(ISD::SRL, dl, IntVT,
@@ -2671,7 +2677,7 @@ static SDValue LowerTRUNCATE(SDValue Op, SelectionDAG &DAG)
    // Type to truncate to
    EVT VT = Op.getValueType();
    MVT simpleVT = VT.getSimpleVT();
-  EVT VecVT = EVT::getVectorVT(*DAG.getContext(), 
+  EVT VecVT = EVT::getVectorVT(*DAG.getContext(),
                                 VT, (128 / VT.getSizeInBits()));
    DebugLoc dl = Op.getDebugLoc();
  
@@ -2720,10 +2726,17 @@ static SDValue LowerSIGN_EXTEND(SDValue Op, SelectionDAG &DAG)
    SDValue Op0 = Op.getOperand(0);
    MVT Op0VT = Op0.getValueType().getSimpleVT();
  
+  // extend i8 & i16 via i32
+  if (Op0VT == MVT::i8 || Op0VT == MVT::i16) {
+    Op0 = DAG.getNode(ISD::SIGN_EXTEND, dl, MVT::i32, Op0);
+    Op0VT = MVT::i32;
+  }
+
    // The type to extend to needs to be a i128 and
    // the type to extend from needs to be i64 or i32.
    assert((OpVT == MVT::i128 && (Op0VT == MVT::i64 || Op0VT == MVT::i32)) &&
            "LowerSIGN_EXTEND: input and/or output operand have wrong size");
+  (void)OpVT;
  
    // Create shuffle mask
    unsigned mask1 = 0x10101010; // byte 0 - 3 and 4 - 7
@@ -2745,16 +2758,16 @@ static SDValue LowerSIGN_EXTEND(SDValue Op, SelectionDAG &DAG)
                   DAG.getConstant(31, MVT::i32));
  
    // reinterpret as a i128 (SHUFB requires it). This gets lowered away.
-  SDValue extended = SDValue(DAG.getMachineNode(TargetOpcode::COPY_TO_REGCLASS, 
+  SDValue extended = SDValue(DAG.getMachineNode(TargetOpcode::COPY_TO_REGCLASS,
                                          dl, Op0VT, Op0,
                                          DAG.getTargetConstant(
-                                                  SPU::GPRCRegClass.getID(), 
+                                                  SPU::GPRCRegClass.getID(),
                                                    MVT::i32)), 0);
    // Shuffle bytes - Copy the sign bits into the upper 64 bits
    // and the input value into the lower 64 bits.
    SDValue extShuffle = DAG.getNode(SPUISD::SHUFB, dl, mvt,
          extended, sraVal, shufMask);
-  return DAG.getNode(ISD::BIT_CONVERT, dl, MVT::i128, extShuffle);
+  return DAG.getNode(ISD::BITCAST, dl, MVT::i128, extShuffle);
  }
  
  //! Custom (target-specific) lowering entry point
@@ -3107,7 +3120,7 @@ SPUTargetLowering::getSingleConstraintMatchWeight(
    switch (*constraint) {
    default:
      weight = TargetLowering::getSingleConstraintMatchWeight(info, constraint);
-    break;\r
+    break;
      //FIXME: Seems like the supported constraint letters were just copied
      // from PPC, as the following doesn't correspond to the GCC docs.
      // I'm leaving it so until someone adds the corresponding lowering support.
@@ -3133,16 +3146,16 @@ SPUTargetLowering::getRegForInlineAsmConstraint(const std::string &Constraint,
      case 'b':   // R1-R31
      case 'r':   // R0-R31
        if (VT == MVT::i64)
-        return std::make_pair(0U, SPU::R64CRegisterClass);
-      return std::make_pair(0U, SPU::R32CRegisterClass);
+        return std::make_pair(0U, &SPU::R64CRegClass);
+      return std::make_pair(0U, &SPU::R32CRegClass);
      case 'f':
        if (VT == MVT::f32)
-        return std::make_pair(0U, SPU::R32FPRegisterClass);
-      else if (VT == MVT::f64)
-        return std::make_pair(0U, SPU::R64FPRegisterClass);
+        return std::make_pair(0U, &SPU::R32FPRegClass);
+      if (VT == MVT::f64)
+        return std::make_pair(0U, &SPU::R64FPRegClass);
        break;
      case 'v':
-      return std::make_pair(0U, SPU::GPRCRegisterClass);
+      return std::make_pair(0U, &SPU::GPRCRegClass);
      }
    }
  
@@ -3152,7 +3165,6 @@ SPUTargetLowering::getRegForInlineAsmConstraint(const std::string &Constraint,
  //! Compute used/known bits for a SPU operand
  void
  SPUTargetLowering::computeMaskedBitsForTargetNode(const SDValue Op,
-                                                  const APInt &Mask,
                                                    APInt &KnownZero,
                                                    APInt &KnownOne,
                                                    const SelectionDAG &DAG,
@@ -3203,22 +3215,22 @@ SPUTargetLowering::ComputeNumSignBitsForTargetNode(SDValue Op,
  // LowerAsmOperandForConstraint
  void
  SPUTargetLowering::LowerAsmOperandForConstraint(SDValue Op,
-                                                char ConstraintLetter,
+                                                std::string &Constraint,
                                                  std::vector<SDValue> &Ops,
                                                  SelectionDAG &DAG) const {
    // Default, for the time being, to the base class handler
-  TargetLowering::LowerAsmOperandForConstraint(Op, ConstraintLetter, Ops, DAG);
+  TargetLowering::LowerAsmOperandForConstraint(Op, Constraint, Ops, DAG);
  }
  
  /// isLegalAddressImmediate - Return true if the integer value can be used
  /// as the offset of the target addressing mode.
  bool SPUTargetLowering::isLegalAddressImmediate(int64_t V,
-                                                const Type *Ty) const {
+                                                Type *Ty) const {
    // SPU's addresses are 256K:
    return (V > -(1 << 18) && V < (1 << 18) - 1);
  }
  
-bool SPUTargetLowering::isLegalAddressImmediate(llvm::GlobalValue* GV) const {
+bool SPUTargetLowering::isLegalAddressImmediate(GlobalValue* GV) const {
    return false;
  }
  
@@ -3234,14 +3246,14 @@ bool SPUTargetLowering::isLegalICmpImmediate(int64_t Imm) const {
    return isInt<10>(Imm);
  }
  
-bool 
-SPUTargetLowering::isLegalAddressingMode(const AddrMode &AM, 
-                                         const Type * ) const{
+bool
+SPUTargetLowering::isLegalAddressingMode(const AddrMode &AM,
+                                         Type * ) const{
  
-  // A-form: 18bit absolute address. 
+  // A-form: 18bit absolute address.
    if (AM.BaseGV && !AM.HasBaseReg && AM.Scale == 0 && AM.BaseOffs == 0)
      return true;
- 
+
    // D-form: reg + 14bit offset
    if (AM.BaseGV ==0 && AM.HasBaseReg && AM.Scale == 0 && isInt<14>(AM.BaseOffs))
      return true;
@@ -3252,4 +3264,3 @@ SPUTargetLowering::isLegalAddressingMode(const AddrMode &AM,
  
    return false;
  }
-