Add enums and functions for symbols Mips64 uses.

[oota-llvm.git] / lib / Target / X86 / X86FastISel.cpp
diff --git a/lib/Target/X86/X86FastISel.cpp b/lib/Target/X86/X86FastISel.cpp

index a4d1c675ee698945a0e5c75c638c8ecd533a19d5..457b74250c8a2d7d292fef2fe3cbb40bdafa9db7 100644 (file)
--- a/lib/Target/X86/X86FastISel.cpp
+++ b/lib/Target/X86/X86FastISel.cpp
@@ -59,8 +59,8 @@ public:
    explicit X86FastISel(FunctionLoweringInfo &funcInfo) : FastISel(funcInfo) {
      Subtarget = &TM.getSubtarget<X86Subtarget>();
      StackPtr = Subtarget->is64Bit() ? X86::RSP : X86::ESP;
-    X86ScalarSSEf64 = Subtarget->hasSSE2();
-    X86ScalarSSEf32 = Subtarget->hasSSE1();
+    X86ScalarSSEf64 = Subtarget->hasSSE2() || Subtarget->hasAVX();
+    X86ScalarSSEf32 = Subtarget->hasSSE1() || Subtarget->hasAVX();
    }
  
    virtual bool TargetSelectInstruction(const Instruction *I);
@@ -134,7 +134,7 @@ private:
        (VT == MVT::f32 && X86ScalarSSEf32);   // f32 is when SSE1
    }
  
-  bool isTypeLegal(const Type *Ty, MVT &VT, bool AllowI1 = false);
+  bool isTypeLegal(Type *Ty, MVT &VT, bool AllowI1 = false);
  
    bool IsMemcpySmall(uint64_t Len);
  
@@ -144,7 +144,7 @@ private:
  
  } // end anonymous namespace.
  
-bool X86FastISel::isTypeLegal(const Type *Ty, MVT &VT, bool AllowI1) {
+bool X86FastISel::isTypeLegal(Type *Ty, MVT &VT, bool AllowI1) {
    EVT evt = TLI.getValueType(Ty, /*HandleUnknown=*/true);
    if (evt == MVT::Other || !evt.isSimple())
      // Unhandled type. Halt "fast" selection and bail.
@@ -198,8 +198,8 @@ bool X86FastISel::X86FastEmitLoad(EVT VT, const X86AddressMode &AM,
      RC  = X86::GR64RegisterClass;
      break;
    case MVT::f32:
-    if (Subtarget->hasSSE1()) {
-      Opc = X86::MOVSSrm;
+    if (X86ScalarSSEf32) {
+      Opc = Subtarget->hasAVX() ? X86::VMOVSSrm : X86::MOVSSrm;
        RC  = X86::FR32RegisterClass;
      } else {
        Opc = X86::LD_Fp32m;
@@ -207,8 +207,8 @@ bool X86FastISel::X86FastEmitLoad(EVT VT, const X86AddressMode &AM,
      }
      break;
    case MVT::f64:
-    if (Subtarget->hasSSE2()) {
-      Opc = X86::MOVSDrm;
+    if (X86ScalarSSEf64) {
+      Opc = Subtarget->hasAVX() ? X86::VMOVSDrm : X86::MOVSDrm;
        RC  = X86::FR64RegisterClass;
      } else {
        Opc = X86::LD_Fp64m;
@@ -250,10 +250,12 @@ X86FastISel::X86FastEmitStore(EVT VT, unsigned Val, const X86AddressMode &AM) {
    case MVT::i32: Opc = X86::MOV32mr; break;
    case MVT::i64: Opc = X86::MOV64mr; break; // Must be in x86-64 mode.
    case MVT::f32:
-    Opc = Subtarget->hasSSE1() ? X86::MOVSSmr : X86::ST_Fp32m;
+    Opc = X86ScalarSSEf32 ?
+          (Subtarget->hasAVX() ? X86::VMOVSSmr : X86::MOVSSmr) : X86::ST_Fp32m;
      break;
    case MVT::f64:
-    Opc = Subtarget->hasSSE2() ? X86::MOVSDmr : X86::ST_Fp64m;
+    Opc = X86ScalarSSEf64 ?
+          (Subtarget->hasAVX() ? X86::VMOVSDmr : X86::MOVSDmr) : X86::ST_Fp64m;
      break;
    }
  
@@ -336,7 +338,7 @@ bool X86FastISel::X86SelectAddress(const Value *V, X86AddressMode &AM) {
      U = C;
    }
  
-  if (const PointerType *Ty = dyn_cast<PointerType>(V->getType()))
+  if (PointerType *Ty = dyn_cast<PointerType>(V->getType()))
      if (Ty->getAddressSpace() > 255)
        // Fast instruction selection doesn't support the special
        // address spaces.
@@ -399,7 +401,7 @@ bool X86FastISel::X86SelectAddress(const Value *V, X86AddressMode &AM) {
      for (User::const_op_iterator i = U->op_begin() + 1, e = U->op_end();
           i != e; ++i, ++GTI) {
        const Value *Op = *i;
-      if (const StructType *STy = dyn_cast<StructType>(*GTI)) {
+      if (StructType *STy = dyn_cast<StructType>(*GTI)) {
          const StructLayout *SL = TD.getStructLayout(STy);
          Disp += SL->getElementOffset(cast<ConstantInt>(Op)->getZExtValue());
          continue;
@@ -658,6 +660,10 @@ bool X86FastISel::X86SelectCallAddress(const Value *V, X86AddressMode &AM) {
  
  /// X86SelectStore - Select and emit code to implement store instructions.
  bool X86FastISel::X86SelectStore(const Instruction *I) {
+  // Atomic stores need special handling.
+  if (cast<StoreInst>(I)->isAtomic())
+    return false;
+
    MVT VT;
    if (!isTypeLegal(I->getOperand(0)->getType(), VT, /*AllowI1=*/true))
      return false;
@@ -780,6 +786,10 @@ bool X86FastISel::X86SelectRet(const Instruction *I) {
  /// X86SelectLoad - Select and emit code to implement load instructions.
  ///
  bool X86FastISel::X86SelectLoad(const Instruction *I)  {
+  // Atomic loads need special handling.
+  if (cast<LoadInst>(I)->isAtomic())
+    return false;
+
    MVT VT;
    if (!isTypeLegal(I->getType(), VT, /*AllowI1=*/true))
      return false;
@@ -797,14 +807,20 @@ bool X86FastISel::X86SelectLoad(const Instruction *I)  {
  }
  
  static unsigned X86ChooseCmpOpcode(EVT VT, const X86Subtarget *Subtarget) {
+  bool HasAVX = Subtarget->hasAVX();
+  bool X86ScalarSSEf32 = HasAVX || Subtarget->hasSSE1();
+  bool X86ScalarSSEf64 = HasAVX || Subtarget->hasSSE2();
+
    switch (VT.getSimpleVT().SimpleTy) {
    default:       return 0;
    case MVT::i8:  return X86::CMP8rr;
    case MVT::i16: return X86::CMP16rr;
    case MVT::i32: return X86::CMP32rr;
    case MVT::i64: return X86::CMP64rr;
-  case MVT::f32: return Subtarget->hasSSE1() ? X86::UCOMISSrr : 0;
-  case MVT::f64: return Subtarget->hasSSE2() ? X86::UCOMISDrr : 0;
+  case MVT::f32:
+    return X86ScalarSSEf32 ? (HasAVX ? X86::VUCOMISSrr : X86::UCOMISSrr) : 0;
+  case MVT::f64:
+    return X86ScalarSSEf64 ? (HasAVX ? X86::VUCOMISDrr : X86::UCOMISDrr) : 0;
    }
  }
  
@@ -1207,7 +1223,7 @@ bool X86FastISel::X86SelectSelect(const Instruction *I) {
  
  bool X86FastISel::X86SelectFPExt(const Instruction *I) {
    // fpext from float to double.
-  if (Subtarget->hasSSE2() &&
+  if (X86ScalarSSEf64 &&
        I->getType()->isDoubleTy()) {
      const Value *V = I->getOperand(0);
      if (V->getType()->isFloatTy()) {
@@ -1226,7 +1242,7 @@ bool X86FastISel::X86SelectFPExt(const Instruction *I) {
  }
  
  bool X86FastISel::X86SelectFPTrunc(const Instruction *I) {
-  if (Subtarget->hasSSE2()) {
+  if (X86ScalarSSEf64) {
      if (I->getType()->isFloatTy()) {
        const Value *V = I->getOperand(0);
        if (V->getType()->isDoubleTy()) {
@@ -1365,6 +1381,9 @@ bool X86FastISel::X86VisitIntrinsicCall(const IntrinsicInst &I) {
    case Intrinsic::memset: {
      const MemSetInst &MSI = cast<MemSetInst>(I);
  
+    if (MSI.isVolatile())
+      return false;
+
      unsigned SizeWidth = Subtarget->is64Bit() ? 64 : 32;
      if (!MSI.getLength()->getType()->isIntegerTy(SizeWidth))
        return false;
@@ -1393,7 +1412,7 @@ bool X86FastISel::X86VisitIntrinsicCall(const IntrinsicInst &I) {
      assert(DI->getAddress() && "Null address should be checked earlier!");
      if (!X86SelectAddress(DI->getAddress(), AM))
        return false;
-    const TargetInstrDesc &II = TII.get(TargetOpcode::DBG_VALUE);
+    const MCInstrDesc &II = TII.get(TargetOpcode::DBG_VALUE);
      // FIXME may need to add RegState::Debug to any registers produced,
      // although ESP/EBP should be the only ones at the moment.
      addFullAddress(BuildMI(*FuncInfo.MBB, FuncInfo.InsertPt, DL, II), AM).
@@ -1411,7 +1430,7 @@ bool X86FastISel::X86VisitIntrinsicCall(const IntrinsicInst &I) {
      // Replace "add with overflow" intrinsics with an "add" instruction followed
      // by a seto/setc instruction.
      const Function *Callee = I.getCalledFunction();
-    const Type *RetTy =
+    Type *RetTy =
        cast<StructType>(Callee->getReturnType())->getTypeAtIndex(unsigned(0));
  
      MVT VT;
@@ -1484,8 +1503,8 @@ bool X86FastISel::DoSelectCall(const Instruction *I, const char *MemIntName) {
    if (CC == CallingConv::Fast && GuaranteedTailCallOpt)
      return false;
  
-  const PointerType *PT = cast<PointerType>(CS.getCalledValue()->getType());
-  const FunctionType *FTy = cast<FunctionType>(PT->getElementType());
+  PointerType *PT = cast<PointerType>(CS.getCalledValue()->getType());
+  FunctionType *FTy = cast<FunctionType>(PT->getElementType());
    bool isVarArg = FTy->isVarArg();
  
    // Don't know how to handle Win64 varargs yet.  Nothing special needed for
@@ -1547,8 +1566,8 @@ bool X86FastISel::DoSelectCall(const Instruction *I, const char *MemIntName) {
        Flags.setZExt();
  
      if (CS.paramHasAttr(AttrInd, Attribute::ByVal)) {
-      const PointerType *Ty = cast<PointerType>(ArgVal->getType());
-      const Type *ElementTy = Ty->getElementType();
+      PointerType *Ty = cast<PointerType>(ArgVal->getType());
+      Type *ElementTy = Ty->getElementType();
        unsigned FrameSize = TD.getTypeAllocSize(ElementTy);
        unsigned FrameAlign = CS.getParamAlignment(AttrInd);
        if (!FrameAlign)
@@ -1600,7 +1619,7 @@ bool X86FastISel::DoSelectCall(const Instruction *I, const char *MemIntName) {
  
      if (ArgReg == 0) return false;
  
-    const Type *ArgTy = ArgVal->getType();
+    Type *ArgTy = ArgVal->getType();
      MVT ArgVT;
      if (!isTypeLegal(ArgTy, ArgVT))
        return false;
@@ -1630,7 +1649,7 @@ bool X86FastISel::DoSelectCall(const Instruction *I, const char *MemIntName) {
    unsigned NumBytes = CCInfo.getNextStackOffset();
  
    // Issue CALLSEQ_START
-  unsigned AdjStackDown = TM.getRegisterInfo()->getCallFrameSetupOpcode();
+  unsigned AdjStackDown = TII.getCallFrameSetupOpcode();
    BuildMI(*FuncInfo.MBB, FuncInfo.InsertPt, DL, TII.get(AdjStackDown))
      .addImm(NumBytes);
  
@@ -1803,7 +1822,7 @@ bool X86FastISel::DoSelectCall(const Instruction *I, const char *MemIntName) {
      MIB.addReg(RegArgs[i]);
  
    // Issue CALLSEQ_END
-  unsigned AdjStackUp = TM.getRegisterInfo()->getCallFrameDestroyOpcode();
+  unsigned AdjStackUp = TII.getCallFrameDestroyOpcode();
    unsigned NumBytesCallee = 0;
    if (!Subtarget->is64Bit() && CS.paramHasAttr(1, Attribute::StructRet))
      NumBytesCallee = 4;
@@ -1849,9 +1868,10 @@ bool X86FastISel::DoSelectCall(const Instruction *I, const char *MemIntName) {
      // out as F80 and use a truncate to move it from fp stack reg to xmm reg.
      if ((RVLocs[i].getLocReg() == X86::ST0 ||
           RVLocs[i].getLocReg() == X86::ST1)) {
-      if (isScalarFPTypeInSSEReg(RVLocs[i].getValVT()))
+      if (isScalarFPTypeInSSEReg(RVLocs[i].getValVT())) {
          CopyVT = MVT::f80;
-      CopyReg = createResultReg(X86::RFP80RegisterClass);
+        CopyReg = createResultReg(X86::RFP80RegisterClass);
+      }
        BuildMI(*FuncInfo.MBB, FuncInfo.InsertPt, DL, TII.get(X86::FpPOP_RETVAL),
                CopyReg);
      } else {
@@ -1964,8 +1984,8 @@ unsigned X86FastISel::TargetMaterializeConstant(const Constant *C) {
      RC  = X86::GR64RegisterClass;
      break;
    case MVT::f32:
-    if (Subtarget->hasSSE1()) {
-      Opc = X86::MOVSSrm;
+    if (X86ScalarSSEf32) {
+      Opc = Subtarget->hasAVX() ? X86::VMOVSSrm : X86::MOVSSrm;
        RC  = X86::FR32RegisterClass;
      } else {
        Opc = X86::LD_Fp32m;
@@ -1973,8 +1993,8 @@ unsigned X86FastISel::TargetMaterializeConstant(const Constant *C) {
      }
      break;
    case MVT::f64:
-    if (Subtarget->hasSSE2()) {
-      Opc = X86::MOVSDrm;
+    if (X86ScalarSSEf64) {
+      Opc = Subtarget->hasAVX() ? X86::VMOVSDrm : X86::MOVSDrm;
        RC  = X86::FR64RegisterClass;
      } else {
        Opc = X86::LD_Fp64m;
@@ -2069,8 +2089,8 @@ unsigned X86FastISel::TargetMaterializeFloatZero(const ConstantFP *CF) {
    switch (VT.SimpleTy) {
      default: return false;
      case MVT::f32:
-      if (Subtarget->hasSSE1()) {
-        Opc = X86::FsFLD0SS;
+      if (X86ScalarSSEf32) {
+        Opc = Subtarget->hasAVX() ? X86::VFsFLD0SS : X86::FsFLD0SS;
          RC  = X86::FR32RegisterClass;
        } else {
          Opc = X86::LD_Fp032;
@@ -2078,8 +2098,8 @@ unsigned X86FastISel::TargetMaterializeFloatZero(const ConstantFP *CF) {
        }
        break;
      case MVT::f64:
-      if (Subtarget->hasSSE2()) {
-        Opc = X86::FsFLD0SD;
+      if (X86ScalarSSEf64) {
+        Opc = Subtarget->hasAVX() ? X86::VFsFLD0SD : X86::FsFLD0SD;
          RC  = X86::FR64RegisterClass;
        } else {
          Opc = X86::LD_Fp064;