Enable execution dependency fix pass for YMM registers when AVX2 is enabled. Add...

[oota-llvm.git] / lib / Target / X86 / X86InstrFragmentsSIMD.td
diff --git a/lib/Target/X86/X86InstrFragmentsSIMD.td b/lib/Target/X86/X86InstrFragmentsSIMD.td

index 670bbc5763b68310a5eef079444621a47e7bb475..6fd2efdab8f711ee3b3d2c9fe29ef609d4e5587b 100644 (file)
--- a/lib/Target/X86/X86InstrFragmentsSIMD.td
+++ b/lib/Target/X86/X86InstrFragmentsSIMD.td
@@ -39,6 +39,8 @@ def X86frsqrt  : SDNode<"X86ISD::FRSQRT",    SDTFPUnaryOp>;
  def X86frcp    : SDNode<"X86ISD::FRCP",      SDTFPUnaryOp>;
  def X86fsrl    : SDNode<"X86ISD::FSRL",      SDTX86FPShiftOp>;
  def X86fgetsign: SDNode<"X86ISD::FGETSIGNx86",SDTFPToIntOp>;
+def X86fhadd   : SDNode<"X86ISD::FHADD",     SDTFPBinOp>;
+def X86fhsub   : SDNode<"X86ISD::FHSUB",     SDTFPBinOp>;
  def X86comi    : SDNode<"X86ISD::COMI",      SDTX86CmpTest>;
  def X86ucomi   : SDNode<"X86ISD::UCOMI",     SDTX86CmpTest>;
  def X86cmpss   : SDNode<"X86ISD::FSETCCss",    SDTX86Cmpss>;
@@ -58,9 +60,6 @@ def X86psignw  : SDNode<"X86ISD::PSIGNW",
  def X86psignd  : SDNode<"X86ISD::PSIGND",
                   SDTypeProfile<1, 2, [SDTCisVT<0, v4i32>, SDTCisSameAs<0,1>,
                                        SDTCisSameAs<0,2>]>>;
-def X86pblendv : SDNode<"X86ISD::PBLENDVB",
-                 SDTypeProfile<1, 3, [SDTCisVT<0, v16i8>, SDTCisSameAs<0,1>,
-                                      SDTCisSameAs<0,2>, SDTCisSameAs<0,3>]>>;
  def X86pextrb  : SDNode<"X86ISD::PEXTRB",
                   SDTypeProfile<1, 2, [SDTCisVT<0, i32>, SDTCisPtrTy<2>]>>;
  def X86pextrw  : SDNode<"X86ISD::PEXTRW",
@@ -109,6 +108,8 @@ def SDTShuff2OpI : SDTypeProfile<1, 2, [SDTCisVec<0>,
  def SDTShuff3OpI : SDTypeProfile<1, 3, [SDTCisVec<0>, SDTCisSameAs<0,1>,
                                   SDTCisSameAs<0,2>, SDTCisInt<3>]>;
  
+def SDTVBroadcast : SDTypeProfile<1, 1, [SDTCisVec<0>]>;
+
  def X86PAlign : SDNode<"X86ISD::PALIGN", SDTShuff3OpI>;
  
  def X86PShufd  : SDNode<"X86ISD::PSHUFD", SDTShuff2OpI>;
@@ -158,6 +159,10 @@ def X86VPermilpsy : SDNode<"X86ISD::VPERMILPSY", SDTShuff2OpI>;
  def X86VPermilpd  : SDNode<"X86ISD::VPERMILPD", SDTShuff2OpI>;
  def X86VPermilpdy : SDNode<"X86ISD::VPERMILPDY", SDTShuff2OpI>;
  
+def X86VPerm2f128 : SDNode<"X86ISD::VPERM2F128", SDTShuff3OpI>;
+
+def X86VBroadcast : SDNode<"X86ISD::VBROADCAST", SDTVBroadcast>;
+
  //===----------------------------------------------------------------------===//
  // SSE Complex Patterns
  //===----------------------------------------------------------------------===//
@@ -201,17 +206,28 @@ def loadv4f64    : PatFrag<(ops node:$ptr), (v4f64 (load node:$ptr))>;
  def loadv8i32    : PatFrag<(ops node:$ptr), (v8i32 (load node:$ptr))>;
  def loadv4i64    : PatFrag<(ops node:$ptr), (v4i64 (load node:$ptr))>;
  
-// Like 'store', but always requires vector alignment.
+// Like 'store', but always requires 128-bit vector alignment.
  def alignedstore : PatFrag<(ops node:$val, node:$ptr),
                             (store node:$val, node:$ptr), [{
    return cast<StoreSDNode>(N)->getAlignment() >= 16;
  }]>;
  
-// Like 'load', but always requires vector alignment.
+// Like 'store', but always requires 256-bit vector alignment.
+def alignedstore256 : PatFrag<(ops node:$val, node:$ptr),
+                              (store node:$val, node:$ptr), [{
+  return cast<StoreSDNode>(N)->getAlignment() >= 32;
+}]>;
+
+// Like 'load', but always requires 128-bit vector alignment.
  def alignedload : PatFrag<(ops node:$ptr), (load node:$ptr), [{
    return cast<LoadSDNode>(N)->getAlignment() >= 16;
  }]>;
  
+// Like 'load', but always requires 256-bit vector alignment.
+def alignedload256 : PatFrag<(ops node:$ptr), (load node:$ptr), [{
+  return cast<LoadSDNode>(N)->getAlignment() >= 32;
+}]>;
+
  def alignedloadfsf32 : PatFrag<(ops node:$ptr),
                                 (f32 (alignedload node:$ptr))>;
  def alignedloadfsf64 : PatFrag<(ops node:$ptr),
@@ -229,13 +245,13 @@ def alignedloadv2i64 : PatFrag<(ops node:$ptr),
  
  // 256-bit aligned load pattern fragments
  def alignedloadv8f32 : PatFrag<(ops node:$ptr),
-                               (v8f32 (alignedload node:$ptr))>;
+                               (v8f32 (alignedload256 node:$ptr))>;
  def alignedloadv4f64 : PatFrag<(ops node:$ptr),
-                               (v4f64 (alignedload node:$ptr))>;
+                               (v4f64 (alignedload256 node:$ptr))>;
  def alignedloadv8i32 : PatFrag<(ops node:$ptr),
-                               (v8i32 (alignedload node:$ptr))>;
+                               (v8i32 (alignedload256 node:$ptr))>;
  def alignedloadv4i64 : PatFrag<(ops node:$ptr),
-                               (v4i64 (alignedload node:$ptr))>;
+                               (v4i64 (alignedload256 node:$ptr))>;
  
  // Like 'load', but uses special alignment checks suitable for use in
  // memory operands in most SSE instructions, which are required to
@@ -260,11 +276,12 @@ def memopv8i16 : PatFrag<(ops node:$ptr), (v8i16 (memop node:$ptr))>;
  def memopv16i8 : PatFrag<(ops node:$ptr), (v16i8 (memop node:$ptr))>;
  
  // 256-bit memop pattern fragments
-def memopv32i8 : PatFrag<(ops node:$ptr), (v32i8 (memop node:$ptr))>;
  def memopv8f32 : PatFrag<(ops node:$ptr), (v8f32 (memop node:$ptr))>;
  def memopv4f64 : PatFrag<(ops node:$ptr), (v4f64 (memop node:$ptr))>;
  def memopv4i64 : PatFrag<(ops node:$ptr), (v4i64 (memop node:$ptr))>;
  def memopv8i32 : PatFrag<(ops node:$ptr), (v8i32 (memop node:$ptr))>;
+def memopv16i16 : PatFrag<(ops node:$ptr), (v16i16 (memop node:$ptr))>;
+def memopv32i8 : PatFrag<(ops node:$ptr), (v32i8 (memop node:$ptr))>;
  
  // SSSE3 uses MMX registers for some instructions. They aren't aligned on a
  // 16-byte boundary.
@@ -310,6 +327,8 @@ def bc_v4i32 : PatFrag<(ops node:$in), (v4i32 (bitconvert node:$in))>;
  def bc_v2i64 : PatFrag<(ops node:$in), (v2i64 (bitconvert node:$in))>;
  
  // 256-bit bitconvert pattern fragments
+def bc_v32i8 : PatFrag<(ops node:$in), (v32i8 (bitconvert node:$in))>;
+def bc_v16i16 : PatFrag<(ops node:$in), (v16i16 (bitconvert node:$in))>;
  def bc_v8i32 : PatFrag<(ops node:$in), (v8i32 (bitconvert node:$in))>;
  def bc_v4i64 : PatFrag<(ops node:$in), (v4i64 (bitconvert node:$in))>;