Support AVX 256-bit load and store intrinsics

author Bruno Cardoso Lopes <bruno.cardoso@gmail.com>

Tue, 10 Aug 2010 01:43:16 +0000 (01:43 +0000)

committer Bruno Cardoso Lopes <bruno.cardoso@gmail.com>

Tue, 10 Aug 2010 01:43:16 +0000 (01:43 +0000)
author Bruno Cardoso Lopes <bruno.cardoso@gmail.com>
Tue, 10 Aug 2010 01:43:16 +0000 (01:43 +0000)
committer Bruno Cardoso Lopes <bruno.cardoso@gmail.com>
Tue, 10 Aug 2010 01:43:16 +0000 (01:43 +0000)
diff --git a/lib/Target/X86/X86ISelLowering.cpp b/lib/Target/X86/X86ISelLowering.cpp

index 1b3d3e8b7a28841670b9d6b4d41cef004a67f7ae..12453e3bc04dde552807890a3abc7e7e7e3dfb12 100644 (file)
--- a/lib/Target/X86/X86ISelLowering.cpp
+++ b/lib/Target/X86/X86ISelLowering.cpp
@@ -871,6 +871,7 @@ X86TargetLowering::X86TargetLowering(X86TargetMachine &TM)
      addRegisterClass(MVT::v4f64, X86::VR256RegisterClass);
      addRegisterClass(MVT::v8i32, X86::VR256RegisterClass);
      addRegisterClass(MVT::v4i64, X86::VR256RegisterClass);
+    addRegisterClass(MVT::v32i8, X86::VR256RegisterClass);
  
      setOperationAction(ISD::LOAD,               MVT::v8f32, Legal);
      setOperationAction(ISD::LOAD,               MVT::v8i32, Legal);
diff --git a/lib/Target/X86/X86InstrSSE.td b/lib/Target/X86/X86InstrSSE.td

index d562a1aaac1f0cd8c6a197aff4e383a8446b9f21..59ce3adc1cb6305b37d8b62f3b2c4d6cef451321 100644 (file)
--- a/lib/Target/X86/X86InstrSSE.td
+++ b/lib/Target/X86/X86InstrSSE.td
@@ -340,6 +340,15 @@ def VMOVUPDYmr : VPDI<0x11, MRMDestMem, (outs), (ins f256mem:$dst, VR256:$src),
                     "movupd\t{$src, $dst|$dst, $src}",
                     [(store (v4f64 VR256:$src), addr:$dst)]>, VEX;
  }
+
+def : Pat<(int_x86_avx_loadu_ps_256 addr:$src), (VMOVUPSYrm addr:$src)>;
+def : Pat<(int_x86_avx_storeu_ps_256 addr:$dst, VR256:$src),
+          (VMOVUPSYmr addr:$dst, VR256:$src)>;
+
+def : Pat<(int_x86_avx_loadu_pd_256 addr:$src), (VMOVUPDYrm addr:$src)>;
+def : Pat<(int_x86_avx_storeu_pd_256 addr:$dst, VR256:$src),
+          (VMOVUPDYmr addr:$dst, VR256:$src)>;
+
  def MOVAPSmr : PSI<0x29, MRMDestMem, (outs), (ins f128mem:$dst, VR128:$src),
                     "movaps\t{$src, $dst|$dst, $src}",
                     [(alignedstore (v4f32 VR128:$src), addr:$dst)]>;
@@ -2291,6 +2300,10 @@ def MOVDQUmr_Int :   I<0x7F, MRMDestMem, (outs), (ins i128mem:$dst, VR128:$src),
  
  } // ExeDomain = SSEPackedInt
  
+def : Pat<(int_x86_avx_loadu_dq_256 addr:$src), (VMOVDQUYrm addr:$src)>;
+def : Pat<(int_x86_avx_storeu_dq_256 addr:$dst, VR256:$src),
+          (VMOVDQUYmr addr:$dst, VR256:$src)>;
+
  //===---------------------------------------------------------------------===//
  // SSE2 - Packed Integer Arithmetic Instructions
  //===---------------------------------------------------------------------===//
@@ -3348,10 +3361,11 @@ defm MOVDDUP : sse3_replicate_dfp<"movddup">;
  // Move Unaligned Integer
  let isAsmParserOnly = 1, Predicates = [HasAVX] in {
    def VLDDQUrm : S3DI<0xF0, MRMSrcMem, (outs VR128:$dst), (ins i128mem:$src),
-                     "vlddqu\t{$src, $dst|$dst, $src}",
-                     [(set VR128:$dst, (int_x86_sse3_ldu_dq addr:$src))]>, VEX;
+                   "vlddqu\t{$src, $dst|$dst, $src}",
+                   [(set VR128:$dst, (int_x86_sse3_ldu_dq addr:$src))]>, VEX;
    def VLDDQUYrm : S3DI<0xF0, MRMSrcMem, (outs VR256:$dst), (ins i256mem:$src),
-                     "vlddqu\t{$src, $dst|$dst, $src}", []>, VEX;
+                   "vlddqu\t{$src, $dst|$dst, $src}",
+                   [(set VR256:$dst, (int_x86_avx_ldu_dq_256 addr:$src))]>, VEX;
  }
  def LDDQUrm : S3DI<0xF0, MRMSrcMem, (outs VR128:$dst), (ins i128mem:$src),
                     "lddqu\t{$src, $dst|$dst, $src}",
@@ -4833,9 +4847,8 @@ let isAsmParserOnly = 1, Predicates = [HasAVX] in {
                                     VR128, memopv16i8, i128mem, 0>, VEX_4V;
    defm VDPPD : SS41I_binop_rmi_int<0x41, "vdppd", int_x86_sse41_dppd,
                                     VR128, memopv16i8, i128mem, 0>, VEX_4V;
-  let Pattern = []<dag> in
-  defm VDPPSY : SS41I_binop_rmi_int<0x40, "vdpps", int_x86_sse41_dpps,
-                                    VR256, memopv32i8, i256mem, 0>, VEX_4V;
+  defm VDPPSY : SS41I_binop_rmi_int<0x40, "vdpps", int_x86_avx_dp_ps_256,
+                                   VR256, memopv32i8, i256mem, 0>, VEX_4V;
  }
  
  let Constraints = "$src1 = $dst" in {
author	Bruno Cardoso Lopes <bruno.cardoso@gmail.com>
	Tue, 10 Aug 2010 01:43:16 +0000 (01:43 +0000)
committer	Bruno Cardoso Lopes <bruno.cardoso@gmail.com>
	Tue, 10 Aug 2010 01:43:16 +0000 (01:43 +0000)
lib/Target/X86/X86ISelLowering.cpp		patch \| blob \| history
lib/Target/X86/X86InstrSSE.td		patch \| blob \| history