Add missing zmovl AVX patterns which were causing crashes.
authorChad Rosier <mcrosier@apple.com>
Thu, 15 Dec 2011 22:11:31 +0000 (22:11 +0000)
committerChad Rosier <mcrosier@apple.com>
Thu, 15 Dec 2011 22:11:31 +0000 (22:11 +0000)
Patch by Elena Demikhovsky <elena.demikhovsky@intel.com>!

git-svn-id: https://llvm.org/svn/llvm-project/llvm/trunk@146689 91177308-0d34-0410-b5e6-96231b3b80d8

lib/Target/X86/X86InstrSSE.td
test/CodeGen/X86/2011-12-08-AVXISelBugs.ll

index 24e7ee430e4236d40bfeaa043b2bd8a2e752f2cd..8c16fe57b13fdd7892393c44ee6e3c22deeb4d34 100644 (file)
@@ -618,6 +618,9 @@ let Predicates = [HasAVX] in {
             (SUBREG_TO_REG (i64 0),
                            (v2f64 (VMOVSDrr (v2f64 (V_SET0)), FR64:$src)),
                            sub_xmm)>;
+  def : Pat<(v4i64 (X86vzmovl (insert_subvector undef,
+                   (v2i64 (scalar_to_vector (loadi64 addr:$src))), (i32 0)))),
+            (SUBREG_TO_REG (i64 0), (VMOVSDrm addr:$src), sub_sd)>;
 
   // Move low f64 and clear high bits.
   def : Pat<(v4f64 (X86vzmovl (v4f64 VR256:$src))),
@@ -800,6 +803,9 @@ let Predicates = [HasAVX] in {
 def : Pat<(v8i32 (X86vzmovl
                         (insert_subvector undef, (v4i32 VR128:$src), (i32 0)))),
           (SUBREG_TO_REG (i32 0), (VMOVAPSrr VR128:$src), sub_xmm)>;
+def : Pat<(v4i64 (X86vzmovl
+                        (insert_subvector undef, (v2i64 VR128:$src), (i32 0)))),
+          (SUBREG_TO_REG (i32 0), (VMOVAPSrr VR128:$src), sub_xmm)>;
 def : Pat<(v8f32 (X86vzmovl
                         (insert_subvector undef, (v4f32 VR128:$src), (i32 0)))),
           (SUBREG_TO_REG (i32 0), (VMOVAPSrr VR128:$src), sub_xmm)>;
index 26670c169ea485dbd3ea11335a5941cc928b57e5..d9781027ae2c23c5e3c5ccd195c034f47c839b1e 100644 (file)
@@ -61,3 +61,11 @@ t2.exit:                                 ; preds = %0, %loop
 return:                                           ; preds = %loop.cond
   ret void
 }
+
+define <3 x i64> @t4() nounwind {
+entry:
+  %0 = load <2 x i64> addrspace(1)* undef, align 16
+  %1 = extractelement <2 x i64> %0, i32 0
+  %2 = insertelement <3 x i64> <i64 undef, i64 0, i64 0>, i64 %1, i32 0
+  ret <3 x i64> %2
+}