This commit enables unaligned memory accesses of vector types on AArch64 back end...

[oota-llvm.git] / test / CodeGen / X86 / sse41-blend.ll
diff --git a/test/CodeGen/X86/sse41-blend.ll b/test/CodeGen/X86/sse41-blend.ll

index 78604a0e96345ce0a5477ab5ec795c986e1885b9..4681fde7548e93eeaa4bc473e6488a7655f447c2 100644 (file)
--- a/test/CodeGen/X86/sse41-blend.ll
+++ b/test/CodeGen/X86/sse41-blend.ll
@@ -1,42 +1,42 @@
-; RUN: llc < %s -mtriple=x86_64-apple-darwin -mcpu=corei7 -promote-elements -mattr=+sse41 | FileCheck %s
+; RUN: llc < %s -mtriple=x86_64-apple-darwin -mcpu=corei7 -mattr=+sse4.1 | FileCheck %s
  
-;CHECK: vsel_float
+;CHECK-LABEL: vsel_float:
  ;CHECK: blendvps
  ;CHECK: ret
  define <4 x float> @vsel_float(<4 x float> %v1, <4 x float> %v2) {
-  %vsel = select <4 x i1> <i1 true, i1 false, i1 false, i1 false>, <4 x float> %v1, <4 x float> %v2
+  %vsel = select <4 x i1> <i1 true, i1 false, i1 true, i1 true>, <4 x float> %v1, <4 x float> %v2
    ret <4 x float> %vsel
  }
  
  
-;CHECK: vsel_4xi8
+;CHECK-LABEL: vsel_4xi8:
  ;CHECK: blendvps
  ;CHECK: ret
  define <4 x i8> @vsel_4xi8(<4 x i8> %v1, <4 x i8> %v2) {
-  %vsel = select <4 x i1> <i1 true, i1 false, i1 false, i1 false>, <4 x i8> %v1, <4 x i8> %v2
+  %vsel = select <4 x i1> <i1 true, i1 true, i1 false, i1 true>, <4 x i8> %v1, <4 x i8> %v2
    ret <4 x i8> %vsel
  }
  
-;CHECK: vsel_4xi16
+;CHECK-LABEL: vsel_4xi16:
  ;CHECK: blendvps
  ;CHECK: ret
  define <4 x i16> @vsel_4xi16(<4 x i16> %v1, <4 x i16> %v2) {
-  %vsel = select <4 x i1> <i1 true, i1 false, i1 false, i1 false>, <4 x i16> %v1, <4 x i16> %v2
+  %vsel = select <4 x i1> <i1 true, i1 false, i1 true, i1 true>, <4 x i16> %v1, <4 x i16> %v2
    ret <4 x i16> %vsel
  }
  
  
-;CHECK: vsel_i32
+;CHECK-LABEL: vsel_i32:
  ;CHECK: blendvps
  ;CHECK: ret
  define <4 x i32> @vsel_i32(<4 x i32> %v1, <4 x i32> %v2) {
-  %vsel = select <4 x i1> <i1 true, i1 false, i1 false, i1 false>, <4 x i32> %v1, <4 x i32> %v2
+  %vsel = select <4 x i1> <i1 true, i1 true, i1 false, i1 true>, <4 x i32> %v1, <4 x i32> %v2
    ret <4 x i32> %vsel
  }
  
  
-;CHECK: vsel_double
-;CHECK: blendvpd
+;CHECK-LABEL: vsel_double:
+;CHECK: movsd
  ;CHECK: ret
  define <4 x double> @vsel_double(<4 x double> %v1, <4 x double> %v2) {
    %vsel = select <4 x i1> <i1 true, i1 false, i1 false, i1 false>, <4 x double> %v1, <4 x double> %v2
@@ -44,8 +44,8 @@ define <4 x double> @vsel_double(<4 x double> %v1, <4 x double> %v2) {
  }
  
  
-;CHECK: vsel_i64
-;CHECK: blendvpd
+;CHECK-LABEL: vsel_i64:
+;CHECK: movsd
  ;CHECK: ret
  define <4 x i64> @vsel_i64(<4 x i64> %v1, <4 x i64> %v2) {
    %vsel = select <4 x i1> <i1 true, i1 false, i1 false, i1 false>, <4 x i64> %v1, <4 x i64> %v2
@@ -53,7 +53,7 @@ define <4 x i64> @vsel_i64(<4 x i64> %v1, <4 x i64> %v2) {
  }
  
  
-;CHECK: vsel_i8
+;CHECK-LABEL: vsel_i8:
  ;CHECK: pblendvb
  ;CHECK: ret
  define <16 x i8> @vsel_i8(<16 x i8> %v1, <16 x i8> %v2) {
@@ -80,3 +80,11 @@ define <2 x double> @B(<2 x double> %x, <2 x double> %y) {
    ret <2 x double> %min
  }
  
+; CHECK: float_crash
+define void @float_crash() nounwind {
+entry:
+  %merge205vector_func.i = select <4 x i1> undef, <4 x double> undef, <4 x double> undef
+  %extract214vector_func.i = extractelement <4 x double> %merge205vector_func.i, i32 0
+  store double %extract214vector_func.i, double addrspace(1)* undef, align 8
+  ret void
+}