1 ; RUN: llc < %s -march=x86-64 -mtriple=x86_64-apple-darwin -mcpu=knl | FileCheck %s --check-prefix=KNL --check-prefix=CHECK
2 ; RUN: llc < %s -march=x86-64 -mtriple=x86_64-apple-darwin -mcpu=skx | FileCheck %s --check-prefix=SKX --check-prefix=CHECK
8 define i16 @mask16(i16 %x) {
9 %m0 = bitcast i16 %x to <16 x i1>
10 %m1 = xor <16 x i1> %m0, <i1 -1, i1 -1, i1 -1, i1 -1, i1 -1, i1 -1, i1 -1, i1 -1, i1 -1, i1 -1, i1 -1, i1 -1, i1 -1, i1 -1, i1 -1, i1 -1>
11 %ret = bitcast <16 x i1> %m1 to i16
23 define i8 @mask8(i8 %x) {
24 %m0 = bitcast i8 %x to <8 x i1>
25 %m1 = xor <8 x i1> %m0, <i1 -1, i1 -1, i1 -1, i1 -1, i1 -1, i1 -1, i1 -1, i1 -1>
26 %ret = bitcast <8 x i1> %m1 to i8
30 ; CHECK-LABEL: mask16_mem
31 ; CHECK: kmovw ([[ARG1:%rdi|%rcx]]), %k{{[0-7]}}
33 ; CHECK-NEXT: kmovw %k{{[0-7]}}, ([[ARG1]])
36 define void @mask16_mem(i16* %ptr) {
37 %x = load i16, i16* %ptr, align 4
38 %m0 = bitcast i16 %x to <16 x i1>
39 %m1 = xor <16 x i1> %m0, <i1 -1, i1 -1, i1 -1, i1 -1, i1 -1, i1 -1, i1 -1, i1 -1, i1 -1, i1 -1, i1 -1, i1 -1, i1 -1, i1 -1, i1 -1, i1 -1>
40 %ret = bitcast <16 x i1> %m1 to i16
41 store i16 %ret, i16* %ptr, align 4
45 ; CHECK-LABEL: mask8_mem
46 ; KNL: kmovw ([[ARG1]]), %k{{[0-7]}}
48 ; KNL-NEXT: kmovw %k{{[0-7]}}, ([[ARG1]])
49 ; SKX: kmovb ([[ARG1]]), %k{{[0-7]}}
51 ; SKX-NEXT: kmovb %k{{[0-7]}}, ([[ARG1]])
53 define void @mask8_mem(i8* %ptr) {
54 %x = load i8, i8* %ptr, align 4
55 %m0 = bitcast i8 %x to <8 x i1>
56 %m1 = xor <8 x i1> %m0, <i1 -1, i1 -1, i1 -1, i1 -1, i1 -1, i1 -1, i1 -1, i1 -1>
57 %ret = bitcast <8 x i1> %m1 to i8
58 store i8 %ret, i8* %ptr, align 4
66 define i16 @mand16(i16 %x, i16 %y) {
67 %ma = bitcast i16 %x to <16 x i1>
68 %mb = bitcast i16 %y to <16 x i1>
69 %mc = and <16 x i1> %ma, %mb
70 %md = xor <16 x i1> %ma, %mb
71 %me = or <16 x i1> %mc, %md
72 %ret = bitcast <16 x i1> %me to i16
76 ; CHECK-LABEL: shuf_test1
78 define i8 @shuf_test1(i16 %v) nounwind {
79 %v1 = bitcast i16 %v to <16 x i1>
80 %mask = shufflevector <16 x i1> %v1, <16 x i1> undef, <8 x i32> <i32 8, i32 9, i32 10, i32 11, i32 12, i32 13, i32 14, i32 15>
81 %mask1 = bitcast <8 x i1> %mask to i8
85 ; CHECK-LABEL: zext_test1
90 define i32 @zext_test1(<16 x i32> %a, <16 x i32> %b) {
91 %cmp_res = icmp ugt <16 x i32> %a, %b
92 %cmp_res.i1 = extractelement <16 x i1> %cmp_res, i32 5
93 %res = zext i1 %cmp_res.i1 to i32
97 ; CHECK-LABEL: zext_test2
102 define i16 @zext_test2(<16 x i32> %a, <16 x i32> %b) {
103 %cmp_res = icmp ugt <16 x i32> %a, %b
104 %cmp_res.i1 = extractelement <16 x i1> %cmp_res, i32 5
105 %res = zext i1 %cmp_res.i1 to i16
109 ; CHECK-LABEL: zext_test3
114 define i8 @zext_test3(<16 x i32> %a, <16 x i32> %b) {
115 %cmp_res = icmp ugt <16 x i32> %a, %b
116 %cmp_res.i1 = extractelement <16 x i1> %cmp_res, i32 5
117 %res = zext i1 %cmp_res.i1 to i8
122 ; KNL: kmovw %k0, %eax
123 ; KNL: movb %al, (%rdi)
124 ; SKX: kmovb %k0, (%rdi)
125 define i8 @conv1(<8 x i1>* %R) {
127 store <8 x i1> <i1 1, i1 1, i1 1, i1 1, i1 1, i1 1, i1 1, i1 1>, <8 x i1>* %R
129 %maskPtr = alloca <8 x i1>
130 store <8 x i1> <i1 0, i1 1, i1 1, i1 1, i1 1, i1 1, i1 1, i1 1>, <8 x i1>* %maskPtr
131 %mask = load <8 x i1>, <8 x i1>* %maskPtr
132 %mask_convert = bitcast <8 x i1> %mask to i8
141 define <4 x i32> @test4(<4 x i64> %x, <4 x i64> %y, <4 x i64> %x1, <4 x i64> %y1) {
142 %x_gt_y = icmp sgt <4 x i64> %x, %y
143 %x1_gt_y1 = icmp sgt <4 x i64> %x1, %y1
144 %res = icmp sgt <4 x i1>%x_gt_y, %x1_gt_y1
145 %resse = sext <4 x i1>%res to <4 x i32>
154 define <2 x i64> @test5(<2 x i64> %x, <2 x i64> %y, <2 x i64> %x1, <2 x i64> %y1) {
155 %x_gt_y = icmp slt <2 x i64> %x, %y
156 %x1_gt_y1 = icmp sgt <2 x i64> %x1, %y1
157 %res = icmp slt <2 x i1>%x_gt_y, %x1_gt_y1
158 %resse = sext <2 x i1>%res to <2 x i64>