test/CodeGen/X86/combine-or.ll

   1 ; RUN: llc < %s -mtriple=x86_64-unknown-linux-gnu -mcpu=corei7 | FileCheck %s
   2
   3
   4 ; Verify that each of the following test cases is folded into a single
   5 ; instruction which performs a blend operation.
   6
   7 define <2 x i64> @test1(<2 x i64> %a, <2 x i64> %b) {
   8 ; CHECK-LABEL: test1:
   9 ; CHECK:       # BB#0:
  10 ; CHECK-NEXT:    pblendw {{.*#+}} xmm0 = xmm0[0,1,2,3],xmm1[4,5,6,7]
  11 ; CHECK-NEXT:    retq
  12   %shuf1 = shufflevector <2 x i64> %a, <2 x i64> zeroinitializer, <2 x i32><i32 0, i32 2>
  13   %shuf2 = shufflevector <2 x i64> %b, <2 x i64> zeroinitializer, <2 x i32><i32 2, i32 1>
  14   %or = or <2 x i64> %shuf1, %shuf2
  15   ret <2 x i64> %or
  16 }
  17
  18
  19 define <4 x i32> @test2(<4 x i32> %a, <4 x i32> %b) {
  20 ; CHECK-LABEL: test2:
  21 ; CHECK:       # BB#0:
  22 ; CHECK-NEXT:    pblendw {{.*#+}} xmm0 = xmm1[0,1,2,3],xmm0[4,5,6,7]
  23 ; CHECK-NEXT:    retq
  24   %shuf1 = shufflevector <4 x i32> %a, <4 x i32> zeroinitializer, <4 x i32><i32 4, i32 4, i32 2, i32 3>
  25   %shuf2 = shufflevector <4 x i32> %b, <4 x i32> zeroinitializer, <4 x i32><i32 0, i32 1, i32 4, i32 4>
  26   %or = or <4 x i32> %shuf1, %shuf2
  27   ret <4 x i32> %or
  28 }
  29
  30
  31 define <2 x i64> @test3(<2 x i64> %a, <2 x i64> %b) {
  32 ; CHECK-LABEL: test3:
  33 ; CHECK:       # BB#0:
  34 ; CHECK-NEXT:    pblendw {{.*#+}} xmm0 = xmm1[0,1,2,3],xmm0[4,5,6,7]
  35 ; CHECK-NEXT:    retq
  36   %shuf1 = shufflevector <2 x i64> %a, <2 x i64> zeroinitializer, <2 x i32><i32 2, i32 1>
  37   %shuf2 = shufflevector <2 x i64> %b, <2 x i64> zeroinitializer, <2 x i32><i32 0, i32 2>
  38   %or = or <2 x i64> %shuf1, %shuf2
  39   ret <2 x i64> %or
  40 }
  41
  42
  43 define <4 x i32> @test4(<4 x i32> %a, <4 x i32> %b) {
  44 ; CHECK-LABEL: test4:
  45 ; CHECK:       # BB#0:
  46 ; CHECK-NEXT:    pblendw {{.*#+}} xmm0 = xmm0[0,1],xmm1[2,3,4,5,6,7]
  47 ; CHECK-NEXT:    retq
  48   %shuf1 = shufflevector <4 x i32> %a, <4 x i32> zeroinitializer, <4 x i32><i32 0, i32 4, i32 4, i32 4>
  49   %shuf2 = shufflevector <4 x i32> %b, <4 x i32> zeroinitializer, <4 x i32><i32 4, i32 1, i32 2, i32 3>
  50   %or = or <4 x i32> %shuf1, %shuf2
  51   ret <4 x i32> %or
  52 }
  53
  54
  55 define <4 x i32> @test5(<4 x i32> %a, <4 x i32> %b) {
  56 ; CHECK-LABEL: test5:
  57 ; CHECK:       # BB#0:
  58 ; CHECK-NEXT:    pblendw {{.*#+}} xmm0 = xmm1[0,1],xmm0[2,3,4,5,6,7]
  59 ; CHECK-NEXT:    retq
  60   %shuf1 = shufflevector <4 x i32> %a, <4 x i32> zeroinitializer, <4 x i32><i32 4, i32 1, i32 2, i32 3>
  61   %shuf2 = shufflevector <4 x i32> %b, <4 x i32> zeroinitializer, <4 x i32><i32 0, i32 4, i32 4, i32 4>
  62   %or = or <4 x i32> %shuf1, %shuf2
  63   ret <4 x i32> %or
  64 }
  65
  66
  67 define <4 x i32> @test6(<4 x i32> %a, <4 x i32> %b) {
  68 ; CHECK-LABEL: test6:
  69 ; CHECK:       # BB#0:
  70 ; CHECK-NEXT:    pblendw {{.*#+}} xmm0 = xmm0[0,1,2,3],xmm1[4,5,6,7]
  71 ; CHECK-NEXT:    retq
  72   %shuf1 = shufflevector <4 x i32> %a, <4 x i32> zeroinitializer, <4 x i32><i32 0, i32 1, i32 4, i32 4>
  73   %shuf2 = shufflevector <4 x i32> %b, <4 x i32> zeroinitializer, <4 x i32><i32 4, i32 4, i32 2, i32 3>
  74   %or = or <4 x i32> %shuf1, %shuf2
  75   ret <4 x i32> %or
  76 }
  77
  78
  79 define <4 x i32> @test7(<4 x i32> %a, <4 x i32> %b) {
  80 ; CHECK-LABEL: test7:
  81 ; CHECK:       # BB#0:
  82 ; CHECK-NEXT:    pblendw {{.*#+}} xmm0 = xmm0[0,1,2,3],xmm1[4,5,6,7]
  83 ; CHECK-NEXT:    retq
  84   %and1 = and <4 x i32> %a, <i32 -1, i32 -1, i32 0, i32 0>
  85   %and2 = and <4 x i32> %b, <i32 0, i32 0, i32 -1, i32 -1>
  86   %or = or <4 x i32> %and1, %and2
  87   ret <4 x i32> %or
  88 }
  89
  90
  91 define <2 x i64> @test8(<2 x i64> %a, <2 x i64> %b) {
  92 ; CHECK-LABEL: test8:
  93 ; CHECK:       # BB#0:
  94 ; CHECK-NEXT:    pblendw {{.*#+}} xmm0 = xmm0[0,1,2,3],xmm1[4,5,6,7]
  95 ; CHECK-NEXT:    retq
  96   %and1 = and <2 x i64> %a, <i64 -1, i64 0>
  97   %and2 = and <2 x i64> %b, <i64 0, i64 -1>
  98   %or = or <2 x i64> %and1, %and2
  99   ret <2 x i64> %or
 100 }
 101
 102
 103 define <4 x i32> @test9(<4 x i32> %a, <4 x i32> %b) {
 104 ; CHECK-LABEL: test9:
 105 ; CHECK:       # BB#0:
 106 ; CHECK-NEXT:    pblendw {{.*#+}} xmm0 = xmm1[0,1,2,3],xmm0[4,5,6,7]
 107 ; CHECK-NEXT:    retq
 108   %and1 = and <4 x i32> %a, <i32 0, i32 0, i32 -1, i32 -1>
 109   %and2 = and <4 x i32> %b, <i32 -1, i32 -1, i32 0, i32 0>
 110   %or = or <4 x i32> %and1, %and2
 111   ret <4 x i32> %or
 112 }
 113
 114
 115 define <2 x i64> @test10(<2 x i64> %a, <2 x i64> %b) {
 116 ; CHECK-LABEL: test10:
 117 ; CHECK:       # BB#0:
 118 ; CHECK-NEXT:    pblendw {{.*#+}} xmm0 = xmm1[0,1,2,3],xmm0[4,5,6,7]
 119 ; CHECK-NEXT:    retq
 120   %and1 = and <2 x i64> %a, <i64 0, i64 -1>
 121   %and2 = and <2 x i64> %b, <i64 -1, i64 0>
 122   %or = or <2 x i64> %and1, %and2
 123   ret <2 x i64> %or
 124 }
 125
 126
 127 define <4 x i32> @test11(<4 x i32> %a, <4 x i32> %b) {
 128 ; CHECK-LABEL: test11:
 129 ; CHECK:       # BB#0:
 130 ; CHECK-NEXT:    pblendw {{.*#+}} xmm0 = xmm0[0,1],xmm1[2,3,4,5,6,7]
 131 ; CHECK-NEXT:    retq
 132   %and1 = and <4 x i32> %a, <i32 -1, i32 0, i32 0, i32 0>
 133   %and2 = and <4 x i32> %b, <i32 0, i32 -1, i32 -1, i32 -1>
 134   %or = or <4 x i32> %and1, %and2
 135   ret <4 x i32> %or
 136 }
 137
 138
 139 define <4 x i32> @test12(<4 x i32> %a, <4 x i32> %b) {
 140 ; CHECK-LABEL: test12:
 141 ; CHECK:       # BB#0:
 142 ; CHECK-NEXT:    pblendw {{.*#+}} xmm0 = xmm1[0,1],xmm0[2,3,4,5,6,7]
 143 ; CHECK-NEXT:    retq
 144   %and1 = and <4 x i32> %a, <i32 0, i32 -1, i32 -1, i32 -1>
 145   %and2 = and <4 x i32> %b, <i32 -1, i32 0, i32 0, i32 0>
 146   %or = or <4 x i32> %and1, %and2
 147   ret <4 x i32> %or
 148 }
 149
 150
 151 ; Verify that the following test cases are folded into single shuffles.
 152
 153 define <4 x i32> @test13(<4 x i32> %a, <4 x i32> %b) {
 154 ; CHECK-LABEL: test13:
 155 ; CHECK:       # BB#0:
 156 ; CHECK-NEXT:    pshufd {{.*#+}} xmm0 = xmm0[1,1,2,3]
 157 ; CHECK-NEXT:    pblendw {{.*#+}} xmm0 = xmm0[0,1,2,3],xmm1[4,5,6,7]
 158 ; CHECK-NEXT:    retq
 159   %shuf1 = shufflevector <4 x i32> %a, <4 x i32> zeroinitializer, <4 x i32><i32 1, i32 1, i32 4, i32 4>
 160   %shuf2 = shufflevector <4 x i32> %b, <4 x i32> zeroinitializer, <4 x i32><i32 4, i32 4, i32 2, i32 3>
 161   %or = or <4 x i32> %shuf1, %shuf2
 162   ret <4 x i32> %or
 163 }
 164
 165
 166 define <2 x i64> @test14(<2 x i64> %a, <2 x i64> %b) {
 167 ; CHECK-LABEL: test14:
 168 ; CHECK:       # BB#0:
 169 ; CHECK-NEXT:    punpcklqdq {{.*#+}} xmm0 = xmm0[0],xmm1[0]
 170 ; CHECK-NEXT:    retq
 171   %shuf1 = shufflevector <2 x i64> %a, <2 x i64> zeroinitializer, <2 x i32><i32 0, i32 2>
 172   %shuf2 = shufflevector <2 x i64> %b, <2 x i64> zeroinitializer, <2 x i32><i32 2, i32 0>
 173   %or = or <2 x i64> %shuf1, %shuf2
 174   ret <2 x i64> %or
 175 }
 176
 177
 178 define <4 x i32> @test15(<4 x i32> %a, <4 x i32> %b) {
 179 ; CHECK-LABEL: test15:
 180 ; CHECK:       # BB#0:
 181 ; CHECK-NEXT:    pshufd {{.*#+}} xmm2 = xmm0[0,1,2,1]
 182 ; CHECK-NEXT:    pshufd {{.*#+}} xmm0 = xmm1[2,1,2,3]
 183 ; CHECK-NEXT:    pblendw {{.*#+}} xmm0 = xmm0[0,1,2,3],xmm2[4,5,6,7]
 184 ; CHECK-NEXT:    retq
 185   %shuf1 = shufflevector <4 x i32> %a, <4 x i32> zeroinitializer, <4 x i32><i32 4, i32 4, i32 2, i32 1>
 186   %shuf2 = shufflevector <4 x i32> %b, <4 x i32> zeroinitializer, <4 x i32><i32 2, i32 1, i32 4, i32 4>
 187   %or = or <4 x i32> %shuf1, %shuf2
 188   ret <4 x i32> %or
 189 }
 190
 191
 192 define <2 x i64> @test16(<2 x i64> %a, <2 x i64> %b) {
 193 ; CHECK-LABEL: test16:
 194 ; CHECK:       # BB#0:
 195 ; CHECK-NEXT:    punpcklqdq {{.*#+}} xmm1 = xmm1[0],xmm0[0]
 196 ; CHECK-NEXT:    movdqa %xmm1, %xmm0
 197 ; CHECK-NEXT:    retq
 198   %shuf1 = shufflevector <2 x i64> %a, <2 x i64> zeroinitializer, <2 x i32><i32 2, i32 0>
 199   %shuf2 = shufflevector <2 x i64> %b, <2 x i64> zeroinitializer, <2 x i32><i32 0, i32 2>
 200   %or = or <2 x i64> %shuf1, %shuf2
 201   ret <2 x i64> %or
 202 }
 203
 204
 205 ; Verify that the dag-combiner does not fold a OR of two shuffles into a single
 206 ; shuffle instruction when the shuffle indexes are not compatible.
 207
 208 define <4 x i32> @test17(<4 x i32> %a, <4 x i32> %b) {
 209 ; CHECK-LABEL: test17:
 210 ; CHECK:       # BB#0:
 211 ; CHECK-NEXT:    psllq $32, %xmm0
 212 ; CHECK-NEXT:    movq {{.*#+}} xmm1 = xmm1[0],zero
 213 ; CHECK-NEXT:    por %xmm1, %xmm0
 214 ; CHECK-NEXT:    retq
 215   %shuf1 = shufflevector <4 x i32> %a, <4 x i32> zeroinitializer, <4 x i32><i32 4, i32 0, i32 4, i32 2>
 216   %shuf2 = shufflevector <4 x i32> %b, <4 x i32> zeroinitializer, <4 x i32><i32 0, i32 1, i32 4, i32 4>
 217   %or = or <4 x i32> %shuf1, %shuf2
 218   ret <4 x i32> %or
 219 }
 220
 221
 222 define <4 x i32> @test18(<4 x i32> %a, <4 x i32> %b) {
 223 ; CHECK-LABEL: test18:
 224 ; CHECK:       # BB#0:
 225 ; CHECK-NEXT:    pxor %xmm2, %xmm2
 226 ; CHECK-NEXT:    pblendw {{.*#+}} xmm0 = xmm0[0,1],xmm2[2,3,4,5,6,7]
 227 ; CHECK-NEXT:    pshufd {{.*#+}} xmm0 = xmm0[1,0,1,1]
 228 ; CHECK-NEXT:    pblendw {{.*#+}} xmm1 = xmm1[0,1],xmm2[2,3,4,5,6,7]
 229 ; CHECK-NEXT:    por %xmm1, %xmm0
 230 ; CHECK-NEXT:    retq
 231   %shuf1 = shufflevector <4 x i32> %a, <4 x i32> zeroinitializer, <4 x i32><i32 4, i32 0, i32 4, i32 4>
 232   %shuf2 = shufflevector <4 x i32> %b, <4 x i32> zeroinitializer, <4 x i32><i32 0, i32 4, i32 4, i32 4>
 233   %or = or <4 x i32> %shuf1, %shuf2
 234   ret <4 x i32> %or
 235 }
 236
 237
 238 define <4 x i32> @test19(<4 x i32> %a, <4 x i32> %b) {
 239 ; CHECK-LABEL: test19:
 240 ; CHECK:       # BB#0:
 241 ; CHECK-NEXT:    pshufd {{.*#+}} xmm2 = xmm0[0,0,2,3]
 242 ; CHECK-NEXT:    pxor %xmm3, %xmm3
 243 ; CHECK-NEXT:    pblendw {{.*#+}} xmm2 = xmm3[0,1],xmm2[2,3],xmm3[4,5],xmm2[6,7]
 244 ; CHECK-NEXT:    pshufd {{.*#+}} xmm0 = xmm1[0,1,2,2]
 245 ; CHECK-NEXT:    pblendw {{.*#+}} xmm0 = xmm0[0,1],xmm3[2,3],xmm0[4,5,6,7]
 246 ; CHECK-NEXT:    por %xmm2, %xmm0
 247 ; CHECK-NEXT:    retq
 248   %shuf1 = shufflevector <4 x i32> %a, <4 x i32> zeroinitializer, <4 x i32><i32 4, i32 0, i32 4, i32 3>
 249   %shuf2 = shufflevector <4 x i32> %b, <4 x i32> zeroinitializer, <4 x i32><i32 0, i32 4, i32 2, i32 2>
 250   %or = or <4 x i32> %shuf1, %shuf2
 251   ret <4 x i32> %or
 252 }
 253
 254
 255 define <2 x i64> @test20(<2 x i64> %a, <2 x i64> %b) {
 256 ; CHECK-LABEL: test20:
 257 ; CHECK:       # BB#0:
 258 ; CHECK-NEXT:    por %xmm1, %xmm0
 259 ; CHECK-NEXT:    movq {{.*#+}} xmm0 = xmm0[0],zero
 260 ; CHECK-NEXT:    retq
 261   %shuf1 = shufflevector <2 x i64> %a, <2 x i64> zeroinitializer, <2 x i32><i32 0, i32 2>
 262   %shuf2 = shufflevector <2 x i64> %b, <2 x i64> zeroinitializer, <2 x i32><i32 0, i32 2>
 263   %or = or <2 x i64> %shuf1, %shuf2
 264   ret <2 x i64> %or
 265 }
 266
 267
 268 define <2 x i64> @test21(<2 x i64> %a, <2 x i64> %b) {
 269 ; CHECK-LABEL: test21:
 270 ; CHECK:       # BB#0:
 271 ; CHECK-NEXT:    por %xmm1, %xmm0
 272 ; CHECK-NEXT:    pslldq {{.*#+}} xmm0 = zero,zero,zero,zero,zero,zero,zero,zero,xmm0[0,1,2,3,4,5,6,7]
 273 ; CHECK-NEXT:    retq
 274   %shuf1 = shufflevector <2 x i64> %a, <2 x i64> zeroinitializer, <2 x i32><i32 2, i32 0>
 275   %shuf2 = shufflevector <2 x i64> %b, <2 x i64> zeroinitializer, <2 x i32><i32 2, i32 0>
 276   %or = or <2 x i64> %shuf1, %shuf2
 277   ret <2 x i64> %or
 278 }
 279
 280
 281 ; Verify that the dag-combiner keeps the correct domain for float/double vectors
 282 ; bitcast to use the mask-or blend combine.
 283
 284 define <2 x double> @test22(<2 x double> %a0, <2 x double> %a1) {
 285 ; CHECK-LABEL: test22:
 286 ; CHECK:       # BB#0:
 287 ; CHECK-NEXT:    blendpd {{.*#+}} xmm0 = xmm1[0],xmm0[1]
 288 ; CHECK-NEXT:    retq
 289   %bc1 = bitcast <2 x double> %a0 to <2 x i64>
 290   %bc2 = bitcast <2 x double> %a1 to <2 x i64>
 291   %and1 = and <2 x i64> %bc1, <i64 0, i64 -1>
 292   %and2 = and <2 x i64> %bc2, <i64 -1, i64 0>
 293   %or = or <2 x i64> %and1, %and2
 294   %bc3 = bitcast <2 x i64> %or to <2 x double>
 295   ret <2 x double> %bc3
 296 }
 297
 298
 299 define <4 x float> @test23(<4 x float> %a0, <4 x float> %a1) {
 300 ; CHECK-LABEL: test23:
 301 ; CHECK:       # BB#0:
 302 ; CHECK-NEXT:    blendps {{.*#+}} xmm0 = xmm1[0],xmm0[1,2],xmm1[3]
 303 ; CHECK-NEXT:    retq
 304   %bc1 = bitcast <4 x float> %a0 to <4 x i32>
 305   %bc2 = bitcast <4 x float> %a1 to <4 x i32>
 306   %and1 = and <4 x i32> %bc1, <i32 0, i32 -1, i32 -1, i32 0>
 307   %and2 = and <4 x i32> %bc2, <i32 -1, i32 0, i32 0, i32 -1>
 308   %or = or <4 x i32> %and1, %and2
 309   %bc3 = bitcast <4 x i32> %or to <4 x float>
 310   ret <4 x float> %bc3
 311 }
 312
 313
 314 define <4 x float> @test24(<4 x float> %a0, <4 x float> %a1) {
 315 ; CHECK-LABEL: test24:
 316 ; CHECK:       # BB#0:
 317 ; CHECK-NEXT:    blendpd {{.*#+}} xmm0 = xmm1[0],xmm0[1]
 318 ; CHECK-NEXT:    retq
 319   %bc1 = bitcast <4 x float> %a0 to <2 x i64>
 320   %bc2 = bitcast <4 x float> %a1 to <2 x i64>
 321   %and1 = and <2 x i64> %bc1, <i64 0, i64 -1>
 322   %and2 = and <2 x i64> %bc2, <i64 -1, i64 0>
 323   %or = or <2 x i64> %and1, %and2
 324   %bc3 = bitcast <2 x i64> %or to <4 x float>
 325   ret <4 x float> %bc3
 326 }
 327
 328
 329 define <4 x float> @test25(<4 x float> %a0) {
 330 ; CHECK-LABEL: test25:
 331 ; CHECK:       # BB#0:
 332 ; CHECK-NEXT:    blendps {{.*#+}} xmm0 = mem[0],xmm0[1,2],mem[3]
 333 ; CHECK-NEXT:    retq
 334   %bc1 = bitcast <4 x float> %a0 to <4 x i32>
 335   %bc2 = bitcast <4 x float> <float 1.0, float 1.0, float 1.0, float 1.0> to <4 x i32>
 336   %and1 = and <4 x i32> %bc1, <i32 0, i32 -1, i32 -1, i32 0>
 337   %and2 = and <4 x i32> %bc2, <i32 -1, i32 0, i32 0, i32 -1>
 338   %or = or <4 x i32> %and1, %and2
 339   %bc3 = bitcast <4 x i32> %or to <4 x float>
 340   ret <4 x float> %bc3
 341 }
 342
 343
 344 ; Verify that the DAGCombiner doesn't crash in the attempt to check if a shuffle
 345 ; with illegal type has a legal mask. Method 'isShuffleMaskLegal' only knows how to
 346 ; handle legal vector value types.
 347 define <4 x i8> @test_crash(<4 x i8> %a, <4 x i8> %b) {
 348 ; CHECK-LABEL: test_crash:
 349 ; CHECK:       # BB#0:
 350 ; CHECK-NEXT:    pblendw {{.*#+}} xmm0 = xmm1[0,1,2,3],xmm0[4,5,6,7]
 351 ; CHECK-NEXT:    retq
 352   %shuf1 = shufflevector <4 x i8> %a, <4 x i8> zeroinitializer, <4 x i32><i32 4, i32 4, i32 2, i32 3>
 353   %shuf2 = shufflevector <4 x i8> %b, <4 x i8> zeroinitializer, <4 x i32><i32 0, i32 1, i32 4, i32 4>
 354   %or = or <4 x i8> %shuf1, %shuf2
 355   ret <4 x i8> %or
 356 }
 357