[x86] Teach the rest of the 'target shuffle' machinery about blends and

author Chandler Carruth <chandlerc@gmail.com>

Tue, 23 Sep 2014 22:14:14 +0000 (22:14 +0000)

committer Chandler Carruth <chandlerc@gmail.com>

Tue, 23 Sep 2014 22:14:14 +0000 (22:14 +0000)
author Chandler Carruth <chandlerc@gmail.com>
Tue, 23 Sep 2014 22:14:14 +0000 (22:14 +0000)
committer Chandler Carruth <chandlerc@gmail.com>
Tue, 23 Sep 2014 22:14:14 +0000 (22:14 +0000)
diff --git a/lib/Target/X86/InstPrinter/X86InstComments.cpp b/lib/Target/X86/InstPrinter/X86InstComments.cpp

index 472dbfa62f89e37d35bf18e161ca892495f919fc..fc2932b181f51ad7c9ecc2612228e3433c75cbba 100644 (file)
--- a/lib/Target/X86/InstPrinter/X86InstComments.cpp
+++ b/lib/Target/X86/InstPrinter/X86InstComments.cpp
@@ -103,6 +103,30 @@ bool llvm::EmitAnyX86InstComments(const MCInst *MI, raw_ostream &OS,
      DestName = getRegName(MI->getOperand(0).getReg());
      break;
  
+  case X86::VPBLENDDrri:
+    Src2Name = getRegName(MI->getOperand(2).getReg());
+    // FALL THROUGH.
+  case X86::VPBLENDDrmi:
+    if(MI->getOperand(MI->getNumOperands()-1).isImm())
+      DecodeBLENDMask(MVT::v4i32,
+                      MI->getOperand(MI->getNumOperands()-1).getImm(),
+                      ShuffleMask);
+    Src1Name = getRegName(MI->getOperand(1).getReg());
+    DestName = getRegName(MI->getOperand(0).getReg());
+    break;
+
+  case X86::VPBLENDDYrri:
+    Src2Name = getRegName(MI->getOperand(2).getReg());
+    // FALL THROUGH.
+  case X86::VPBLENDDYrmi:
+    if(MI->getOperand(MI->getNumOperands()-1).isImm())
+      DecodeBLENDMask(MVT::v8i32,
+                      MI->getOperand(MI->getNumOperands()-1).getImm(),
+                      ShuffleMask);
+    Src1Name = getRegName(MI->getOperand(1).getReg());
+    DestName = getRegName(MI->getOperand(0).getReg());
+    break;
+
    case X86::INSERTPSrr:
    case X86::VINSERTPSrr:
      DestName = getRegName(MI->getOperand(0).getReg());
diff --git a/lib/Target/X86/X86ISelLowering.cpp b/lib/Target/X86/X86ISelLowering.cpp

index b7c1c1d8be5834eaf80cafbf4dc4904b42822a03..0f0341e8ace67a453a020a62e0082b561ca6945c 100644 (file)
--- a/lib/Target/X86/X86ISelLowering.cpp
+++ b/lib/Target/X86/X86ISelLowering.cpp
@@ -3539,6 +3539,7 @@ static bool MayFoldIntoStore(SDValue Op) {
  static bool isTargetShuffle(unsigned Opcode) {
    switch(Opcode) {
    default: return false;
+  case X86ISD::BLENDI:
    case X86ISD::PSHUFB:
    case X86ISD::PSHUFD:
    case X86ISD::PSHUFHW:
@@ -5288,6 +5289,10 @@ static bool getTargetShuffleMask(SDNode *N, MVT VT,
    IsUnary = false;
    bool IsFakeUnary = false;
    switch(N->getOpcode()) {
+  case X86ISD::BLENDI:
+    ImmN = N->getOperand(N->getNumOperands()-1);
+    DecodeBLENDMask(VT, cast<ConstantSDNode>(ImmN)->getZExtValue(), Mask);
+    break;
    case X86ISD::SHUFP:
      ImmN = N->getOperand(N->getNumOperands()-1);
      DecodeSHUFPMask(VT, cast<ConstantSDNode>(ImmN)->getZExtValue(), Mask);
@@ -7270,7 +7275,7 @@ static SDValue lowerVectorShuffleAsBlend(SDLoc DL, MVT VT, SDValue V1,
      // If we have AVX2 it is faster to use VPBLENDD when the shuffle fits into
      // that instruction.
      if (Subtarget->hasAVX2()) {
-      int Scale = 8 / VT.getVectorNumElements();
+      int Scale = 4 / VT.getVectorNumElements();
        BlendMask = 0;
        for (int i = 0, Size = Mask.size(); i < Size; ++i)
          if (Mask[i] >= Size)
diff --git a/test/CodeGen/X86/vector-shuffle-256-v16.ll b/test/CodeGen/X86/vector-shuffle-256-v16.ll

index ea9289e384926b79ef0a4e0dae90b71f4d6ef17d..12e84f08607a09e72e32a87f7d38fea608425ac3 100644 (file)
--- a/test/CodeGen/X86/vector-shuffle-256-v16.ll
+++ b/test/CodeGen/X86/vector-shuffle-256-v16.ll
@@ -716,9 +716,9 @@ define <16 x i16> @shuffle_v16i16_16_16_16_16_04_05_06_07_24_24_24_24_12_13_14_1
  ; AVX2-NEXT:    vextracti128 $1, %ymm0, %xmm2
  ; AVX2-NEXT:    vextracti128 $1, %ymm1, %xmm3
  ; AVX2-NEXT:    vpshuflw {{.*}} # xmm3 = xmm3[0,0,0,0,4,5,6,7]
-; AVX2-NEXT:    vpblendd $-16, %xmm2, %xmm3, %xmm2
+; AVX2-NEXT:    vpblendd {{.*}} # xmm2 = xmm3[0,1],xmm2[2,3]
  ; AVX2-NEXT:    vpshuflw {{.*}} # xmm1 = xmm1[0,0,0,0,4,5,6,7]
-; AVX2-NEXT:    vpblendd $-16, %xmm0, %xmm1, %xmm0
+; AVX2-NEXT:    vpblendd {{.*}} # xmm0 = xmm1[0,1],xmm0[2,3]
  ; AVX2-NEXT:    vinserti128 $1, %xmm2, %ymm0, %ymm0
  ; AVX2-NEXT:    retq
    %shuffle = shufflevector <16 x i16> %a, <16 x i16> %b, <16 x i32> <i32 16, i32 16, i32 16, i32 16, i32 4, i32 5, i32 6, i32 7, i32 24, i32 24, i32 24, i32 24, i32 12, i32 13, i32 14, i32 15>
@@ -745,10 +745,10 @@ define <16 x i16> @shuffle_v16i16_19_18_17_16_07_06_05_04_27_26_25_24_15_14_13_1
  ; AVX2-NEXT:    vpshufhw {{.*}} # xmm2 = xmm2[0,1,2,3,7,6,5,4]
  ; AVX2-NEXT:    vextracti128 $1, %ymm1, %xmm3
  ; AVX2-NEXT:    vpshuflw {{.*}} # xmm3 = xmm3[3,2,1,0,4,5,6,7]
-; AVX2-NEXT:    vpblendd $-16, %xmm2, %xmm3, %xmm2
+; AVX2-NEXT:    vpblendd {{.*}} # xmm2 = xmm3[0,1],xmm2[2,3]
  ; AVX2-NEXT:    vpshufhw {{.*}} # xmm0 = xmm0[0,1,2,3,7,6,5,4]
  ; AVX2-NEXT:    vpshuflw {{.*}} # xmm1 = xmm1[3,2,1,0,4,5,6,7]
-; AVX2-NEXT:    vpblendd $-16, %xmm0, %xmm1, %xmm0
+; AVX2-NEXT:    vpblendd {{.*}} # xmm0 = xmm1[0,1],xmm0[2,3]
  ; AVX2-NEXT:    vinserti128 $1, %xmm2, %ymm0, %ymm0
  ; AVX2-NEXT:    retq
    %shuffle = shufflevector <16 x i16> %a, <16 x i16> %b, <16 x i32> <i32 19, i32 18, i32 17, i32 16, i32 7, i32 6, i32 5, i32 4, i32 27, i32 26, i32 25, i32 24, i32 15, i32 14, i32 13, i32 12>
@@ -778,11 +778,11 @@ define <16 x i16> @shuffle_v16i16_19_18_17_16_03_02_01_00_27_26_25_24_11_10_09_0
  ; AVX2-NEXT:    vextracti128 $1, %ymm0, %xmm3
  ; AVX2-NEXT:    vpshufd {{.*}} # xmm3 = xmm3[0,1,0,1]
  ; AVX2-NEXT:    vpshufhw {{.*}} # xmm3 = xmm3[0,1,2,3,7,6,5,4]
-; AVX2-NEXT:    vpblendd $-16, %xmm3, %xmm2, %xmm2
+; AVX2-NEXT:    vpblendd {{.*}} # xmm2 = xmm2[0,1],xmm3[2,3]
  ; AVX2-NEXT:    vpshuflw {{.*}} # xmm1 = xmm1[3,2,1,0,4,5,6,7]
  ; AVX2-NEXT:    vpshufd {{.*}} # xmm0 = xmm0[0,1,0,1]
  ; AVX2-NEXT:    vpshufhw {{.*}} # xmm0 = xmm0[0,1,2,3,7,6,5,4]
-; AVX2-NEXT:    vpblendd $-16, %xmm0, %xmm1, %xmm0
+; AVX2-NEXT:    vpblendd {{.*}} # xmm0 = xmm1[0,1],xmm0[2,3]
  ; AVX2-NEXT:    vinserti128 $1, %xmm2, %ymm0, %ymm0
  ; AVX2-NEXT:    retq
    %shuffle = shufflevector <16 x i16> %a, <16 x i16> %b, <16 x i32> <i32 19, i32 18, i32 17, i32 16, i32 3, i32 2, i32 1, i32 0, i32 27, i32 26, i32 25, i32 24, i32 11, i32 10, i32 9, i32 8>
diff --git a/test/CodeGen/X86/vector-shuffle-256-v32.ll b/test/CodeGen/X86/vector-shuffle-256-v32.ll

index 5dec202813f3707c54714eddfe66fcb8ed3fc8d9..3a5c89455d5c75933a94cfce229a44a75952a9d2 100644 (file)
--- a/test/CodeGen/X86/vector-shuffle-256-v32.ll
+++ b/test/CodeGen/X86/vector-shuffle-256-v32.ll
@@ -1138,11 +1138,11 @@ define <32 x i8> @shuffle_v32i8_32_32_32_32_32_32_32_32_08_08_10_10_12_12_14_14_
  ; AVX2-NEXT:    vextracti128 $1, %ymm1, %xmm4
  ; AVX2-NEXT:    vpunpcklbw {{.*}} # xmm4 = xmm4[0,0,1,1,2,2,3,3,4,4,5,5,6,6,7,7]
  ; AVX2-NEXT:    vpshuflw {{.*}} # xmm4 = xmm4[0,0,0,0,4,5,6,7]
-; AVX2-NEXT:    vpblendd $-16, %xmm2, %xmm4, %xmm2
+; AVX2-NEXT:    vpblendd {{.*}} # xmm2 = xmm4[0,1],xmm2[2,3]
  ; AVX2-NEXT:    vpshufb %xmm3, %xmm0, %xmm0
  ; AVX2-NEXT:    vpunpcklbw {{.*}} # xmm1 = xmm1[0,0,1,1,2,2,3,3,4,4,5,5,6,6,7,7]
  ; AVX2-NEXT:    vpshuflw {{.*}} # xmm1 = xmm1[0,0,0,0,4,5,6,7]
-; AVX2-NEXT:    vpblendd $-16, %xmm0, %xmm1, %xmm0
+; AVX2-NEXT:    vpblendd {{.*}} # xmm0 = xmm1[0,1],xmm0[2,3]
  ; AVX2-NEXT:    vinserti128 $1, %xmm2, %ymm0, %ymm0
  ; AVX2-NEXT:    retq
    %shuffle = shufflevector <32 x i8> %a, <32 x i8> %b, <32 x i32> <i32 32, i32 32, i32 32, i32 32, i32 32, i32 32, i32 32, i32 32, i32 8, i32 8, i32 10, i32 10, i32 12, i32 12, i32 14, i32 14, i32 48, i32 48, i32 48, i32 48, i32 48, i32 48, i32 48, i32 48, i32 24, i32 24, i32 26, i32 26, i32 28, i32 28, i32 30, i32 30>
@@ -1173,10 +1173,10 @@ define <32 x i8> @shuffle_v32i8_38_38_36_36_34_34_32_32_14_14_12_12_10_10_08_08_
  ; AVX2-NEXT:    vextracti128 $1, %ymm1, %xmm4
  ; AVX2-NEXT:    vmovdqa .LCPI50_1(%rip), %xmm5
  ; AVX2-NEXT:    vpshufb %xmm5, %xmm4, %xmm4
-; AVX2-NEXT:    vpblendd $-16, %xmm2, %xmm4, %xmm2
+; AVX2-NEXT:    vpblendd {{.*}} # xmm2 = xmm4[0,1],xmm2[2,3]
  ; AVX2-NEXT:    vpshufb %xmm3, %xmm0, %xmm0
  ; AVX2-NEXT:    vpshufb %xmm5, %xmm1, %xmm1
-; AVX2-NEXT:    vpblendd $-16, %xmm0, %xmm1, %xmm0
+; AVX2-NEXT:    vpblendd {{.*}} # xmm0 = xmm1[0,1],xmm0[2,3]
  ; AVX2-NEXT:    vinserti128 $1, %xmm2, %ymm0, %ymm0
  ; AVX2-NEXT:    retq
    %shuffle = shufflevector <32 x i8> %a, <32 x i8> %b, <32 x i32> <i32 38, i32 38, i32 36, i32 36, i32 34, i32 34, i32 32, i32 32, i32 14, i32 14, i32 12, i32 12, i32 10, i32 10, i32 8, i32 8, i32 54, i32 54, i32 52, i32 52, i32 50, i32 50, i32 48, i32 48, i32 30, i32 30, i32 28, i32 28, i32 26, i32 26, i32 24, i32 24>
@@ -1207,10 +1207,10 @@ define <32 x i8> @shuffle_v32i8_38_38_36_36_34_34_32_32_06_06_04_04_02_02_00_00_
  ; AVX2-NEXT:    vextracti128 $1, %ymm1, %xmm4
  ; AVX2-NEXT:    vmovdqa .LCPI51_1(%rip), %xmm5
  ; AVX2-NEXT:    vpshufb %xmm5, %xmm4, %xmm4
-; AVX2-NEXT:    vpblendd $-16, %xmm2, %xmm4, %xmm2
+; AVX2-NEXT:    vpblendd {{.*}} # xmm2 = xmm4[0,1],xmm2[2,3]
  ; AVX2-NEXT:    vpshufb %xmm3, %xmm0, %xmm0
  ; AVX2-NEXT:    vpshufb %xmm5, %xmm1, %xmm1
-; AVX2-NEXT:    vpblendd $-16, %xmm0, %xmm1, %xmm0
+; AVX2-NEXT:    vpblendd {{.*}} # xmm0 = xmm1[0,1],xmm0[2,3]
  ; AVX2-NEXT:    vinserti128 $1, %xmm2, %ymm0, %ymm0
  ; AVX2-NEXT:    retq
    %shuffle = shufflevector <32 x i8> %a, <32 x i8> %b, <32 x i32> <i32 38, i32 38, i32 36, i32 36, i32 34, i32 34, i32 32, i32 32, i32 6, i32 6, i32 4, i32 4, i32 2, i32 2, i32 0, i32 0, i32 54, i32 54, i32 52, i32 52, i32 50, i32 50, i32 48, i32 48, i32 22, i32 22, i32 20, i32 20, i32 18, i32 18, i32 16, i32 16>
author	Chandler Carruth <chandlerc@gmail.com>
	Tue, 23 Sep 2014 22:14:14 +0000 (22:14 +0000)
committer	Chandler Carruth <chandlerc@gmail.com>
	Tue, 23 Sep 2014 22:14:14 +0000 (22:14 +0000)
lib/Target/X86/InstPrinter/X86InstComments.cpp		patch \| blob \| history
lib/Target/X86/X86ISelLowering.cpp		patch \| blob \| history
test/CodeGen/X86/vector-shuffle-256-v16.ll		patch \| blob \| history
test/CodeGen/X86/vector-shuffle-256-v32.ll		patch \| blob \| history