; RUN: llc -march=x86-64 -mcpu=corei7 < %s | FileCheck %s -check-prefix=SSE ; RUN: llc -march=x86-64 -mcpu=core-avx2 < %s | FileCheck %s -check-prefix=AVX define <4 x i32> @test1(<4 x i32> %a) { %div = udiv <4 x i32> %a, ret <4 x i32> %div ; SSE-LABEL: test1: ; SSE: pmuludq ; SSE: pshufd $57 ; SSE: pmuludq ; SSE: shufps $-35 ; SSE: psubd ; SSE: psrld $1 ; SSE: padd ; SSE: psrld $2 ; AVX-LABEL: test1: ; AVX: vpmuludq ; AVX: vpshufd $57 ; AVX: vpmuludq ; AVX: vshufps $-35 ; AVX: vpsubd ; AVX: vpsrld $1 ; AVX: vpadd ; AVX: vpsrld $2 } define <8 x i32> @test2(<8 x i32> %a) { %div = udiv <8 x i32> %a, ret <8 x i32> %div ; AVX-LABEL: test2: ; AVX: vpermd ; AVX: vpmuludq ; AVX: vshufps $-35 ; AVX: vpmuludq ; AVX: vshufps $-35 ; AVX: vpsubd ; AVX: vpsrld $1 ; AVX: vpadd ; AVX: vpsrld $2 } define <8 x i16> @test3(<8 x i16> %a) { %div = udiv <8 x i16> %a, ret <8 x i16> %div ; SSE-LABEL: test3: ; SSE: pmulhuw ; SSE: psubw ; SSE: psrlw $1 ; SSE: paddw ; SSE: psrlw $2 ; AVX-LABEL: test3: ; AVX: vpmulhuw ; AVX: vpsubw ; AVX: vpsrlw $1 ; AVX: vpaddw ; AVX: vpsrlw $2 } define <16 x i16> @test4(<16 x i16> %a) { %div = udiv <16 x i16> %a, ret <16 x i16> %div ; AVX-LABEL: test4: ; AVX: vpmulhuw ; AVX: vpsubw ; AVX: vpsrlw $1 ; AVX: vpaddw ; AVX: vpsrlw $2 ; AVX-NOT: vpmulhuw } define <8 x i16> @test5(<8 x i16> %a) { %div = sdiv <8 x i16> %a, ret <8 x i16> %div ; SSE-LABEL: test5: ; SSE: pmulhw ; SSE: psrlw $15 ; SSE: psraw $1 ; SSE: paddw ; AVX-LABEL: test5: ; AVX: vpmulhw ; AVX: vpsrlw $15 ; AVX: vpsraw $1 ; AVX: vpaddw } define <16 x i16> @test6(<16 x i16> %a) { %div = sdiv <16 x i16> %a, ret <16 x i16> %div ; AVX-LABEL: test6: ; AVX: vpmulhw ; AVX: vpsrlw $15 ; AVX: vpsraw $1 ; AVX: vpaddw ; AVX-NOT: vpmulhw } define <16 x i8> @test7(<16 x i8> %a) { %div = sdiv <16 x i8> %a, ret <16 x i8> %div } define <4 x i32> @test8(<4 x i32> %a) { %div = sdiv <4 x i32> %a, ret <4 x i32> %div ; SSE-LABEL: test8: ; SSE: pmuldq ; SSE: pshufd $57 ; SSE-NOT: pshufd $57 ; SSE: pmuldq ; SSE: shufps $-35 ; SSE: pshufd $-40 ; SSE: padd ; SSE: psrld $31 ; SSE: psrad $2 ; SSE: padd ; AVX-LABEL: test8: ; AVX: vpmuldq ; AVX: vpshufd $57 ; AVX-NOT: vpshufd $57 ; AVX: vpmuldq ; AVX: vshufps $-35 ; AVX: vpshufd $-40 ; AVX: vpadd ; AVX: vpsrld $31 ; AVX: vpsrad $2 ; AVX: vpadd } define <8 x i32> @test9(<8 x i32> %a) { %div = sdiv <8 x i32> %a, ret <8 x i32> %div ; AVX-LABEL: test9: ; AVX: vpbroadcastd ; AVX: vpmuldq ; AVX: vshufps $-35 ; AVX: vpmuldq ; AVX: vshufps $-35 ; AVX: vpshufd $-40 ; AVX: vpadd ; AVX: vpsrld $31 ; AVX: vpsrad $2 ; AVX: vpadd } define <8 x i32> @test10(<8 x i32> %a) { %rem = urem <8 x i32> %a, ret <8 x i32> %rem ; AVX-LABEL: test10: ; AVX: vpbroadcastd ; AVX: vpmuludq ; AVX: vshufps $-35 ; AVX: vpmuludq ; AVX: vshufps $-35 ; AVX: vpsubd ; AVX: vpsrld $1 ; AVX: vpadd ; AVX: vpsrld $2 ; AVX: vpmulld } define <8 x i32> @test11(<8 x i32> %a) { %rem = srem <8 x i32> %a, ret <8 x i32> %rem ; AVX-LABEL: test11: ; AVX: vpbroadcastd ; AVX: vpmuldq ; AVX: vshufps $-35 ; AVX: vpmuldq ; AVX: vshufps $-35 ; AVX: vpshufd $-40 ; AVX: vpadd ; AVX: vpsrld $31 ; AVX: vpsrad $2 ; AVX: vpadd ; AVX: vpmulld }