Use new TokenFactor chain when merging stores
[oota-llvm.git] / test / CodeGen / X86 / merge-store-partially-alias-loads.ll
1 ; REQUIRES: asserts
2 ; RUN: llc -march=x86-64 -mtriple=x86_64-unknown-linux-gnu < %s | FileCheck -check-prefix=X86 %s
3 ; RUN: llc -march=x86-64 -mtriple=x86_64-unknown-linux-gnu -debug-only=isel < %s 2>&1 | FileCheck -check-prefix=DBGDAG %s
4
5 ; It's OK to merge the load / store of the first 2 components, but
6 ; they must not be placed on the same chain after merging.
7
8 ; X86-LABEL: {{^}}merge_store_partial_overlap_load:
9 ; X86-DAG: movw ([[BASEREG:%[a-z]+]]), [[LO2:%[a-z]+]]
10 ; X86-DAG: movb 2([[BASEREG]]), [[HI1:%[a-z]+]]
11
12 ; X86-NEXT: movw [[LO2]], 1([[BASEREG]])
13 ; X86-NEXT: movb [[HI1]], 3([[BASEREG]])
14 ; X86-NEXT: retq
15
16 ; DBGDAG-LABEL: Optimized lowered selection DAG: BB#0 'merge_store_partial_overlap_load:'
17 ; DBGDAG: [[ENTRYTOKEN:t[0-9]+]]: ch = EntryToken
18 ; DBGDAG-DAG: [[TWO:t[0-9]+]]: i64 = Constant<2>
19 ; DBGDAG-DAG: [[BASEPTR:t[0-9]+]]: i64,ch = CopyFromReg [[ENTRYTOKEN]],
20 ; DBGDAG-DAG: [[ADDPTR:t[0-9]+]]: i64 = add [[BASEPTR]], [[TWO]]
21
22 ; DBGDAG-DAG: [[LD2:t[0-9]+]]: i16,ch = load [[ENTRYTOKEN]], [[BASEPTR]], t{{[0-9]+}}<LD2[%tmp81](align=1)>
23 ; DBGDAG-DAG: [[LD1:t[0-9]+]]: i8,ch = load [[ENTRYTOKEN]], [[ADDPTR]], t{{[0-9]+}}<LD1[%tmp12]>
24
25 ; DBGDAG: [[LOADTOKEN:t[0-9]+]]: ch = TokenFactor [[LD2]]:1, [[LD1]]:1
26
27 ; DBGDAG-DAG: [[ST2:t[0-9]+]]: ch = store [[LOADTOKEN]], [[LD2]], t{{[0-9]+}}, t{{[0-9]+}}<ST2[%tmp10](align=1)>
28 ; DBGDAG-DAG: [[ST1:t[0-9]+]]: ch = store [[ST2]], [[LD1]], t{{[0-9]+}}, t{{[0-9]+}}<ST1[%tmp14]>
29 ; DBGDAG: X86ISD::RET_FLAG [[ST1]],
30
31 ; DBGDAG: Type-legalized selection DAG: BB#0 'merge_store_partial_overlap_load:'
32 define void @merge_store_partial_overlap_load([4 x i8]* %tmp) {
33   %tmp8 = getelementptr inbounds [4 x i8], [4 x i8]* %tmp, i32 0, i8 0
34   %tmp10 = getelementptr inbounds [4 x i8], [4 x i8]* %tmp, i32 0, i8 1
35   %tmp12 = getelementptr inbounds [4 x i8], [4 x i8]* %tmp, i32 0, i8 2
36   %tmp14 = getelementptr [4 x i8], [4 x i8]* %tmp, i32 0, i8 3
37
38   %tmp9 = load i8, i8* %tmp8, align 1   ; base + 0
39   %tmp11 = load i8, i8* %tmp10, align 1 ; base + 1
40   %tmp13 = load i8, i8* %tmp12, align 1 ; base + 2
41
42   store i8 %tmp9, i8* %tmp10, align 1   ; base + 1
43   store i8 %tmp11, i8* %tmp12, align 1  ; base + 2
44   store i8 %tmp13, i8* %tmp14, align 1  ; base + 3
45
46 ; Should emit
47 ; load base + 0, base + 1
48 ; store base + 1, base + 2
49 ; load base + 2
50 ; store base + 3
51
52   ret void
53 }