Proper va_arg/va_copy lowering on win64
[oota-llvm.git] / test / CodeGen / X86 / win64_vararg.ll
1 ; RUN: llc < %s -mcpu=generic -mtriple=x86_64-pc-win32 | FileCheck %s
2
3 ; Verify that the var arg parameters which are passed in registers are stored
4 ; in home stack slots allocated by the caller and that AP is correctly
5 ; calculated.
6 define void @average_va(i32 %count, ...) nounwind {
7 entry:
8 ; CHECK: pushq
9 ; CHECK: movq   %r9, 40(%rsp)
10 ; CHECK: movq   %r8, 32(%rsp)
11 ; CHECK: movq   %rdx, 24(%rsp)
12 ; CHECK: leaq   24(%rsp), %rax
13
14   %ap = alloca i8*, align 8                       ; <i8**> [#uses=1]
15   %ap1 = bitcast i8** %ap to i8*                  ; <i8*> [#uses=1]
16   call void @llvm.va_start(i8* %ap1)
17   ret void
18 }
19
20 declare void @llvm.va_start(i8*) nounwind
21 declare void @llvm.va_copy(i8*, i8*) nounwind
22
23 ; CHECK: f5:
24 ; CHECK: pushq
25 ; CHECK: leaq 56(%rsp),
26 define i8* @f5(i64 %a0, i64 %a1, i64 %a2, i64 %a3, i64 %a4, ...) nounwind {
27 entry:
28   %ap = alloca i8*, align 8
29   %ap1 = bitcast i8** %ap to i8*
30   call void @llvm.va_start(i8* %ap1)
31   ret i8* %ap1
32 }
33
34 ; CHECK: f4:
35 ; CHECK: pushq
36 ; CHECK: leaq 48(%rsp),
37 define i8* @f4(i64 %a0, i64 %a1, i64 %a2, i64 %a3, ...) nounwind {
38 entry:
39   %ap = alloca i8*, align 8
40   %ap1 = bitcast i8** %ap to i8*
41   call void @llvm.va_start(i8* %ap1)
42   ret i8* %ap1
43 }
44
45 ; CHECK: f3:
46 ; CHECK: pushq
47 ; CHECK: leaq 40(%rsp),
48 define i8* @f3(i64 %a0, i64 %a1, i64 %a2, ...) nounwind {
49 entry:
50   %ap = alloca i8*, align 8
51   %ap1 = bitcast i8** %ap to i8*
52   call void @llvm.va_start(i8* %ap1)
53   ret i8* %ap1
54 }
55
56 ; WinX86_64 uses char* for va_list. Verify that the correct amount of bytes
57 ; are copied using va_copy.
58 ; CHECK: copy4:
59 ; CHECK: subq $16
60 ; CHECK: leaq 56(%rsp), [[REGISTER:%[a-z]+]]
61 ; CHECK: movq [[REGISTER]], 8(%rsp)
62 ; CHECK: movq [[REGISTER]], (%rsp)
63 ; CHECK: addq $16
64 ; CHECK: ret
65 define void @copy4(i64 %a0, i64 %a1, i64 %a2, i64 %a3, ...) nounwind {
66 entry:
67   %ap = alloca i8*, align 8
68   %cp = alloca i8*, align 8
69   %ap1 = bitcast i8** %ap to i8*
70   %cp1 = bitcast i8** %cp to i8*
71   call void @llvm.va_start(i8* %ap1)
72   call void @llvm.va_copy(i8* %cp1, i8* %ap1)
73   ret void
74 }
75
76 ; CHECK: copy1:
77 ; CHECK: subq $16
78 ; CHECK: leaq 32(%rsp), [[REGISTER:%[a-z]+]]
79 ; CHECK: movq [[REGISTER]], 8(%rsp)
80 ; CHECK: movq [[REGISTER]], (%rsp)
81 ; CHECK: addq $16
82 ; CHECK: ret
83 define void @copy1(i64 %a0, ...) nounwind {
84 entry:
85   %ap = alloca i8*, align 8
86   %cp = alloca i8*, align 8
87   %ap1 = bitcast i8** %ap to i8*
88   %cp1 = bitcast i8** %cp to i8*
89   call void @llvm.va_start(i8* %ap1)
90   call void @llvm.va_copy(i8* %cp1, i8* %ap1)
91   ret void
92 }
93
94 ; CHECK: arg4:
95 ; CHECK: pushq
96 ; va_start:
97 ; CHECK: leaq 48(%rsp), [[REG1:%[a-z]+]]
98 ; CHECK: movq [[REG1]], (%rsp)
99 ; va_arg:
100 ; CHECK: leaq 52(%rsp), [[REG2:%[a-z]+]]
101 ; CHECK: movq [[REG2]], (%rsp)
102 ; CHECK: movl 48(%rsp), %eax
103 ; CHECK: popq
104 ; CHECK: ret
105 define i32 @arg4(i64 %a0, i64 %a1, i64 %a2, i64 %a3, ...) nounwind {
106 entry:
107   %ap = alloca i8*, align 8
108   %ap1 = bitcast i8** %ap to i8*
109   call void @llvm.va_start(i8* %ap1)
110   %tmp = va_arg i8** %ap, i32
111   ret i32 %tmp
112 }