Don't use a potentially expensive shift if all we want is one set bit.
[oota-llvm.git] / test / CodeGen / SystemZ / int-sub-01.ll
1 ; Test 32-bit subtraction.
2 ;
3 ; RUN: llc < %s -mtriple=s390x-linux-gnu | FileCheck %s
4
5 declare i32 @foo()
6
7 ; Check SR.
8 define i32 @f1(i32 %a, i32 %b) {
9 ; CHECK: f1:
10 ; CHECK: sr %r2, %r3
11 ; CHECK: br %r14
12   %sub = sub i32 %a, %b
13   ret i32 %sub
14 }
15
16 ; Check the low end of the S range.
17 define i32 @f2(i32 %a, i32 *%src) {
18 ; CHECK: f2:
19 ; CHECK: s %r2, 0(%r3)
20 ; CHECK: br %r14
21   %b = load i32 *%src
22   %sub = sub i32 %a, %b
23   ret i32 %sub
24 }
25
26 ; Check the high end of the aligned S range.
27 define i32 @f3(i32 %a, i32 *%src) {
28 ; CHECK: f3:
29 ; CHECK: s %r2, 4092(%r3)
30 ; CHECK: br %r14
31   %ptr = getelementptr i32 *%src, i64 1023
32   %b = load i32 *%ptr
33   %sub = sub i32 %a, %b
34   ret i32 %sub
35 }
36
37 ; Check the next word up, which should use SY instead of S.
38 define i32 @f4(i32 %a, i32 *%src) {
39 ; CHECK: f4:
40 ; CHECK: sy %r2, 4096(%r3)
41 ; CHECK: br %r14
42   %ptr = getelementptr i32 *%src, i64 1024
43   %b = load i32 *%ptr
44   %sub = sub i32 %a, %b
45   ret i32 %sub
46 }
47
48 ; Check the high end of the aligned SY range.
49 define i32 @f5(i32 %a, i32 *%src) {
50 ; CHECK: f5:
51 ; CHECK: sy %r2, 524284(%r3)
52 ; CHECK: br %r14
53   %ptr = getelementptr i32 *%src, i64 131071
54   %b = load i32 *%ptr
55   %sub = sub i32 %a, %b
56   ret i32 %sub
57 }
58
59 ; Check the next word up, which needs separate address logic.
60 ; Other sequences besides this one would be OK.
61 define i32 @f6(i32 %a, i32 *%src) {
62 ; CHECK: f6:
63 ; CHECK: agfi %r3, 524288
64 ; CHECK: s %r2, 0(%r3)
65 ; CHECK: br %r14
66   %ptr = getelementptr i32 *%src, i64 131072
67   %b = load i32 *%ptr
68   %sub = sub i32 %a, %b
69   ret i32 %sub
70 }
71
72 ; Check the high end of the negative aligned SY range.
73 define i32 @f7(i32 %a, i32 *%src) {
74 ; CHECK: f7:
75 ; CHECK: sy %r2, -4(%r3)
76 ; CHECK: br %r14
77   %ptr = getelementptr i32 *%src, i64 -1
78   %b = load i32 *%ptr
79   %sub = sub i32 %a, %b
80   ret i32 %sub
81 }
82
83 ; Check the low end of the SY range.
84 define i32 @f8(i32 %a, i32 *%src) {
85 ; CHECK: f8:
86 ; CHECK: sy %r2, -524288(%r3)
87 ; CHECK: br %r14
88   %ptr = getelementptr i32 *%src, i64 -131072
89   %b = load i32 *%ptr
90   %sub = sub i32 %a, %b
91   ret i32 %sub
92 }
93
94 ; Check the next word down, which needs separate address logic.
95 ; Other sequences besides this one would be OK.
96 define i32 @f9(i32 %a, i32 *%src) {
97 ; CHECK: f9:
98 ; CHECK: agfi %r3, -524292
99 ; CHECK: s %r2, 0(%r3)
100 ; CHECK: br %r14
101   %ptr = getelementptr i32 *%src, i64 -131073
102   %b = load i32 *%ptr
103   %sub = sub i32 %a, %b
104   ret i32 %sub
105 }
106
107 ; Check that S allows an index.
108 define i32 @f10(i32 %a, i64 %src, i64 %index) {
109 ; CHECK: f10:
110 ; CHECK: s %r2, 4092({{%r4,%r3|%r3,%r4}})
111 ; CHECK: br %r14
112   %add1 = add i64 %src, %index
113   %add2 = add i64 %add1, 4092
114   %ptr = inttoptr i64 %add2 to i32 *
115   %b = load i32 *%ptr
116   %sub = sub i32 %a, %b
117   ret i32 %sub
118 }
119
120 ; Check that SY allows an index.
121 define i32 @f11(i32 %a, i64 %src, i64 %index) {
122 ; CHECK: f11:
123 ; CHECK: sy %r2, 4096({{%r4,%r3|%r3,%r4}})
124 ; CHECK: br %r14
125   %add1 = add i64 %src, %index
126   %add2 = add i64 %add1, 4096
127   %ptr = inttoptr i64 %add2 to i32 *
128   %b = load i32 *%ptr
129   %sub = sub i32 %a, %b
130   ret i32 %sub
131 }
132
133 ; Check that subtractions of spilled values can use S rather than SR.
134 define i32 @f12(i32 *%ptr0) {
135 ; CHECK: f12:
136 ; CHECK: brasl %r14, foo@PLT
137 ; CHECK: s %r2, 16{{[04]}}(%r15)
138 ; CHECK: br %r14
139   %ptr1 = getelementptr i32 *%ptr0, i64 2
140   %ptr2 = getelementptr i32 *%ptr0, i64 4
141   %ptr3 = getelementptr i32 *%ptr0, i64 6
142   %ptr4 = getelementptr i32 *%ptr0, i64 8
143   %ptr5 = getelementptr i32 *%ptr0, i64 10
144   %ptr6 = getelementptr i32 *%ptr0, i64 12
145   %ptr7 = getelementptr i32 *%ptr0, i64 14
146   %ptr8 = getelementptr i32 *%ptr0, i64 16
147   %ptr9 = getelementptr i32 *%ptr0, i64 18
148
149   %val0 = load i32 *%ptr0
150   %val1 = load i32 *%ptr1
151   %val2 = load i32 *%ptr2
152   %val3 = load i32 *%ptr3
153   %val4 = load i32 *%ptr4
154   %val5 = load i32 *%ptr5
155   %val6 = load i32 *%ptr6
156   %val7 = load i32 *%ptr7
157   %val8 = load i32 *%ptr8
158   %val9 = load i32 *%ptr9
159
160   %ret = call i32 @foo()
161
162   %sub0 = sub i32 %ret, %val0
163   %sub1 = sub i32 %sub0, %val1
164   %sub2 = sub i32 %sub1, %val2
165   %sub3 = sub i32 %sub2, %val3
166   %sub4 = sub i32 %sub3, %val4
167   %sub5 = sub i32 %sub4, %val5
168   %sub6 = sub i32 %sub5, %val6
169   %sub7 = sub i32 %sub6, %val7
170   %sub8 = sub i32 %sub7, %val8
171   %sub9 = sub i32 %sub8, %val9
172
173   ret i32 %sub9
174 }