perf bench: Add futex-hash microbenchmark
[firefly-linux-kernel-4.4.55.git] / tools / perf / perf.h
1 #ifndef _PERF_PERF_H
2 #define _PERF_PERF_H
3
4 #include <asm/unistd.h>
5
6 #if defined(__i386__)
7 #define mb()            asm volatile("lock; addl $0,0(%%esp)" ::: "memory")
8 #define wmb()           asm volatile("lock; addl $0,0(%%esp)" ::: "memory")
9 #define rmb()           asm volatile("lock; addl $0,0(%%esp)" ::: "memory")
10 #define cpu_relax()     asm volatile("rep; nop" ::: "memory");
11 #define CPUINFO_PROC    "model name"
12 #ifndef __NR_perf_event_open
13 # define __NR_perf_event_open 336
14 #endif
15 #ifndef __NR_futex
16 # define __NR_futex 240
17 #endif
18 #endif
19
20 #if defined(__x86_64__)
21 #define mb()            asm volatile("mfence" ::: "memory")
22 #define wmb()           asm volatile("sfence" ::: "memory")
23 #define rmb()           asm volatile("lfence" ::: "memory")
24 #define cpu_relax()     asm volatile("rep; nop" ::: "memory");
25 #define CPUINFO_PROC    "model name"
26 #ifndef __NR_perf_event_open
27 # define __NR_perf_event_open 298
28 #endif
29 #ifndef __NR_futex
30 # define __NR_futex 202
31 #endif
32 #endif
33
34 #ifdef __powerpc__
35 #include "../../arch/powerpc/include/uapi/asm/unistd.h"
36 #define mb()            asm volatile ("sync" ::: "memory")
37 #define wmb()           asm volatile ("sync" ::: "memory")
38 #define rmb()           asm volatile ("sync" ::: "memory")
39 #define CPUINFO_PROC    "cpu"
40 #endif
41
42 #ifdef __s390__
43 #define mb()            asm volatile("bcr 15,0" ::: "memory")
44 #define wmb()           asm volatile("bcr 15,0" ::: "memory")
45 #define rmb()           asm volatile("bcr 15,0" ::: "memory")
46 #endif
47
48 #ifdef __sh__
49 #if defined(__SH4A__) || defined(__SH5__)
50 # define mb()           asm volatile("synco" ::: "memory")
51 # define wmb()          asm volatile("synco" ::: "memory")
52 # define rmb()          asm volatile("synco" ::: "memory")
53 #else
54 # define mb()           asm volatile("" ::: "memory")
55 # define wmb()          asm volatile("" ::: "memory")
56 # define rmb()          asm volatile("" ::: "memory")
57 #endif
58 #define CPUINFO_PROC    "cpu type"
59 #endif
60
61 #ifdef __hppa__
62 #define mb()            asm volatile("" ::: "memory")
63 #define wmb()           asm volatile("" ::: "memory")
64 #define rmb()           asm volatile("" ::: "memory")
65 #define CPUINFO_PROC    "cpu"
66 #endif
67
68 #ifdef __sparc__
69 #ifdef __LP64__
70 #define mb()            asm volatile("ba,pt %%xcc, 1f\n"        \
71                                      "membar #StoreLoad\n"      \
72                                      "1:\n":::"memory")
73 #else
74 #define mb()            asm volatile("":::"memory")
75 #endif
76 #define wmb()           asm volatile("":::"memory")
77 #define rmb()           asm volatile("":::"memory")
78 #define CPUINFO_PROC    "cpu"
79 #endif
80
81 #ifdef __alpha__
82 #define mb()            asm volatile("mb" ::: "memory")
83 #define wmb()           asm volatile("wmb" ::: "memory")
84 #define rmb()           asm volatile("mb" ::: "memory")
85 #define CPUINFO_PROC    "cpu model"
86 #endif
87
88 #ifdef __ia64__
89 #define mb()            asm volatile ("mf" ::: "memory")
90 #define wmb()           asm volatile ("mf" ::: "memory")
91 #define rmb()           asm volatile ("mf" ::: "memory")
92 #define cpu_relax()     asm volatile ("hint @pause" ::: "memory")
93 #define CPUINFO_PROC    "model name"
94 #endif
95
96 #ifdef __arm__
97 /*
98  * Use the __kuser_memory_barrier helper in the CPU helper page. See
99  * arch/arm/kernel/entry-armv.S in the kernel source for details.
100  */
101 #define mb()            ((void(*)(void))0xffff0fa0)()
102 #define wmb()           ((void(*)(void))0xffff0fa0)()
103 #define rmb()           ((void(*)(void))0xffff0fa0)()
104 #define CPUINFO_PROC    "Processor"
105 #endif
106
107 #ifdef __aarch64__
108 #define mb()            asm volatile("dmb ish" ::: "memory")
109 #define wmb()           asm volatile("dmb ishst" ::: "memory")
110 #define rmb()           asm volatile("dmb ishld" ::: "memory")
111 #define cpu_relax()     asm volatile("yield" ::: "memory")
112 #endif
113
114 #ifdef __mips__
115 #define mb()            asm volatile(                                   \
116                                 ".set   mips2\n\t"                      \
117                                 "sync\n\t"                              \
118                                 ".set   mips0"                          \
119                                 : /* no output */                       \
120                                 : /* no input */                        \
121                                 : "memory")
122 #define wmb()   mb()
123 #define rmb()   mb()
124 #define CPUINFO_PROC    "cpu model"
125 #endif
126
127 #ifdef __arc__
128 #define mb()            asm volatile("" ::: "memory")
129 #define wmb()           asm volatile("" ::: "memory")
130 #define rmb()           asm volatile("" ::: "memory")
131 #define CPUINFO_PROC    "Processor"
132 #endif
133
134 #ifdef __metag__
135 #define mb()            asm volatile("" ::: "memory")
136 #define wmb()           asm volatile("" ::: "memory")
137 #define rmb()           asm volatile("" ::: "memory")
138 #define CPUINFO_PROC    "CPU"
139 #endif
140
141 #ifdef __xtensa__
142 #define mb()            asm volatile("memw" ::: "memory")
143 #define wmb()           asm volatile("memw" ::: "memory")
144 #define rmb()           asm volatile("" ::: "memory")
145 #define CPUINFO_PROC    "core ID"
146 #endif
147
148 #define barrier() asm volatile ("" ::: "memory")
149
150 #ifndef cpu_relax
151 #define cpu_relax() barrier()
152 #endif
153
154 #define ACCESS_ONCE(x) (*(volatile typeof(x) *)&(x))
155
156
157 #include <time.h>
158 #include <unistd.h>
159 #include <sys/types.h>
160 #include <sys/syscall.h>
161
162 #include <linux/perf_event.h>
163 #include "util/types.h"
164 #include <stdbool.h>
165
166 /*
167  * prctl(PR_TASK_PERF_EVENTS_DISABLE) will (cheaply) disable all
168  * counters in the current task.
169  */
170 #define PR_TASK_PERF_EVENTS_DISABLE   31
171 #define PR_TASK_PERF_EVENTS_ENABLE    32
172
173 #ifndef NSEC_PER_SEC
174 # define NSEC_PER_SEC                   1000000000ULL
175 #endif
176 #ifndef NSEC_PER_USEC
177 # define NSEC_PER_USEC                  1000ULL
178 #endif
179
180 static inline unsigned long long rdclock(void)
181 {
182         struct timespec ts;
183
184         clock_gettime(CLOCK_MONOTONIC, &ts);
185         return ts.tv_sec * 1000000000ULL + ts.tv_nsec;
186 }
187
188 /*
189  * Pick up some kernel type conventions:
190  */
191 #define __user
192 #define asmlinkage
193
194 #define unlikely(x)     __builtin_expect(!!(x), 0)
195 #define min(x, y) ({                            \
196         typeof(x) _min1 = (x);                  \
197         typeof(y) _min2 = (y);                  \
198         (void) (&_min1 == &_min2);              \
199         _min1 < _min2 ? _min1 : _min2; })
200
201 extern bool test_attr__enabled;
202 void test_attr__init(void);
203 void test_attr__open(struct perf_event_attr *attr, pid_t pid, int cpu,
204                      int fd, int group_fd, unsigned long flags);
205
206 static inline int
207 sys_perf_event_open(struct perf_event_attr *attr,
208                       pid_t pid, int cpu, int group_fd,
209                       unsigned long flags)
210 {
211         int fd;
212
213         fd = syscall(__NR_perf_event_open, attr, pid, cpu,
214                      group_fd, flags);
215
216         if (unlikely(test_attr__enabled))
217                 test_attr__open(attr, pid, cpu, fd, group_fd, flags);
218
219         return fd;
220 }
221
222 #define MAX_COUNTERS                    256
223 #define MAX_NR_CPUS                     256
224
225 struct ip_callchain {
226         u64 nr;
227         u64 ips[0];
228 };
229
230 struct branch_flags {
231         u64 mispred:1;
232         u64 predicted:1;
233         u64 in_tx:1;
234         u64 abort:1;
235         u64 reserved:60;
236 };
237
238 struct branch_entry {
239         u64                             from;
240         u64                             to;
241         struct branch_flags flags;
242 };
243
244 struct branch_stack {
245         u64                             nr;
246         struct branch_entry     entries[0];
247 };
248
249 extern const char *input_name;
250 extern bool perf_host, perf_guest;
251 extern const char perf_version_string[];
252
253 void pthread__unblock_sigwinch(void);
254
255 #include "util/target.h"
256
257 enum perf_call_graph_mode {
258         CALLCHAIN_NONE,
259         CALLCHAIN_FP,
260         CALLCHAIN_DWARF,
261         CALLCHAIN_MAX
262 };
263
264 struct record_opts {
265         struct target target;
266         int          call_graph;
267         bool         call_graph_enabled;
268         bool         group;
269         bool         inherit_stat;
270         bool         no_buffering;
271         bool         no_inherit;
272         bool         no_inherit_set;
273         bool         no_samples;
274         bool         raw_samples;
275         bool         sample_address;
276         bool         sample_weight;
277         bool         sample_time;
278         bool         period;
279         unsigned int freq;
280         unsigned int mmap_pages;
281         unsigned int user_freq;
282         u64          branch_stack;
283         u64          default_interval;
284         u64          user_interval;
285         u16          stack_dump_size;
286         bool         sample_transaction;
287         unsigned     initial_delay;
288 };
289
290 #endif