pktgen: enable automatic IPv6 address setting
[firefly-linux-kernel-4.4.55.git] / net / core / pktgen.c
1 /*
2  * Authors:
3  * Copyright 2001, 2002 by Robert Olsson <robert.olsson@its.uu.se>
4  *                             Uppsala University and
5  *                             Swedish University of Agricultural Sciences
6  *
7  * Alexey Kuznetsov  <kuznet@ms2.inr.ac.ru>
8  * Ben Greear <greearb@candelatech.com>
9  * Jens Låås <jens.laas@data.slu.se>
10  *
11  * This program is free software; you can redistribute it and/or
12  * modify it under the terms of the GNU General Public License
13  * as published by the Free Software Foundation; either version
14  * 2 of the License, or (at your option) any later version.
15  *
16  *
17  * A tool for loading the network with preconfigurated packets.
18  * The tool is implemented as a linux module.  Parameters are output
19  * device, delay (to hard_xmit), number of packets, and whether
20  * to use multiple SKBs or just the same one.
21  * pktgen uses the installed interface's output routine.
22  *
23  * Additional hacking by:
24  *
25  * Jens.Laas@data.slu.se
26  * Improved by ANK. 010120.
27  * Improved by ANK even more. 010212.
28  * MAC address typo fixed. 010417 --ro
29  * Integrated.  020301 --DaveM
30  * Added multiskb option 020301 --DaveM
31  * Scaling of results. 020417--sigurdur@linpro.no
32  * Significant re-work of the module:
33  *   *  Convert to threaded model to more efficiently be able to transmit
34  *       and receive on multiple interfaces at once.
35  *   *  Converted many counters to __u64 to allow longer runs.
36  *   *  Allow configuration of ranges, like min/max IP address, MACs,
37  *       and UDP-ports, for both source and destination, and can
38  *       set to use a random distribution or sequentially walk the range.
39  *   *  Can now change most values after starting.
40  *   *  Place 12-byte packet in UDP payload with magic number,
41  *       sequence number, and timestamp.
42  *   *  Add receiver code that detects dropped pkts, re-ordered pkts, and
43  *       latencies (with micro-second) precision.
44  *   *  Add IOCTL interface to easily get counters & configuration.
45  *   --Ben Greear <greearb@candelatech.com>
46  *
47  * Renamed multiskb to clone_skb and cleaned up sending core for two distinct
48  * skb modes. A clone_skb=0 mode for Ben "ranges" work and a clone_skb != 0
49  * as a "fastpath" with a configurable number of clones after alloc's.
50  * clone_skb=0 means all packets are allocated this also means ranges time
51  * stamps etc can be used. clone_skb=100 means 1 malloc is followed by 100
52  * clones.
53  *
54  * Also moved to /proc/net/pktgen/
55  * --ro
56  *
57  * Sept 10:  Fixed threading/locking.  Lots of bone-headed and more clever
58  *    mistakes.  Also merged in DaveM's patch in the -pre6 patch.
59  * --Ben Greear <greearb@candelatech.com>
60  *
61  * Integrated to 2.5.x 021029 --Lucio Maciel (luciomaciel@zipmail.com.br)
62  *
63  *
64  * 021124 Finished major redesign and rewrite for new functionality.
65  * See Documentation/networking/pktgen.txt for how to use this.
66  *
67  * The new operation:
68  * For each CPU one thread/process is created at start. This process checks
69  * for running devices in the if_list and sends packets until count is 0 it
70  * also the thread checks the thread->control which is used for inter-process
71  * communication. controlling process "posts" operations to the threads this
72  * way. The if_lock should be possible to remove when add/rem_device is merged
73  * into this too.
74  *
75  * By design there should only be *one* "controlling" process. In practice
76  * multiple write accesses gives unpredictable result. Understood by "write"
77  * to /proc gives result code thats should be read be the "writer".
78  * For practical use this should be no problem.
79  *
80  * Note when adding devices to a specific CPU there good idea to also assign
81  * /proc/irq/XX/smp_affinity so TX-interrupts gets bound to the same CPU.
82  * --ro
83  *
84  * Fix refcount off by one if first packet fails, potential null deref,
85  * memleak 030710- KJP
86  *
87  * First "ranges" functionality for ipv6 030726 --ro
88  *
89  * Included flow support. 030802 ANK.
90  *
91  * Fixed unaligned access on IA-64 Grant Grundler <grundler@parisc-linux.org>
92  *
93  * Remove if fix from added Harald Welte <laforge@netfilter.org> 040419
94  * ia64 compilation fix from  Aron Griffis <aron@hp.com> 040604
95  *
96  * New xmit() return, do_div and misc clean up by Stephen Hemminger
97  * <shemminger@osdl.org> 040923
98  *
99  * Randy Dunlap fixed u64 printk compiler waring
100  *
101  * Remove FCS from BW calculation.  Lennert Buytenhek <buytenh@wantstofly.org>
102  * New time handling. Lennert Buytenhek <buytenh@wantstofly.org> 041213
103  *
104  * Corrections from Nikolai Malykh (nmalykh@bilim.com)
105  * Removed unused flags F_SET_SRCMAC & F_SET_SRCIP 041230
106  *
107  * interruptible_sleep_on_timeout() replaced Nishanth Aravamudan <nacc@us.ibm.com>
108  * 050103
109  *
110  * MPLS support by Steven Whitehouse <steve@chygwyn.com>
111  *
112  * 802.1Q/Q-in-Q support by Francesco Fondelli (FF) <francesco.fondelli@gmail.com>
113  *
114  * Fixed src_mac command to set source mac of packet to value specified in
115  * command by Adit Ranadive <adit.262@gmail.com>
116  *
117  */
118
119 #define pr_fmt(fmt) KBUILD_MODNAME ": " fmt
120
121 #include <linux/sys.h>
122 #include <linux/types.h>
123 #include <linux/module.h>
124 #include <linux/moduleparam.h>
125 #include <linux/kernel.h>
126 #include <linux/mutex.h>
127 #include <linux/sched.h>
128 #include <linux/slab.h>
129 #include <linux/vmalloc.h>
130 #include <linux/unistd.h>
131 #include <linux/string.h>
132 #include <linux/ptrace.h>
133 #include <linux/errno.h>
134 #include <linux/ioport.h>
135 #include <linux/interrupt.h>
136 #include <linux/capability.h>
137 #include <linux/hrtimer.h>
138 #include <linux/freezer.h>
139 #include <linux/delay.h>
140 #include <linux/timer.h>
141 #include <linux/list.h>
142 #include <linux/init.h>
143 #include <linux/skbuff.h>
144 #include <linux/netdevice.h>
145 #include <linux/inet.h>
146 #include <linux/inetdevice.h>
147 #include <linux/rtnetlink.h>
148 #include <linux/if_arp.h>
149 #include <linux/if_vlan.h>
150 #include <linux/in.h>
151 #include <linux/ip.h>
152 #include <linux/ipv6.h>
153 #include <linux/udp.h>
154 #include <linux/proc_fs.h>
155 #include <linux/seq_file.h>
156 #include <linux/wait.h>
157 #include <linux/etherdevice.h>
158 #include <linux/kthread.h>
159 #include <linux/prefetch.h>
160 #include <net/net_namespace.h>
161 #include <net/checksum.h>
162 #include <net/ipv6.h>
163 #include <net/addrconf.h>
164 #ifdef CONFIG_XFRM
165 #include <net/xfrm.h>
166 #endif
167 #include <asm/byteorder.h>
168 #include <linux/rcupdate.h>
169 #include <linux/bitops.h>
170 #include <linux/io.h>
171 #include <linux/timex.h>
172 #include <linux/uaccess.h>
173 #include <asm/dma.h>
174 #include <asm/div64.h>          /* do_div */
175
176 #define VERSION "2.74"
177 #define IP_NAME_SZ 32
178 #define MAX_MPLS_LABELS 16 /* This is the max label stack depth */
179 #define MPLS_STACK_BOTTOM htonl(0x00000100)
180
181 #define func_enter() pr_debug("entering %s\n", __func__);
182
183 /* Device flag bits */
184 #define F_IPSRC_RND   (1<<0)    /* IP-Src Random  */
185 #define F_IPDST_RND   (1<<1)    /* IP-Dst Random  */
186 #define F_UDPSRC_RND  (1<<2)    /* UDP-Src Random */
187 #define F_UDPDST_RND  (1<<3)    /* UDP-Dst Random */
188 #define F_MACSRC_RND  (1<<4)    /* MAC-Src Random */
189 #define F_MACDST_RND  (1<<5)    /* MAC-Dst Random */
190 #define F_TXSIZE_RND  (1<<6)    /* Transmit size is random */
191 #define F_IPV6        (1<<7)    /* Interface in IPV6 Mode */
192 #define F_MPLS_RND    (1<<8)    /* Random MPLS labels */
193 #define F_VID_RND     (1<<9)    /* Random VLAN ID */
194 #define F_SVID_RND    (1<<10)   /* Random SVLAN ID */
195 #define F_FLOW_SEQ    (1<<11)   /* Sequential flows */
196 #define F_IPSEC_ON    (1<<12)   /* ipsec on for flows */
197 #define F_QUEUE_MAP_RND (1<<13) /* queue map Random */
198 #define F_QUEUE_MAP_CPU (1<<14) /* queue map mirrors smp_processor_id() */
199 #define F_NODE          (1<<15) /* Node memory alloc*/
200
201 /* Thread control flag bits */
202 #define T_STOP        (1<<0)    /* Stop run */
203 #define T_RUN         (1<<1)    /* Start run */
204 #define T_REMDEVALL   (1<<2)    /* Remove all devs */
205 #define T_REMDEV      (1<<3)    /* Remove one dev */
206
207 /* If lock -- can be removed after some work */
208 #define   if_lock(t)           spin_lock(&(t->if_lock));
209 #define   if_unlock(t)           spin_unlock(&(t->if_lock));
210
211 /* Used to help with determining the pkts on receive */
212 #define PKTGEN_MAGIC 0xbe9be955
213 #define PG_PROC_DIR "pktgen"
214 #define PGCTRL      "pgctrl"
215 static struct proc_dir_entry *pg_proc_dir;
216
217 #define MAX_CFLOWS  65536
218
219 #define VLAN_TAG_SIZE(x) ((x)->vlan_id == 0xffff ? 0 : 4)
220 #define SVLAN_TAG_SIZE(x) ((x)->svlan_id == 0xffff ? 0 : 4)
221
222 struct flow_state {
223         __be32 cur_daddr;
224         int count;
225 #ifdef CONFIG_XFRM
226         struct xfrm_state *x;
227 #endif
228         __u32 flags;
229 };
230
231 /* flow flag bits */
232 #define F_INIT   (1<<0)         /* flow has been initialized */
233
234 struct pktgen_dev {
235         /*
236          * Try to keep frequent/infrequent used vars. separated.
237          */
238         struct proc_dir_entry *entry;   /* proc file */
239         struct pktgen_thread *pg_thread;/* the owner */
240         struct list_head list;          /* chaining in the thread's run-queue */
241
242         int running;            /* if false, the test will stop */
243
244         /* If min != max, then we will either do a linear iteration, or
245          * we will do a random selection from within the range.
246          */
247         __u32 flags;
248         int removal_mark;       /* non-zero => the device is marked for
249                                  * removal by worker thread */
250
251         int min_pkt_size;
252         int max_pkt_size;
253         int pkt_overhead;       /* overhead for MPLS, VLANs, IPSEC etc */
254         int nfrags;
255         struct page *page;
256         u64 delay;              /* nano-seconds */
257
258         __u64 count;            /* Default No packets to send */
259         __u64 sofar;            /* How many pkts we've sent so far */
260         __u64 tx_bytes;         /* How many bytes we've transmitted */
261         __u64 errors;           /* Errors when trying to transmit, */
262
263         /* runtime counters relating to clone_skb */
264
265         __u64 allocated_skbs;
266         __u32 clone_count;
267         int last_ok;            /* Was last skb sent?
268                                  * Or a failed transmit of some sort?
269                                  * This will keep sequence numbers in order
270                                  */
271         ktime_t next_tx;
272         ktime_t started_at;
273         ktime_t stopped_at;
274         u64     idle_acc;       /* nano-seconds */
275
276         __u32 seq_num;
277
278         int clone_skb;          /*
279                                  * Use multiple SKBs during packet gen.
280                                  * If this number is greater than 1, then
281                                  * that many copies of the same packet will be
282                                  * sent before a new packet is allocated.
283                                  * If you want to send 1024 identical packets
284                                  * before creating a new packet,
285                                  * set clone_skb to 1024.
286                                  */
287
288         char dst_min[IP_NAME_SZ];       /* IP, ie 1.2.3.4 */
289         char dst_max[IP_NAME_SZ];       /* IP, ie 1.2.3.4 */
290         char src_min[IP_NAME_SZ];       /* IP, ie 1.2.3.4 */
291         char src_max[IP_NAME_SZ];       /* IP, ie 1.2.3.4 */
292
293         struct in6_addr in6_saddr;
294         struct in6_addr in6_daddr;
295         struct in6_addr cur_in6_daddr;
296         struct in6_addr cur_in6_saddr;
297         /* For ranges */
298         struct in6_addr min_in6_daddr;
299         struct in6_addr max_in6_daddr;
300         struct in6_addr min_in6_saddr;
301         struct in6_addr max_in6_saddr;
302
303         /* If we're doing ranges, random or incremental, then this
304          * defines the min/max for those ranges.
305          */
306         __be32 saddr_min;       /* inclusive, source IP address */
307         __be32 saddr_max;       /* exclusive, source IP address */
308         __be32 daddr_min;       /* inclusive, dest IP address */
309         __be32 daddr_max;       /* exclusive, dest IP address */
310
311         __u16 udp_src_min;      /* inclusive, source UDP port */
312         __u16 udp_src_max;      /* exclusive, source UDP port */
313         __u16 udp_dst_min;      /* inclusive, dest UDP port */
314         __u16 udp_dst_max;      /* exclusive, dest UDP port */
315
316         /* DSCP + ECN */
317         __u8 tos;            /* six MSB of (former) IPv4 TOS
318                                 are for dscp codepoint */
319         __u8 traffic_class;  /* ditto for the (former) Traffic Class in IPv6
320                                 (see RFC 3260, sec. 4) */
321
322         /* MPLS */
323         unsigned int nr_labels; /* Depth of stack, 0 = no MPLS */
324         __be32 labels[MAX_MPLS_LABELS];
325
326         /* VLAN/SVLAN (802.1Q/Q-in-Q) */
327         __u8  vlan_p;
328         __u8  vlan_cfi;
329         __u16 vlan_id;  /* 0xffff means no vlan tag */
330
331         __u8  svlan_p;
332         __u8  svlan_cfi;
333         __u16 svlan_id; /* 0xffff means no svlan tag */
334
335         __u32 src_mac_count;    /* How many MACs to iterate through */
336         __u32 dst_mac_count;    /* How many MACs to iterate through */
337
338         unsigned char dst_mac[ETH_ALEN];
339         unsigned char src_mac[ETH_ALEN];
340
341         __u32 cur_dst_mac_offset;
342         __u32 cur_src_mac_offset;
343         __be32 cur_saddr;
344         __be32 cur_daddr;
345         __u16 ip_id;
346         __u16 cur_udp_dst;
347         __u16 cur_udp_src;
348         __u16 cur_queue_map;
349         __u32 cur_pkt_size;
350         __u32 last_pkt_size;
351
352         __u8 hh[14];
353         /* = {
354            0x00, 0x80, 0xC8, 0x79, 0xB3, 0xCB,
355
356            We fill in SRC address later
357            0x00, 0x00, 0x00, 0x00, 0x00, 0x00,
358            0x08, 0x00
359            };
360          */
361         __u16 pad;              /* pad out the hh struct to an even 16 bytes */
362
363         struct sk_buff *skb;    /* skb we are to transmit next, used for when we
364                                  * are transmitting the same one multiple times
365                                  */
366         struct net_device *odev; /* The out-going device.
367                                   * Note that the device should have it's
368                                   * pg_info pointer pointing back to this
369                                   * device.
370                                   * Set when the user specifies the out-going
371                                   * device name (not when the inject is
372                                   * started as it used to do.)
373                                   */
374         char odevname[32];
375         struct flow_state *flows;
376         unsigned int cflows;    /* Concurrent flows (config) */
377         unsigned int lflow;             /* Flow length  (config) */
378         unsigned int nflows;    /* accumulated flows (stats) */
379         unsigned int curfl;             /* current sequenced flow (state)*/
380
381         u16 queue_map_min;
382         u16 queue_map_max;
383         __u32 skb_priority;     /* skb priority field */
384         int node;               /* Memory node */
385
386 #ifdef CONFIG_XFRM
387         __u8    ipsmode;                /* IPSEC mode (config) */
388         __u8    ipsproto;               /* IPSEC type (config) */
389 #endif
390         char result[512];
391 };
392
393 struct pktgen_hdr {
394         __be32 pgh_magic;
395         __be32 seq_num;
396         __be32 tv_sec;
397         __be32 tv_usec;
398 };
399
400 static bool pktgen_exiting __read_mostly;
401
402 struct pktgen_thread {
403         spinlock_t if_lock;             /* for list of devices */
404         struct list_head if_list;       /* All device here */
405         struct list_head th_list;
406         struct task_struct *tsk;
407         char result[512];
408
409         /* Field for thread to receive "posted" events terminate,
410            stop ifs etc. */
411
412         u32 control;
413         int cpu;
414
415         wait_queue_head_t queue;
416         struct completion start_done;
417 };
418
419 #define REMOVE 1
420 #define FIND   0
421
422 static inline ktime_t ktime_now(void)
423 {
424         struct timespec ts;
425         ktime_get_ts(&ts);
426
427         return timespec_to_ktime(ts);
428 }
429
430 /* This works even if 32 bit because of careful byte order choice */
431 static inline int ktime_lt(const ktime_t cmp1, const ktime_t cmp2)
432 {
433         return cmp1.tv64 < cmp2.tv64;
434 }
435
436 static const char version[] =
437         "Packet Generator for packet performance testing. "
438         "Version: " VERSION "\n";
439
440 static int pktgen_remove_device(struct pktgen_thread *t, struct pktgen_dev *i);
441 static int pktgen_add_device(struct pktgen_thread *t, const char *ifname);
442 static struct pktgen_dev *pktgen_find_dev(struct pktgen_thread *t,
443                                           const char *ifname, bool exact);
444 static int pktgen_device_event(struct notifier_block *, unsigned long, void *);
445 static void pktgen_run_all_threads(void);
446 static void pktgen_reset_all_threads(void);
447 static void pktgen_stop_all_threads_ifs(void);
448
449 static void pktgen_stop(struct pktgen_thread *t);
450 static void pktgen_clear_counters(struct pktgen_dev *pkt_dev);
451
452 static unsigned int scan_ip6(const char *s, char ip[16]);
453
454 /* Module parameters, defaults. */
455 static int pg_count_d __read_mostly = 1000;
456 static int pg_delay_d __read_mostly;
457 static int pg_clone_skb_d  __read_mostly;
458 static int debug  __read_mostly;
459
460 static DEFINE_MUTEX(pktgen_thread_lock);
461 static LIST_HEAD(pktgen_threads);
462
463 static struct notifier_block pktgen_notifier_block = {
464         .notifier_call = pktgen_device_event,
465 };
466
467 /*
468  * /proc handling functions
469  *
470  */
471
472 static int pgctrl_show(struct seq_file *seq, void *v)
473 {
474         seq_puts(seq, version);
475         return 0;
476 }
477
478 static ssize_t pgctrl_write(struct file *file, const char __user *buf,
479                             size_t count, loff_t *ppos)
480 {
481         int err = 0;
482         char data[128];
483
484         if (!capable(CAP_NET_ADMIN)) {
485                 err = -EPERM;
486                 goto out;
487         }
488
489         if (count > sizeof(data))
490                 count = sizeof(data);
491
492         if (copy_from_user(data, buf, count)) {
493                 err = -EFAULT;
494                 goto out;
495         }
496         data[count - 1] = 0;    /* Make string */
497
498         if (!strcmp(data, "stop"))
499                 pktgen_stop_all_threads_ifs();
500
501         else if (!strcmp(data, "start"))
502                 pktgen_run_all_threads();
503
504         else if (!strcmp(data, "reset"))
505                 pktgen_reset_all_threads();
506
507         else
508                 pr_warning("Unknown command: %s\n", data);
509
510         err = count;
511
512 out:
513         return err;
514 }
515
516 static int pgctrl_open(struct inode *inode, struct file *file)
517 {
518         return single_open(file, pgctrl_show, PDE(inode)->data);
519 }
520
521 static const struct file_operations pktgen_fops = {
522         .owner   = THIS_MODULE,
523         .open    = pgctrl_open,
524         .read    = seq_read,
525         .llseek  = seq_lseek,
526         .write   = pgctrl_write,
527         .release = single_release,
528 };
529
530 static int pktgen_if_show(struct seq_file *seq, void *v)
531 {
532         const struct pktgen_dev *pkt_dev = seq->private;
533         ktime_t stopped;
534         u64 idle;
535
536         seq_printf(seq,
537                    "Params: count %llu  min_pkt_size: %u  max_pkt_size: %u\n",
538                    (unsigned long long)pkt_dev->count, pkt_dev->min_pkt_size,
539                    pkt_dev->max_pkt_size);
540
541         seq_printf(seq,
542                    "     frags: %d  delay: %llu  clone_skb: %d  ifname: %s\n",
543                    pkt_dev->nfrags, (unsigned long long) pkt_dev->delay,
544                    pkt_dev->clone_skb, pkt_dev->odevname);
545
546         seq_printf(seq, "     flows: %u flowlen: %u\n", pkt_dev->cflows,
547                    pkt_dev->lflow);
548
549         seq_printf(seq,
550                    "     queue_map_min: %u  queue_map_max: %u\n",
551                    pkt_dev->queue_map_min,
552                    pkt_dev->queue_map_max);
553
554         if (pkt_dev->skb_priority)
555                 seq_printf(seq, "     skb_priority: %u\n",
556                            pkt_dev->skb_priority);
557
558         if (pkt_dev->flags & F_IPV6) {
559                 seq_printf(seq,
560                            "     saddr: %pI6c  min_saddr: %pI6c  max_saddr: %pI6c\n"
561                            "     daddr: %pI6c  min_daddr: %pI6c  max_daddr: %pI6c\n",
562                            &pkt_dev->in6_saddr,
563                            &pkt_dev->min_in6_saddr, &pkt_dev->max_in6_saddr,
564                            &pkt_dev->in6_daddr,
565                            &pkt_dev->min_in6_daddr, &pkt_dev->max_in6_daddr);
566         } else {
567                 seq_printf(seq,
568                            "     dst_min: %s  dst_max: %s\n",
569                            pkt_dev->dst_min, pkt_dev->dst_max);
570                 seq_printf(seq,
571                            "        src_min: %s  src_max: %s\n",
572                            pkt_dev->src_min, pkt_dev->src_max);
573         }
574
575         seq_puts(seq, "     src_mac: ");
576
577         seq_printf(seq, "%pM ",
578                    is_zero_ether_addr(pkt_dev->src_mac) ?
579                              pkt_dev->odev->dev_addr : pkt_dev->src_mac);
580
581         seq_printf(seq, "dst_mac: ");
582         seq_printf(seq, "%pM\n", pkt_dev->dst_mac);
583
584         seq_printf(seq,
585                    "     udp_src_min: %d  udp_src_max: %d"
586                    "  udp_dst_min: %d  udp_dst_max: %d\n",
587                    pkt_dev->udp_src_min, pkt_dev->udp_src_max,
588                    pkt_dev->udp_dst_min, pkt_dev->udp_dst_max);
589
590         seq_printf(seq,
591                    "     src_mac_count: %d  dst_mac_count: %d\n",
592                    pkt_dev->src_mac_count, pkt_dev->dst_mac_count);
593
594         if (pkt_dev->nr_labels) {
595                 unsigned int i;
596                 seq_printf(seq, "     mpls: ");
597                 for (i = 0; i < pkt_dev->nr_labels; i++)
598                         seq_printf(seq, "%08x%s", ntohl(pkt_dev->labels[i]),
599                                    i == pkt_dev->nr_labels-1 ? "\n" : ", ");
600         }
601
602         if (pkt_dev->vlan_id != 0xffff)
603                 seq_printf(seq, "     vlan_id: %u  vlan_p: %u  vlan_cfi: %u\n",
604                            pkt_dev->vlan_id, pkt_dev->vlan_p,
605                            pkt_dev->vlan_cfi);
606
607         if (pkt_dev->svlan_id != 0xffff)
608                 seq_printf(seq, "     svlan_id: %u  vlan_p: %u  vlan_cfi: %u\n",
609                            pkt_dev->svlan_id, pkt_dev->svlan_p,
610                            pkt_dev->svlan_cfi);
611
612         if (pkt_dev->tos)
613                 seq_printf(seq, "     tos: 0x%02x\n", pkt_dev->tos);
614
615         if (pkt_dev->traffic_class)
616                 seq_printf(seq, "     traffic_class: 0x%02x\n", pkt_dev->traffic_class);
617
618         if (pkt_dev->node >= 0)
619                 seq_printf(seq, "     node: %d\n", pkt_dev->node);
620
621         seq_printf(seq, "     Flags: ");
622
623         if (pkt_dev->flags & F_IPV6)
624                 seq_printf(seq, "IPV6  ");
625
626         if (pkt_dev->flags & F_IPSRC_RND)
627                 seq_printf(seq, "IPSRC_RND  ");
628
629         if (pkt_dev->flags & F_IPDST_RND)
630                 seq_printf(seq, "IPDST_RND  ");
631
632         if (pkt_dev->flags & F_TXSIZE_RND)
633                 seq_printf(seq, "TXSIZE_RND  ");
634
635         if (pkt_dev->flags & F_UDPSRC_RND)
636                 seq_printf(seq, "UDPSRC_RND  ");
637
638         if (pkt_dev->flags & F_UDPDST_RND)
639                 seq_printf(seq, "UDPDST_RND  ");
640
641         if (pkt_dev->flags & F_MPLS_RND)
642                 seq_printf(seq,  "MPLS_RND  ");
643
644         if (pkt_dev->flags & F_QUEUE_MAP_RND)
645                 seq_printf(seq,  "QUEUE_MAP_RND  ");
646
647         if (pkt_dev->flags & F_QUEUE_MAP_CPU)
648                 seq_printf(seq,  "QUEUE_MAP_CPU  ");
649
650         if (pkt_dev->cflows) {
651                 if (pkt_dev->flags & F_FLOW_SEQ)
652                         seq_printf(seq,  "FLOW_SEQ  "); /*in sequence flows*/
653                 else
654                         seq_printf(seq,  "FLOW_RND  ");
655         }
656
657 #ifdef CONFIG_XFRM
658         if (pkt_dev->flags & F_IPSEC_ON)
659                 seq_printf(seq,  "IPSEC  ");
660 #endif
661
662         if (pkt_dev->flags & F_MACSRC_RND)
663                 seq_printf(seq, "MACSRC_RND  ");
664
665         if (pkt_dev->flags & F_MACDST_RND)
666                 seq_printf(seq, "MACDST_RND  ");
667
668         if (pkt_dev->flags & F_VID_RND)
669                 seq_printf(seq, "VID_RND  ");
670
671         if (pkt_dev->flags & F_SVID_RND)
672                 seq_printf(seq, "SVID_RND  ");
673
674         if (pkt_dev->flags & F_NODE)
675                 seq_printf(seq, "NODE_ALLOC  ");
676
677         seq_puts(seq, "\n");
678
679         /* not really stopped, more like last-running-at */
680         stopped = pkt_dev->running ? ktime_now() : pkt_dev->stopped_at;
681         idle = pkt_dev->idle_acc;
682         do_div(idle, NSEC_PER_USEC);
683
684         seq_printf(seq,
685                    "Current:\n     pkts-sofar: %llu  errors: %llu\n",
686                    (unsigned long long)pkt_dev->sofar,
687                    (unsigned long long)pkt_dev->errors);
688
689         seq_printf(seq,
690                    "     started: %lluus  stopped: %lluus idle: %lluus\n",
691                    (unsigned long long) ktime_to_us(pkt_dev->started_at),
692                    (unsigned long long) ktime_to_us(stopped),
693                    (unsigned long long) idle);
694
695         seq_printf(seq,
696                    "     seq_num: %d  cur_dst_mac_offset: %d  cur_src_mac_offset: %d\n",
697                    pkt_dev->seq_num, pkt_dev->cur_dst_mac_offset,
698                    pkt_dev->cur_src_mac_offset);
699
700         if (pkt_dev->flags & F_IPV6) {
701                 seq_printf(seq, "     cur_saddr: %pI6c  cur_daddr: %pI6c\n",
702                                 &pkt_dev->cur_in6_saddr,
703                                 &pkt_dev->cur_in6_daddr);
704         } else
705                 seq_printf(seq, "     cur_saddr: %pI4  cur_daddr: %pI4\n",
706                            &pkt_dev->cur_saddr, &pkt_dev->cur_daddr);
707
708         seq_printf(seq, "     cur_udp_dst: %d  cur_udp_src: %d\n",
709                    pkt_dev->cur_udp_dst, pkt_dev->cur_udp_src);
710
711         seq_printf(seq, "     cur_queue_map: %u\n", pkt_dev->cur_queue_map);
712
713         seq_printf(seq, "     flows: %u\n", pkt_dev->nflows);
714
715         if (pkt_dev->result[0])
716                 seq_printf(seq, "Result: %s\n", pkt_dev->result);
717         else
718                 seq_printf(seq, "Result: Idle\n");
719
720         return 0;
721 }
722
723
724 static int hex32_arg(const char __user *user_buffer, unsigned long maxlen,
725                      __u32 *num)
726 {
727         int i = 0;
728         *num = 0;
729
730         for (; i < maxlen; i++) {
731                 int value;
732                 char c;
733                 *num <<= 4;
734                 if (get_user(c, &user_buffer[i]))
735                         return -EFAULT;
736                 value = hex_to_bin(c);
737                 if (value >= 0)
738                         *num |= value;
739                 else
740                         break;
741         }
742         return i;
743 }
744
745 static int count_trail_chars(const char __user * user_buffer,
746                              unsigned int maxlen)
747 {
748         int i;
749
750         for (i = 0; i < maxlen; i++) {
751                 char c;
752                 if (get_user(c, &user_buffer[i]))
753                         return -EFAULT;
754                 switch (c) {
755                 case '\"':
756                 case '\n':
757                 case '\r':
758                 case '\t':
759                 case ' ':
760                 case '=':
761                         break;
762                 default:
763                         goto done;
764                 }
765         }
766 done:
767         return i;
768 }
769
770 static long num_arg(const char __user *user_buffer, unsigned long maxlen,
771                                 unsigned long *num)
772 {
773         int i;
774         *num = 0;
775
776         for (i = 0; i < maxlen; i++) {
777                 char c;
778                 if (get_user(c, &user_buffer[i]))
779                         return -EFAULT;
780                 if ((c >= '0') && (c <= '9')) {
781                         *num *= 10;
782                         *num += c - '0';
783                 } else
784                         break;
785         }
786         return i;
787 }
788
789 static int strn_len(const char __user * user_buffer, unsigned int maxlen)
790 {
791         int i;
792
793         for (i = 0; i < maxlen; i++) {
794                 char c;
795                 if (get_user(c, &user_buffer[i]))
796                         return -EFAULT;
797                 switch (c) {
798                 case '\"':
799                 case '\n':
800                 case '\r':
801                 case '\t':
802                 case ' ':
803                         goto done_str;
804                         break;
805                 default:
806                         break;
807                 }
808         }
809 done_str:
810         return i;
811 }
812
813 static ssize_t get_labels(const char __user *buffer, struct pktgen_dev *pkt_dev)
814 {
815         unsigned int n = 0;
816         char c;
817         ssize_t i = 0;
818         int len;
819
820         pkt_dev->nr_labels = 0;
821         do {
822                 __u32 tmp;
823                 len = hex32_arg(&buffer[i], 8, &tmp);
824                 if (len <= 0)
825                         return len;
826                 pkt_dev->labels[n] = htonl(tmp);
827                 if (pkt_dev->labels[n] & MPLS_STACK_BOTTOM)
828                         pkt_dev->flags |= F_MPLS_RND;
829                 i += len;
830                 if (get_user(c, &buffer[i]))
831                         return -EFAULT;
832                 i++;
833                 n++;
834                 if (n >= MAX_MPLS_LABELS)
835                         return -E2BIG;
836         } while (c == ',');
837
838         pkt_dev->nr_labels = n;
839         return i;
840 }
841
842 static ssize_t pktgen_if_write(struct file *file,
843                                const char __user * user_buffer, size_t count,
844                                loff_t * offset)
845 {
846         struct seq_file *seq = file->private_data;
847         struct pktgen_dev *pkt_dev = seq->private;
848         int i, max, len;
849         char name[16], valstr[32];
850         unsigned long value = 0;
851         char *pg_result = NULL;
852         int tmp = 0;
853         char buf[128];
854
855         pg_result = &(pkt_dev->result[0]);
856
857         if (count < 1) {
858                 pr_warning("wrong command format\n");
859                 return -EINVAL;
860         }
861
862         max = count;
863         tmp = count_trail_chars(user_buffer, max);
864         if (tmp < 0) {
865                 pr_warning("illegal format\n");
866                 return tmp;
867         }
868         i = tmp;
869
870         /* Read variable name */
871
872         len = strn_len(&user_buffer[i], sizeof(name) - 1);
873         if (len < 0)
874                 return len;
875
876         memset(name, 0, sizeof(name));
877         if (copy_from_user(name, &user_buffer[i], len))
878                 return -EFAULT;
879         i += len;
880
881         max = count - i;
882         len = count_trail_chars(&user_buffer[i], max);
883         if (len < 0)
884                 return len;
885
886         i += len;
887
888         if (debug) {
889                 size_t copy = min_t(size_t, count, 1023);
890                 char tb[copy + 1];
891                 if (copy_from_user(tb, user_buffer, copy))
892                         return -EFAULT;
893                 tb[copy] = 0;
894                 pr_debug("%s,%lu  buffer -:%s:-\n",
895                          name, (unsigned long)count, tb);
896         }
897
898         if (!strcmp(name, "min_pkt_size")) {
899                 len = num_arg(&user_buffer[i], 10, &value);
900                 if (len < 0)
901                         return len;
902
903                 i += len;
904                 if (value < 14 + 20 + 8)
905                         value = 14 + 20 + 8;
906                 if (value != pkt_dev->min_pkt_size) {
907                         pkt_dev->min_pkt_size = value;
908                         pkt_dev->cur_pkt_size = value;
909                 }
910                 sprintf(pg_result, "OK: min_pkt_size=%u",
911                         pkt_dev->min_pkt_size);
912                 return count;
913         }
914
915         if (!strcmp(name, "max_pkt_size")) {
916                 len = num_arg(&user_buffer[i], 10, &value);
917                 if (len < 0)
918                         return len;
919
920                 i += len;
921                 if (value < 14 + 20 + 8)
922                         value = 14 + 20 + 8;
923                 if (value != pkt_dev->max_pkt_size) {
924                         pkt_dev->max_pkt_size = value;
925                         pkt_dev->cur_pkt_size = value;
926                 }
927                 sprintf(pg_result, "OK: max_pkt_size=%u",
928                         pkt_dev->max_pkt_size);
929                 return count;
930         }
931
932         /* Shortcut for min = max */
933
934         if (!strcmp(name, "pkt_size")) {
935                 len = num_arg(&user_buffer[i], 10, &value);
936                 if (len < 0)
937                         return len;
938
939                 i += len;
940                 if (value < 14 + 20 + 8)
941                         value = 14 + 20 + 8;
942                 if (value != pkt_dev->min_pkt_size) {
943                         pkt_dev->min_pkt_size = value;
944                         pkt_dev->max_pkt_size = value;
945                         pkt_dev->cur_pkt_size = value;
946                 }
947                 sprintf(pg_result, "OK: pkt_size=%u", pkt_dev->min_pkt_size);
948                 return count;
949         }
950
951         if (!strcmp(name, "debug")) {
952                 len = num_arg(&user_buffer[i], 10, &value);
953                 if (len < 0)
954                         return len;
955
956                 i += len;
957                 debug = value;
958                 sprintf(pg_result, "OK: debug=%u", debug);
959                 return count;
960         }
961
962         if (!strcmp(name, "frags")) {
963                 len = num_arg(&user_buffer[i], 10, &value);
964                 if (len < 0)
965                         return len;
966
967                 i += len;
968                 pkt_dev->nfrags = value;
969                 sprintf(pg_result, "OK: frags=%u", pkt_dev->nfrags);
970                 return count;
971         }
972         if (!strcmp(name, "delay")) {
973                 len = num_arg(&user_buffer[i], 10, &value);
974                 if (len < 0)
975                         return len;
976
977                 i += len;
978                 if (value == 0x7FFFFFFF)
979                         pkt_dev->delay = ULLONG_MAX;
980                 else
981                         pkt_dev->delay = (u64)value;
982
983                 sprintf(pg_result, "OK: delay=%llu",
984                         (unsigned long long) pkt_dev->delay);
985                 return count;
986         }
987         if (!strcmp(name, "rate")) {
988                 len = num_arg(&user_buffer[i], 10, &value);
989                 if (len < 0)
990                         return len;
991
992                 i += len;
993                 if (!value)
994                         return len;
995                 pkt_dev->delay = pkt_dev->min_pkt_size*8*NSEC_PER_USEC/value;
996                 if (debug)
997                         pr_info("Delay set at: %llu ns\n", pkt_dev->delay);
998
999                 sprintf(pg_result, "OK: rate=%lu", value);
1000                 return count;
1001         }
1002         if (!strcmp(name, "ratep")) {
1003                 len = num_arg(&user_buffer[i], 10, &value);
1004                 if (len < 0)
1005                         return len;
1006
1007                 i += len;
1008                 if (!value)
1009                         return len;
1010                 pkt_dev->delay = NSEC_PER_SEC/value;
1011                 if (debug)
1012                         pr_info("Delay set at: %llu ns\n", pkt_dev->delay);
1013
1014                 sprintf(pg_result, "OK: rate=%lu", value);
1015                 return count;
1016         }
1017         if (!strcmp(name, "udp_src_min")) {
1018                 len = num_arg(&user_buffer[i], 10, &value);
1019                 if (len < 0)
1020                         return len;
1021
1022                 i += len;
1023                 if (value != pkt_dev->udp_src_min) {
1024                         pkt_dev->udp_src_min = value;
1025                         pkt_dev->cur_udp_src = value;
1026                 }
1027                 sprintf(pg_result, "OK: udp_src_min=%u", pkt_dev->udp_src_min);
1028                 return count;
1029         }
1030         if (!strcmp(name, "udp_dst_min")) {
1031                 len = num_arg(&user_buffer[i], 10, &value);
1032                 if (len < 0)
1033                         return len;
1034
1035                 i += len;
1036                 if (value != pkt_dev->udp_dst_min) {
1037                         pkt_dev->udp_dst_min = value;
1038                         pkt_dev->cur_udp_dst = value;
1039                 }
1040                 sprintf(pg_result, "OK: udp_dst_min=%u", pkt_dev->udp_dst_min);
1041                 return count;
1042         }
1043         if (!strcmp(name, "udp_src_max")) {
1044                 len = num_arg(&user_buffer[i], 10, &value);
1045                 if (len < 0)
1046                         return len;
1047
1048                 i += len;
1049                 if (value != pkt_dev->udp_src_max) {
1050                         pkt_dev->udp_src_max = value;
1051                         pkt_dev->cur_udp_src = value;
1052                 }
1053                 sprintf(pg_result, "OK: udp_src_max=%u", pkt_dev->udp_src_max);
1054                 return count;
1055         }
1056         if (!strcmp(name, "udp_dst_max")) {
1057                 len = num_arg(&user_buffer[i], 10, &value);
1058                 if (len < 0)
1059                         return len;
1060
1061                 i += len;
1062                 if (value != pkt_dev->udp_dst_max) {
1063                         pkt_dev->udp_dst_max = value;
1064                         pkt_dev->cur_udp_dst = value;
1065                 }
1066                 sprintf(pg_result, "OK: udp_dst_max=%u", pkt_dev->udp_dst_max);
1067                 return count;
1068         }
1069         if (!strcmp(name, "clone_skb")) {
1070                 len = num_arg(&user_buffer[i], 10, &value);
1071                 if (len < 0)
1072                         return len;
1073                 if ((value > 0) &&
1074                     (!(pkt_dev->odev->priv_flags & IFF_TX_SKB_SHARING)))
1075                         return -ENOTSUPP;
1076                 i += len;
1077                 pkt_dev->clone_skb = value;
1078
1079                 sprintf(pg_result, "OK: clone_skb=%d", pkt_dev->clone_skb);
1080                 return count;
1081         }
1082         if (!strcmp(name, "count")) {
1083                 len = num_arg(&user_buffer[i], 10, &value);
1084                 if (len < 0)
1085                         return len;
1086
1087                 i += len;
1088                 pkt_dev->count = value;
1089                 sprintf(pg_result, "OK: count=%llu",
1090                         (unsigned long long)pkt_dev->count);
1091                 return count;
1092         }
1093         if (!strcmp(name, "src_mac_count")) {
1094                 len = num_arg(&user_buffer[i], 10, &value);
1095                 if (len < 0)
1096                         return len;
1097
1098                 i += len;
1099                 if (pkt_dev->src_mac_count != value) {
1100                         pkt_dev->src_mac_count = value;
1101                         pkt_dev->cur_src_mac_offset = 0;
1102                 }
1103                 sprintf(pg_result, "OK: src_mac_count=%d",
1104                         pkt_dev->src_mac_count);
1105                 return count;
1106         }
1107         if (!strcmp(name, "dst_mac_count")) {
1108                 len = num_arg(&user_buffer[i], 10, &value);
1109                 if (len < 0)
1110                         return len;
1111
1112                 i += len;
1113                 if (pkt_dev->dst_mac_count != value) {
1114                         pkt_dev->dst_mac_count = value;
1115                         pkt_dev->cur_dst_mac_offset = 0;
1116                 }
1117                 sprintf(pg_result, "OK: dst_mac_count=%d",
1118                         pkt_dev->dst_mac_count);
1119                 return count;
1120         }
1121         if (!strcmp(name, "node")) {
1122                 len = num_arg(&user_buffer[i], 10, &value);
1123                 if (len < 0)
1124                         return len;
1125
1126                 i += len;
1127
1128                 if (node_possible(value)) {
1129                         pkt_dev->node = value;
1130                         sprintf(pg_result, "OK: node=%d", pkt_dev->node);
1131                         if (pkt_dev->page) {
1132                                 put_page(pkt_dev->page);
1133                                 pkt_dev->page = NULL;
1134                         }
1135                 }
1136                 else
1137                         sprintf(pg_result, "ERROR: node not possible");
1138                 return count;
1139         }
1140         if (!strcmp(name, "flag")) {
1141                 char f[32];
1142                 memset(f, 0, 32);
1143                 len = strn_len(&user_buffer[i], sizeof(f) - 1);
1144                 if (len < 0)
1145                         return len;
1146
1147                 if (copy_from_user(f, &user_buffer[i], len))
1148                         return -EFAULT;
1149                 i += len;
1150                 if (strcmp(f, "IPSRC_RND") == 0)
1151                         pkt_dev->flags |= F_IPSRC_RND;
1152
1153                 else if (strcmp(f, "!IPSRC_RND") == 0)
1154                         pkt_dev->flags &= ~F_IPSRC_RND;
1155
1156                 else if (strcmp(f, "TXSIZE_RND") == 0)
1157                         pkt_dev->flags |= F_TXSIZE_RND;
1158
1159                 else if (strcmp(f, "!TXSIZE_RND") == 0)
1160                         pkt_dev->flags &= ~F_TXSIZE_RND;
1161
1162                 else if (strcmp(f, "IPDST_RND") == 0)
1163                         pkt_dev->flags |= F_IPDST_RND;
1164
1165                 else if (strcmp(f, "!IPDST_RND") == 0)
1166                         pkt_dev->flags &= ~F_IPDST_RND;
1167
1168                 else if (strcmp(f, "UDPSRC_RND") == 0)
1169                         pkt_dev->flags |= F_UDPSRC_RND;
1170
1171                 else if (strcmp(f, "!UDPSRC_RND") == 0)
1172                         pkt_dev->flags &= ~F_UDPSRC_RND;
1173
1174                 else if (strcmp(f, "UDPDST_RND") == 0)
1175                         pkt_dev->flags |= F_UDPDST_RND;
1176
1177                 else if (strcmp(f, "!UDPDST_RND") == 0)
1178                         pkt_dev->flags &= ~F_UDPDST_RND;
1179
1180                 else if (strcmp(f, "MACSRC_RND") == 0)
1181                         pkt_dev->flags |= F_MACSRC_RND;
1182
1183                 else if (strcmp(f, "!MACSRC_RND") == 0)
1184                         pkt_dev->flags &= ~F_MACSRC_RND;
1185
1186                 else if (strcmp(f, "MACDST_RND") == 0)
1187                         pkt_dev->flags |= F_MACDST_RND;
1188
1189                 else if (strcmp(f, "!MACDST_RND") == 0)
1190                         pkt_dev->flags &= ~F_MACDST_RND;
1191
1192                 else if (strcmp(f, "MPLS_RND") == 0)
1193                         pkt_dev->flags |= F_MPLS_RND;
1194
1195                 else if (strcmp(f, "!MPLS_RND") == 0)
1196                         pkt_dev->flags &= ~F_MPLS_RND;
1197
1198                 else if (strcmp(f, "VID_RND") == 0)
1199                         pkt_dev->flags |= F_VID_RND;
1200
1201                 else if (strcmp(f, "!VID_RND") == 0)
1202                         pkt_dev->flags &= ~F_VID_RND;
1203
1204                 else if (strcmp(f, "SVID_RND") == 0)
1205                         pkt_dev->flags |= F_SVID_RND;
1206
1207                 else if (strcmp(f, "!SVID_RND") == 0)
1208                         pkt_dev->flags &= ~F_SVID_RND;
1209
1210                 else if (strcmp(f, "FLOW_SEQ") == 0)
1211                         pkt_dev->flags |= F_FLOW_SEQ;
1212
1213                 else if (strcmp(f, "QUEUE_MAP_RND") == 0)
1214                         pkt_dev->flags |= F_QUEUE_MAP_RND;
1215
1216                 else if (strcmp(f, "!QUEUE_MAP_RND") == 0)
1217                         pkt_dev->flags &= ~F_QUEUE_MAP_RND;
1218
1219                 else if (strcmp(f, "QUEUE_MAP_CPU") == 0)
1220                         pkt_dev->flags |= F_QUEUE_MAP_CPU;
1221
1222                 else if (strcmp(f, "!QUEUE_MAP_CPU") == 0)
1223                         pkt_dev->flags &= ~F_QUEUE_MAP_CPU;
1224 #ifdef CONFIG_XFRM
1225                 else if (strcmp(f, "IPSEC") == 0)
1226                         pkt_dev->flags |= F_IPSEC_ON;
1227 #endif
1228
1229                 else if (strcmp(f, "!IPV6") == 0)
1230                         pkt_dev->flags &= ~F_IPV6;
1231
1232                 else if (strcmp(f, "NODE_ALLOC") == 0)
1233                         pkt_dev->flags |= F_NODE;
1234
1235                 else if (strcmp(f, "!NODE_ALLOC") == 0)
1236                         pkt_dev->flags &= ~F_NODE;
1237
1238                 else {
1239                         sprintf(pg_result,
1240                                 "Flag -:%s:- unknown\nAvailable flags, (prepend ! to un-set flag):\n%s",
1241                                 f,
1242                                 "IPSRC_RND, IPDST_RND, UDPSRC_RND, UDPDST_RND, "
1243                                 "MACSRC_RND, MACDST_RND, TXSIZE_RND, IPV6, MPLS_RND, VID_RND, SVID_RND, FLOW_SEQ, IPSEC, NODE_ALLOC\n");
1244                         return count;
1245                 }
1246                 sprintf(pg_result, "OK: flags=0x%x", pkt_dev->flags);
1247                 return count;
1248         }
1249         if (!strcmp(name, "dst_min") || !strcmp(name, "dst")) {
1250                 len = strn_len(&user_buffer[i], sizeof(pkt_dev->dst_min) - 1);
1251                 if (len < 0)
1252                         return len;
1253
1254                 if (copy_from_user(buf, &user_buffer[i], len))
1255                         return -EFAULT;
1256                 buf[len] = 0;
1257                 if (strcmp(buf, pkt_dev->dst_min) != 0) {
1258                         memset(pkt_dev->dst_min, 0, sizeof(pkt_dev->dst_min));
1259                         strncpy(pkt_dev->dst_min, buf, len);
1260                         pkt_dev->daddr_min = in_aton(pkt_dev->dst_min);
1261                         pkt_dev->cur_daddr = pkt_dev->daddr_min;
1262                 }
1263                 if (debug)
1264                         pr_debug("dst_min set to: %s\n", pkt_dev->dst_min);
1265                 i += len;
1266                 sprintf(pg_result, "OK: dst_min=%s", pkt_dev->dst_min);
1267                 return count;
1268         }
1269         if (!strcmp(name, "dst_max")) {
1270                 len = strn_len(&user_buffer[i], sizeof(pkt_dev->dst_max) - 1);
1271                 if (len < 0)
1272                         return len;
1273
1274
1275                 if (copy_from_user(buf, &user_buffer[i], len))
1276                         return -EFAULT;
1277
1278                 buf[len] = 0;
1279                 if (strcmp(buf, pkt_dev->dst_max) != 0) {
1280                         memset(pkt_dev->dst_max, 0, sizeof(pkt_dev->dst_max));
1281                         strncpy(pkt_dev->dst_max, buf, len);
1282                         pkt_dev->daddr_max = in_aton(pkt_dev->dst_max);
1283                         pkt_dev->cur_daddr = pkt_dev->daddr_max;
1284                 }
1285                 if (debug)
1286                         pr_debug("dst_max set to: %s\n", pkt_dev->dst_max);
1287                 i += len;
1288                 sprintf(pg_result, "OK: dst_max=%s", pkt_dev->dst_max);
1289                 return count;
1290         }
1291         if (!strcmp(name, "dst6")) {
1292                 len = strn_len(&user_buffer[i], sizeof(buf) - 1);
1293                 if (len < 0)
1294                         return len;
1295
1296                 pkt_dev->flags |= F_IPV6;
1297
1298                 if (copy_from_user(buf, &user_buffer[i], len))
1299                         return -EFAULT;
1300                 buf[len] = 0;
1301
1302                 scan_ip6(buf, pkt_dev->in6_daddr.s6_addr);
1303                 snprintf(buf, sizeof(buf), "%pI6c", &pkt_dev->in6_daddr);
1304
1305                 pkt_dev->cur_in6_daddr = pkt_dev->in6_daddr;
1306
1307                 if (debug)
1308                         pr_debug("dst6 set to: %s\n", buf);
1309
1310                 i += len;
1311                 sprintf(pg_result, "OK: dst6=%s", buf);
1312                 return count;
1313         }
1314         if (!strcmp(name, "dst6_min")) {
1315                 len = strn_len(&user_buffer[i], sizeof(buf) - 1);
1316                 if (len < 0)
1317                         return len;
1318
1319                 pkt_dev->flags |= F_IPV6;
1320
1321                 if (copy_from_user(buf, &user_buffer[i], len))
1322                         return -EFAULT;
1323                 buf[len] = 0;
1324
1325                 scan_ip6(buf, pkt_dev->min_in6_daddr.s6_addr);
1326                 snprintf(buf, sizeof(buf), "%pI6c", &pkt_dev->min_in6_daddr);
1327
1328                 pkt_dev->cur_in6_daddr = pkt_dev->min_in6_daddr;
1329                 if (debug)
1330                         pr_debug("dst6_min set to: %s\n", buf);
1331
1332                 i += len;
1333                 sprintf(pg_result, "OK: dst6_min=%s", buf);
1334                 return count;
1335         }
1336         if (!strcmp(name, "dst6_max")) {
1337                 len = strn_len(&user_buffer[i], sizeof(buf) - 1);
1338                 if (len < 0)
1339                         return len;
1340
1341                 pkt_dev->flags |= F_IPV6;
1342
1343                 if (copy_from_user(buf, &user_buffer[i], len))
1344                         return -EFAULT;
1345                 buf[len] = 0;
1346
1347                 scan_ip6(buf, pkt_dev->max_in6_daddr.s6_addr);
1348                 snprintf(buf, sizeof(buf), "%pI6c", &pkt_dev->max_in6_daddr);
1349
1350                 if (debug)
1351                         pr_debug("dst6_max set to: %s\n", buf);
1352
1353                 i += len;
1354                 sprintf(pg_result, "OK: dst6_max=%s", buf);
1355                 return count;
1356         }
1357         if (!strcmp(name, "src6")) {
1358                 len = strn_len(&user_buffer[i], sizeof(buf) - 1);
1359                 if (len < 0)
1360                         return len;
1361
1362                 pkt_dev->flags |= F_IPV6;
1363
1364                 if (copy_from_user(buf, &user_buffer[i], len))
1365                         return -EFAULT;
1366                 buf[len] = 0;
1367
1368                 scan_ip6(buf, pkt_dev->in6_saddr.s6_addr);
1369                 snprintf(buf, sizeof(buf), "%pI6c", &pkt_dev->in6_saddr);
1370
1371                 pkt_dev->cur_in6_saddr = pkt_dev->in6_saddr;
1372
1373                 if (debug)
1374                         pr_debug("src6 set to: %s\n", buf);
1375
1376                 i += len;
1377                 sprintf(pg_result, "OK: src6=%s", buf);
1378                 return count;
1379         }
1380         if (!strcmp(name, "src_min")) {
1381                 len = strn_len(&user_buffer[i], sizeof(pkt_dev->src_min) - 1);
1382                 if (len < 0)
1383                         return len;
1384
1385                 if (copy_from_user(buf, &user_buffer[i], len))
1386                         return -EFAULT;
1387                 buf[len] = 0;
1388                 if (strcmp(buf, pkt_dev->src_min) != 0) {
1389                         memset(pkt_dev->src_min, 0, sizeof(pkt_dev->src_min));
1390                         strncpy(pkt_dev->src_min, buf, len);
1391                         pkt_dev->saddr_min = in_aton(pkt_dev->src_min);
1392                         pkt_dev->cur_saddr = pkt_dev->saddr_min;
1393                 }
1394                 if (debug)
1395                         pr_debug("src_min set to: %s\n", pkt_dev->src_min);
1396                 i += len;
1397                 sprintf(pg_result, "OK: src_min=%s", pkt_dev->src_min);
1398                 return count;
1399         }
1400         if (!strcmp(name, "src_max")) {
1401                 len = strn_len(&user_buffer[i], sizeof(pkt_dev->src_max) - 1);
1402                 if (len < 0)
1403                         return len;
1404
1405                 if (copy_from_user(buf, &user_buffer[i], len))
1406                         return -EFAULT;
1407                 buf[len] = 0;
1408                 if (strcmp(buf, pkt_dev->src_max) != 0) {
1409                         memset(pkt_dev->src_max, 0, sizeof(pkt_dev->src_max));
1410                         strncpy(pkt_dev->src_max, buf, len);
1411                         pkt_dev->saddr_max = in_aton(pkt_dev->src_max);
1412                         pkt_dev->cur_saddr = pkt_dev->saddr_max;
1413                 }
1414                 if (debug)
1415                         pr_debug("src_max set to: %s\n", pkt_dev->src_max);
1416                 i += len;
1417                 sprintf(pg_result, "OK: src_max=%s", pkt_dev->src_max);
1418                 return count;
1419         }
1420         if (!strcmp(name, "dst_mac")) {
1421                 len = strn_len(&user_buffer[i], sizeof(valstr) - 1);
1422                 if (len < 0)
1423                         return len;
1424
1425                 memset(valstr, 0, sizeof(valstr));
1426                 if (copy_from_user(valstr, &user_buffer[i], len))
1427                         return -EFAULT;
1428
1429                 if (!mac_pton(valstr, pkt_dev->dst_mac))
1430                         return -EINVAL;
1431                 /* Set up Dest MAC */
1432                 memcpy(&pkt_dev->hh[0], pkt_dev->dst_mac, ETH_ALEN);
1433
1434                 sprintf(pg_result, "OK: dstmac %pM", pkt_dev->dst_mac);
1435                 return count;
1436         }
1437         if (!strcmp(name, "src_mac")) {
1438                 len = strn_len(&user_buffer[i], sizeof(valstr) - 1);
1439                 if (len < 0)
1440                         return len;
1441
1442                 memset(valstr, 0, sizeof(valstr));
1443                 if (copy_from_user(valstr, &user_buffer[i], len))
1444                         return -EFAULT;
1445
1446                 if (!mac_pton(valstr, pkt_dev->src_mac))
1447                         return -EINVAL;
1448                 /* Set up Src MAC */
1449                 memcpy(&pkt_dev->hh[6], pkt_dev->src_mac, ETH_ALEN);
1450
1451                 sprintf(pg_result, "OK: srcmac %pM", pkt_dev->src_mac);
1452                 return count;
1453         }
1454
1455         if (!strcmp(name, "clear_counters")) {
1456                 pktgen_clear_counters(pkt_dev);
1457                 sprintf(pg_result, "OK: Clearing counters.\n");
1458                 return count;
1459         }
1460
1461         if (!strcmp(name, "flows")) {
1462                 len = num_arg(&user_buffer[i], 10, &value);
1463                 if (len < 0)
1464                         return len;
1465
1466                 i += len;
1467                 if (value > MAX_CFLOWS)
1468                         value = MAX_CFLOWS;
1469
1470                 pkt_dev->cflows = value;
1471                 sprintf(pg_result, "OK: flows=%u", pkt_dev->cflows);
1472                 return count;
1473         }
1474
1475         if (!strcmp(name, "flowlen")) {
1476                 len = num_arg(&user_buffer[i], 10, &value);
1477                 if (len < 0)
1478                         return len;
1479
1480                 i += len;
1481                 pkt_dev->lflow = value;
1482                 sprintf(pg_result, "OK: flowlen=%u", pkt_dev->lflow);
1483                 return count;
1484         }
1485
1486         if (!strcmp(name, "queue_map_min")) {
1487                 len = num_arg(&user_buffer[i], 5, &value);
1488                 if (len < 0)
1489                         return len;
1490
1491                 i += len;
1492                 pkt_dev->queue_map_min = value;
1493                 sprintf(pg_result, "OK: queue_map_min=%u", pkt_dev->queue_map_min);
1494                 return count;
1495         }
1496
1497         if (!strcmp(name, "queue_map_max")) {
1498                 len = num_arg(&user_buffer[i], 5, &value);
1499                 if (len < 0)
1500                         return len;
1501
1502                 i += len;
1503                 pkt_dev->queue_map_max = value;
1504                 sprintf(pg_result, "OK: queue_map_max=%u", pkt_dev->queue_map_max);
1505                 return count;
1506         }
1507
1508         if (!strcmp(name, "mpls")) {
1509                 unsigned int n, cnt;
1510
1511                 len = get_labels(&user_buffer[i], pkt_dev);
1512                 if (len < 0)
1513                         return len;
1514                 i += len;
1515                 cnt = sprintf(pg_result, "OK: mpls=");
1516                 for (n = 0; n < pkt_dev->nr_labels; n++)
1517                         cnt += sprintf(pg_result + cnt,
1518                                        "%08x%s", ntohl(pkt_dev->labels[n]),
1519                                        n == pkt_dev->nr_labels-1 ? "" : ",");
1520
1521                 if (pkt_dev->nr_labels && pkt_dev->vlan_id != 0xffff) {
1522                         pkt_dev->vlan_id = 0xffff; /* turn off VLAN/SVLAN */
1523                         pkt_dev->svlan_id = 0xffff;
1524
1525                         if (debug)
1526                                 pr_debug("VLAN/SVLAN auto turned off\n");
1527                 }
1528                 return count;
1529         }
1530
1531         if (!strcmp(name, "vlan_id")) {
1532                 len = num_arg(&user_buffer[i], 4, &value);
1533                 if (len < 0)
1534                         return len;
1535
1536                 i += len;
1537                 if (value <= 4095) {
1538                         pkt_dev->vlan_id = value;  /* turn on VLAN */
1539
1540                         if (debug)
1541                                 pr_debug("VLAN turned on\n");
1542
1543                         if (debug && pkt_dev->nr_labels)
1544                                 pr_debug("MPLS auto turned off\n");
1545
1546                         pkt_dev->nr_labels = 0;    /* turn off MPLS */
1547                         sprintf(pg_result, "OK: vlan_id=%u", pkt_dev->vlan_id);
1548                 } else {
1549                         pkt_dev->vlan_id = 0xffff; /* turn off VLAN/SVLAN */
1550                         pkt_dev->svlan_id = 0xffff;
1551
1552                         if (debug)
1553                                 pr_debug("VLAN/SVLAN turned off\n");
1554                 }
1555                 return count;
1556         }
1557
1558         if (!strcmp(name, "vlan_p")) {
1559                 len = num_arg(&user_buffer[i], 1, &value);
1560                 if (len < 0)
1561                         return len;
1562
1563                 i += len;
1564                 if ((value <= 7) && (pkt_dev->vlan_id != 0xffff)) {
1565                         pkt_dev->vlan_p = value;
1566                         sprintf(pg_result, "OK: vlan_p=%u", pkt_dev->vlan_p);
1567                 } else {
1568                         sprintf(pg_result, "ERROR: vlan_p must be 0-7");
1569                 }
1570                 return count;
1571         }
1572
1573         if (!strcmp(name, "vlan_cfi")) {
1574                 len = num_arg(&user_buffer[i], 1, &value);
1575                 if (len < 0)
1576                         return len;
1577
1578                 i += len;
1579                 if ((value <= 1) && (pkt_dev->vlan_id != 0xffff)) {
1580                         pkt_dev->vlan_cfi = value;
1581                         sprintf(pg_result, "OK: vlan_cfi=%u", pkt_dev->vlan_cfi);
1582                 } else {
1583                         sprintf(pg_result, "ERROR: vlan_cfi must be 0-1");
1584                 }
1585                 return count;
1586         }
1587
1588         if (!strcmp(name, "svlan_id")) {
1589                 len = num_arg(&user_buffer[i], 4, &value);
1590                 if (len < 0)
1591                         return len;
1592
1593                 i += len;
1594                 if ((value <= 4095) && ((pkt_dev->vlan_id != 0xffff))) {
1595                         pkt_dev->svlan_id = value;  /* turn on SVLAN */
1596
1597                         if (debug)
1598                                 pr_debug("SVLAN turned on\n");
1599
1600                         if (debug && pkt_dev->nr_labels)
1601                                 pr_debug("MPLS auto turned off\n");
1602
1603                         pkt_dev->nr_labels = 0;    /* turn off MPLS */
1604                         sprintf(pg_result, "OK: svlan_id=%u", pkt_dev->svlan_id);
1605                 } else {
1606                         pkt_dev->vlan_id = 0xffff; /* turn off VLAN/SVLAN */
1607                         pkt_dev->svlan_id = 0xffff;
1608
1609                         if (debug)
1610                                 pr_debug("VLAN/SVLAN turned off\n");
1611                 }
1612                 return count;
1613         }
1614
1615         if (!strcmp(name, "svlan_p")) {
1616                 len = num_arg(&user_buffer[i], 1, &value);
1617                 if (len < 0)
1618                         return len;
1619
1620                 i += len;
1621                 if ((value <= 7) && (pkt_dev->svlan_id != 0xffff)) {
1622                         pkt_dev->svlan_p = value;
1623                         sprintf(pg_result, "OK: svlan_p=%u", pkt_dev->svlan_p);
1624                 } else {
1625                         sprintf(pg_result, "ERROR: svlan_p must be 0-7");
1626                 }
1627                 return count;
1628         }
1629
1630         if (!strcmp(name, "svlan_cfi")) {
1631                 len = num_arg(&user_buffer[i], 1, &value);
1632                 if (len < 0)
1633                         return len;
1634
1635                 i += len;
1636                 if ((value <= 1) && (pkt_dev->svlan_id != 0xffff)) {
1637                         pkt_dev->svlan_cfi = value;
1638                         sprintf(pg_result, "OK: svlan_cfi=%u", pkt_dev->svlan_cfi);
1639                 } else {
1640                         sprintf(pg_result, "ERROR: svlan_cfi must be 0-1");
1641                 }
1642                 return count;
1643         }
1644
1645         if (!strcmp(name, "tos")) {
1646                 __u32 tmp_value = 0;
1647                 len = hex32_arg(&user_buffer[i], 2, &tmp_value);
1648                 if (len < 0)
1649                         return len;
1650
1651                 i += len;
1652                 if (len == 2) {
1653                         pkt_dev->tos = tmp_value;
1654                         sprintf(pg_result, "OK: tos=0x%02x", pkt_dev->tos);
1655                 } else {
1656                         sprintf(pg_result, "ERROR: tos must be 00-ff");
1657                 }
1658                 return count;
1659         }
1660
1661         if (!strcmp(name, "traffic_class")) {
1662                 __u32 tmp_value = 0;
1663                 len = hex32_arg(&user_buffer[i], 2, &tmp_value);
1664                 if (len < 0)
1665                         return len;
1666
1667                 i += len;
1668                 if (len == 2) {
1669                         pkt_dev->traffic_class = tmp_value;
1670                         sprintf(pg_result, "OK: traffic_class=0x%02x", pkt_dev->traffic_class);
1671                 } else {
1672                         sprintf(pg_result, "ERROR: traffic_class must be 00-ff");
1673                 }
1674                 return count;
1675         }
1676
1677         if (!strcmp(name, "skb_priority")) {
1678                 len = num_arg(&user_buffer[i], 9, &value);
1679                 if (len < 0)
1680                         return len;
1681
1682                 i += len;
1683                 pkt_dev->skb_priority = value;
1684                 sprintf(pg_result, "OK: skb_priority=%i",
1685                         pkt_dev->skb_priority);
1686                 return count;
1687         }
1688
1689         sprintf(pkt_dev->result, "No such parameter \"%s\"", name);
1690         return -EINVAL;
1691 }
1692
1693 static int pktgen_if_open(struct inode *inode, struct file *file)
1694 {
1695         return single_open(file, pktgen_if_show, PDE(inode)->data);
1696 }
1697
1698 static const struct file_operations pktgen_if_fops = {
1699         .owner   = THIS_MODULE,
1700         .open    = pktgen_if_open,
1701         .read    = seq_read,
1702         .llseek  = seq_lseek,
1703         .write   = pktgen_if_write,
1704         .release = single_release,
1705 };
1706
1707 static int pktgen_thread_show(struct seq_file *seq, void *v)
1708 {
1709         struct pktgen_thread *t = seq->private;
1710         const struct pktgen_dev *pkt_dev;
1711
1712         BUG_ON(!t);
1713
1714         seq_printf(seq, "Running: ");
1715
1716         if_lock(t);
1717         list_for_each_entry(pkt_dev, &t->if_list, list)
1718                 if (pkt_dev->running)
1719                         seq_printf(seq, "%s ", pkt_dev->odevname);
1720
1721         seq_printf(seq, "\nStopped: ");
1722
1723         list_for_each_entry(pkt_dev, &t->if_list, list)
1724                 if (!pkt_dev->running)
1725                         seq_printf(seq, "%s ", pkt_dev->odevname);
1726
1727         if (t->result[0])
1728                 seq_printf(seq, "\nResult: %s\n", t->result);
1729         else
1730                 seq_printf(seq, "\nResult: NA\n");
1731
1732         if_unlock(t);
1733
1734         return 0;
1735 }
1736
1737 static ssize_t pktgen_thread_write(struct file *file,
1738                                    const char __user * user_buffer,
1739                                    size_t count, loff_t * offset)
1740 {
1741         struct seq_file *seq = file->private_data;
1742         struct pktgen_thread *t = seq->private;
1743         int i, max, len, ret;
1744         char name[40];
1745         char *pg_result;
1746
1747         if (count < 1) {
1748                 //      sprintf(pg_result, "Wrong command format");
1749                 return -EINVAL;
1750         }
1751
1752         max = count;
1753         len = count_trail_chars(user_buffer, max);
1754         if (len < 0)
1755                 return len;
1756
1757         i = len;
1758
1759         /* Read variable name */
1760
1761         len = strn_len(&user_buffer[i], sizeof(name) - 1);
1762         if (len < 0)
1763                 return len;
1764
1765         memset(name, 0, sizeof(name));
1766         if (copy_from_user(name, &user_buffer[i], len))
1767                 return -EFAULT;
1768         i += len;
1769
1770         max = count - i;
1771         len = count_trail_chars(&user_buffer[i], max);
1772         if (len < 0)
1773                 return len;
1774
1775         i += len;
1776
1777         if (debug)
1778                 pr_debug("t=%s, count=%lu\n", name, (unsigned long)count);
1779
1780         if (!t) {
1781                 pr_err("ERROR: No thread\n");
1782                 ret = -EINVAL;
1783                 goto out;
1784         }
1785
1786         pg_result = &(t->result[0]);
1787
1788         if (!strcmp(name, "add_device")) {
1789                 char f[32];
1790                 memset(f, 0, 32);
1791                 len = strn_len(&user_buffer[i], sizeof(f) - 1);
1792                 if (len < 0) {
1793                         ret = len;
1794                         goto out;
1795                 }
1796                 if (copy_from_user(f, &user_buffer[i], len))
1797                         return -EFAULT;
1798                 i += len;
1799                 mutex_lock(&pktgen_thread_lock);
1800                 pktgen_add_device(t, f);
1801                 mutex_unlock(&pktgen_thread_lock);
1802                 ret = count;
1803                 sprintf(pg_result, "OK: add_device=%s", f);
1804                 goto out;
1805         }
1806
1807         if (!strcmp(name, "rem_device_all")) {
1808                 mutex_lock(&pktgen_thread_lock);
1809                 t->control |= T_REMDEVALL;
1810                 mutex_unlock(&pktgen_thread_lock);
1811                 schedule_timeout_interruptible(msecs_to_jiffies(125));  /* Propagate thread->control  */
1812                 ret = count;
1813                 sprintf(pg_result, "OK: rem_device_all");
1814                 goto out;
1815         }
1816
1817         if (!strcmp(name, "max_before_softirq")) {
1818                 sprintf(pg_result, "OK: Note! max_before_softirq is obsoleted -- Do not use");
1819                 ret = count;
1820                 goto out;
1821         }
1822
1823         ret = -EINVAL;
1824 out:
1825         return ret;
1826 }
1827
1828 static int pktgen_thread_open(struct inode *inode, struct file *file)
1829 {
1830         return single_open(file, pktgen_thread_show, PDE(inode)->data);
1831 }
1832
1833 static const struct file_operations pktgen_thread_fops = {
1834         .owner   = THIS_MODULE,
1835         .open    = pktgen_thread_open,
1836         .read    = seq_read,
1837         .llseek  = seq_lseek,
1838         .write   = pktgen_thread_write,
1839         .release = single_release,
1840 };
1841
1842 /* Think find or remove for NN */
1843 static struct pktgen_dev *__pktgen_NN_threads(const char *ifname, int remove)
1844 {
1845         struct pktgen_thread *t;
1846         struct pktgen_dev *pkt_dev = NULL;
1847         bool exact = (remove == FIND);
1848
1849         list_for_each_entry(t, &pktgen_threads, th_list) {
1850                 pkt_dev = pktgen_find_dev(t, ifname, exact);
1851                 if (pkt_dev) {
1852                         if (remove) {
1853                                 if_lock(t);
1854                                 pkt_dev->removal_mark = 1;
1855                                 t->control |= T_REMDEV;
1856                                 if_unlock(t);
1857                         }
1858                         break;
1859                 }
1860         }
1861         return pkt_dev;
1862 }
1863
1864 /*
1865  * mark a device for removal
1866  */
1867 static void pktgen_mark_device(const char *ifname)
1868 {
1869         struct pktgen_dev *pkt_dev = NULL;
1870         const int max_tries = 10, msec_per_try = 125;
1871         int i = 0;
1872
1873         mutex_lock(&pktgen_thread_lock);
1874         pr_debug("%s: marking %s for removal\n", __func__, ifname);
1875
1876         while (1) {
1877
1878                 pkt_dev = __pktgen_NN_threads(ifname, REMOVE);
1879                 if (pkt_dev == NULL)
1880                         break;  /* success */
1881
1882                 mutex_unlock(&pktgen_thread_lock);
1883                 pr_debug("%s: waiting for %s to disappear....\n",
1884                          __func__, ifname);
1885                 schedule_timeout_interruptible(msecs_to_jiffies(msec_per_try));
1886                 mutex_lock(&pktgen_thread_lock);
1887
1888                 if (++i >= max_tries) {
1889                         pr_err("%s: timed out after waiting %d msec for device %s to be removed\n",
1890                                __func__, msec_per_try * i, ifname);
1891                         break;
1892                 }
1893
1894         }
1895
1896         mutex_unlock(&pktgen_thread_lock);
1897 }
1898
1899 static void pktgen_change_name(struct net_device *dev)
1900 {
1901         struct pktgen_thread *t;
1902
1903         list_for_each_entry(t, &pktgen_threads, th_list) {
1904                 struct pktgen_dev *pkt_dev;
1905
1906                 list_for_each_entry(pkt_dev, &t->if_list, list) {
1907                         if (pkt_dev->odev != dev)
1908                                 continue;
1909
1910                         remove_proc_entry(pkt_dev->entry->name, pg_proc_dir);
1911
1912                         pkt_dev->entry = proc_create_data(dev->name, 0600,
1913                                                           pg_proc_dir,
1914                                                           &pktgen_if_fops,
1915                                                           pkt_dev);
1916                         if (!pkt_dev->entry)
1917                                 pr_err("can't move proc entry for '%s'\n",
1918                                        dev->name);
1919                         break;
1920                 }
1921         }
1922 }
1923
1924 static int pktgen_device_event(struct notifier_block *unused,
1925                                unsigned long event, void *ptr)
1926 {
1927         struct net_device *dev = ptr;
1928
1929         if (!net_eq(dev_net(dev), &init_net) || pktgen_exiting)
1930                 return NOTIFY_DONE;
1931
1932         /* It is OK that we do not hold the group lock right now,
1933          * as we run under the RTNL lock.
1934          */
1935
1936         switch (event) {
1937         case NETDEV_CHANGENAME:
1938                 pktgen_change_name(dev);
1939                 break;
1940
1941         case NETDEV_UNREGISTER:
1942                 pktgen_mark_device(dev->name);
1943                 break;
1944         }
1945
1946         return NOTIFY_DONE;
1947 }
1948
1949 static struct net_device *pktgen_dev_get_by_name(struct pktgen_dev *pkt_dev,
1950                                                  const char *ifname)
1951 {
1952         char b[IFNAMSIZ+5];
1953         int i;
1954
1955         for (i = 0; ifname[i] != '@'; i++) {
1956                 if (i == IFNAMSIZ)
1957                         break;
1958
1959                 b[i] = ifname[i];
1960         }
1961         b[i] = 0;
1962
1963         return dev_get_by_name(&init_net, b);
1964 }
1965
1966
1967 /* Associate pktgen_dev with a device. */
1968
1969 static int pktgen_setup_dev(struct pktgen_dev *pkt_dev, const char *ifname)
1970 {
1971         struct net_device *odev;
1972         int err;
1973
1974         /* Clean old setups */
1975         if (pkt_dev->odev) {
1976                 dev_put(pkt_dev->odev);
1977                 pkt_dev->odev = NULL;
1978         }
1979
1980         odev = pktgen_dev_get_by_name(pkt_dev, ifname);
1981         if (!odev) {
1982                 pr_err("no such netdevice: \"%s\"\n", ifname);
1983                 return -ENODEV;
1984         }
1985
1986         if (odev->type != ARPHRD_ETHER) {
1987                 pr_err("not an ethernet device: \"%s\"\n", ifname);
1988                 err = -EINVAL;
1989         } else if (!netif_running(odev)) {
1990                 pr_err("device is down: \"%s\"\n", ifname);
1991                 err = -ENETDOWN;
1992         } else {
1993                 pkt_dev->odev = odev;
1994                 return 0;
1995         }
1996
1997         dev_put(odev);
1998         return err;
1999 }
2000
2001 /* Read pkt_dev from the interface and set up internal pktgen_dev
2002  * structure to have the right information to create/send packets
2003  */
2004 static void pktgen_setup_inject(struct pktgen_dev *pkt_dev)
2005 {
2006         int ntxq;
2007
2008         if (!pkt_dev->odev) {
2009                 pr_err("ERROR: pkt_dev->odev == NULL in setup_inject\n");
2010                 sprintf(pkt_dev->result,
2011                         "ERROR: pkt_dev->odev == NULL in setup_inject.\n");
2012                 return;
2013         }
2014
2015         /* make sure that we don't pick a non-existing transmit queue */
2016         ntxq = pkt_dev->odev->real_num_tx_queues;
2017
2018         if (ntxq <= pkt_dev->queue_map_min) {
2019                 pr_warning("WARNING: Requested queue_map_min (zero-based) (%d) exceeds valid range [0 - %d] for (%d) queues on %s, resetting\n",
2020                            pkt_dev->queue_map_min, (ntxq ?: 1) - 1, ntxq,
2021                            pkt_dev->odevname);
2022                 pkt_dev->queue_map_min = (ntxq ?: 1) - 1;
2023         }
2024         if (pkt_dev->queue_map_max >= ntxq) {
2025                 pr_warning("WARNING: Requested queue_map_max (zero-based) (%d) exceeds valid range [0 - %d] for (%d) queues on %s, resetting\n",
2026                            pkt_dev->queue_map_max, (ntxq ?: 1) - 1, ntxq,
2027                            pkt_dev->odevname);
2028                 pkt_dev->queue_map_max = (ntxq ?: 1) - 1;
2029         }
2030
2031         /* Default to the interface's mac if not explicitly set. */
2032
2033         if (is_zero_ether_addr(pkt_dev->src_mac))
2034                 memcpy(&(pkt_dev->hh[6]), pkt_dev->odev->dev_addr, ETH_ALEN);
2035
2036         /* Set up Dest MAC */
2037         memcpy(&(pkt_dev->hh[0]), pkt_dev->dst_mac, ETH_ALEN);
2038
2039         if (pkt_dev->flags & F_IPV6) {
2040                 int i, set = 0, err = 1;
2041                 struct inet6_dev *idev;
2042
2043                 if (pkt_dev->min_pkt_size == 0) {
2044                         pkt_dev->min_pkt_size = 14 + sizeof(struct ipv6hdr)
2045                                                 + sizeof(struct udphdr)
2046                                                 + sizeof(struct pktgen_hdr)
2047                                                 + pkt_dev->pkt_overhead;
2048                 }
2049
2050                 for (i = 0; i < IN6_ADDR_HSIZE; i++)
2051                         if (pkt_dev->cur_in6_saddr.s6_addr[i]) {
2052                                 set = 1;
2053                                 break;
2054                         }
2055
2056                 if (!set) {
2057
2058                         /*
2059                          * Use linklevel address if unconfigured.
2060                          *
2061                          * use ipv6_get_lladdr if/when it's get exported
2062                          */
2063
2064                         rcu_read_lock();
2065                         idev = __in6_dev_get(pkt_dev->odev);
2066                         if (idev) {
2067                                 struct inet6_ifaddr *ifp;
2068
2069                                 read_lock_bh(&idev->lock);
2070                                 list_for_each_entry(ifp, &idev->addr_list, if_list) {
2071                                         if ((ifp->scope & IFA_LINK) &&
2072                                             !(ifp->flags & IFA_F_TENTATIVE)) {
2073                                                 pkt_dev->cur_in6_saddr = ifp->addr;
2074                                                 err = 0;
2075                                                 break;
2076                                         }
2077                                 }
2078                                 read_unlock_bh(&idev->lock);
2079                         }
2080                         rcu_read_unlock();
2081                         if (err)
2082                                 pr_err("ERROR: IPv6 link address not available\n");
2083                 }
2084         } else {
2085                 if (pkt_dev->min_pkt_size == 0) {
2086                         pkt_dev->min_pkt_size = 14 + sizeof(struct iphdr)
2087                                                 + sizeof(struct udphdr)
2088                                                 + sizeof(struct pktgen_hdr)
2089                                                 + pkt_dev->pkt_overhead;
2090                 }
2091
2092                 pkt_dev->saddr_min = 0;
2093                 pkt_dev->saddr_max = 0;
2094                 if (strlen(pkt_dev->src_min) == 0) {
2095
2096                         struct in_device *in_dev;
2097
2098                         rcu_read_lock();
2099                         in_dev = __in_dev_get_rcu(pkt_dev->odev);
2100                         if (in_dev) {
2101                                 if (in_dev->ifa_list) {
2102                                         pkt_dev->saddr_min =
2103                                             in_dev->ifa_list->ifa_address;
2104                                         pkt_dev->saddr_max = pkt_dev->saddr_min;
2105                                 }
2106                         }
2107                         rcu_read_unlock();
2108                 } else {
2109                         pkt_dev->saddr_min = in_aton(pkt_dev->src_min);
2110                         pkt_dev->saddr_max = in_aton(pkt_dev->src_max);
2111                 }
2112
2113                 pkt_dev->daddr_min = in_aton(pkt_dev->dst_min);
2114                 pkt_dev->daddr_max = in_aton(pkt_dev->dst_max);
2115         }
2116         /* Initialize current values. */
2117         pkt_dev->cur_pkt_size = pkt_dev->min_pkt_size;
2118         if (pkt_dev->min_pkt_size > pkt_dev->max_pkt_size)
2119                 pkt_dev->max_pkt_size = pkt_dev->min_pkt_size;
2120
2121         pkt_dev->cur_dst_mac_offset = 0;
2122         pkt_dev->cur_src_mac_offset = 0;
2123         pkt_dev->cur_saddr = pkt_dev->saddr_min;
2124         pkt_dev->cur_daddr = pkt_dev->daddr_min;
2125         pkt_dev->cur_udp_dst = pkt_dev->udp_dst_min;
2126         pkt_dev->cur_udp_src = pkt_dev->udp_src_min;
2127         pkt_dev->nflows = 0;
2128 }
2129
2130
2131 static void spin(struct pktgen_dev *pkt_dev, ktime_t spin_until)
2132 {
2133         ktime_t start_time, end_time;
2134         s64 remaining;
2135         struct hrtimer_sleeper t;
2136
2137         hrtimer_init_on_stack(&t.timer, CLOCK_MONOTONIC, HRTIMER_MODE_ABS);
2138         hrtimer_set_expires(&t.timer, spin_until);
2139
2140         remaining = ktime_to_ns(hrtimer_expires_remaining(&t.timer));
2141         if (remaining <= 0) {
2142                 pkt_dev->next_tx = ktime_add_ns(spin_until, pkt_dev->delay);
2143                 return;
2144         }
2145
2146         start_time = ktime_now();
2147         if (remaining < 100000) {
2148                 /* for small delays (<100us), just loop until limit is reached */
2149                 do {
2150                         end_time = ktime_now();
2151                 } while (ktime_lt(end_time, spin_until));
2152         } else {
2153                 /* see do_nanosleep */
2154                 hrtimer_init_sleeper(&t, current);
2155                 do {
2156                         set_current_state(TASK_INTERRUPTIBLE);
2157                         hrtimer_start_expires(&t.timer, HRTIMER_MODE_ABS);
2158                         if (!hrtimer_active(&t.timer))
2159                                 t.task = NULL;
2160
2161                         if (likely(t.task))
2162                                 schedule();
2163
2164                         hrtimer_cancel(&t.timer);
2165                 } while (t.task && pkt_dev->running && !signal_pending(current));
2166                 __set_current_state(TASK_RUNNING);
2167                 end_time = ktime_now();
2168         }
2169
2170         pkt_dev->idle_acc += ktime_to_ns(ktime_sub(end_time, start_time));
2171         pkt_dev->next_tx = ktime_add_ns(spin_until, pkt_dev->delay);
2172 }
2173
2174 static inline void set_pkt_overhead(struct pktgen_dev *pkt_dev)
2175 {
2176         pkt_dev->pkt_overhead = 0;
2177         pkt_dev->pkt_overhead += pkt_dev->nr_labels*sizeof(u32);
2178         pkt_dev->pkt_overhead += VLAN_TAG_SIZE(pkt_dev);
2179         pkt_dev->pkt_overhead += SVLAN_TAG_SIZE(pkt_dev);
2180 }
2181
2182 static inline int f_seen(const struct pktgen_dev *pkt_dev, int flow)
2183 {
2184         return !!(pkt_dev->flows[flow].flags & F_INIT);
2185 }
2186
2187 static inline int f_pick(struct pktgen_dev *pkt_dev)
2188 {
2189         int flow = pkt_dev->curfl;
2190
2191         if (pkt_dev->flags & F_FLOW_SEQ) {
2192                 if (pkt_dev->flows[flow].count >= pkt_dev->lflow) {
2193                         /* reset time */
2194                         pkt_dev->flows[flow].count = 0;
2195                         pkt_dev->flows[flow].flags = 0;
2196                         pkt_dev->curfl += 1;
2197                         if (pkt_dev->curfl >= pkt_dev->cflows)
2198                                 pkt_dev->curfl = 0; /*reset */
2199                 }
2200         } else {
2201                 flow = random32() % pkt_dev->cflows;
2202                 pkt_dev->curfl = flow;
2203
2204                 if (pkt_dev->flows[flow].count > pkt_dev->lflow) {
2205                         pkt_dev->flows[flow].count = 0;
2206                         pkt_dev->flows[flow].flags = 0;
2207                 }
2208         }
2209
2210         return pkt_dev->curfl;
2211 }
2212
2213
2214 #ifdef CONFIG_XFRM
2215 /* If there was already an IPSEC SA, we keep it as is, else
2216  * we go look for it ...
2217 */
2218 #define DUMMY_MARK 0
2219 static void get_ipsec_sa(struct pktgen_dev *pkt_dev, int flow)
2220 {
2221         struct xfrm_state *x = pkt_dev->flows[flow].x;
2222         if (!x) {
2223                 /*slow path: we dont already have xfrm_state*/
2224                 x = xfrm_stateonly_find(&init_net, DUMMY_MARK,
2225                                         (xfrm_address_t *)&pkt_dev->cur_daddr,
2226                                         (xfrm_address_t *)&pkt_dev->cur_saddr,
2227                                         AF_INET,
2228                                         pkt_dev->ipsmode,
2229                                         pkt_dev->ipsproto, 0);
2230                 if (x) {
2231                         pkt_dev->flows[flow].x = x;
2232                         set_pkt_overhead(pkt_dev);
2233                         pkt_dev->pkt_overhead += x->props.header_len;
2234                 }
2235
2236         }
2237 }
2238 #endif
2239 static void set_cur_queue_map(struct pktgen_dev *pkt_dev)
2240 {
2241
2242         if (pkt_dev->flags & F_QUEUE_MAP_CPU)
2243                 pkt_dev->cur_queue_map = smp_processor_id();
2244
2245         else if (pkt_dev->queue_map_min <= pkt_dev->queue_map_max) {
2246                 __u16 t;
2247                 if (pkt_dev->flags & F_QUEUE_MAP_RND) {
2248                         t = random32() %
2249                                 (pkt_dev->queue_map_max -
2250                                  pkt_dev->queue_map_min + 1)
2251                                 + pkt_dev->queue_map_min;
2252                 } else {
2253                         t = pkt_dev->cur_queue_map + 1;
2254                         if (t > pkt_dev->queue_map_max)
2255                                 t = pkt_dev->queue_map_min;
2256                 }
2257                 pkt_dev->cur_queue_map = t;
2258         }
2259         pkt_dev->cur_queue_map  = pkt_dev->cur_queue_map % pkt_dev->odev->real_num_tx_queues;
2260 }
2261
2262 /* Increment/randomize headers according to flags and current values
2263  * for IP src/dest, UDP src/dst port, MAC-Addr src/dst
2264  */
2265 static void mod_cur_headers(struct pktgen_dev *pkt_dev)
2266 {
2267         __u32 imn;
2268         __u32 imx;
2269         int flow = 0;
2270
2271         if (pkt_dev->cflows)
2272                 flow = f_pick(pkt_dev);
2273
2274         /*  Deal with source MAC */
2275         if (pkt_dev->src_mac_count > 1) {
2276                 __u32 mc;
2277                 __u32 tmp;
2278
2279                 if (pkt_dev->flags & F_MACSRC_RND)
2280                         mc = random32() % pkt_dev->src_mac_count;
2281                 else {
2282                         mc = pkt_dev->cur_src_mac_offset++;
2283                         if (pkt_dev->cur_src_mac_offset >=
2284                             pkt_dev->src_mac_count)
2285                                 pkt_dev->cur_src_mac_offset = 0;
2286                 }
2287
2288                 tmp = pkt_dev->src_mac[5] + (mc & 0xFF);
2289                 pkt_dev->hh[11] = tmp;
2290                 tmp = (pkt_dev->src_mac[4] + ((mc >> 8) & 0xFF) + (tmp >> 8));
2291                 pkt_dev->hh[10] = tmp;
2292                 tmp = (pkt_dev->src_mac[3] + ((mc >> 16) & 0xFF) + (tmp >> 8));
2293                 pkt_dev->hh[9] = tmp;
2294                 tmp = (pkt_dev->src_mac[2] + ((mc >> 24) & 0xFF) + (tmp >> 8));
2295                 pkt_dev->hh[8] = tmp;
2296                 tmp = (pkt_dev->src_mac[1] + (tmp >> 8));
2297                 pkt_dev->hh[7] = tmp;
2298         }
2299
2300         /*  Deal with Destination MAC */
2301         if (pkt_dev->dst_mac_count > 1) {
2302                 __u32 mc;
2303                 __u32 tmp;
2304
2305                 if (pkt_dev->flags & F_MACDST_RND)
2306                         mc = random32() % pkt_dev->dst_mac_count;
2307
2308                 else {
2309                         mc = pkt_dev->cur_dst_mac_offset++;
2310                         if (pkt_dev->cur_dst_mac_offset >=
2311                             pkt_dev->dst_mac_count) {
2312                                 pkt_dev->cur_dst_mac_offset = 0;
2313                         }
2314                 }
2315
2316                 tmp = pkt_dev->dst_mac[5] + (mc & 0xFF);
2317                 pkt_dev->hh[5] = tmp;
2318                 tmp = (pkt_dev->dst_mac[4] + ((mc >> 8) & 0xFF) + (tmp >> 8));
2319                 pkt_dev->hh[4] = tmp;
2320                 tmp = (pkt_dev->dst_mac[3] + ((mc >> 16) & 0xFF) + (tmp >> 8));
2321                 pkt_dev->hh[3] = tmp;
2322                 tmp = (pkt_dev->dst_mac[2] + ((mc >> 24) & 0xFF) + (tmp >> 8));
2323                 pkt_dev->hh[2] = tmp;
2324                 tmp = (pkt_dev->dst_mac[1] + (tmp >> 8));
2325                 pkt_dev->hh[1] = tmp;
2326         }
2327
2328         if (pkt_dev->flags & F_MPLS_RND) {
2329                 unsigned int i;
2330                 for (i = 0; i < pkt_dev->nr_labels; i++)
2331                         if (pkt_dev->labels[i] & MPLS_STACK_BOTTOM)
2332                                 pkt_dev->labels[i] = MPLS_STACK_BOTTOM |
2333                                              ((__force __be32)random32() &
2334                                                       htonl(0x000fffff));
2335         }
2336
2337         if ((pkt_dev->flags & F_VID_RND) && (pkt_dev->vlan_id != 0xffff)) {
2338                 pkt_dev->vlan_id = random32() & (4096-1);
2339         }
2340
2341         if ((pkt_dev->flags & F_SVID_RND) && (pkt_dev->svlan_id != 0xffff)) {
2342                 pkt_dev->svlan_id = random32() & (4096 - 1);
2343         }
2344
2345         if (pkt_dev->udp_src_min < pkt_dev->udp_src_max) {
2346                 if (pkt_dev->flags & F_UDPSRC_RND)
2347                         pkt_dev->cur_udp_src = random32() %
2348                                 (pkt_dev->udp_src_max - pkt_dev->udp_src_min)
2349                                 + pkt_dev->udp_src_min;
2350
2351                 else {
2352                         pkt_dev->cur_udp_src++;
2353                         if (pkt_dev->cur_udp_src >= pkt_dev->udp_src_max)
2354                                 pkt_dev->cur_udp_src = pkt_dev->udp_src_min;
2355                 }
2356         }
2357
2358         if (pkt_dev->udp_dst_min < pkt_dev->udp_dst_max) {
2359                 if (pkt_dev->flags & F_UDPDST_RND) {
2360                         pkt_dev->cur_udp_dst = random32() %
2361                                 (pkt_dev->udp_dst_max - pkt_dev->udp_dst_min)
2362                                 + pkt_dev->udp_dst_min;
2363                 } else {
2364                         pkt_dev->cur_udp_dst++;
2365                         if (pkt_dev->cur_udp_dst >= pkt_dev->udp_dst_max)
2366                                 pkt_dev->cur_udp_dst = pkt_dev->udp_dst_min;
2367                 }
2368         }
2369
2370         if (!(pkt_dev->flags & F_IPV6)) {
2371
2372                 imn = ntohl(pkt_dev->saddr_min);
2373                 imx = ntohl(pkt_dev->saddr_max);
2374                 if (imn < imx) {
2375                         __u32 t;
2376                         if (pkt_dev->flags & F_IPSRC_RND)
2377                                 t = random32() % (imx - imn) + imn;
2378                         else {
2379                                 t = ntohl(pkt_dev->cur_saddr);
2380                                 t++;
2381                                 if (t > imx)
2382                                         t = imn;
2383
2384                         }
2385                         pkt_dev->cur_saddr = htonl(t);
2386                 }
2387
2388                 if (pkt_dev->cflows && f_seen(pkt_dev, flow)) {
2389                         pkt_dev->cur_daddr = pkt_dev->flows[flow].cur_daddr;
2390                 } else {
2391                         imn = ntohl(pkt_dev->daddr_min);
2392                         imx = ntohl(pkt_dev->daddr_max);
2393                         if (imn < imx) {
2394                                 __u32 t;
2395                                 __be32 s;
2396                                 if (pkt_dev->flags & F_IPDST_RND) {
2397
2398                                         t = random32() % (imx - imn) + imn;
2399                                         s = htonl(t);
2400
2401                                         while (ipv4_is_loopback(s) ||
2402                                                ipv4_is_multicast(s) ||
2403                                                ipv4_is_lbcast(s) ||
2404                                                ipv4_is_zeronet(s) ||
2405                                                ipv4_is_local_multicast(s)) {
2406                                                 t = random32() % (imx - imn) + imn;
2407                                                 s = htonl(t);
2408                                         }
2409                                         pkt_dev->cur_daddr = s;
2410                                 } else {
2411                                         t = ntohl(pkt_dev->cur_daddr);
2412                                         t++;
2413                                         if (t > imx) {
2414                                                 t = imn;
2415                                         }
2416                                         pkt_dev->cur_daddr = htonl(t);
2417                                 }
2418                         }
2419                         if (pkt_dev->cflows) {
2420                                 pkt_dev->flows[flow].flags |= F_INIT;
2421                                 pkt_dev->flows[flow].cur_daddr =
2422                                     pkt_dev->cur_daddr;
2423 #ifdef CONFIG_XFRM
2424                                 if (pkt_dev->flags & F_IPSEC_ON)
2425                                         get_ipsec_sa(pkt_dev, flow);
2426 #endif
2427                                 pkt_dev->nflows++;
2428                         }
2429                 }
2430         } else {                /* IPV6 * */
2431
2432                 if (pkt_dev->min_in6_daddr.s6_addr32[0] == 0 &&
2433                     pkt_dev->min_in6_daddr.s6_addr32[1] == 0 &&
2434                     pkt_dev->min_in6_daddr.s6_addr32[2] == 0 &&
2435                     pkt_dev->min_in6_daddr.s6_addr32[3] == 0) ;
2436                 else {
2437                         int i;
2438
2439                         /* Only random destinations yet */
2440
2441                         for (i = 0; i < 4; i++) {
2442                                 pkt_dev->cur_in6_daddr.s6_addr32[i] =
2443                                     (((__force __be32)random32() |
2444                                       pkt_dev->min_in6_daddr.s6_addr32[i]) &
2445                                      pkt_dev->max_in6_daddr.s6_addr32[i]);
2446                         }
2447                 }
2448         }
2449
2450         if (pkt_dev->min_pkt_size < pkt_dev->max_pkt_size) {
2451                 __u32 t;
2452                 if (pkt_dev->flags & F_TXSIZE_RND) {
2453                         t = random32() %
2454                                 (pkt_dev->max_pkt_size - pkt_dev->min_pkt_size)
2455                                 + pkt_dev->min_pkt_size;
2456                 } else {
2457                         t = pkt_dev->cur_pkt_size + 1;
2458                         if (t > pkt_dev->max_pkt_size)
2459                                 t = pkt_dev->min_pkt_size;
2460                 }
2461                 pkt_dev->cur_pkt_size = t;
2462         }
2463
2464         set_cur_queue_map(pkt_dev);
2465
2466         pkt_dev->flows[flow].count++;
2467 }
2468
2469
2470 #ifdef CONFIG_XFRM
2471 static int pktgen_output_ipsec(struct sk_buff *skb, struct pktgen_dev *pkt_dev)
2472 {
2473         struct xfrm_state *x = pkt_dev->flows[pkt_dev->curfl].x;
2474         int err = 0;
2475
2476         if (!x)
2477                 return 0;
2478         /* XXX: we dont support tunnel mode for now until
2479          * we resolve the dst issue */
2480         if (x->props.mode != XFRM_MODE_TRANSPORT)
2481                 return 0;
2482
2483         spin_lock(&x->lock);
2484
2485         err = x->outer_mode->output(x, skb);
2486         if (err)
2487                 goto error;
2488         err = x->type->output(x, skb);
2489         if (err)
2490                 goto error;
2491
2492         x->curlft.bytes += skb->len;
2493         x->curlft.packets++;
2494 error:
2495         spin_unlock(&x->lock);
2496         return err;
2497 }
2498
2499 static void free_SAs(struct pktgen_dev *pkt_dev)
2500 {
2501         if (pkt_dev->cflows) {
2502                 /* let go of the SAs if we have them */
2503                 int i;
2504                 for (i = 0; i < pkt_dev->cflows; i++) {
2505                         struct xfrm_state *x = pkt_dev->flows[i].x;
2506                         if (x) {
2507                                 xfrm_state_put(x);
2508                                 pkt_dev->flows[i].x = NULL;
2509                         }
2510                 }
2511         }
2512 }
2513
2514 static int process_ipsec(struct pktgen_dev *pkt_dev,
2515                               struct sk_buff *skb, __be16 protocol)
2516 {
2517         if (pkt_dev->flags & F_IPSEC_ON) {
2518                 struct xfrm_state *x = pkt_dev->flows[pkt_dev->curfl].x;
2519                 int nhead = 0;
2520                 if (x) {
2521                         int ret;
2522                         __u8 *eth;
2523                         nhead = x->props.header_len - skb_headroom(skb);
2524                         if (nhead > 0) {
2525                                 ret = pskb_expand_head(skb, nhead, 0, GFP_ATOMIC);
2526                                 if (ret < 0) {
2527                                         pr_err("Error expanding ipsec packet %d\n",
2528                                                ret);
2529                                         goto err;
2530                                 }
2531                         }
2532
2533                         /* ipsec is not expecting ll header */
2534                         skb_pull(skb, ETH_HLEN);
2535                         ret = pktgen_output_ipsec(skb, pkt_dev);
2536                         if (ret) {
2537                                 pr_err("Error creating ipsec packet %d\n", ret);
2538                                 goto err;
2539                         }
2540                         /* restore ll */
2541                         eth = (__u8 *) skb_push(skb, ETH_HLEN);
2542                         memcpy(eth, pkt_dev->hh, 12);
2543                         *(u16 *) &eth[12] = protocol;
2544                 }
2545         }
2546         return 1;
2547 err:
2548         kfree_skb(skb);
2549         return 0;
2550 }
2551 #endif
2552
2553 static void mpls_push(__be32 *mpls, struct pktgen_dev *pkt_dev)
2554 {
2555         unsigned int i;
2556         for (i = 0; i < pkt_dev->nr_labels; i++)
2557                 *mpls++ = pkt_dev->labels[i] & ~MPLS_STACK_BOTTOM;
2558
2559         mpls--;
2560         *mpls |= MPLS_STACK_BOTTOM;
2561 }
2562
2563 static inline __be16 build_tci(unsigned int id, unsigned int cfi,
2564                                unsigned int prio)
2565 {
2566         return htons(id | (cfi << 12) | (prio << 13));
2567 }
2568
2569 static void pktgen_finalize_skb(struct pktgen_dev *pkt_dev, struct sk_buff *skb,
2570                                 int datalen)
2571 {
2572         struct timeval timestamp;
2573         struct pktgen_hdr *pgh;
2574
2575         pgh = (struct pktgen_hdr *)skb_put(skb, sizeof(*pgh));
2576         datalen -= sizeof(*pgh);
2577
2578         if (pkt_dev->nfrags <= 0) {
2579                 memset(skb_put(skb, datalen), 0, datalen);
2580         } else {
2581                 int frags = pkt_dev->nfrags;
2582                 int i, len;
2583                 int frag_len;
2584
2585
2586                 if (frags > MAX_SKB_FRAGS)
2587                         frags = MAX_SKB_FRAGS;
2588                 len = datalen - frags * PAGE_SIZE;
2589                 if (len > 0) {
2590                         memset(skb_put(skb, len), 0, len);
2591                         datalen = frags * PAGE_SIZE;
2592                 }
2593
2594                 i = 0;
2595                 frag_len = (datalen/frags) < PAGE_SIZE ?
2596                            (datalen/frags) : PAGE_SIZE;
2597                 while (datalen > 0) {
2598                         if (unlikely(!pkt_dev->page)) {
2599                                 int node = numa_node_id();
2600
2601                                 if (pkt_dev->node >= 0 && (pkt_dev->flags & F_NODE))
2602                                         node = pkt_dev->node;
2603                                 pkt_dev->page = alloc_pages_node(node, GFP_KERNEL | __GFP_ZERO, 0);
2604                                 if (!pkt_dev->page)
2605                                         break;
2606                         }
2607                         get_page(pkt_dev->page);
2608                         skb_frag_set_page(skb, i, pkt_dev->page);
2609                         skb_shinfo(skb)->frags[i].page_offset = 0;
2610                         /*last fragment, fill rest of data*/
2611                         if (i == (frags - 1))
2612                                 skb_frag_size_set(&skb_shinfo(skb)->frags[i],
2613                                     (datalen < PAGE_SIZE ? datalen : PAGE_SIZE));
2614                         else
2615                                 skb_frag_size_set(&skb_shinfo(skb)->frags[i], frag_len);
2616                         datalen -= skb_frag_size(&skb_shinfo(skb)->frags[i]);
2617                         skb->len += skb_frag_size(&skb_shinfo(skb)->frags[i]);
2618                         skb->data_len += skb_frag_size(&skb_shinfo(skb)->frags[i]);
2619                         i++;
2620                         skb_shinfo(skb)->nr_frags = i;
2621                 }
2622         }
2623
2624         /* Stamp the time, and sequence number,
2625          * convert them to network byte order
2626          */
2627         pgh->pgh_magic = htonl(PKTGEN_MAGIC);
2628         pgh->seq_num = htonl(pkt_dev->seq_num);
2629
2630         do_gettimeofday(&timestamp);
2631         pgh->tv_sec = htonl(timestamp.tv_sec);
2632         pgh->tv_usec = htonl(timestamp.tv_usec);
2633 }
2634
2635 static struct sk_buff *fill_packet_ipv4(struct net_device *odev,
2636                                         struct pktgen_dev *pkt_dev)
2637 {
2638         struct sk_buff *skb = NULL;
2639         __u8 *eth;
2640         struct udphdr *udph;
2641         int datalen, iplen;
2642         struct iphdr *iph;
2643         __be16 protocol = htons(ETH_P_IP);
2644         __be32 *mpls;
2645         __be16 *vlan_tci = NULL;                 /* Encapsulates priority and VLAN ID */
2646         __be16 *vlan_encapsulated_proto = NULL;  /* packet type ID field (or len) for VLAN tag */
2647         __be16 *svlan_tci = NULL;                /* Encapsulates priority and SVLAN ID */
2648         __be16 *svlan_encapsulated_proto = NULL; /* packet type ID field (or len) for SVLAN tag */
2649         u16 queue_map;
2650
2651         if (pkt_dev->nr_labels)
2652                 protocol = htons(ETH_P_MPLS_UC);
2653
2654         if (pkt_dev->vlan_id != 0xffff)
2655                 protocol = htons(ETH_P_8021Q);
2656
2657         /* Update any of the values, used when we're incrementing various
2658          * fields.
2659          */
2660         mod_cur_headers(pkt_dev);
2661         queue_map = pkt_dev->cur_queue_map;
2662
2663         datalen = (odev->hard_header_len + 16) & ~0xf;
2664
2665         if (pkt_dev->flags & F_NODE) {
2666                 int node;
2667
2668                 if (pkt_dev->node >= 0)
2669                         node = pkt_dev->node;
2670                 else
2671                         node =  numa_node_id();
2672
2673                 skb = __alloc_skb(NET_SKB_PAD + pkt_dev->cur_pkt_size + 64
2674                                   + datalen + pkt_dev->pkt_overhead, GFP_NOWAIT, 0, node);
2675                 if (likely(skb)) {
2676                         skb_reserve(skb, NET_SKB_PAD);
2677                         skb->dev = odev;
2678                 }
2679         }
2680         else
2681           skb = __netdev_alloc_skb(odev,
2682                                    pkt_dev->cur_pkt_size + 64
2683                                    + datalen + pkt_dev->pkt_overhead, GFP_NOWAIT);
2684
2685         if (!skb) {
2686                 sprintf(pkt_dev->result, "No memory");
2687                 return NULL;
2688         }
2689         prefetchw(skb->data);
2690
2691         skb_reserve(skb, datalen);
2692
2693         /*  Reserve for ethernet and IP header  */
2694         eth = (__u8 *) skb_push(skb, 14);
2695         mpls = (__be32 *)skb_put(skb, pkt_dev->nr_labels*sizeof(__u32));
2696         if (pkt_dev->nr_labels)
2697                 mpls_push(mpls, pkt_dev);
2698
2699         if (pkt_dev->vlan_id != 0xffff) {
2700                 if (pkt_dev->svlan_id != 0xffff) {
2701                         svlan_tci = (__be16 *)skb_put(skb, sizeof(__be16));
2702                         *svlan_tci = build_tci(pkt_dev->svlan_id,
2703                                                pkt_dev->svlan_cfi,
2704                                                pkt_dev->svlan_p);
2705                         svlan_encapsulated_proto = (__be16 *)skb_put(skb, sizeof(__be16));
2706                         *svlan_encapsulated_proto = htons(ETH_P_8021Q);
2707                 }
2708                 vlan_tci = (__be16 *)skb_put(skb, sizeof(__be16));
2709                 *vlan_tci = build_tci(pkt_dev->vlan_id,
2710                                       pkt_dev->vlan_cfi,
2711                                       pkt_dev->vlan_p);
2712                 vlan_encapsulated_proto = (__be16 *)skb_put(skb, sizeof(__be16));
2713                 *vlan_encapsulated_proto = htons(ETH_P_IP);
2714         }
2715
2716         skb->network_header = skb->tail;
2717         skb->transport_header = skb->network_header + sizeof(struct iphdr);
2718         skb_put(skb, sizeof(struct iphdr) + sizeof(struct udphdr));
2719         skb_set_queue_mapping(skb, queue_map);
2720         skb->priority = pkt_dev->skb_priority;
2721
2722         iph = ip_hdr(skb);
2723         udph = udp_hdr(skb);
2724
2725         memcpy(eth, pkt_dev->hh, 12);
2726         *(__be16 *) & eth[12] = protocol;
2727
2728         /* Eth + IPh + UDPh + mpls */
2729         datalen = pkt_dev->cur_pkt_size - 14 - 20 - 8 -
2730                   pkt_dev->pkt_overhead;
2731         if (datalen < 0 || datalen < sizeof(struct pktgen_hdr))
2732                 datalen = sizeof(struct pktgen_hdr);
2733
2734         udph->source = htons(pkt_dev->cur_udp_src);
2735         udph->dest = htons(pkt_dev->cur_udp_dst);
2736         udph->len = htons(datalen + 8); /* DATA + udphdr */
2737         udph->check = 0;        /* No checksum */
2738
2739         iph->ihl = 5;
2740         iph->version = 4;
2741         iph->ttl = 32;
2742         iph->tos = pkt_dev->tos;
2743         iph->protocol = IPPROTO_UDP;    /* UDP */
2744         iph->saddr = pkt_dev->cur_saddr;
2745         iph->daddr = pkt_dev->cur_daddr;
2746         iph->id = htons(pkt_dev->ip_id);
2747         pkt_dev->ip_id++;
2748         iph->frag_off = 0;
2749         iplen = 20 + 8 + datalen;
2750         iph->tot_len = htons(iplen);
2751         iph->check = 0;
2752         iph->check = ip_fast_csum((void *)iph, iph->ihl);
2753         skb->protocol = protocol;
2754         skb->mac_header = (skb->network_header - ETH_HLEN -
2755                            pkt_dev->pkt_overhead);
2756         skb->dev = odev;
2757         skb->pkt_type = PACKET_HOST;
2758         pktgen_finalize_skb(pkt_dev, skb, datalen);
2759
2760 #ifdef CONFIG_XFRM
2761         if (!process_ipsec(pkt_dev, skb, protocol))
2762                 return NULL;
2763 #endif
2764
2765         return skb;
2766 }
2767
2768 /*
2769  * scan_ip6, fmt_ip taken from dietlibc-0.21
2770  * Author Felix von Leitner <felix-dietlibc@fefe.de>
2771  *
2772  * Slightly modified for kernel.
2773  * Should be candidate for net/ipv4/utils.c
2774  * --ro
2775  */
2776
2777 static unsigned int scan_ip6(const char *s, char ip[16])
2778 {
2779         unsigned int i;
2780         unsigned int len = 0;
2781         unsigned long u;
2782         char suffix[16];
2783         unsigned int prefixlen = 0;
2784         unsigned int suffixlen = 0;
2785         __be32 tmp;
2786         char *pos;
2787
2788         for (i = 0; i < 16; i++)
2789                 ip[i] = 0;
2790
2791         for (;;) {
2792                 if (*s == ':') {
2793                         len++;
2794                         if (s[1] == ':') {      /* Found "::", skip to part 2 */
2795                                 s += 2;
2796                                 len++;
2797                                 break;
2798                         }
2799                         s++;
2800                 }
2801
2802                 u = simple_strtoul(s, &pos, 16);
2803                 i = pos - s;
2804                 if (!i)
2805                         return 0;
2806                 if (prefixlen == 12 && s[i] == '.') {
2807
2808                         /* the last 4 bytes may be written as IPv4 address */
2809
2810                         tmp = in_aton(s);
2811                         memcpy((struct in_addr *)(ip + 12), &tmp, sizeof(tmp));
2812                         return i + len;
2813                 }
2814                 ip[prefixlen++] = (u >> 8);
2815                 ip[prefixlen++] = (u & 255);
2816                 s += i;
2817                 len += i;
2818                 if (prefixlen == 16)
2819                         return len;
2820         }
2821
2822 /* part 2, after "::" */
2823         for (;;) {
2824                 if (*s == ':') {
2825                         if (suffixlen == 0)
2826                                 break;
2827                         s++;
2828                         len++;
2829                 } else if (suffixlen != 0)
2830                         break;
2831
2832                 u = simple_strtol(s, &pos, 16);
2833                 i = pos - s;
2834                 if (!i) {
2835                         if (*s)
2836                                 len--;
2837                         break;
2838                 }
2839                 if (suffixlen + prefixlen <= 12 && s[i] == '.') {
2840                         tmp = in_aton(s);
2841                         memcpy((struct in_addr *)(suffix + suffixlen), &tmp,
2842                                sizeof(tmp));
2843                         suffixlen += 4;
2844                         len += strlen(s);
2845                         break;
2846                 }
2847                 suffix[suffixlen++] = (u >> 8);
2848                 suffix[suffixlen++] = (u & 255);
2849                 s += i;
2850                 len += i;
2851                 if (prefixlen + suffixlen == 16)
2852                         break;
2853         }
2854         for (i = 0; i < suffixlen; i++)
2855                 ip[16 - suffixlen + i] = suffix[i];
2856         return len;
2857 }
2858
2859 static struct sk_buff *fill_packet_ipv6(struct net_device *odev,
2860                                         struct pktgen_dev *pkt_dev)
2861 {
2862         struct sk_buff *skb = NULL;
2863         __u8 *eth;
2864         struct udphdr *udph;
2865         int datalen;
2866         struct ipv6hdr *iph;
2867         __be16 protocol = htons(ETH_P_IPV6);
2868         __be32 *mpls;
2869         __be16 *vlan_tci = NULL;                 /* Encapsulates priority and VLAN ID */
2870         __be16 *vlan_encapsulated_proto = NULL;  /* packet type ID field (or len) for VLAN tag */
2871         __be16 *svlan_tci = NULL;                /* Encapsulates priority and SVLAN ID */
2872         __be16 *svlan_encapsulated_proto = NULL; /* packet type ID field (or len) for SVLAN tag */
2873         u16 queue_map;
2874
2875         if (pkt_dev->nr_labels)
2876                 protocol = htons(ETH_P_MPLS_UC);
2877
2878         if (pkt_dev->vlan_id != 0xffff)
2879                 protocol = htons(ETH_P_8021Q);
2880
2881         /* Update any of the values, used when we're incrementing various
2882          * fields.
2883          */
2884         mod_cur_headers(pkt_dev);
2885         queue_map = pkt_dev->cur_queue_map;
2886
2887         skb = __netdev_alloc_skb(odev,
2888                                  pkt_dev->cur_pkt_size + 64
2889                                  + 16 + pkt_dev->pkt_overhead, GFP_NOWAIT);
2890         if (!skb) {
2891                 sprintf(pkt_dev->result, "No memory");
2892                 return NULL;
2893         }
2894         prefetchw(skb->data);
2895
2896         skb_reserve(skb, 16);
2897
2898         /*  Reserve for ethernet and IP header  */
2899         eth = (__u8 *) skb_push(skb, 14);
2900         mpls = (__be32 *)skb_put(skb, pkt_dev->nr_labels*sizeof(__u32));
2901         if (pkt_dev->nr_labels)
2902                 mpls_push(mpls, pkt_dev);
2903
2904         if (pkt_dev->vlan_id != 0xffff) {
2905                 if (pkt_dev->svlan_id != 0xffff) {
2906                         svlan_tci = (__be16 *)skb_put(skb, sizeof(__be16));
2907                         *svlan_tci = build_tci(pkt_dev->svlan_id,
2908                                                pkt_dev->svlan_cfi,
2909                                                pkt_dev->svlan_p);
2910                         svlan_encapsulated_proto = (__be16 *)skb_put(skb, sizeof(__be16));
2911                         *svlan_encapsulated_proto = htons(ETH_P_8021Q);
2912                 }
2913                 vlan_tci = (__be16 *)skb_put(skb, sizeof(__be16));
2914                 *vlan_tci = build_tci(pkt_dev->vlan_id,
2915                                       pkt_dev->vlan_cfi,
2916                                       pkt_dev->vlan_p);
2917                 vlan_encapsulated_proto = (__be16 *)skb_put(skb, sizeof(__be16));
2918                 *vlan_encapsulated_proto = htons(ETH_P_IPV6);
2919         }
2920
2921         skb->network_header = skb->tail;
2922         skb->transport_header = skb->network_header + sizeof(struct ipv6hdr);
2923         skb_put(skb, sizeof(struct ipv6hdr) + sizeof(struct udphdr));
2924         skb_set_queue_mapping(skb, queue_map);
2925         skb->priority = pkt_dev->skb_priority;
2926         iph = ipv6_hdr(skb);
2927         udph = udp_hdr(skb);
2928
2929         memcpy(eth, pkt_dev->hh, 12);
2930         *(__be16 *) &eth[12] = protocol;
2931
2932         /* Eth + IPh + UDPh + mpls */
2933         datalen = pkt_dev->cur_pkt_size - 14 -
2934                   sizeof(struct ipv6hdr) - sizeof(struct udphdr) -
2935                   pkt_dev->pkt_overhead;
2936
2937         if (datalen < 0 || datalen < sizeof(struct pktgen_hdr)) {
2938                 datalen = sizeof(struct pktgen_hdr);
2939                 net_info_ratelimited("increased datalen to %d\n", datalen);
2940         }
2941
2942         udph->source = htons(pkt_dev->cur_udp_src);
2943         udph->dest = htons(pkt_dev->cur_udp_dst);
2944         udph->len = htons(datalen + sizeof(struct udphdr));
2945         udph->check = 0;        /* No checksum */
2946
2947         *(__be32 *) iph = htonl(0x60000000);    /* Version + flow */
2948
2949         if (pkt_dev->traffic_class) {
2950                 /* Version + traffic class + flow (0) */
2951                 *(__be32 *)iph |= htonl(0x60000000 | (pkt_dev->traffic_class << 20));
2952         }
2953
2954         iph->hop_limit = 32;
2955
2956         iph->payload_len = htons(sizeof(struct udphdr) + datalen);
2957         iph->nexthdr = IPPROTO_UDP;
2958
2959         iph->daddr = pkt_dev->cur_in6_daddr;
2960         iph->saddr = pkt_dev->cur_in6_saddr;
2961
2962         skb->mac_header = (skb->network_header - ETH_HLEN -
2963                            pkt_dev->pkt_overhead);
2964         skb->protocol = protocol;
2965         skb->dev = odev;
2966         skb->pkt_type = PACKET_HOST;
2967
2968         pktgen_finalize_skb(pkt_dev, skb, datalen);
2969
2970         return skb;
2971 }
2972
2973 static struct sk_buff *fill_packet(struct net_device *odev,
2974                                    struct pktgen_dev *pkt_dev)
2975 {
2976         if (pkt_dev->flags & F_IPV6)
2977                 return fill_packet_ipv6(odev, pkt_dev);
2978         else
2979                 return fill_packet_ipv4(odev, pkt_dev);
2980 }
2981
2982 static void pktgen_clear_counters(struct pktgen_dev *pkt_dev)
2983 {
2984         pkt_dev->seq_num = 1;
2985         pkt_dev->idle_acc = 0;
2986         pkt_dev->sofar = 0;
2987         pkt_dev->tx_bytes = 0;
2988         pkt_dev->errors = 0;
2989 }
2990
2991 /* Set up structure for sending pkts, clear counters */
2992
2993 static void pktgen_run(struct pktgen_thread *t)
2994 {
2995         struct pktgen_dev *pkt_dev;
2996         int started = 0;
2997
2998         func_enter();
2999
3000         if_lock(t);
3001         list_for_each_entry(pkt_dev, &t->if_list, list) {
3002
3003                 /*
3004                  * setup odev and create initial packet.
3005                  */
3006                 pktgen_setup_inject(pkt_dev);
3007
3008                 if (pkt_dev->odev) {
3009                         pktgen_clear_counters(pkt_dev);
3010                         pkt_dev->running = 1;   /* Cranke yeself! */
3011                         pkt_dev->skb = NULL;
3012                         pkt_dev->started_at =
3013                                 pkt_dev->next_tx = ktime_now();
3014
3015                         set_pkt_overhead(pkt_dev);
3016
3017                         strcpy(pkt_dev->result, "Starting");
3018                         started++;
3019                 } else
3020                         strcpy(pkt_dev->result, "Error starting");
3021         }
3022         if_unlock(t);
3023         if (started)
3024                 t->control &= ~(T_STOP);
3025 }
3026
3027 static void pktgen_stop_all_threads_ifs(void)
3028 {
3029         struct pktgen_thread *t;
3030
3031         func_enter();
3032
3033         mutex_lock(&pktgen_thread_lock);
3034
3035         list_for_each_entry(t, &pktgen_threads, th_list)
3036                 t->control |= T_STOP;
3037
3038         mutex_unlock(&pktgen_thread_lock);
3039 }
3040
3041 static int thread_is_running(const struct pktgen_thread *t)
3042 {
3043         const struct pktgen_dev *pkt_dev;
3044
3045         list_for_each_entry(pkt_dev, &t->if_list, list)
3046                 if (pkt_dev->running)
3047                         return 1;
3048         return 0;
3049 }
3050
3051 static int pktgen_wait_thread_run(struct pktgen_thread *t)
3052 {
3053         if_lock(t);
3054
3055         while (thread_is_running(t)) {
3056
3057                 if_unlock(t);
3058
3059                 msleep_interruptible(100);
3060
3061                 if (signal_pending(current))
3062                         goto signal;
3063                 if_lock(t);
3064         }
3065         if_unlock(t);
3066         return 1;
3067 signal:
3068         return 0;
3069 }
3070
3071 static int pktgen_wait_all_threads_run(void)
3072 {
3073         struct pktgen_thread *t;
3074         int sig = 1;
3075
3076         mutex_lock(&pktgen_thread_lock);
3077
3078         list_for_each_entry(t, &pktgen_threads, th_list) {
3079                 sig = pktgen_wait_thread_run(t);
3080                 if (sig == 0)
3081                         break;
3082         }
3083
3084         if (sig == 0)
3085                 list_for_each_entry(t, &pktgen_threads, th_list)
3086                         t->control |= (T_STOP);
3087
3088         mutex_unlock(&pktgen_thread_lock);
3089         return sig;
3090 }
3091
3092 static void pktgen_run_all_threads(void)
3093 {
3094         struct pktgen_thread *t;
3095
3096         func_enter();
3097
3098         mutex_lock(&pktgen_thread_lock);
3099
3100         list_for_each_entry(t, &pktgen_threads, th_list)
3101                 t->control |= (T_RUN);
3102
3103         mutex_unlock(&pktgen_thread_lock);
3104
3105         /* Propagate thread->control  */
3106         schedule_timeout_interruptible(msecs_to_jiffies(125));
3107
3108         pktgen_wait_all_threads_run();
3109 }
3110
3111 static void pktgen_reset_all_threads(void)
3112 {
3113         struct pktgen_thread *t;
3114
3115         func_enter();
3116
3117         mutex_lock(&pktgen_thread_lock);
3118
3119         list_for_each_entry(t, &pktgen_threads, th_list)
3120                 t->control |= (T_REMDEVALL);
3121
3122         mutex_unlock(&pktgen_thread_lock);
3123
3124         /* Propagate thread->control  */
3125         schedule_timeout_interruptible(msecs_to_jiffies(125));
3126
3127         pktgen_wait_all_threads_run();
3128 }
3129
3130 static void show_results(struct pktgen_dev *pkt_dev, int nr_frags)
3131 {
3132         __u64 bps, mbps, pps;
3133         char *p = pkt_dev->result;
3134         ktime_t elapsed = ktime_sub(pkt_dev->stopped_at,
3135                                     pkt_dev->started_at);
3136         ktime_t idle = ns_to_ktime(pkt_dev->idle_acc);
3137
3138         p += sprintf(p, "OK: %llu(c%llu+d%llu) usec, %llu (%dbyte,%dfrags)\n",
3139                      (unsigned long long)ktime_to_us(elapsed),
3140                      (unsigned long long)ktime_to_us(ktime_sub(elapsed, idle)),
3141                      (unsigned long long)ktime_to_us(idle),
3142                      (unsigned long long)pkt_dev->sofar,
3143                      pkt_dev->cur_pkt_size, nr_frags);
3144
3145         pps = div64_u64(pkt_dev->sofar * NSEC_PER_SEC,
3146                         ktime_to_ns(elapsed));
3147
3148         bps = pps * 8 * pkt_dev->cur_pkt_size;
3149
3150         mbps = bps;
3151         do_div(mbps, 1000000);
3152         p += sprintf(p, "  %llupps %lluMb/sec (%llubps) errors: %llu",
3153                      (unsigned long long)pps,
3154                      (unsigned long long)mbps,
3155                      (unsigned long long)bps,
3156                      (unsigned long long)pkt_dev->errors);
3157 }
3158
3159 /* Set stopped-at timer, remove from running list, do counters & statistics */
3160 static int pktgen_stop_device(struct pktgen_dev *pkt_dev)
3161 {
3162         int nr_frags = pkt_dev->skb ? skb_shinfo(pkt_dev->skb)->nr_frags : -1;
3163
3164         if (!pkt_dev->running) {
3165                 pr_warning("interface: %s is already stopped\n",
3166                            pkt_dev->odevname);
3167                 return -EINVAL;
3168         }
3169
3170         kfree_skb(pkt_dev->skb);
3171         pkt_dev->skb = NULL;
3172         pkt_dev->stopped_at = ktime_now();
3173         pkt_dev->running = 0;
3174
3175         show_results(pkt_dev, nr_frags);
3176
3177         return 0;
3178 }
3179
3180 static struct pktgen_dev *next_to_run(struct pktgen_thread *t)
3181 {
3182         struct pktgen_dev *pkt_dev, *best = NULL;
3183
3184         if_lock(t);
3185
3186         list_for_each_entry(pkt_dev, &t->if_list, list) {
3187                 if (!pkt_dev->running)
3188                         continue;
3189                 if (best == NULL)
3190                         best = pkt_dev;
3191                 else if (ktime_lt(pkt_dev->next_tx, best->next_tx))
3192                         best = pkt_dev;
3193         }
3194         if_unlock(t);
3195         return best;
3196 }
3197
3198 static void pktgen_stop(struct pktgen_thread *t)
3199 {
3200         struct pktgen_dev *pkt_dev;
3201
3202         func_enter();
3203
3204         if_lock(t);
3205
3206         list_for_each_entry(pkt_dev, &t->if_list, list) {
3207                 pktgen_stop_device(pkt_dev);
3208         }
3209
3210         if_unlock(t);
3211 }
3212
3213 /*
3214  * one of our devices needs to be removed - find it
3215  * and remove it
3216  */
3217 static void pktgen_rem_one_if(struct pktgen_thread *t)
3218 {
3219         struct list_head *q, *n;
3220         struct pktgen_dev *cur;
3221
3222         func_enter();
3223
3224         if_lock(t);
3225
3226         list_for_each_safe(q, n, &t->if_list) {
3227                 cur = list_entry(q, struct pktgen_dev, list);
3228
3229                 if (!cur->removal_mark)
3230                         continue;
3231
3232                 kfree_skb(cur->skb);
3233                 cur->skb = NULL;
3234
3235                 pktgen_remove_device(t, cur);
3236
3237                 break;
3238         }
3239
3240         if_unlock(t);
3241 }
3242
3243 static void pktgen_rem_all_ifs(struct pktgen_thread *t)
3244 {
3245         struct list_head *q, *n;
3246         struct pktgen_dev *cur;
3247
3248         func_enter();
3249
3250         /* Remove all devices, free mem */
3251
3252         if_lock(t);
3253
3254         list_for_each_safe(q, n, &t->if_list) {
3255                 cur = list_entry(q, struct pktgen_dev, list);
3256
3257                 kfree_skb(cur->skb);
3258                 cur->skb = NULL;
3259
3260                 pktgen_remove_device(t, cur);
3261         }
3262
3263         if_unlock(t);
3264 }
3265
3266 static void pktgen_rem_thread(struct pktgen_thread *t)
3267 {
3268         /* Remove from the thread list */
3269
3270         remove_proc_entry(t->tsk->comm, pg_proc_dir);
3271
3272 }
3273
3274 static void pktgen_resched(struct pktgen_dev *pkt_dev)
3275 {
3276         ktime_t idle_start = ktime_now();
3277         schedule();
3278         pkt_dev->idle_acc += ktime_to_ns(ktime_sub(ktime_now(), idle_start));
3279 }
3280
3281 static void pktgen_wait_for_skb(struct pktgen_dev *pkt_dev)
3282 {
3283         ktime_t idle_start = ktime_now();
3284
3285         while (atomic_read(&(pkt_dev->skb->users)) != 1) {
3286                 if (signal_pending(current))
3287                         break;
3288
3289                 if (need_resched())
3290                         pktgen_resched(pkt_dev);
3291                 else
3292                         cpu_relax();
3293         }
3294         pkt_dev->idle_acc += ktime_to_ns(ktime_sub(ktime_now(), idle_start));
3295 }
3296
3297 static void pktgen_xmit(struct pktgen_dev *pkt_dev)
3298 {
3299         struct net_device *odev = pkt_dev->odev;
3300         netdev_tx_t (*xmit)(struct sk_buff *, struct net_device *)
3301                 = odev->netdev_ops->ndo_start_xmit;
3302         struct netdev_queue *txq;
3303         u16 queue_map;
3304         int ret;
3305
3306         /* If device is offline, then don't send */
3307         if (unlikely(!netif_running(odev) || !netif_carrier_ok(odev))) {
3308                 pktgen_stop_device(pkt_dev);
3309                 return;
3310         }
3311
3312         /* This is max DELAY, this has special meaning of
3313          * "never transmit"
3314          */
3315         if (unlikely(pkt_dev->delay == ULLONG_MAX)) {
3316                 pkt_dev->next_tx = ktime_add_ns(ktime_now(), ULONG_MAX);
3317                 return;
3318         }
3319
3320         /* If no skb or clone count exhausted then get new one */
3321         if (!pkt_dev->skb || (pkt_dev->last_ok &&
3322                               ++pkt_dev->clone_count >= pkt_dev->clone_skb)) {
3323                 /* build a new pkt */
3324                 kfree_skb(pkt_dev->skb);
3325
3326                 pkt_dev->skb = fill_packet(odev, pkt_dev);
3327                 if (pkt_dev->skb == NULL) {
3328                         pr_err("ERROR: couldn't allocate skb in fill_packet\n");
3329                         schedule();
3330                         pkt_dev->clone_count--; /* back out increment, OOM */
3331                         return;
3332                 }
3333                 pkt_dev->last_pkt_size = pkt_dev->skb->len;
3334                 pkt_dev->allocated_skbs++;
3335                 pkt_dev->clone_count = 0;       /* reset counter */
3336         }
3337
3338         if (pkt_dev->delay && pkt_dev->last_ok)
3339                 spin(pkt_dev, pkt_dev->next_tx);
3340
3341         queue_map = skb_get_queue_mapping(pkt_dev->skb);
3342         txq = netdev_get_tx_queue(odev, queue_map);
3343
3344         __netif_tx_lock_bh(txq);
3345
3346         if (unlikely(netif_xmit_frozen_or_stopped(txq))) {
3347                 ret = NETDEV_TX_BUSY;
3348                 pkt_dev->last_ok = 0;
3349                 goto unlock;
3350         }
3351         atomic_inc(&(pkt_dev->skb->users));
3352         ret = (*xmit)(pkt_dev->skb, odev);
3353
3354         switch (ret) {
3355         case NETDEV_TX_OK:
3356                 txq_trans_update(txq);
3357                 pkt_dev->last_ok = 1;
3358                 pkt_dev->sofar++;
3359                 pkt_dev->seq_num++;
3360                 pkt_dev->tx_bytes += pkt_dev->last_pkt_size;
3361                 break;
3362         case NET_XMIT_DROP:
3363         case NET_XMIT_CN:
3364         case NET_XMIT_POLICED:
3365                 /* skb has been consumed */
3366                 pkt_dev->errors++;
3367                 break;
3368         default: /* Drivers are not supposed to return other values! */
3369                 net_info_ratelimited("%s xmit error: %d\n",
3370                                      pkt_dev->odevname, ret);
3371                 pkt_dev->errors++;
3372                 /* fallthru */
3373         case NETDEV_TX_LOCKED:
3374         case NETDEV_TX_BUSY:
3375                 /* Retry it next time */
3376                 atomic_dec(&(pkt_dev->skb->users));
3377                 pkt_dev->last_ok = 0;
3378         }
3379 unlock:
3380         __netif_tx_unlock_bh(txq);
3381
3382         /* If pkt_dev->count is zero, then run forever */
3383         if ((pkt_dev->count != 0) && (pkt_dev->sofar >= pkt_dev->count)) {
3384                 pktgen_wait_for_skb(pkt_dev);
3385
3386                 /* Done with this */
3387                 pktgen_stop_device(pkt_dev);
3388         }
3389 }
3390
3391 /*
3392  * Main loop of the thread goes here
3393  */
3394
3395 static int pktgen_thread_worker(void *arg)
3396 {
3397         DEFINE_WAIT(wait);
3398         struct pktgen_thread *t = arg;
3399         struct pktgen_dev *pkt_dev = NULL;
3400         int cpu = t->cpu;
3401
3402         BUG_ON(smp_processor_id() != cpu);
3403
3404         init_waitqueue_head(&t->queue);
3405         complete(&t->start_done);
3406
3407         pr_debug("starting pktgen/%d:  pid=%d\n", cpu, task_pid_nr(current));
3408
3409         set_current_state(TASK_INTERRUPTIBLE);
3410
3411         set_freezable();
3412
3413         while (!kthread_should_stop()) {
3414                 pkt_dev = next_to_run(t);
3415
3416                 if (unlikely(!pkt_dev && t->control == 0)) {
3417                         if (pktgen_exiting)
3418                                 break;
3419                         wait_event_interruptible_timeout(t->queue,
3420                                                          t->control != 0,
3421                                                          HZ/10);
3422                         try_to_freeze();
3423                         continue;
3424                 }
3425
3426                 __set_current_state(TASK_RUNNING);
3427
3428                 if (likely(pkt_dev)) {
3429                         pktgen_xmit(pkt_dev);
3430
3431                         if (need_resched())
3432                                 pktgen_resched(pkt_dev);
3433                         else
3434                                 cpu_relax();
3435                 }
3436
3437                 if (t->control & T_STOP) {
3438                         pktgen_stop(t);
3439                         t->control &= ~(T_STOP);
3440                 }
3441
3442                 if (t->control & T_RUN) {
3443                         pktgen_run(t);
3444                         t->control &= ~(T_RUN);
3445                 }
3446
3447                 if (t->control & T_REMDEVALL) {
3448                         pktgen_rem_all_ifs(t);
3449                         t->control &= ~(T_REMDEVALL);
3450                 }
3451
3452                 if (t->control & T_REMDEV) {
3453                         pktgen_rem_one_if(t);
3454                         t->control &= ~(T_REMDEV);
3455                 }
3456
3457                 try_to_freeze();
3458
3459                 set_current_state(TASK_INTERRUPTIBLE);
3460         }
3461
3462         pr_debug("%s stopping all device\n", t->tsk->comm);
3463         pktgen_stop(t);
3464
3465         pr_debug("%s removing all device\n", t->tsk->comm);
3466         pktgen_rem_all_ifs(t);
3467
3468         pr_debug("%s removing thread\n", t->tsk->comm);
3469         pktgen_rem_thread(t);
3470
3471         /* Wait for kthread_stop */
3472         while (!kthread_should_stop()) {
3473                 set_current_state(TASK_INTERRUPTIBLE);
3474                 schedule();
3475         }
3476         __set_current_state(TASK_RUNNING);
3477
3478         return 0;
3479 }
3480
3481 static struct pktgen_dev *pktgen_find_dev(struct pktgen_thread *t,
3482                                           const char *ifname, bool exact)
3483 {
3484         struct pktgen_dev *p, *pkt_dev = NULL;
3485         size_t len = strlen(ifname);
3486
3487         if_lock(t);
3488         list_for_each_entry(p, &t->if_list, list)
3489                 if (strncmp(p->odevname, ifname, len) == 0) {
3490                         if (p->odevname[len]) {
3491                                 if (exact || p->odevname[len] != '@')
3492                                         continue;
3493                         }
3494                         pkt_dev = p;
3495                         break;
3496                 }
3497
3498         if_unlock(t);
3499         pr_debug("find_dev(%s) returning %p\n", ifname, pkt_dev);
3500         return pkt_dev;
3501 }
3502
3503 /*
3504  * Adds a dev at front of if_list.
3505  */
3506
3507 static int add_dev_to_thread(struct pktgen_thread *t,
3508                              struct pktgen_dev *pkt_dev)
3509 {
3510         int rv = 0;
3511
3512         if_lock(t);
3513
3514         if (pkt_dev->pg_thread) {
3515                 pr_err("ERROR: already assigned to a thread\n");
3516                 rv = -EBUSY;
3517                 goto out;
3518         }
3519
3520         list_add(&pkt_dev->list, &t->if_list);
3521         pkt_dev->pg_thread = t;
3522         pkt_dev->running = 0;
3523
3524 out:
3525         if_unlock(t);
3526         return rv;
3527 }
3528
3529 /* Called under thread lock */
3530
3531 static int pktgen_add_device(struct pktgen_thread *t, const char *ifname)
3532 {
3533         struct pktgen_dev *pkt_dev;
3534         int err;
3535         int node = cpu_to_node(t->cpu);
3536
3537         /* We don't allow a device to be on several threads */
3538
3539         pkt_dev = __pktgen_NN_threads(ifname, FIND);
3540         if (pkt_dev) {
3541                 pr_err("ERROR: interface already used\n");
3542                 return -EBUSY;
3543         }
3544
3545         pkt_dev = kzalloc_node(sizeof(struct pktgen_dev), GFP_KERNEL, node);
3546         if (!pkt_dev)
3547                 return -ENOMEM;
3548
3549         strcpy(pkt_dev->odevname, ifname);
3550         pkt_dev->flows = vzalloc_node(MAX_CFLOWS * sizeof(struct flow_state),
3551                                       node);
3552         if (pkt_dev->flows == NULL) {
3553                 kfree(pkt_dev);
3554                 return -ENOMEM;
3555         }
3556
3557         pkt_dev->removal_mark = 0;
3558         pkt_dev->nfrags = 0;
3559         pkt_dev->delay = pg_delay_d;
3560         pkt_dev->count = pg_count_d;
3561         pkt_dev->sofar = 0;
3562         pkt_dev->udp_src_min = 9;       /* sink port */
3563         pkt_dev->udp_src_max = 9;
3564         pkt_dev->udp_dst_min = 9;
3565         pkt_dev->udp_dst_max = 9;
3566         pkt_dev->vlan_p = 0;
3567         pkt_dev->vlan_cfi = 0;
3568         pkt_dev->vlan_id = 0xffff;
3569         pkt_dev->svlan_p = 0;
3570         pkt_dev->svlan_cfi = 0;
3571         pkt_dev->svlan_id = 0xffff;
3572         pkt_dev->node = -1;
3573
3574         err = pktgen_setup_dev(pkt_dev, ifname);
3575         if (err)
3576                 goto out1;
3577         if (pkt_dev->odev->priv_flags & IFF_TX_SKB_SHARING)
3578                 pkt_dev->clone_skb = pg_clone_skb_d;
3579
3580         pkt_dev->entry = proc_create_data(ifname, 0600, pg_proc_dir,
3581                                           &pktgen_if_fops, pkt_dev);
3582         if (!pkt_dev->entry) {
3583                 pr_err("cannot create %s/%s procfs entry\n",
3584                        PG_PROC_DIR, ifname);
3585                 err = -EINVAL;
3586                 goto out2;
3587         }
3588 #ifdef CONFIG_XFRM
3589         pkt_dev->ipsmode = XFRM_MODE_TRANSPORT;
3590         pkt_dev->ipsproto = IPPROTO_ESP;
3591 #endif
3592
3593         return add_dev_to_thread(t, pkt_dev);
3594 out2:
3595         dev_put(pkt_dev->odev);
3596 out1:
3597 #ifdef CONFIG_XFRM
3598         free_SAs(pkt_dev);
3599 #endif
3600         vfree(pkt_dev->flows);
3601         kfree(pkt_dev);
3602         return err;
3603 }
3604
3605 static int __init pktgen_create_thread(int cpu)
3606 {
3607         struct pktgen_thread *t;
3608         struct proc_dir_entry *pe;
3609         struct task_struct *p;
3610
3611         t = kzalloc_node(sizeof(struct pktgen_thread), GFP_KERNEL,
3612                          cpu_to_node(cpu));
3613         if (!t) {
3614                 pr_err("ERROR: out of memory, can't create new thread\n");
3615                 return -ENOMEM;
3616         }
3617
3618         spin_lock_init(&t->if_lock);
3619         t->cpu = cpu;
3620
3621         INIT_LIST_HEAD(&t->if_list);
3622
3623         list_add_tail(&t->th_list, &pktgen_threads);
3624         init_completion(&t->start_done);
3625
3626         p = kthread_create_on_node(pktgen_thread_worker,
3627                                    t,
3628                                    cpu_to_node(cpu),
3629                                    "kpktgend_%d", cpu);
3630         if (IS_ERR(p)) {
3631                 pr_err("kernel_thread() failed for cpu %d\n", t->cpu);
3632                 list_del(&t->th_list);
3633                 kfree(t);
3634                 return PTR_ERR(p);
3635         }
3636         kthread_bind(p, cpu);
3637         t->tsk = p;
3638
3639         pe = proc_create_data(t->tsk->comm, 0600, pg_proc_dir,
3640                               &pktgen_thread_fops, t);
3641         if (!pe) {
3642                 pr_err("cannot create %s/%s procfs entry\n",
3643                        PG_PROC_DIR, t->tsk->comm);
3644                 kthread_stop(p);
3645                 list_del(&t->th_list);
3646                 kfree(t);
3647                 return -EINVAL;
3648         }
3649
3650         wake_up_process(p);
3651         wait_for_completion(&t->start_done);
3652
3653         return 0;
3654 }
3655
3656 /*
3657  * Removes a device from the thread if_list.
3658  */
3659 static void _rem_dev_from_if_list(struct pktgen_thread *t,
3660                                   struct pktgen_dev *pkt_dev)
3661 {
3662         struct list_head *q, *n;
3663         struct pktgen_dev *p;
3664
3665         list_for_each_safe(q, n, &t->if_list) {
3666                 p = list_entry(q, struct pktgen_dev, list);
3667                 if (p == pkt_dev)
3668                         list_del(&p->list);
3669         }
3670 }
3671
3672 static int pktgen_remove_device(struct pktgen_thread *t,
3673                                 struct pktgen_dev *pkt_dev)
3674 {
3675
3676         pr_debug("remove_device pkt_dev=%p\n", pkt_dev);
3677
3678         if (pkt_dev->running) {
3679                 pr_warning("WARNING: trying to remove a running interface, stopping it now\n");
3680                 pktgen_stop_device(pkt_dev);
3681         }
3682
3683         /* Dis-associate from the interface */
3684
3685         if (pkt_dev->odev) {
3686                 dev_put(pkt_dev->odev);
3687                 pkt_dev->odev = NULL;
3688         }
3689
3690         /* And update the thread if_list */
3691
3692         _rem_dev_from_if_list(t, pkt_dev);
3693
3694         if (pkt_dev->entry)
3695                 remove_proc_entry(pkt_dev->entry->name, pg_proc_dir);
3696
3697 #ifdef CONFIG_XFRM
3698         free_SAs(pkt_dev);
3699 #endif
3700         vfree(pkt_dev->flows);
3701         if (pkt_dev->page)
3702                 put_page(pkt_dev->page);
3703         kfree(pkt_dev);
3704         return 0;
3705 }
3706
3707 static int __init pg_init(void)
3708 {
3709         int cpu;
3710         struct proc_dir_entry *pe;
3711         int ret = 0;
3712
3713         pr_info("%s", version);
3714
3715         pg_proc_dir = proc_mkdir(PG_PROC_DIR, init_net.proc_net);
3716         if (!pg_proc_dir)
3717                 return -ENODEV;
3718
3719         pe = proc_create(PGCTRL, 0600, pg_proc_dir, &pktgen_fops);
3720         if (pe == NULL) {
3721                 pr_err("ERROR: cannot create %s procfs entry\n", PGCTRL);
3722                 ret = -EINVAL;
3723                 goto remove_dir;
3724         }
3725
3726         register_netdevice_notifier(&pktgen_notifier_block);
3727
3728         for_each_online_cpu(cpu) {
3729                 int err;
3730
3731                 err = pktgen_create_thread(cpu);
3732                 if (err)
3733                         pr_warning("WARNING: Cannot create thread for cpu %d (%d)\n",
3734                                    cpu, err);
3735         }
3736
3737         if (list_empty(&pktgen_threads)) {
3738                 pr_err("ERROR: Initialization failed for all threads\n");
3739                 ret = -ENODEV;
3740                 goto unregister;
3741         }
3742
3743         return 0;
3744
3745  unregister:
3746         unregister_netdevice_notifier(&pktgen_notifier_block);
3747         remove_proc_entry(PGCTRL, pg_proc_dir);
3748  remove_dir:
3749         proc_net_remove(&init_net, PG_PROC_DIR);
3750         return ret;
3751 }
3752
3753 static void __exit pg_cleanup(void)
3754 {
3755         struct pktgen_thread *t;
3756         struct list_head *q, *n;
3757         LIST_HEAD(list);
3758
3759         /* Stop all interfaces & threads */
3760         pktgen_exiting = true;
3761
3762         mutex_lock(&pktgen_thread_lock);
3763         list_splice_init(&pktgen_threads, &list);
3764         mutex_unlock(&pktgen_thread_lock);
3765
3766         list_for_each_safe(q, n, &list) {
3767                 t = list_entry(q, struct pktgen_thread, th_list);
3768                 list_del(&t->th_list);
3769                 kthread_stop(t->tsk);
3770                 kfree(t);
3771         }
3772
3773         /* Un-register us from receiving netdevice events */
3774         unregister_netdevice_notifier(&pktgen_notifier_block);
3775
3776         /* Clean up proc file system */
3777         remove_proc_entry(PGCTRL, pg_proc_dir);
3778         proc_net_remove(&init_net, PG_PROC_DIR);
3779 }
3780
3781 module_init(pg_init);
3782 module_exit(pg_cleanup);
3783
3784 MODULE_AUTHOR("Robert Olsson <robert.olsson@its.uu.se>");
3785 MODULE_DESCRIPTION("Packet Generator tool");
3786 MODULE_LICENSE("GPL");
3787 MODULE_VERSION(VERSION);
3788 module_param(pg_count_d, int, 0);
3789 MODULE_PARM_DESC(pg_count_d, "Default number of packets to inject");
3790 module_param(pg_delay_d, int, 0);
3791 MODULE_PARM_DESC(pg_delay_d, "Default delay between packets (nanoseconds)");
3792 module_param(pg_clone_skb_d, int, 0);
3793 MODULE_PARM_DESC(pg_clone_skb_d, "Default number of copies of the same packet");
3794 module_param(debug, int, 0);
3795 MODULE_PARM_DESC(debug, "Enable debugging of pktgen module");