pktgen: set different default min_pkt_size for different protocols
[firefly-linux-kernel-4.4.55.git] / net / core / pktgen.c
1 /*
2  * Authors:
3  * Copyright 2001, 2002 by Robert Olsson <robert.olsson@its.uu.se>
4  *                             Uppsala University and
5  *                             Swedish University of Agricultural Sciences
6  *
7  * Alexey Kuznetsov  <kuznet@ms2.inr.ac.ru>
8  * Ben Greear <greearb@candelatech.com>
9  * Jens Låås <jens.laas@data.slu.se>
10  *
11  * This program is free software; you can redistribute it and/or
12  * modify it under the terms of the GNU General Public License
13  * as published by the Free Software Foundation; either version
14  * 2 of the License, or (at your option) any later version.
15  *
16  *
17  * A tool for loading the network with preconfigurated packets.
18  * The tool is implemented as a linux module.  Parameters are output
19  * device, delay (to hard_xmit), number of packets, and whether
20  * to use multiple SKBs or just the same one.
21  * pktgen uses the installed interface's output routine.
22  *
23  * Additional hacking by:
24  *
25  * Jens.Laas@data.slu.se
26  * Improved by ANK. 010120.
27  * Improved by ANK even more. 010212.
28  * MAC address typo fixed. 010417 --ro
29  * Integrated.  020301 --DaveM
30  * Added multiskb option 020301 --DaveM
31  * Scaling of results. 020417--sigurdur@linpro.no
32  * Significant re-work of the module:
33  *   *  Convert to threaded model to more efficiently be able to transmit
34  *       and receive on multiple interfaces at once.
35  *   *  Converted many counters to __u64 to allow longer runs.
36  *   *  Allow configuration of ranges, like min/max IP address, MACs,
37  *       and UDP-ports, for both source and destination, and can
38  *       set to use a random distribution or sequentially walk the range.
39  *   *  Can now change most values after starting.
40  *   *  Place 12-byte packet in UDP payload with magic number,
41  *       sequence number, and timestamp.
42  *   *  Add receiver code that detects dropped pkts, re-ordered pkts, and
43  *       latencies (with micro-second) precision.
44  *   *  Add IOCTL interface to easily get counters & configuration.
45  *   --Ben Greear <greearb@candelatech.com>
46  *
47  * Renamed multiskb to clone_skb and cleaned up sending core for two distinct
48  * skb modes. A clone_skb=0 mode for Ben "ranges" work and a clone_skb != 0
49  * as a "fastpath" with a configurable number of clones after alloc's.
50  * clone_skb=0 means all packets are allocated this also means ranges time
51  * stamps etc can be used. clone_skb=100 means 1 malloc is followed by 100
52  * clones.
53  *
54  * Also moved to /proc/net/pktgen/
55  * --ro
56  *
57  * Sept 10:  Fixed threading/locking.  Lots of bone-headed and more clever
58  *    mistakes.  Also merged in DaveM's patch in the -pre6 patch.
59  * --Ben Greear <greearb@candelatech.com>
60  *
61  * Integrated to 2.5.x 021029 --Lucio Maciel (luciomaciel@zipmail.com.br)
62  *
63  *
64  * 021124 Finished major redesign and rewrite for new functionality.
65  * See Documentation/networking/pktgen.txt for how to use this.
66  *
67  * The new operation:
68  * For each CPU one thread/process is created at start. This process checks
69  * for running devices in the if_list and sends packets until count is 0 it
70  * also the thread checks the thread->control which is used for inter-process
71  * communication. controlling process "posts" operations to the threads this
72  * way. The if_lock should be possible to remove when add/rem_device is merged
73  * into this too.
74  *
75  * By design there should only be *one* "controlling" process. In practice
76  * multiple write accesses gives unpredictable result. Understood by "write"
77  * to /proc gives result code thats should be read be the "writer".
78  * For practical use this should be no problem.
79  *
80  * Note when adding devices to a specific CPU there good idea to also assign
81  * /proc/irq/XX/smp_affinity so TX-interrupts gets bound to the same CPU.
82  * --ro
83  *
84  * Fix refcount off by one if first packet fails, potential null deref,
85  * memleak 030710- KJP
86  *
87  * First "ranges" functionality for ipv6 030726 --ro
88  *
89  * Included flow support. 030802 ANK.
90  *
91  * Fixed unaligned access on IA-64 Grant Grundler <grundler@parisc-linux.org>
92  *
93  * Remove if fix from added Harald Welte <laforge@netfilter.org> 040419
94  * ia64 compilation fix from  Aron Griffis <aron@hp.com> 040604
95  *
96  * New xmit() return, do_div and misc clean up by Stephen Hemminger
97  * <shemminger@osdl.org> 040923
98  *
99  * Randy Dunlap fixed u64 printk compiler waring
100  *
101  * Remove FCS from BW calculation.  Lennert Buytenhek <buytenh@wantstofly.org>
102  * New time handling. Lennert Buytenhek <buytenh@wantstofly.org> 041213
103  *
104  * Corrections from Nikolai Malykh (nmalykh@bilim.com)
105  * Removed unused flags F_SET_SRCMAC & F_SET_SRCIP 041230
106  *
107  * interruptible_sleep_on_timeout() replaced Nishanth Aravamudan <nacc@us.ibm.com>
108  * 050103
109  *
110  * MPLS support by Steven Whitehouse <steve@chygwyn.com>
111  *
112  * 802.1Q/Q-in-Q support by Francesco Fondelli (FF) <francesco.fondelli@gmail.com>
113  *
114  * Fixed src_mac command to set source mac of packet to value specified in
115  * command by Adit Ranadive <adit.262@gmail.com>
116  *
117  */
118
119 #define pr_fmt(fmt) KBUILD_MODNAME ": " fmt
120
121 #include <linux/sys.h>
122 #include <linux/types.h>
123 #include <linux/module.h>
124 #include <linux/moduleparam.h>
125 #include <linux/kernel.h>
126 #include <linux/mutex.h>
127 #include <linux/sched.h>
128 #include <linux/slab.h>
129 #include <linux/vmalloc.h>
130 #include <linux/unistd.h>
131 #include <linux/string.h>
132 #include <linux/ptrace.h>
133 #include <linux/errno.h>
134 #include <linux/ioport.h>
135 #include <linux/interrupt.h>
136 #include <linux/capability.h>
137 #include <linux/hrtimer.h>
138 #include <linux/freezer.h>
139 #include <linux/delay.h>
140 #include <linux/timer.h>
141 #include <linux/list.h>
142 #include <linux/init.h>
143 #include <linux/skbuff.h>
144 #include <linux/netdevice.h>
145 #include <linux/inet.h>
146 #include <linux/inetdevice.h>
147 #include <linux/rtnetlink.h>
148 #include <linux/if_arp.h>
149 #include <linux/if_vlan.h>
150 #include <linux/in.h>
151 #include <linux/ip.h>
152 #include <linux/ipv6.h>
153 #include <linux/udp.h>
154 #include <linux/proc_fs.h>
155 #include <linux/seq_file.h>
156 #include <linux/wait.h>
157 #include <linux/etherdevice.h>
158 #include <linux/kthread.h>
159 #include <linux/prefetch.h>
160 #include <net/net_namespace.h>
161 #include <net/checksum.h>
162 #include <net/ipv6.h>
163 #include <net/addrconf.h>
164 #ifdef CONFIG_XFRM
165 #include <net/xfrm.h>
166 #endif
167 #include <asm/byteorder.h>
168 #include <linux/rcupdate.h>
169 #include <linux/bitops.h>
170 #include <linux/io.h>
171 #include <linux/timex.h>
172 #include <linux/uaccess.h>
173 #include <asm/dma.h>
174 #include <asm/div64.h>          /* do_div */
175
176 #define VERSION "2.74"
177 #define IP_NAME_SZ 32
178 #define MAX_MPLS_LABELS 16 /* This is the max label stack depth */
179 #define MPLS_STACK_BOTTOM htonl(0x00000100)
180
181 #define func_enter() pr_debug("entering %s\n", __func__);
182
183 /* Device flag bits */
184 #define F_IPSRC_RND   (1<<0)    /* IP-Src Random  */
185 #define F_IPDST_RND   (1<<1)    /* IP-Dst Random  */
186 #define F_UDPSRC_RND  (1<<2)    /* UDP-Src Random */
187 #define F_UDPDST_RND  (1<<3)    /* UDP-Dst Random */
188 #define F_MACSRC_RND  (1<<4)    /* MAC-Src Random */
189 #define F_MACDST_RND  (1<<5)    /* MAC-Dst Random */
190 #define F_TXSIZE_RND  (1<<6)    /* Transmit size is random */
191 #define F_IPV6        (1<<7)    /* Interface in IPV6 Mode */
192 #define F_MPLS_RND    (1<<8)    /* Random MPLS labels */
193 #define F_VID_RND     (1<<9)    /* Random VLAN ID */
194 #define F_SVID_RND    (1<<10)   /* Random SVLAN ID */
195 #define F_FLOW_SEQ    (1<<11)   /* Sequential flows */
196 #define F_IPSEC_ON    (1<<12)   /* ipsec on for flows */
197 #define F_QUEUE_MAP_RND (1<<13) /* queue map Random */
198 #define F_QUEUE_MAP_CPU (1<<14) /* queue map mirrors smp_processor_id() */
199 #define F_NODE          (1<<15) /* Node memory alloc*/
200
201 /* Thread control flag bits */
202 #define T_STOP        (1<<0)    /* Stop run */
203 #define T_RUN         (1<<1)    /* Start run */
204 #define T_REMDEVALL   (1<<2)    /* Remove all devs */
205 #define T_REMDEV      (1<<3)    /* Remove one dev */
206
207 /* If lock -- can be removed after some work */
208 #define   if_lock(t)           spin_lock(&(t->if_lock));
209 #define   if_unlock(t)           spin_unlock(&(t->if_lock));
210
211 /* Used to help with determining the pkts on receive */
212 #define PKTGEN_MAGIC 0xbe9be955
213 #define PG_PROC_DIR "pktgen"
214 #define PGCTRL      "pgctrl"
215 static struct proc_dir_entry *pg_proc_dir;
216
217 #define MAX_CFLOWS  65536
218
219 #define VLAN_TAG_SIZE(x) ((x)->vlan_id == 0xffff ? 0 : 4)
220 #define SVLAN_TAG_SIZE(x) ((x)->svlan_id == 0xffff ? 0 : 4)
221
222 struct flow_state {
223         __be32 cur_daddr;
224         int count;
225 #ifdef CONFIG_XFRM
226         struct xfrm_state *x;
227 #endif
228         __u32 flags;
229 };
230
231 /* flow flag bits */
232 #define F_INIT   (1<<0)         /* flow has been initialized */
233
234 struct pktgen_dev {
235         /*
236          * Try to keep frequent/infrequent used vars. separated.
237          */
238         struct proc_dir_entry *entry;   /* proc file */
239         struct pktgen_thread *pg_thread;/* the owner */
240         struct list_head list;          /* chaining in the thread's run-queue */
241
242         int running;            /* if false, the test will stop */
243
244         /* If min != max, then we will either do a linear iteration, or
245          * we will do a random selection from within the range.
246          */
247         __u32 flags;
248         int removal_mark;       /* non-zero => the device is marked for
249                                  * removal by worker thread */
250
251         int min_pkt_size;
252         int max_pkt_size;
253         int pkt_overhead;       /* overhead for MPLS, VLANs, IPSEC etc */
254         int nfrags;
255         struct page *page;
256         u64 delay;              /* nano-seconds */
257
258         __u64 count;            /* Default No packets to send */
259         __u64 sofar;            /* How many pkts we've sent so far */
260         __u64 tx_bytes;         /* How many bytes we've transmitted */
261         __u64 errors;           /* Errors when trying to transmit, */
262
263         /* runtime counters relating to clone_skb */
264
265         __u64 allocated_skbs;
266         __u32 clone_count;
267         int last_ok;            /* Was last skb sent?
268                                  * Or a failed transmit of some sort?
269                                  * This will keep sequence numbers in order
270                                  */
271         ktime_t next_tx;
272         ktime_t started_at;
273         ktime_t stopped_at;
274         u64     idle_acc;       /* nano-seconds */
275
276         __u32 seq_num;
277
278         int clone_skb;          /*
279                                  * Use multiple SKBs during packet gen.
280                                  * If this number is greater than 1, then
281                                  * that many copies of the same packet will be
282                                  * sent before a new packet is allocated.
283                                  * If you want to send 1024 identical packets
284                                  * before creating a new packet,
285                                  * set clone_skb to 1024.
286                                  */
287
288         char dst_min[IP_NAME_SZ];       /* IP, ie 1.2.3.4 */
289         char dst_max[IP_NAME_SZ];       /* IP, ie 1.2.3.4 */
290         char src_min[IP_NAME_SZ];       /* IP, ie 1.2.3.4 */
291         char src_max[IP_NAME_SZ];       /* IP, ie 1.2.3.4 */
292
293         struct in6_addr in6_saddr;
294         struct in6_addr in6_daddr;
295         struct in6_addr cur_in6_daddr;
296         struct in6_addr cur_in6_saddr;
297         /* For ranges */
298         struct in6_addr min_in6_daddr;
299         struct in6_addr max_in6_daddr;
300         struct in6_addr min_in6_saddr;
301         struct in6_addr max_in6_saddr;
302
303         /* If we're doing ranges, random or incremental, then this
304          * defines the min/max for those ranges.
305          */
306         __be32 saddr_min;       /* inclusive, source IP address */
307         __be32 saddr_max;       /* exclusive, source IP address */
308         __be32 daddr_min;       /* inclusive, dest IP address */
309         __be32 daddr_max;       /* exclusive, dest IP address */
310
311         __u16 udp_src_min;      /* inclusive, source UDP port */
312         __u16 udp_src_max;      /* exclusive, source UDP port */
313         __u16 udp_dst_min;      /* inclusive, dest UDP port */
314         __u16 udp_dst_max;      /* exclusive, dest UDP port */
315
316         /* DSCP + ECN */
317         __u8 tos;            /* six MSB of (former) IPv4 TOS
318                                 are for dscp codepoint */
319         __u8 traffic_class;  /* ditto for the (former) Traffic Class in IPv6
320                                 (see RFC 3260, sec. 4) */
321
322         /* MPLS */
323         unsigned int nr_labels; /* Depth of stack, 0 = no MPLS */
324         __be32 labels[MAX_MPLS_LABELS];
325
326         /* VLAN/SVLAN (802.1Q/Q-in-Q) */
327         __u8  vlan_p;
328         __u8  vlan_cfi;
329         __u16 vlan_id;  /* 0xffff means no vlan tag */
330
331         __u8  svlan_p;
332         __u8  svlan_cfi;
333         __u16 svlan_id; /* 0xffff means no svlan tag */
334
335         __u32 src_mac_count;    /* How many MACs to iterate through */
336         __u32 dst_mac_count;    /* How many MACs to iterate through */
337
338         unsigned char dst_mac[ETH_ALEN];
339         unsigned char src_mac[ETH_ALEN];
340
341         __u32 cur_dst_mac_offset;
342         __u32 cur_src_mac_offset;
343         __be32 cur_saddr;
344         __be32 cur_daddr;
345         __u16 ip_id;
346         __u16 cur_udp_dst;
347         __u16 cur_udp_src;
348         __u16 cur_queue_map;
349         __u32 cur_pkt_size;
350         __u32 last_pkt_size;
351
352         __u8 hh[14];
353         /* = {
354            0x00, 0x80, 0xC8, 0x79, 0xB3, 0xCB,
355
356            We fill in SRC address later
357            0x00, 0x00, 0x00, 0x00, 0x00, 0x00,
358            0x08, 0x00
359            };
360          */
361         __u16 pad;              /* pad out the hh struct to an even 16 bytes */
362
363         struct sk_buff *skb;    /* skb we are to transmit next, used for when we
364                                  * are transmitting the same one multiple times
365                                  */
366         struct net_device *odev; /* The out-going device.
367                                   * Note that the device should have it's
368                                   * pg_info pointer pointing back to this
369                                   * device.
370                                   * Set when the user specifies the out-going
371                                   * device name (not when the inject is
372                                   * started as it used to do.)
373                                   */
374         char odevname[32];
375         struct flow_state *flows;
376         unsigned int cflows;    /* Concurrent flows (config) */
377         unsigned int lflow;             /* Flow length  (config) */
378         unsigned int nflows;    /* accumulated flows (stats) */
379         unsigned int curfl;             /* current sequenced flow (state)*/
380
381         u16 queue_map_min;
382         u16 queue_map_max;
383         __u32 skb_priority;     /* skb priority field */
384         int node;               /* Memory node */
385
386 #ifdef CONFIG_XFRM
387         __u8    ipsmode;                /* IPSEC mode (config) */
388         __u8    ipsproto;               /* IPSEC type (config) */
389 #endif
390         char result[512];
391 };
392
393 struct pktgen_hdr {
394         __be32 pgh_magic;
395         __be32 seq_num;
396         __be32 tv_sec;
397         __be32 tv_usec;
398 };
399
400 static bool pktgen_exiting __read_mostly;
401
402 struct pktgen_thread {
403         spinlock_t if_lock;             /* for list of devices */
404         struct list_head if_list;       /* All device here */
405         struct list_head th_list;
406         struct task_struct *tsk;
407         char result[512];
408
409         /* Field for thread to receive "posted" events terminate,
410            stop ifs etc. */
411
412         u32 control;
413         int cpu;
414
415         wait_queue_head_t queue;
416         struct completion start_done;
417 };
418
419 #define REMOVE 1
420 #define FIND   0
421
422 static inline ktime_t ktime_now(void)
423 {
424         struct timespec ts;
425         ktime_get_ts(&ts);
426
427         return timespec_to_ktime(ts);
428 }
429
430 /* This works even if 32 bit because of careful byte order choice */
431 static inline int ktime_lt(const ktime_t cmp1, const ktime_t cmp2)
432 {
433         return cmp1.tv64 < cmp2.tv64;
434 }
435
436 static const char version[] =
437         "Packet Generator for packet performance testing. "
438         "Version: " VERSION "\n";
439
440 static int pktgen_remove_device(struct pktgen_thread *t, struct pktgen_dev *i);
441 static int pktgen_add_device(struct pktgen_thread *t, const char *ifname);
442 static struct pktgen_dev *pktgen_find_dev(struct pktgen_thread *t,
443                                           const char *ifname, bool exact);
444 static int pktgen_device_event(struct notifier_block *, unsigned long, void *);
445 static void pktgen_run_all_threads(void);
446 static void pktgen_reset_all_threads(void);
447 static void pktgen_stop_all_threads_ifs(void);
448
449 static void pktgen_stop(struct pktgen_thread *t);
450 static void pktgen_clear_counters(struct pktgen_dev *pkt_dev);
451
452 static unsigned int scan_ip6(const char *s, char ip[16]);
453
454 /* Module parameters, defaults. */
455 static int pg_count_d __read_mostly = 1000;
456 static int pg_delay_d __read_mostly;
457 static int pg_clone_skb_d  __read_mostly;
458 static int debug  __read_mostly;
459
460 static DEFINE_MUTEX(pktgen_thread_lock);
461 static LIST_HEAD(pktgen_threads);
462
463 static struct notifier_block pktgen_notifier_block = {
464         .notifier_call = pktgen_device_event,
465 };
466
467 /*
468  * /proc handling functions
469  *
470  */
471
472 static int pgctrl_show(struct seq_file *seq, void *v)
473 {
474         seq_puts(seq, version);
475         return 0;
476 }
477
478 static ssize_t pgctrl_write(struct file *file, const char __user *buf,
479                             size_t count, loff_t *ppos)
480 {
481         int err = 0;
482         char data[128];
483
484         if (!capable(CAP_NET_ADMIN)) {
485                 err = -EPERM;
486                 goto out;
487         }
488
489         if (count > sizeof(data))
490                 count = sizeof(data);
491
492         if (copy_from_user(data, buf, count)) {
493                 err = -EFAULT;
494                 goto out;
495         }
496         data[count - 1] = 0;    /* Make string */
497
498         if (!strcmp(data, "stop"))
499                 pktgen_stop_all_threads_ifs();
500
501         else if (!strcmp(data, "start"))
502                 pktgen_run_all_threads();
503
504         else if (!strcmp(data, "reset"))
505                 pktgen_reset_all_threads();
506
507         else
508                 pr_warning("Unknown command: %s\n", data);
509
510         err = count;
511
512 out:
513         return err;
514 }
515
516 static int pgctrl_open(struct inode *inode, struct file *file)
517 {
518         return single_open(file, pgctrl_show, PDE(inode)->data);
519 }
520
521 static const struct file_operations pktgen_fops = {
522         .owner   = THIS_MODULE,
523         .open    = pgctrl_open,
524         .read    = seq_read,
525         .llseek  = seq_lseek,
526         .write   = pgctrl_write,
527         .release = single_release,
528 };
529
530 static int pktgen_if_show(struct seq_file *seq, void *v)
531 {
532         const struct pktgen_dev *pkt_dev = seq->private;
533         ktime_t stopped;
534         u64 idle;
535
536         seq_printf(seq,
537                    "Params: count %llu  min_pkt_size: %u  max_pkt_size: %u\n",
538                    (unsigned long long)pkt_dev->count, pkt_dev->min_pkt_size,
539                    pkt_dev->max_pkt_size);
540
541         seq_printf(seq,
542                    "     frags: %d  delay: %llu  clone_skb: %d  ifname: %s\n",
543                    pkt_dev->nfrags, (unsigned long long) pkt_dev->delay,
544                    pkt_dev->clone_skb, pkt_dev->odevname);
545
546         seq_printf(seq, "     flows: %u flowlen: %u\n", pkt_dev->cflows,
547                    pkt_dev->lflow);
548
549         seq_printf(seq,
550                    "     queue_map_min: %u  queue_map_max: %u\n",
551                    pkt_dev->queue_map_min,
552                    pkt_dev->queue_map_max);
553
554         if (pkt_dev->skb_priority)
555                 seq_printf(seq, "     skb_priority: %u\n",
556                            pkt_dev->skb_priority);
557
558         if (pkt_dev->flags & F_IPV6) {
559                 seq_printf(seq,
560                            "     saddr: %pI6c  min_saddr: %pI6c  max_saddr: %pI6c\n"
561                            "     daddr: %pI6c  min_daddr: %pI6c  max_daddr: %pI6c\n",
562                            &pkt_dev->in6_saddr,
563                            &pkt_dev->min_in6_saddr, &pkt_dev->max_in6_saddr,
564                            &pkt_dev->in6_daddr,
565                            &pkt_dev->min_in6_daddr, &pkt_dev->max_in6_daddr);
566         } else {
567                 seq_printf(seq,
568                            "     dst_min: %s  dst_max: %s\n",
569                            pkt_dev->dst_min, pkt_dev->dst_max);
570                 seq_printf(seq,
571                            "        src_min: %s  src_max: %s\n",
572                            pkt_dev->src_min, pkt_dev->src_max);
573         }
574
575         seq_puts(seq, "     src_mac: ");
576
577         seq_printf(seq, "%pM ",
578                    is_zero_ether_addr(pkt_dev->src_mac) ?
579                              pkt_dev->odev->dev_addr : pkt_dev->src_mac);
580
581         seq_printf(seq, "dst_mac: ");
582         seq_printf(seq, "%pM\n", pkt_dev->dst_mac);
583
584         seq_printf(seq,
585                    "     udp_src_min: %d  udp_src_max: %d"
586                    "  udp_dst_min: %d  udp_dst_max: %d\n",
587                    pkt_dev->udp_src_min, pkt_dev->udp_src_max,
588                    pkt_dev->udp_dst_min, pkt_dev->udp_dst_max);
589
590         seq_printf(seq,
591                    "     src_mac_count: %d  dst_mac_count: %d\n",
592                    pkt_dev->src_mac_count, pkt_dev->dst_mac_count);
593
594         if (pkt_dev->nr_labels) {
595                 unsigned int i;
596                 seq_printf(seq, "     mpls: ");
597                 for (i = 0; i < pkt_dev->nr_labels; i++)
598                         seq_printf(seq, "%08x%s", ntohl(pkt_dev->labels[i]),
599                                    i == pkt_dev->nr_labels-1 ? "\n" : ", ");
600         }
601
602         if (pkt_dev->vlan_id != 0xffff)
603                 seq_printf(seq, "     vlan_id: %u  vlan_p: %u  vlan_cfi: %u\n",
604                            pkt_dev->vlan_id, pkt_dev->vlan_p,
605                            pkt_dev->vlan_cfi);
606
607         if (pkt_dev->svlan_id != 0xffff)
608                 seq_printf(seq, "     svlan_id: %u  vlan_p: %u  vlan_cfi: %u\n",
609                            pkt_dev->svlan_id, pkt_dev->svlan_p,
610                            pkt_dev->svlan_cfi);
611
612         if (pkt_dev->tos)
613                 seq_printf(seq, "     tos: 0x%02x\n", pkt_dev->tos);
614
615         if (pkt_dev->traffic_class)
616                 seq_printf(seq, "     traffic_class: 0x%02x\n", pkt_dev->traffic_class);
617
618         if (pkt_dev->node >= 0)
619                 seq_printf(seq, "     node: %d\n", pkt_dev->node);
620
621         seq_printf(seq, "     Flags: ");
622
623         if (pkt_dev->flags & F_IPV6)
624                 seq_printf(seq, "IPV6  ");
625
626         if (pkt_dev->flags & F_IPSRC_RND)
627                 seq_printf(seq, "IPSRC_RND  ");
628
629         if (pkt_dev->flags & F_IPDST_RND)
630                 seq_printf(seq, "IPDST_RND  ");
631
632         if (pkt_dev->flags & F_TXSIZE_RND)
633                 seq_printf(seq, "TXSIZE_RND  ");
634
635         if (pkt_dev->flags & F_UDPSRC_RND)
636                 seq_printf(seq, "UDPSRC_RND  ");
637
638         if (pkt_dev->flags & F_UDPDST_RND)
639                 seq_printf(seq, "UDPDST_RND  ");
640
641         if (pkt_dev->flags & F_MPLS_RND)
642                 seq_printf(seq,  "MPLS_RND  ");
643
644         if (pkt_dev->flags & F_QUEUE_MAP_RND)
645                 seq_printf(seq,  "QUEUE_MAP_RND  ");
646
647         if (pkt_dev->flags & F_QUEUE_MAP_CPU)
648                 seq_printf(seq,  "QUEUE_MAP_CPU  ");
649
650         if (pkt_dev->cflows) {
651                 if (pkt_dev->flags & F_FLOW_SEQ)
652                         seq_printf(seq,  "FLOW_SEQ  "); /*in sequence flows*/
653                 else
654                         seq_printf(seq,  "FLOW_RND  ");
655         }
656
657 #ifdef CONFIG_XFRM
658         if (pkt_dev->flags & F_IPSEC_ON)
659                 seq_printf(seq,  "IPSEC  ");
660 #endif
661
662         if (pkt_dev->flags & F_MACSRC_RND)
663                 seq_printf(seq, "MACSRC_RND  ");
664
665         if (pkt_dev->flags & F_MACDST_RND)
666                 seq_printf(seq, "MACDST_RND  ");
667
668         if (pkt_dev->flags & F_VID_RND)
669                 seq_printf(seq, "VID_RND  ");
670
671         if (pkt_dev->flags & F_SVID_RND)
672                 seq_printf(seq, "SVID_RND  ");
673
674         if (pkt_dev->flags & F_NODE)
675                 seq_printf(seq, "NODE_ALLOC  ");
676
677         seq_puts(seq, "\n");
678
679         /* not really stopped, more like last-running-at */
680         stopped = pkt_dev->running ? ktime_now() : pkt_dev->stopped_at;
681         idle = pkt_dev->idle_acc;
682         do_div(idle, NSEC_PER_USEC);
683
684         seq_printf(seq,
685                    "Current:\n     pkts-sofar: %llu  errors: %llu\n",
686                    (unsigned long long)pkt_dev->sofar,
687                    (unsigned long long)pkt_dev->errors);
688
689         seq_printf(seq,
690                    "     started: %lluus  stopped: %lluus idle: %lluus\n",
691                    (unsigned long long) ktime_to_us(pkt_dev->started_at),
692                    (unsigned long long) ktime_to_us(stopped),
693                    (unsigned long long) idle);
694
695         seq_printf(seq,
696                    "     seq_num: %d  cur_dst_mac_offset: %d  cur_src_mac_offset: %d\n",
697                    pkt_dev->seq_num, pkt_dev->cur_dst_mac_offset,
698                    pkt_dev->cur_src_mac_offset);
699
700         if (pkt_dev->flags & F_IPV6) {
701                 seq_printf(seq, "     cur_saddr: %pI6c  cur_daddr: %pI6c\n",
702                                 &pkt_dev->cur_in6_saddr,
703                                 &pkt_dev->cur_in6_daddr);
704         } else
705                 seq_printf(seq, "     cur_saddr: 0x%x  cur_daddr: 0x%x\n",
706                            pkt_dev->cur_saddr, pkt_dev->cur_daddr);
707
708         seq_printf(seq, "     cur_udp_dst: %d  cur_udp_src: %d\n",
709                    pkt_dev->cur_udp_dst, pkt_dev->cur_udp_src);
710
711         seq_printf(seq, "     cur_queue_map: %u\n", pkt_dev->cur_queue_map);
712
713         seq_printf(seq, "     flows: %u\n", pkt_dev->nflows);
714
715         if (pkt_dev->result[0])
716                 seq_printf(seq, "Result: %s\n", pkt_dev->result);
717         else
718                 seq_printf(seq, "Result: Idle\n");
719
720         return 0;
721 }
722
723
724 static int hex32_arg(const char __user *user_buffer, unsigned long maxlen,
725                      __u32 *num)
726 {
727         int i = 0;
728         *num = 0;
729
730         for (; i < maxlen; i++) {
731                 int value;
732                 char c;
733                 *num <<= 4;
734                 if (get_user(c, &user_buffer[i]))
735                         return -EFAULT;
736                 value = hex_to_bin(c);
737                 if (value >= 0)
738                         *num |= value;
739                 else
740                         break;
741         }
742         return i;
743 }
744
745 static int count_trail_chars(const char __user * user_buffer,
746                              unsigned int maxlen)
747 {
748         int i;
749
750         for (i = 0; i < maxlen; i++) {
751                 char c;
752                 if (get_user(c, &user_buffer[i]))
753                         return -EFAULT;
754                 switch (c) {
755                 case '\"':
756                 case '\n':
757                 case '\r':
758                 case '\t':
759                 case ' ':
760                 case '=':
761                         break;
762                 default:
763                         goto done;
764                 }
765         }
766 done:
767         return i;
768 }
769
770 static long num_arg(const char __user *user_buffer, unsigned long maxlen,
771                                 unsigned long *num)
772 {
773         int i;
774         *num = 0;
775
776         for (i = 0; i < maxlen; i++) {
777                 char c;
778                 if (get_user(c, &user_buffer[i]))
779                         return -EFAULT;
780                 if ((c >= '0') && (c <= '9')) {
781                         *num *= 10;
782                         *num += c - '0';
783                 } else
784                         break;
785         }
786         return i;
787 }
788
789 static int strn_len(const char __user * user_buffer, unsigned int maxlen)
790 {
791         int i;
792
793         for (i = 0; i < maxlen; i++) {
794                 char c;
795                 if (get_user(c, &user_buffer[i]))
796                         return -EFAULT;
797                 switch (c) {
798                 case '\"':
799                 case '\n':
800                 case '\r':
801                 case '\t':
802                 case ' ':
803                         goto done_str;
804                         break;
805                 default:
806                         break;
807                 }
808         }
809 done_str:
810         return i;
811 }
812
813 static ssize_t get_labels(const char __user *buffer, struct pktgen_dev *pkt_dev)
814 {
815         unsigned int n = 0;
816         char c;
817         ssize_t i = 0;
818         int len;
819
820         pkt_dev->nr_labels = 0;
821         do {
822                 __u32 tmp;
823                 len = hex32_arg(&buffer[i], 8, &tmp);
824                 if (len <= 0)
825                         return len;
826                 pkt_dev->labels[n] = htonl(tmp);
827                 if (pkt_dev->labels[n] & MPLS_STACK_BOTTOM)
828                         pkt_dev->flags |= F_MPLS_RND;
829                 i += len;
830                 if (get_user(c, &buffer[i]))
831                         return -EFAULT;
832                 i++;
833                 n++;
834                 if (n >= MAX_MPLS_LABELS)
835                         return -E2BIG;
836         } while (c == ',');
837
838         pkt_dev->nr_labels = n;
839         return i;
840 }
841
842 static ssize_t pktgen_if_write(struct file *file,
843                                const char __user * user_buffer, size_t count,
844                                loff_t * offset)
845 {
846         struct seq_file *seq = file->private_data;
847         struct pktgen_dev *pkt_dev = seq->private;
848         int i, max, len;
849         char name[16], valstr[32];
850         unsigned long value = 0;
851         char *pg_result = NULL;
852         int tmp = 0;
853         char buf[128];
854
855         pg_result = &(pkt_dev->result[0]);
856
857         if (count < 1) {
858                 pr_warning("wrong command format\n");
859                 return -EINVAL;
860         }
861
862         max = count;
863         tmp = count_trail_chars(user_buffer, max);
864         if (tmp < 0) {
865                 pr_warning("illegal format\n");
866                 return tmp;
867         }
868         i = tmp;
869
870         /* Read variable name */
871
872         len = strn_len(&user_buffer[i], sizeof(name) - 1);
873         if (len < 0)
874                 return len;
875
876         memset(name, 0, sizeof(name));
877         if (copy_from_user(name, &user_buffer[i], len))
878                 return -EFAULT;
879         i += len;
880
881         max = count - i;
882         len = count_trail_chars(&user_buffer[i], max);
883         if (len < 0)
884                 return len;
885
886         i += len;
887
888         if (debug) {
889                 size_t copy = min_t(size_t, count, 1023);
890                 char tb[copy + 1];
891                 if (copy_from_user(tb, user_buffer, copy))
892                         return -EFAULT;
893                 tb[copy] = 0;
894                 pr_debug("%s,%lu  buffer -:%s:-\n",
895                          name, (unsigned long)count, tb);
896         }
897
898         if (!strcmp(name, "min_pkt_size")) {
899                 len = num_arg(&user_buffer[i], 10, &value);
900                 if (len < 0)
901                         return len;
902
903                 i += len;
904                 if (value < 14 + 20 + 8)
905                         value = 14 + 20 + 8;
906                 if (value != pkt_dev->min_pkt_size) {
907                         pkt_dev->min_pkt_size = value;
908                         pkt_dev->cur_pkt_size = value;
909                 }
910                 sprintf(pg_result, "OK: min_pkt_size=%u",
911                         pkt_dev->min_pkt_size);
912                 return count;
913         }
914
915         if (!strcmp(name, "max_pkt_size")) {
916                 len = num_arg(&user_buffer[i], 10, &value);
917                 if (len < 0)
918                         return len;
919
920                 i += len;
921                 if (value < 14 + 20 + 8)
922                         value = 14 + 20 + 8;
923                 if (value != pkt_dev->max_pkt_size) {
924                         pkt_dev->max_pkt_size = value;
925                         pkt_dev->cur_pkt_size = value;
926                 }
927                 sprintf(pg_result, "OK: max_pkt_size=%u",
928                         pkt_dev->max_pkt_size);
929                 return count;
930         }
931
932         /* Shortcut for min = max */
933
934         if (!strcmp(name, "pkt_size")) {
935                 len = num_arg(&user_buffer[i], 10, &value);
936                 if (len < 0)
937                         return len;
938
939                 i += len;
940                 if (value < 14 + 20 + 8)
941                         value = 14 + 20 + 8;
942                 if (value != pkt_dev->min_pkt_size) {
943                         pkt_dev->min_pkt_size = value;
944                         pkt_dev->max_pkt_size = value;
945                         pkt_dev->cur_pkt_size = value;
946                 }
947                 sprintf(pg_result, "OK: pkt_size=%u", pkt_dev->min_pkt_size);
948                 return count;
949         }
950
951         if (!strcmp(name, "debug")) {
952                 len = num_arg(&user_buffer[i], 10, &value);
953                 if (len < 0)
954                         return len;
955
956                 i += len;
957                 debug = value;
958                 sprintf(pg_result, "OK: debug=%u", debug);
959                 return count;
960         }
961
962         if (!strcmp(name, "frags")) {
963                 len = num_arg(&user_buffer[i], 10, &value);
964                 if (len < 0)
965                         return len;
966
967                 i += len;
968                 pkt_dev->nfrags = value;
969                 sprintf(pg_result, "OK: frags=%u", pkt_dev->nfrags);
970                 return count;
971         }
972         if (!strcmp(name, "delay")) {
973                 len = num_arg(&user_buffer[i], 10, &value);
974                 if (len < 0)
975                         return len;
976
977                 i += len;
978                 if (value == 0x7FFFFFFF)
979                         pkt_dev->delay = ULLONG_MAX;
980                 else
981                         pkt_dev->delay = (u64)value;
982
983                 sprintf(pg_result, "OK: delay=%llu",
984                         (unsigned long long) pkt_dev->delay);
985                 return count;
986         }
987         if (!strcmp(name, "rate")) {
988                 len = num_arg(&user_buffer[i], 10, &value);
989                 if (len < 0)
990                         return len;
991
992                 i += len;
993                 if (!value)
994                         return len;
995                 pkt_dev->delay = pkt_dev->min_pkt_size*8*NSEC_PER_USEC/value;
996                 if (debug)
997                         pr_info("Delay set at: %llu ns\n", pkt_dev->delay);
998
999                 sprintf(pg_result, "OK: rate=%lu", value);
1000                 return count;
1001         }
1002         if (!strcmp(name, "ratep")) {
1003                 len = num_arg(&user_buffer[i], 10, &value);
1004                 if (len < 0)
1005                         return len;
1006
1007                 i += len;
1008                 if (!value)
1009                         return len;
1010                 pkt_dev->delay = NSEC_PER_SEC/value;
1011                 if (debug)
1012                         pr_info("Delay set at: %llu ns\n", pkt_dev->delay);
1013
1014                 sprintf(pg_result, "OK: rate=%lu", value);
1015                 return count;
1016         }
1017         if (!strcmp(name, "udp_src_min")) {
1018                 len = num_arg(&user_buffer[i], 10, &value);
1019                 if (len < 0)
1020                         return len;
1021
1022                 i += len;
1023                 if (value != pkt_dev->udp_src_min) {
1024                         pkt_dev->udp_src_min = value;
1025                         pkt_dev->cur_udp_src = value;
1026                 }
1027                 sprintf(pg_result, "OK: udp_src_min=%u", pkt_dev->udp_src_min);
1028                 return count;
1029         }
1030         if (!strcmp(name, "udp_dst_min")) {
1031                 len = num_arg(&user_buffer[i], 10, &value);
1032                 if (len < 0)
1033                         return len;
1034
1035                 i += len;
1036                 if (value != pkt_dev->udp_dst_min) {
1037                         pkt_dev->udp_dst_min = value;
1038                         pkt_dev->cur_udp_dst = value;
1039                 }
1040                 sprintf(pg_result, "OK: udp_dst_min=%u", pkt_dev->udp_dst_min);
1041                 return count;
1042         }
1043         if (!strcmp(name, "udp_src_max")) {
1044                 len = num_arg(&user_buffer[i], 10, &value);
1045                 if (len < 0)
1046                         return len;
1047
1048                 i += len;
1049                 if (value != pkt_dev->udp_src_max) {
1050                         pkt_dev->udp_src_max = value;
1051                         pkt_dev->cur_udp_src = value;
1052                 }
1053                 sprintf(pg_result, "OK: udp_src_max=%u", pkt_dev->udp_src_max);
1054                 return count;
1055         }
1056         if (!strcmp(name, "udp_dst_max")) {
1057                 len = num_arg(&user_buffer[i], 10, &value);
1058                 if (len < 0)
1059                         return len;
1060
1061                 i += len;
1062                 if (value != pkt_dev->udp_dst_max) {
1063                         pkt_dev->udp_dst_max = value;
1064                         pkt_dev->cur_udp_dst = value;
1065                 }
1066                 sprintf(pg_result, "OK: udp_dst_max=%u", pkt_dev->udp_dst_max);
1067                 return count;
1068         }
1069         if (!strcmp(name, "clone_skb")) {
1070                 len = num_arg(&user_buffer[i], 10, &value);
1071                 if (len < 0)
1072                         return len;
1073                 if ((value > 0) &&
1074                     (!(pkt_dev->odev->priv_flags & IFF_TX_SKB_SHARING)))
1075                         return -ENOTSUPP;
1076                 i += len;
1077                 pkt_dev->clone_skb = value;
1078
1079                 sprintf(pg_result, "OK: clone_skb=%d", pkt_dev->clone_skb);
1080                 return count;
1081         }
1082         if (!strcmp(name, "count")) {
1083                 len = num_arg(&user_buffer[i], 10, &value);
1084                 if (len < 0)
1085                         return len;
1086
1087                 i += len;
1088                 pkt_dev->count = value;
1089                 sprintf(pg_result, "OK: count=%llu",
1090                         (unsigned long long)pkt_dev->count);
1091                 return count;
1092         }
1093         if (!strcmp(name, "src_mac_count")) {
1094                 len = num_arg(&user_buffer[i], 10, &value);
1095                 if (len < 0)
1096                         return len;
1097
1098                 i += len;
1099                 if (pkt_dev->src_mac_count != value) {
1100                         pkt_dev->src_mac_count = value;
1101                         pkt_dev->cur_src_mac_offset = 0;
1102                 }
1103                 sprintf(pg_result, "OK: src_mac_count=%d",
1104                         pkt_dev->src_mac_count);
1105                 return count;
1106         }
1107         if (!strcmp(name, "dst_mac_count")) {
1108                 len = num_arg(&user_buffer[i], 10, &value);
1109                 if (len < 0)
1110                         return len;
1111
1112                 i += len;
1113                 if (pkt_dev->dst_mac_count != value) {
1114                         pkt_dev->dst_mac_count = value;
1115                         pkt_dev->cur_dst_mac_offset = 0;
1116                 }
1117                 sprintf(pg_result, "OK: dst_mac_count=%d",
1118                         pkt_dev->dst_mac_count);
1119                 return count;
1120         }
1121         if (!strcmp(name, "node")) {
1122                 len = num_arg(&user_buffer[i], 10, &value);
1123                 if (len < 0)
1124                         return len;
1125
1126                 i += len;
1127
1128                 if (node_possible(value)) {
1129                         pkt_dev->node = value;
1130                         sprintf(pg_result, "OK: node=%d", pkt_dev->node);
1131                         if (pkt_dev->page) {
1132                                 put_page(pkt_dev->page);
1133                                 pkt_dev->page = NULL;
1134                         }
1135                 }
1136                 else
1137                         sprintf(pg_result, "ERROR: node not possible");
1138                 return count;
1139         }
1140         if (!strcmp(name, "flag")) {
1141                 char f[32];
1142                 memset(f, 0, 32);
1143                 len = strn_len(&user_buffer[i], sizeof(f) - 1);
1144                 if (len < 0)
1145                         return len;
1146
1147                 if (copy_from_user(f, &user_buffer[i], len))
1148                         return -EFAULT;
1149                 i += len;
1150                 if (strcmp(f, "IPSRC_RND") == 0)
1151                         pkt_dev->flags |= F_IPSRC_RND;
1152
1153                 else if (strcmp(f, "!IPSRC_RND") == 0)
1154                         pkt_dev->flags &= ~F_IPSRC_RND;
1155
1156                 else if (strcmp(f, "TXSIZE_RND") == 0)
1157                         pkt_dev->flags |= F_TXSIZE_RND;
1158
1159                 else if (strcmp(f, "!TXSIZE_RND") == 0)
1160                         pkt_dev->flags &= ~F_TXSIZE_RND;
1161
1162                 else if (strcmp(f, "IPDST_RND") == 0)
1163                         pkt_dev->flags |= F_IPDST_RND;
1164
1165                 else if (strcmp(f, "!IPDST_RND") == 0)
1166                         pkt_dev->flags &= ~F_IPDST_RND;
1167
1168                 else if (strcmp(f, "UDPSRC_RND") == 0)
1169                         pkt_dev->flags |= F_UDPSRC_RND;
1170
1171                 else if (strcmp(f, "!UDPSRC_RND") == 0)
1172                         pkt_dev->flags &= ~F_UDPSRC_RND;
1173
1174                 else if (strcmp(f, "UDPDST_RND") == 0)
1175                         pkt_dev->flags |= F_UDPDST_RND;
1176
1177                 else if (strcmp(f, "!UDPDST_RND") == 0)
1178                         pkt_dev->flags &= ~F_UDPDST_RND;
1179
1180                 else if (strcmp(f, "MACSRC_RND") == 0)
1181                         pkt_dev->flags |= F_MACSRC_RND;
1182
1183                 else if (strcmp(f, "!MACSRC_RND") == 0)
1184                         pkt_dev->flags &= ~F_MACSRC_RND;
1185
1186                 else if (strcmp(f, "MACDST_RND") == 0)
1187                         pkt_dev->flags |= F_MACDST_RND;
1188
1189                 else if (strcmp(f, "!MACDST_RND") == 0)
1190                         pkt_dev->flags &= ~F_MACDST_RND;
1191
1192                 else if (strcmp(f, "MPLS_RND") == 0)
1193                         pkt_dev->flags |= F_MPLS_RND;
1194
1195                 else if (strcmp(f, "!MPLS_RND") == 0)
1196                         pkt_dev->flags &= ~F_MPLS_RND;
1197
1198                 else if (strcmp(f, "VID_RND") == 0)
1199                         pkt_dev->flags |= F_VID_RND;
1200
1201                 else if (strcmp(f, "!VID_RND") == 0)
1202                         pkt_dev->flags &= ~F_VID_RND;
1203
1204                 else if (strcmp(f, "SVID_RND") == 0)
1205                         pkt_dev->flags |= F_SVID_RND;
1206
1207                 else if (strcmp(f, "!SVID_RND") == 0)
1208                         pkt_dev->flags &= ~F_SVID_RND;
1209
1210                 else if (strcmp(f, "FLOW_SEQ") == 0)
1211                         pkt_dev->flags |= F_FLOW_SEQ;
1212
1213                 else if (strcmp(f, "QUEUE_MAP_RND") == 0)
1214                         pkt_dev->flags |= F_QUEUE_MAP_RND;
1215
1216                 else if (strcmp(f, "!QUEUE_MAP_RND") == 0)
1217                         pkt_dev->flags &= ~F_QUEUE_MAP_RND;
1218
1219                 else if (strcmp(f, "QUEUE_MAP_CPU") == 0)
1220                         pkt_dev->flags |= F_QUEUE_MAP_CPU;
1221
1222                 else if (strcmp(f, "!QUEUE_MAP_CPU") == 0)
1223                         pkt_dev->flags &= ~F_QUEUE_MAP_CPU;
1224 #ifdef CONFIG_XFRM
1225                 else if (strcmp(f, "IPSEC") == 0)
1226                         pkt_dev->flags |= F_IPSEC_ON;
1227 #endif
1228
1229                 else if (strcmp(f, "!IPV6") == 0)
1230                         pkt_dev->flags &= ~F_IPV6;
1231
1232                 else if (strcmp(f, "NODE_ALLOC") == 0)
1233                         pkt_dev->flags |= F_NODE;
1234
1235                 else if (strcmp(f, "!NODE_ALLOC") == 0)
1236                         pkt_dev->flags &= ~F_NODE;
1237
1238                 else {
1239                         sprintf(pg_result,
1240                                 "Flag -:%s:- unknown\nAvailable flags, (prepend ! to un-set flag):\n%s",
1241                                 f,
1242                                 "IPSRC_RND, IPDST_RND, UDPSRC_RND, UDPDST_RND, "
1243                                 "MACSRC_RND, MACDST_RND, TXSIZE_RND, IPV6, MPLS_RND, VID_RND, SVID_RND, FLOW_SEQ, IPSEC, NODE_ALLOC\n");
1244                         return count;
1245                 }
1246                 sprintf(pg_result, "OK: flags=0x%x", pkt_dev->flags);
1247                 return count;
1248         }
1249         if (!strcmp(name, "dst_min") || !strcmp(name, "dst")) {
1250                 len = strn_len(&user_buffer[i], sizeof(pkt_dev->dst_min) - 1);
1251                 if (len < 0)
1252                         return len;
1253
1254                 if (copy_from_user(buf, &user_buffer[i], len))
1255                         return -EFAULT;
1256                 buf[len] = 0;
1257                 if (strcmp(buf, pkt_dev->dst_min) != 0) {
1258                         memset(pkt_dev->dst_min, 0, sizeof(pkt_dev->dst_min));
1259                         strncpy(pkt_dev->dst_min, buf, len);
1260                         pkt_dev->daddr_min = in_aton(pkt_dev->dst_min);
1261                         pkt_dev->cur_daddr = pkt_dev->daddr_min;
1262                 }
1263                 if (debug)
1264                         pr_debug("dst_min set to: %s\n", pkt_dev->dst_min);
1265                 i += len;
1266                 sprintf(pg_result, "OK: dst_min=%s", pkt_dev->dst_min);
1267                 return count;
1268         }
1269         if (!strcmp(name, "dst_max")) {
1270                 len = strn_len(&user_buffer[i], sizeof(pkt_dev->dst_max) - 1);
1271                 if (len < 0)
1272                         return len;
1273
1274
1275                 if (copy_from_user(buf, &user_buffer[i], len))
1276                         return -EFAULT;
1277
1278                 buf[len] = 0;
1279                 if (strcmp(buf, pkt_dev->dst_max) != 0) {
1280                         memset(pkt_dev->dst_max, 0, sizeof(pkt_dev->dst_max));
1281                         strncpy(pkt_dev->dst_max, buf, len);
1282                         pkt_dev->daddr_max = in_aton(pkt_dev->dst_max);
1283                         pkt_dev->cur_daddr = pkt_dev->daddr_max;
1284                 }
1285                 if (debug)
1286                         pr_debug("dst_max set to: %s\n", pkt_dev->dst_max);
1287                 i += len;
1288                 sprintf(pg_result, "OK: dst_max=%s", pkt_dev->dst_max);
1289                 return count;
1290         }
1291         if (!strcmp(name, "dst6")) {
1292                 len = strn_len(&user_buffer[i], sizeof(buf) - 1);
1293                 if (len < 0)
1294                         return len;
1295
1296                 pkt_dev->flags |= F_IPV6;
1297
1298                 if (copy_from_user(buf, &user_buffer[i], len))
1299                         return -EFAULT;
1300                 buf[len] = 0;
1301
1302                 scan_ip6(buf, pkt_dev->in6_daddr.s6_addr);
1303                 snprintf(buf, sizeof(buf), "%pI6c", &pkt_dev->in6_daddr);
1304
1305                 pkt_dev->cur_in6_daddr = pkt_dev->in6_daddr;
1306
1307                 if (debug)
1308                         pr_debug("dst6 set to: %s\n", buf);
1309
1310                 i += len;
1311                 sprintf(pg_result, "OK: dst6=%s", buf);
1312                 return count;
1313         }
1314         if (!strcmp(name, "dst6_min")) {
1315                 len = strn_len(&user_buffer[i], sizeof(buf) - 1);
1316                 if (len < 0)
1317                         return len;
1318
1319                 pkt_dev->flags |= F_IPV6;
1320
1321                 if (copy_from_user(buf, &user_buffer[i], len))
1322                         return -EFAULT;
1323                 buf[len] = 0;
1324
1325                 scan_ip6(buf, pkt_dev->min_in6_daddr.s6_addr);
1326                 snprintf(buf, sizeof(buf), "%pI6c", &pkt_dev->min_in6_daddr);
1327
1328                 pkt_dev->cur_in6_daddr = pkt_dev->min_in6_daddr;
1329                 if (debug)
1330                         pr_debug("dst6_min set to: %s\n", buf);
1331
1332                 i += len;
1333                 sprintf(pg_result, "OK: dst6_min=%s", buf);
1334                 return count;
1335         }
1336         if (!strcmp(name, "dst6_max")) {
1337                 len = strn_len(&user_buffer[i], sizeof(buf) - 1);
1338                 if (len < 0)
1339                         return len;
1340
1341                 pkt_dev->flags |= F_IPV6;
1342
1343                 if (copy_from_user(buf, &user_buffer[i], len))
1344                         return -EFAULT;
1345                 buf[len] = 0;
1346
1347                 scan_ip6(buf, pkt_dev->max_in6_daddr.s6_addr);
1348                 snprintf(buf, sizeof(buf), "%pI6c", &pkt_dev->max_in6_daddr);
1349
1350                 if (debug)
1351                         pr_debug("dst6_max set to: %s\n", buf);
1352
1353                 i += len;
1354                 sprintf(pg_result, "OK: dst6_max=%s", buf);
1355                 return count;
1356         }
1357         if (!strcmp(name, "src6")) {
1358                 len = strn_len(&user_buffer[i], sizeof(buf) - 1);
1359                 if (len < 0)
1360                         return len;
1361
1362                 pkt_dev->flags |= F_IPV6;
1363
1364                 if (copy_from_user(buf, &user_buffer[i], len))
1365                         return -EFAULT;
1366                 buf[len] = 0;
1367
1368                 scan_ip6(buf, pkt_dev->in6_saddr.s6_addr);
1369                 snprintf(buf, sizeof(buf), "%pI6c", &pkt_dev->in6_saddr);
1370
1371                 pkt_dev->cur_in6_saddr = pkt_dev->in6_saddr;
1372
1373                 if (debug)
1374                         pr_debug("src6 set to: %s\n", buf);
1375
1376                 i += len;
1377                 sprintf(pg_result, "OK: src6=%s", buf);
1378                 return count;
1379         }
1380         if (!strcmp(name, "src_min")) {
1381                 len = strn_len(&user_buffer[i], sizeof(pkt_dev->src_min) - 1);
1382                 if (len < 0)
1383                         return len;
1384
1385                 if (copy_from_user(buf, &user_buffer[i], len))
1386                         return -EFAULT;
1387                 buf[len] = 0;
1388                 if (strcmp(buf, pkt_dev->src_min) != 0) {
1389                         memset(pkt_dev->src_min, 0, sizeof(pkt_dev->src_min));
1390                         strncpy(pkt_dev->src_min, buf, len);
1391                         pkt_dev->saddr_min = in_aton(pkt_dev->src_min);
1392                         pkt_dev->cur_saddr = pkt_dev->saddr_min;
1393                 }
1394                 if (debug)
1395                         pr_debug("src_min set to: %s\n", pkt_dev->src_min);
1396                 i += len;
1397                 sprintf(pg_result, "OK: src_min=%s", pkt_dev->src_min);
1398                 return count;
1399         }
1400         if (!strcmp(name, "src_max")) {
1401                 len = strn_len(&user_buffer[i], sizeof(pkt_dev->src_max) - 1);
1402                 if (len < 0)
1403                         return len;
1404
1405                 if (copy_from_user(buf, &user_buffer[i], len))
1406                         return -EFAULT;
1407                 buf[len] = 0;
1408                 if (strcmp(buf, pkt_dev->src_max) != 0) {
1409                         memset(pkt_dev->src_max, 0, sizeof(pkt_dev->src_max));
1410                         strncpy(pkt_dev->src_max, buf, len);
1411                         pkt_dev->saddr_max = in_aton(pkt_dev->src_max);
1412                         pkt_dev->cur_saddr = pkt_dev->saddr_max;
1413                 }
1414                 if (debug)
1415                         pr_debug("src_max set to: %s\n", pkt_dev->src_max);
1416                 i += len;
1417                 sprintf(pg_result, "OK: src_max=%s", pkt_dev->src_max);
1418                 return count;
1419         }
1420         if (!strcmp(name, "dst_mac")) {
1421                 len = strn_len(&user_buffer[i], sizeof(valstr) - 1);
1422                 if (len < 0)
1423                         return len;
1424
1425                 memset(valstr, 0, sizeof(valstr));
1426                 if (copy_from_user(valstr, &user_buffer[i], len))
1427                         return -EFAULT;
1428
1429                 if (!mac_pton(valstr, pkt_dev->dst_mac))
1430                         return -EINVAL;
1431                 /* Set up Dest MAC */
1432                 memcpy(&pkt_dev->hh[0], pkt_dev->dst_mac, ETH_ALEN);
1433
1434                 sprintf(pg_result, "OK: dstmac %pM", pkt_dev->dst_mac);
1435                 return count;
1436         }
1437         if (!strcmp(name, "src_mac")) {
1438                 len = strn_len(&user_buffer[i], sizeof(valstr) - 1);
1439                 if (len < 0)
1440                         return len;
1441
1442                 memset(valstr, 0, sizeof(valstr));
1443                 if (copy_from_user(valstr, &user_buffer[i], len))
1444                         return -EFAULT;
1445
1446                 if (!mac_pton(valstr, pkt_dev->src_mac))
1447                         return -EINVAL;
1448                 /* Set up Src MAC */
1449                 memcpy(&pkt_dev->hh[6], pkt_dev->src_mac, ETH_ALEN);
1450
1451                 sprintf(pg_result, "OK: srcmac %pM", pkt_dev->src_mac);
1452                 return count;
1453         }
1454
1455         if (!strcmp(name, "clear_counters")) {
1456                 pktgen_clear_counters(pkt_dev);
1457                 sprintf(pg_result, "OK: Clearing counters.\n");
1458                 return count;
1459         }
1460
1461         if (!strcmp(name, "flows")) {
1462                 len = num_arg(&user_buffer[i], 10, &value);
1463                 if (len < 0)
1464                         return len;
1465
1466                 i += len;
1467                 if (value > MAX_CFLOWS)
1468                         value = MAX_CFLOWS;
1469
1470                 pkt_dev->cflows = value;
1471                 sprintf(pg_result, "OK: flows=%u", pkt_dev->cflows);
1472                 return count;
1473         }
1474
1475         if (!strcmp(name, "flowlen")) {
1476                 len = num_arg(&user_buffer[i], 10, &value);
1477                 if (len < 0)
1478                         return len;
1479
1480                 i += len;
1481                 pkt_dev->lflow = value;
1482                 sprintf(pg_result, "OK: flowlen=%u", pkt_dev->lflow);
1483                 return count;
1484         }
1485
1486         if (!strcmp(name, "queue_map_min")) {
1487                 len = num_arg(&user_buffer[i], 5, &value);
1488                 if (len < 0)
1489                         return len;
1490
1491                 i += len;
1492                 pkt_dev->queue_map_min = value;
1493                 sprintf(pg_result, "OK: queue_map_min=%u", pkt_dev->queue_map_min);
1494                 return count;
1495         }
1496
1497         if (!strcmp(name, "queue_map_max")) {
1498                 len = num_arg(&user_buffer[i], 5, &value);
1499                 if (len < 0)
1500                         return len;
1501
1502                 i += len;
1503                 pkt_dev->queue_map_max = value;
1504                 sprintf(pg_result, "OK: queue_map_max=%u", pkt_dev->queue_map_max);
1505                 return count;
1506         }
1507
1508         if (!strcmp(name, "mpls")) {
1509                 unsigned int n, cnt;
1510
1511                 len = get_labels(&user_buffer[i], pkt_dev);
1512                 if (len < 0)
1513                         return len;
1514                 i += len;
1515                 cnt = sprintf(pg_result, "OK: mpls=");
1516                 for (n = 0; n < pkt_dev->nr_labels; n++)
1517                         cnt += sprintf(pg_result + cnt,
1518                                        "%08x%s", ntohl(pkt_dev->labels[n]),
1519                                        n == pkt_dev->nr_labels-1 ? "" : ",");
1520
1521                 if (pkt_dev->nr_labels && pkt_dev->vlan_id != 0xffff) {
1522                         pkt_dev->vlan_id = 0xffff; /* turn off VLAN/SVLAN */
1523                         pkt_dev->svlan_id = 0xffff;
1524
1525                         if (debug)
1526                                 pr_debug("VLAN/SVLAN auto turned off\n");
1527                 }
1528                 return count;
1529         }
1530
1531         if (!strcmp(name, "vlan_id")) {
1532                 len = num_arg(&user_buffer[i], 4, &value);
1533                 if (len < 0)
1534                         return len;
1535
1536                 i += len;
1537                 if (value <= 4095) {
1538                         pkt_dev->vlan_id = value;  /* turn on VLAN */
1539
1540                         if (debug)
1541                                 pr_debug("VLAN turned on\n");
1542
1543                         if (debug && pkt_dev->nr_labels)
1544                                 pr_debug("MPLS auto turned off\n");
1545
1546                         pkt_dev->nr_labels = 0;    /* turn off MPLS */
1547                         sprintf(pg_result, "OK: vlan_id=%u", pkt_dev->vlan_id);
1548                 } else {
1549                         pkt_dev->vlan_id = 0xffff; /* turn off VLAN/SVLAN */
1550                         pkt_dev->svlan_id = 0xffff;
1551
1552                         if (debug)
1553                                 pr_debug("VLAN/SVLAN turned off\n");
1554                 }
1555                 return count;
1556         }
1557
1558         if (!strcmp(name, "vlan_p")) {
1559                 len = num_arg(&user_buffer[i], 1, &value);
1560                 if (len < 0)
1561                         return len;
1562
1563                 i += len;
1564                 if ((value <= 7) && (pkt_dev->vlan_id != 0xffff)) {
1565                         pkt_dev->vlan_p = value;
1566                         sprintf(pg_result, "OK: vlan_p=%u", pkt_dev->vlan_p);
1567                 } else {
1568                         sprintf(pg_result, "ERROR: vlan_p must be 0-7");
1569                 }
1570                 return count;
1571         }
1572
1573         if (!strcmp(name, "vlan_cfi")) {
1574                 len = num_arg(&user_buffer[i], 1, &value);
1575                 if (len < 0)
1576                         return len;
1577
1578                 i += len;
1579                 if ((value <= 1) && (pkt_dev->vlan_id != 0xffff)) {
1580                         pkt_dev->vlan_cfi = value;
1581                         sprintf(pg_result, "OK: vlan_cfi=%u", pkt_dev->vlan_cfi);
1582                 } else {
1583                         sprintf(pg_result, "ERROR: vlan_cfi must be 0-1");
1584                 }
1585                 return count;
1586         }
1587
1588         if (!strcmp(name, "svlan_id")) {
1589                 len = num_arg(&user_buffer[i], 4, &value);
1590                 if (len < 0)
1591                         return len;
1592
1593                 i += len;
1594                 if ((value <= 4095) && ((pkt_dev->vlan_id != 0xffff))) {
1595                         pkt_dev->svlan_id = value;  /* turn on SVLAN */
1596
1597                         if (debug)
1598                                 pr_debug("SVLAN turned on\n");
1599
1600                         if (debug && pkt_dev->nr_labels)
1601                                 pr_debug("MPLS auto turned off\n");
1602
1603                         pkt_dev->nr_labels = 0;    /* turn off MPLS */
1604                         sprintf(pg_result, "OK: svlan_id=%u", pkt_dev->svlan_id);
1605                 } else {
1606                         pkt_dev->vlan_id = 0xffff; /* turn off VLAN/SVLAN */
1607                         pkt_dev->svlan_id = 0xffff;
1608
1609                         if (debug)
1610                                 pr_debug("VLAN/SVLAN turned off\n");
1611                 }
1612                 return count;
1613         }
1614
1615         if (!strcmp(name, "svlan_p")) {
1616                 len = num_arg(&user_buffer[i], 1, &value);
1617                 if (len < 0)
1618                         return len;
1619
1620                 i += len;
1621                 if ((value <= 7) && (pkt_dev->svlan_id != 0xffff)) {
1622                         pkt_dev->svlan_p = value;
1623                         sprintf(pg_result, "OK: svlan_p=%u", pkt_dev->svlan_p);
1624                 } else {
1625                         sprintf(pg_result, "ERROR: svlan_p must be 0-7");
1626                 }
1627                 return count;
1628         }
1629
1630         if (!strcmp(name, "svlan_cfi")) {
1631                 len = num_arg(&user_buffer[i], 1, &value);
1632                 if (len < 0)
1633                         return len;
1634
1635                 i += len;
1636                 if ((value <= 1) && (pkt_dev->svlan_id != 0xffff)) {
1637                         pkt_dev->svlan_cfi = value;
1638                         sprintf(pg_result, "OK: svlan_cfi=%u", pkt_dev->svlan_cfi);
1639                 } else {
1640                         sprintf(pg_result, "ERROR: svlan_cfi must be 0-1");
1641                 }
1642                 return count;
1643         }
1644
1645         if (!strcmp(name, "tos")) {
1646                 __u32 tmp_value = 0;
1647                 len = hex32_arg(&user_buffer[i], 2, &tmp_value);
1648                 if (len < 0)
1649                         return len;
1650
1651                 i += len;
1652                 if (len == 2) {
1653                         pkt_dev->tos = tmp_value;
1654                         sprintf(pg_result, "OK: tos=0x%02x", pkt_dev->tos);
1655                 } else {
1656                         sprintf(pg_result, "ERROR: tos must be 00-ff");
1657                 }
1658                 return count;
1659         }
1660
1661         if (!strcmp(name, "traffic_class")) {
1662                 __u32 tmp_value = 0;
1663                 len = hex32_arg(&user_buffer[i], 2, &tmp_value);
1664                 if (len < 0)
1665                         return len;
1666
1667                 i += len;
1668                 if (len == 2) {
1669                         pkt_dev->traffic_class = tmp_value;
1670                         sprintf(pg_result, "OK: traffic_class=0x%02x", pkt_dev->traffic_class);
1671                 } else {
1672                         sprintf(pg_result, "ERROR: traffic_class must be 00-ff");
1673                 }
1674                 return count;
1675         }
1676
1677         if (!strcmp(name, "skb_priority")) {
1678                 len = num_arg(&user_buffer[i], 9, &value);
1679                 if (len < 0)
1680                         return len;
1681
1682                 i += len;
1683                 pkt_dev->skb_priority = value;
1684                 sprintf(pg_result, "OK: skb_priority=%i",
1685                         pkt_dev->skb_priority);
1686                 return count;
1687         }
1688
1689         sprintf(pkt_dev->result, "No such parameter \"%s\"", name);
1690         return -EINVAL;
1691 }
1692
1693 static int pktgen_if_open(struct inode *inode, struct file *file)
1694 {
1695         return single_open(file, pktgen_if_show, PDE(inode)->data);
1696 }
1697
1698 static const struct file_operations pktgen_if_fops = {
1699         .owner   = THIS_MODULE,
1700         .open    = pktgen_if_open,
1701         .read    = seq_read,
1702         .llseek  = seq_lseek,
1703         .write   = pktgen_if_write,
1704         .release = single_release,
1705 };
1706
1707 static int pktgen_thread_show(struct seq_file *seq, void *v)
1708 {
1709         struct pktgen_thread *t = seq->private;
1710         const struct pktgen_dev *pkt_dev;
1711
1712         BUG_ON(!t);
1713
1714         seq_printf(seq, "Running: ");
1715
1716         if_lock(t);
1717         list_for_each_entry(pkt_dev, &t->if_list, list)
1718                 if (pkt_dev->running)
1719                         seq_printf(seq, "%s ", pkt_dev->odevname);
1720
1721         seq_printf(seq, "\nStopped: ");
1722
1723         list_for_each_entry(pkt_dev, &t->if_list, list)
1724                 if (!pkt_dev->running)
1725                         seq_printf(seq, "%s ", pkt_dev->odevname);
1726
1727         if (t->result[0])
1728                 seq_printf(seq, "\nResult: %s\n", t->result);
1729         else
1730                 seq_printf(seq, "\nResult: NA\n");
1731
1732         if_unlock(t);
1733
1734         return 0;
1735 }
1736
1737 static ssize_t pktgen_thread_write(struct file *file,
1738                                    const char __user * user_buffer,
1739                                    size_t count, loff_t * offset)
1740 {
1741         struct seq_file *seq = file->private_data;
1742         struct pktgen_thread *t = seq->private;
1743         int i, max, len, ret;
1744         char name[40];
1745         char *pg_result;
1746
1747         if (count < 1) {
1748                 //      sprintf(pg_result, "Wrong command format");
1749                 return -EINVAL;
1750         }
1751
1752         max = count;
1753         len = count_trail_chars(user_buffer, max);
1754         if (len < 0)
1755                 return len;
1756
1757         i = len;
1758
1759         /* Read variable name */
1760
1761         len = strn_len(&user_buffer[i], sizeof(name) - 1);
1762         if (len < 0)
1763                 return len;
1764
1765         memset(name, 0, sizeof(name));
1766         if (copy_from_user(name, &user_buffer[i], len))
1767                 return -EFAULT;
1768         i += len;
1769
1770         max = count - i;
1771         len = count_trail_chars(&user_buffer[i], max);
1772         if (len < 0)
1773                 return len;
1774
1775         i += len;
1776
1777         if (debug)
1778                 pr_debug("t=%s, count=%lu\n", name, (unsigned long)count);
1779
1780         if (!t) {
1781                 pr_err("ERROR: No thread\n");
1782                 ret = -EINVAL;
1783                 goto out;
1784         }
1785
1786         pg_result = &(t->result[0]);
1787
1788         if (!strcmp(name, "add_device")) {
1789                 char f[32];
1790                 memset(f, 0, 32);
1791                 len = strn_len(&user_buffer[i], sizeof(f) - 1);
1792                 if (len < 0) {
1793                         ret = len;
1794                         goto out;
1795                 }
1796                 if (copy_from_user(f, &user_buffer[i], len))
1797                         return -EFAULT;
1798                 i += len;
1799                 mutex_lock(&pktgen_thread_lock);
1800                 pktgen_add_device(t, f);
1801                 mutex_unlock(&pktgen_thread_lock);
1802                 ret = count;
1803                 sprintf(pg_result, "OK: add_device=%s", f);
1804                 goto out;
1805         }
1806
1807         if (!strcmp(name, "rem_device_all")) {
1808                 mutex_lock(&pktgen_thread_lock);
1809                 t->control |= T_REMDEVALL;
1810                 mutex_unlock(&pktgen_thread_lock);
1811                 schedule_timeout_interruptible(msecs_to_jiffies(125));  /* Propagate thread->control  */
1812                 ret = count;
1813                 sprintf(pg_result, "OK: rem_device_all");
1814                 goto out;
1815         }
1816
1817         if (!strcmp(name, "max_before_softirq")) {
1818                 sprintf(pg_result, "OK: Note! max_before_softirq is obsoleted -- Do not use");
1819                 ret = count;
1820                 goto out;
1821         }
1822
1823         ret = -EINVAL;
1824 out:
1825         return ret;
1826 }
1827
1828 static int pktgen_thread_open(struct inode *inode, struct file *file)
1829 {
1830         return single_open(file, pktgen_thread_show, PDE(inode)->data);
1831 }
1832
1833 static const struct file_operations pktgen_thread_fops = {
1834         .owner   = THIS_MODULE,
1835         .open    = pktgen_thread_open,
1836         .read    = seq_read,
1837         .llseek  = seq_lseek,
1838         .write   = pktgen_thread_write,
1839         .release = single_release,
1840 };
1841
1842 /* Think find or remove for NN */
1843 static struct pktgen_dev *__pktgen_NN_threads(const char *ifname, int remove)
1844 {
1845         struct pktgen_thread *t;
1846         struct pktgen_dev *pkt_dev = NULL;
1847         bool exact = (remove == FIND);
1848
1849         list_for_each_entry(t, &pktgen_threads, th_list) {
1850                 pkt_dev = pktgen_find_dev(t, ifname, exact);
1851                 if (pkt_dev) {
1852                         if (remove) {
1853                                 if_lock(t);
1854                                 pkt_dev->removal_mark = 1;
1855                                 t->control |= T_REMDEV;
1856                                 if_unlock(t);
1857                         }
1858                         break;
1859                 }
1860         }
1861         return pkt_dev;
1862 }
1863
1864 /*
1865  * mark a device for removal
1866  */
1867 static void pktgen_mark_device(const char *ifname)
1868 {
1869         struct pktgen_dev *pkt_dev = NULL;
1870         const int max_tries = 10, msec_per_try = 125;
1871         int i = 0;
1872
1873         mutex_lock(&pktgen_thread_lock);
1874         pr_debug("%s: marking %s for removal\n", __func__, ifname);
1875
1876         while (1) {
1877
1878                 pkt_dev = __pktgen_NN_threads(ifname, REMOVE);
1879                 if (pkt_dev == NULL)
1880                         break;  /* success */
1881
1882                 mutex_unlock(&pktgen_thread_lock);
1883                 pr_debug("%s: waiting for %s to disappear....\n",
1884                          __func__, ifname);
1885                 schedule_timeout_interruptible(msecs_to_jiffies(msec_per_try));
1886                 mutex_lock(&pktgen_thread_lock);
1887
1888                 if (++i >= max_tries) {
1889                         pr_err("%s: timed out after waiting %d msec for device %s to be removed\n",
1890                                __func__, msec_per_try * i, ifname);
1891                         break;
1892                 }
1893
1894         }
1895
1896         mutex_unlock(&pktgen_thread_lock);
1897 }
1898
1899 static void pktgen_change_name(struct net_device *dev)
1900 {
1901         struct pktgen_thread *t;
1902
1903         list_for_each_entry(t, &pktgen_threads, th_list) {
1904                 struct pktgen_dev *pkt_dev;
1905
1906                 list_for_each_entry(pkt_dev, &t->if_list, list) {
1907                         if (pkt_dev->odev != dev)
1908                                 continue;
1909
1910                         remove_proc_entry(pkt_dev->entry->name, pg_proc_dir);
1911
1912                         pkt_dev->entry = proc_create_data(dev->name, 0600,
1913                                                           pg_proc_dir,
1914                                                           &pktgen_if_fops,
1915                                                           pkt_dev);
1916                         if (!pkt_dev->entry)
1917                                 pr_err("can't move proc entry for '%s'\n",
1918                                        dev->name);
1919                         break;
1920                 }
1921         }
1922 }
1923
1924 static int pktgen_device_event(struct notifier_block *unused,
1925                                unsigned long event, void *ptr)
1926 {
1927         struct net_device *dev = ptr;
1928
1929         if (!net_eq(dev_net(dev), &init_net) || pktgen_exiting)
1930                 return NOTIFY_DONE;
1931
1932         /* It is OK that we do not hold the group lock right now,
1933          * as we run under the RTNL lock.
1934          */
1935
1936         switch (event) {
1937         case NETDEV_CHANGENAME:
1938                 pktgen_change_name(dev);
1939                 break;
1940
1941         case NETDEV_UNREGISTER:
1942                 pktgen_mark_device(dev->name);
1943                 break;
1944         }
1945
1946         return NOTIFY_DONE;
1947 }
1948
1949 static struct net_device *pktgen_dev_get_by_name(struct pktgen_dev *pkt_dev,
1950                                                  const char *ifname)
1951 {
1952         char b[IFNAMSIZ+5];
1953         int i;
1954
1955         for (i = 0; ifname[i] != '@'; i++) {
1956                 if (i == IFNAMSIZ)
1957                         break;
1958
1959                 b[i] = ifname[i];
1960         }
1961         b[i] = 0;
1962
1963         return dev_get_by_name(&init_net, b);
1964 }
1965
1966
1967 /* Associate pktgen_dev with a device. */
1968
1969 static int pktgen_setup_dev(struct pktgen_dev *pkt_dev, const char *ifname)
1970 {
1971         struct net_device *odev;
1972         int err;
1973
1974         /* Clean old setups */
1975         if (pkt_dev->odev) {
1976                 dev_put(pkt_dev->odev);
1977                 pkt_dev->odev = NULL;
1978         }
1979
1980         odev = pktgen_dev_get_by_name(pkt_dev, ifname);
1981         if (!odev) {
1982                 pr_err("no such netdevice: \"%s\"\n", ifname);
1983                 return -ENODEV;
1984         }
1985
1986         if (odev->type != ARPHRD_ETHER) {
1987                 pr_err("not an ethernet device: \"%s\"\n", ifname);
1988                 err = -EINVAL;
1989         } else if (!netif_running(odev)) {
1990                 pr_err("device is down: \"%s\"\n", ifname);
1991                 err = -ENETDOWN;
1992         } else {
1993                 pkt_dev->odev = odev;
1994                 return 0;
1995         }
1996
1997         dev_put(odev);
1998         return err;
1999 }
2000
2001 /* Read pkt_dev from the interface and set up internal pktgen_dev
2002  * structure to have the right information to create/send packets
2003  */
2004 static void pktgen_setup_inject(struct pktgen_dev *pkt_dev)
2005 {
2006         int ntxq;
2007
2008         if (!pkt_dev->odev) {
2009                 pr_err("ERROR: pkt_dev->odev == NULL in setup_inject\n");
2010                 sprintf(pkt_dev->result,
2011                         "ERROR: pkt_dev->odev == NULL in setup_inject.\n");
2012                 return;
2013         }
2014
2015         /* make sure that we don't pick a non-existing transmit queue */
2016         ntxq = pkt_dev->odev->real_num_tx_queues;
2017
2018         if (ntxq <= pkt_dev->queue_map_min) {
2019                 pr_warning("WARNING: Requested queue_map_min (zero-based) (%d) exceeds valid range [0 - %d] for (%d) queues on %s, resetting\n",
2020                            pkt_dev->queue_map_min, (ntxq ?: 1) - 1, ntxq,
2021                            pkt_dev->odevname);
2022                 pkt_dev->queue_map_min = (ntxq ?: 1) - 1;
2023         }
2024         if (pkt_dev->queue_map_max >= ntxq) {
2025                 pr_warning("WARNING: Requested queue_map_max (zero-based) (%d) exceeds valid range [0 - %d] for (%d) queues on %s, resetting\n",
2026                            pkt_dev->queue_map_max, (ntxq ?: 1) - 1, ntxq,
2027                            pkt_dev->odevname);
2028                 pkt_dev->queue_map_max = (ntxq ?: 1) - 1;
2029         }
2030
2031         /* Default to the interface's mac if not explicitly set. */
2032
2033         if (is_zero_ether_addr(pkt_dev->src_mac))
2034                 memcpy(&(pkt_dev->hh[6]), pkt_dev->odev->dev_addr, ETH_ALEN);
2035
2036         /* Set up Dest MAC */
2037         memcpy(&(pkt_dev->hh[0]), pkt_dev->dst_mac, ETH_ALEN);
2038
2039         if (pkt_dev->flags & F_IPV6) {
2040                 if (pkt_dev->min_pkt_size == 0) {
2041                         pkt_dev->min_pkt_size = 14 + sizeof(struct ipv6hdr)
2042                                                 + sizeof(struct udphdr)
2043                                                 + sizeof(struct pktgen_hdr)
2044                                                 + pkt_dev->pkt_overhead;
2045                 }
2046
2047                 /*
2048                  * Skip this automatic address setting until locks or functions
2049                  * gets exported
2050                  */
2051
2052 #ifdef NOTNOW
2053                 int i, set = 0, err = 1;
2054                 struct inet6_dev *idev;
2055
2056                 for (i = 0; i < IN6_ADDR_HSIZE; i++)
2057                         if (pkt_dev->cur_in6_saddr.s6_addr[i]) {
2058                                 set = 1;
2059                                 break;
2060                         }
2061
2062                 if (!set) {
2063
2064                         /*
2065                          * Use linklevel address if unconfigured.
2066                          *
2067                          * use ipv6_get_lladdr if/when it's get exported
2068                          */
2069
2070                         rcu_read_lock();
2071                         idev = __in6_dev_get(pkt_dev->odev);
2072                         if (idev) {
2073                                 struct inet6_ifaddr *ifp;
2074
2075                                 read_lock_bh(&idev->lock);
2076                                 for (ifp = idev->addr_list; ifp;
2077                                      ifp = ifp->if_next) {
2078                                         if (ifp->scope == IFA_LINK &&
2079                                             !(ifp->flags & IFA_F_TENTATIVE)) {
2080                                                 pkt_dev->cur_in6_saddr = ifp->addr;
2081                                                 err = 0;
2082                                                 break;
2083                                         }
2084                                 }
2085                                 read_unlock_bh(&idev->lock);
2086                         }
2087                         rcu_read_unlock();
2088                         if (err)
2089                                 pr_err("ERROR: IPv6 link address not available\n");
2090                 }
2091 #endif
2092         } else {
2093                 if (pkt_dev->min_pkt_size == 0) {
2094                         pkt_dev->min_pkt_size = 14 + sizeof(struct iphdr)
2095                                                 + sizeof(struct udphdr)
2096                                                 + sizeof(struct pktgen_hdr)
2097                                                 + pkt_dev->pkt_overhead;
2098                 }
2099
2100                 pkt_dev->saddr_min = 0;
2101                 pkt_dev->saddr_max = 0;
2102                 if (strlen(pkt_dev->src_min) == 0) {
2103
2104                         struct in_device *in_dev;
2105
2106                         rcu_read_lock();
2107                         in_dev = __in_dev_get_rcu(pkt_dev->odev);
2108                         if (in_dev) {
2109                                 if (in_dev->ifa_list) {
2110                                         pkt_dev->saddr_min =
2111                                             in_dev->ifa_list->ifa_address;
2112                                         pkt_dev->saddr_max = pkt_dev->saddr_min;
2113                                 }
2114                         }
2115                         rcu_read_unlock();
2116                 } else {
2117                         pkt_dev->saddr_min = in_aton(pkt_dev->src_min);
2118                         pkt_dev->saddr_max = in_aton(pkt_dev->src_max);
2119                 }
2120
2121                 pkt_dev->daddr_min = in_aton(pkt_dev->dst_min);
2122                 pkt_dev->daddr_max = in_aton(pkt_dev->dst_max);
2123         }
2124         /* Initialize current values. */
2125         pkt_dev->cur_pkt_size = pkt_dev->min_pkt_size;
2126         if (pkt_dev->min_pkt_size > pkt_dev->max_pkt_size)
2127                 pkt_dev->max_pkt_size = pkt_dev->min_pkt_size;
2128
2129         pkt_dev->cur_dst_mac_offset = 0;
2130         pkt_dev->cur_src_mac_offset = 0;
2131         pkt_dev->cur_saddr = pkt_dev->saddr_min;
2132         pkt_dev->cur_daddr = pkt_dev->daddr_min;
2133         pkt_dev->cur_udp_dst = pkt_dev->udp_dst_min;
2134         pkt_dev->cur_udp_src = pkt_dev->udp_src_min;
2135         pkt_dev->nflows = 0;
2136 }
2137
2138
2139 static void spin(struct pktgen_dev *pkt_dev, ktime_t spin_until)
2140 {
2141         ktime_t start_time, end_time;
2142         s64 remaining;
2143         struct hrtimer_sleeper t;
2144
2145         hrtimer_init_on_stack(&t.timer, CLOCK_MONOTONIC, HRTIMER_MODE_ABS);
2146         hrtimer_set_expires(&t.timer, spin_until);
2147
2148         remaining = ktime_to_ns(hrtimer_expires_remaining(&t.timer));
2149         if (remaining <= 0) {
2150                 pkt_dev->next_tx = ktime_add_ns(spin_until, pkt_dev->delay);
2151                 return;
2152         }
2153
2154         start_time = ktime_now();
2155         if (remaining < 100000) {
2156                 /* for small delays (<100us), just loop until limit is reached */
2157                 do {
2158                         end_time = ktime_now();
2159                 } while (ktime_lt(end_time, spin_until));
2160         } else {
2161                 /* see do_nanosleep */
2162                 hrtimer_init_sleeper(&t, current);
2163                 do {
2164                         set_current_state(TASK_INTERRUPTIBLE);
2165                         hrtimer_start_expires(&t.timer, HRTIMER_MODE_ABS);
2166                         if (!hrtimer_active(&t.timer))
2167                                 t.task = NULL;
2168
2169                         if (likely(t.task))
2170                                 schedule();
2171
2172                         hrtimer_cancel(&t.timer);
2173                 } while (t.task && pkt_dev->running && !signal_pending(current));
2174                 __set_current_state(TASK_RUNNING);
2175                 end_time = ktime_now();
2176         }
2177
2178         pkt_dev->idle_acc += ktime_to_ns(ktime_sub(end_time, start_time));
2179         pkt_dev->next_tx = ktime_add_ns(spin_until, pkt_dev->delay);
2180 }
2181
2182 static inline void set_pkt_overhead(struct pktgen_dev *pkt_dev)
2183 {
2184         pkt_dev->pkt_overhead = 0;
2185         pkt_dev->pkt_overhead += pkt_dev->nr_labels*sizeof(u32);
2186         pkt_dev->pkt_overhead += VLAN_TAG_SIZE(pkt_dev);
2187         pkt_dev->pkt_overhead += SVLAN_TAG_SIZE(pkt_dev);
2188 }
2189
2190 static inline int f_seen(const struct pktgen_dev *pkt_dev, int flow)
2191 {
2192         return !!(pkt_dev->flows[flow].flags & F_INIT);
2193 }
2194
2195 static inline int f_pick(struct pktgen_dev *pkt_dev)
2196 {
2197         int flow = pkt_dev->curfl;
2198
2199         if (pkt_dev->flags & F_FLOW_SEQ) {
2200                 if (pkt_dev->flows[flow].count >= pkt_dev->lflow) {
2201                         /* reset time */
2202                         pkt_dev->flows[flow].count = 0;
2203                         pkt_dev->flows[flow].flags = 0;
2204                         pkt_dev->curfl += 1;
2205                         if (pkt_dev->curfl >= pkt_dev->cflows)
2206                                 pkt_dev->curfl = 0; /*reset */
2207                 }
2208         } else {
2209                 flow = random32() % pkt_dev->cflows;
2210                 pkt_dev->curfl = flow;
2211
2212                 if (pkt_dev->flows[flow].count > pkt_dev->lflow) {
2213                         pkt_dev->flows[flow].count = 0;
2214                         pkt_dev->flows[flow].flags = 0;
2215                 }
2216         }
2217
2218         return pkt_dev->curfl;
2219 }
2220
2221
2222 #ifdef CONFIG_XFRM
2223 /* If there was already an IPSEC SA, we keep it as is, else
2224  * we go look for it ...
2225 */
2226 #define DUMMY_MARK 0
2227 static void get_ipsec_sa(struct pktgen_dev *pkt_dev, int flow)
2228 {
2229         struct xfrm_state *x = pkt_dev->flows[flow].x;
2230         if (!x) {
2231                 /*slow path: we dont already have xfrm_state*/
2232                 x = xfrm_stateonly_find(&init_net, DUMMY_MARK,
2233                                         (xfrm_address_t *)&pkt_dev->cur_daddr,
2234                                         (xfrm_address_t *)&pkt_dev->cur_saddr,
2235                                         AF_INET,
2236                                         pkt_dev->ipsmode,
2237                                         pkt_dev->ipsproto, 0);
2238                 if (x) {
2239                         pkt_dev->flows[flow].x = x;
2240                         set_pkt_overhead(pkt_dev);
2241                         pkt_dev->pkt_overhead += x->props.header_len;
2242                 }
2243
2244         }
2245 }
2246 #endif
2247 static void set_cur_queue_map(struct pktgen_dev *pkt_dev)
2248 {
2249
2250         if (pkt_dev->flags & F_QUEUE_MAP_CPU)
2251                 pkt_dev->cur_queue_map = smp_processor_id();
2252
2253         else if (pkt_dev->queue_map_min <= pkt_dev->queue_map_max) {
2254                 __u16 t;
2255                 if (pkt_dev->flags & F_QUEUE_MAP_RND) {
2256                         t = random32() %
2257                                 (pkt_dev->queue_map_max -
2258                                  pkt_dev->queue_map_min + 1)
2259                                 + pkt_dev->queue_map_min;
2260                 } else {
2261                         t = pkt_dev->cur_queue_map + 1;
2262                         if (t > pkt_dev->queue_map_max)
2263                                 t = pkt_dev->queue_map_min;
2264                 }
2265                 pkt_dev->cur_queue_map = t;
2266         }
2267         pkt_dev->cur_queue_map  = pkt_dev->cur_queue_map % pkt_dev->odev->real_num_tx_queues;
2268 }
2269
2270 /* Increment/randomize headers according to flags and current values
2271  * for IP src/dest, UDP src/dst port, MAC-Addr src/dst
2272  */
2273 static void mod_cur_headers(struct pktgen_dev *pkt_dev)
2274 {
2275         __u32 imn;
2276         __u32 imx;
2277         int flow = 0;
2278
2279         if (pkt_dev->cflows)
2280                 flow = f_pick(pkt_dev);
2281
2282         /*  Deal with source MAC */
2283         if (pkt_dev->src_mac_count > 1) {
2284                 __u32 mc;
2285                 __u32 tmp;
2286
2287                 if (pkt_dev->flags & F_MACSRC_RND)
2288                         mc = random32() % pkt_dev->src_mac_count;
2289                 else {
2290                         mc = pkt_dev->cur_src_mac_offset++;
2291                         if (pkt_dev->cur_src_mac_offset >=
2292                             pkt_dev->src_mac_count)
2293                                 pkt_dev->cur_src_mac_offset = 0;
2294                 }
2295
2296                 tmp = pkt_dev->src_mac[5] + (mc & 0xFF);
2297                 pkt_dev->hh[11] = tmp;
2298                 tmp = (pkt_dev->src_mac[4] + ((mc >> 8) & 0xFF) + (tmp >> 8));
2299                 pkt_dev->hh[10] = tmp;
2300                 tmp = (pkt_dev->src_mac[3] + ((mc >> 16) & 0xFF) + (tmp >> 8));
2301                 pkt_dev->hh[9] = tmp;
2302                 tmp = (pkt_dev->src_mac[2] + ((mc >> 24) & 0xFF) + (tmp >> 8));
2303                 pkt_dev->hh[8] = tmp;
2304                 tmp = (pkt_dev->src_mac[1] + (tmp >> 8));
2305                 pkt_dev->hh[7] = tmp;
2306         }
2307
2308         /*  Deal with Destination MAC */
2309         if (pkt_dev->dst_mac_count > 1) {
2310                 __u32 mc;
2311                 __u32 tmp;
2312
2313                 if (pkt_dev->flags & F_MACDST_RND)
2314                         mc = random32() % pkt_dev->dst_mac_count;
2315
2316                 else {
2317                         mc = pkt_dev->cur_dst_mac_offset++;
2318                         if (pkt_dev->cur_dst_mac_offset >=
2319                             pkt_dev->dst_mac_count) {
2320                                 pkt_dev->cur_dst_mac_offset = 0;
2321                         }
2322                 }
2323
2324                 tmp = pkt_dev->dst_mac[5] + (mc & 0xFF);
2325                 pkt_dev->hh[5] = tmp;
2326                 tmp = (pkt_dev->dst_mac[4] + ((mc >> 8) & 0xFF) + (tmp >> 8));
2327                 pkt_dev->hh[4] = tmp;
2328                 tmp = (pkt_dev->dst_mac[3] + ((mc >> 16) & 0xFF) + (tmp >> 8));
2329                 pkt_dev->hh[3] = tmp;
2330                 tmp = (pkt_dev->dst_mac[2] + ((mc >> 24) & 0xFF) + (tmp >> 8));
2331                 pkt_dev->hh[2] = tmp;
2332                 tmp = (pkt_dev->dst_mac[1] + (tmp >> 8));
2333                 pkt_dev->hh[1] = tmp;
2334         }
2335
2336         if (pkt_dev->flags & F_MPLS_RND) {
2337                 unsigned int i;
2338                 for (i = 0; i < pkt_dev->nr_labels; i++)
2339                         if (pkt_dev->labels[i] & MPLS_STACK_BOTTOM)
2340                                 pkt_dev->labels[i] = MPLS_STACK_BOTTOM |
2341                                              ((__force __be32)random32() &
2342                                                       htonl(0x000fffff));
2343         }
2344
2345         if ((pkt_dev->flags & F_VID_RND) && (pkt_dev->vlan_id != 0xffff)) {
2346                 pkt_dev->vlan_id = random32() & (4096-1);
2347         }
2348
2349         if ((pkt_dev->flags & F_SVID_RND) && (pkt_dev->svlan_id != 0xffff)) {
2350                 pkt_dev->svlan_id = random32() & (4096 - 1);
2351         }
2352
2353         if (pkt_dev->udp_src_min < pkt_dev->udp_src_max) {
2354                 if (pkt_dev->flags & F_UDPSRC_RND)
2355                         pkt_dev->cur_udp_src = random32() %
2356                                 (pkt_dev->udp_src_max - pkt_dev->udp_src_min)
2357                                 + pkt_dev->udp_src_min;
2358
2359                 else {
2360                         pkt_dev->cur_udp_src++;
2361                         if (pkt_dev->cur_udp_src >= pkt_dev->udp_src_max)
2362                                 pkt_dev->cur_udp_src = pkt_dev->udp_src_min;
2363                 }
2364         }
2365
2366         if (pkt_dev->udp_dst_min < pkt_dev->udp_dst_max) {
2367                 if (pkt_dev->flags & F_UDPDST_RND) {
2368                         pkt_dev->cur_udp_dst = random32() %
2369                                 (pkt_dev->udp_dst_max - pkt_dev->udp_dst_min)
2370                                 + pkt_dev->udp_dst_min;
2371                 } else {
2372                         pkt_dev->cur_udp_dst++;
2373                         if (pkt_dev->cur_udp_dst >= pkt_dev->udp_dst_max)
2374                                 pkt_dev->cur_udp_dst = pkt_dev->udp_dst_min;
2375                 }
2376         }
2377
2378         if (!(pkt_dev->flags & F_IPV6)) {
2379
2380                 imn = ntohl(pkt_dev->saddr_min);
2381                 imx = ntohl(pkt_dev->saddr_max);
2382                 if (imn < imx) {
2383                         __u32 t;
2384                         if (pkt_dev->flags & F_IPSRC_RND)
2385                                 t = random32() % (imx - imn) + imn;
2386                         else {
2387                                 t = ntohl(pkt_dev->cur_saddr);
2388                                 t++;
2389                                 if (t > imx)
2390                                         t = imn;
2391
2392                         }
2393                         pkt_dev->cur_saddr = htonl(t);
2394                 }
2395
2396                 if (pkt_dev->cflows && f_seen(pkt_dev, flow)) {
2397                         pkt_dev->cur_daddr = pkt_dev->flows[flow].cur_daddr;
2398                 } else {
2399                         imn = ntohl(pkt_dev->daddr_min);
2400                         imx = ntohl(pkt_dev->daddr_max);
2401                         if (imn < imx) {
2402                                 __u32 t;
2403                                 __be32 s;
2404                                 if (pkt_dev->flags & F_IPDST_RND) {
2405
2406                                         t = random32() % (imx - imn) + imn;
2407                                         s = htonl(t);
2408
2409                                         while (ipv4_is_loopback(s) ||
2410                                                ipv4_is_multicast(s) ||
2411                                                ipv4_is_lbcast(s) ||
2412                                                ipv4_is_zeronet(s) ||
2413                                                ipv4_is_local_multicast(s)) {
2414                                                 t = random32() % (imx - imn) + imn;
2415                                                 s = htonl(t);
2416                                         }
2417                                         pkt_dev->cur_daddr = s;
2418                                 } else {
2419                                         t = ntohl(pkt_dev->cur_daddr);
2420                                         t++;
2421                                         if (t > imx) {
2422                                                 t = imn;
2423                                         }
2424                                         pkt_dev->cur_daddr = htonl(t);
2425                                 }
2426                         }
2427                         if (pkt_dev->cflows) {
2428                                 pkt_dev->flows[flow].flags |= F_INIT;
2429                                 pkt_dev->flows[flow].cur_daddr =
2430                                     pkt_dev->cur_daddr;
2431 #ifdef CONFIG_XFRM
2432                                 if (pkt_dev->flags & F_IPSEC_ON)
2433                                         get_ipsec_sa(pkt_dev, flow);
2434 #endif
2435                                 pkt_dev->nflows++;
2436                         }
2437                 }
2438         } else {                /* IPV6 * */
2439
2440                 if (pkt_dev->min_in6_daddr.s6_addr32[0] == 0 &&
2441                     pkt_dev->min_in6_daddr.s6_addr32[1] == 0 &&
2442                     pkt_dev->min_in6_daddr.s6_addr32[2] == 0 &&
2443                     pkt_dev->min_in6_daddr.s6_addr32[3] == 0) ;
2444                 else {
2445                         int i;
2446
2447                         /* Only random destinations yet */
2448
2449                         for (i = 0; i < 4; i++) {
2450                                 pkt_dev->cur_in6_daddr.s6_addr32[i] =
2451                                     (((__force __be32)random32() |
2452                                       pkt_dev->min_in6_daddr.s6_addr32[i]) &
2453                                      pkt_dev->max_in6_daddr.s6_addr32[i]);
2454                         }
2455                 }
2456         }
2457
2458         if (pkt_dev->min_pkt_size < pkt_dev->max_pkt_size) {
2459                 __u32 t;
2460                 if (pkt_dev->flags & F_TXSIZE_RND) {
2461                         t = random32() %
2462                                 (pkt_dev->max_pkt_size - pkt_dev->min_pkt_size)
2463                                 + pkt_dev->min_pkt_size;
2464                 } else {
2465                         t = pkt_dev->cur_pkt_size + 1;
2466                         if (t > pkt_dev->max_pkt_size)
2467                                 t = pkt_dev->min_pkt_size;
2468                 }
2469                 pkt_dev->cur_pkt_size = t;
2470         }
2471
2472         set_cur_queue_map(pkt_dev);
2473
2474         pkt_dev->flows[flow].count++;
2475 }
2476
2477
2478 #ifdef CONFIG_XFRM
2479 static int pktgen_output_ipsec(struct sk_buff *skb, struct pktgen_dev *pkt_dev)
2480 {
2481         struct xfrm_state *x = pkt_dev->flows[pkt_dev->curfl].x;
2482         int err = 0;
2483
2484         if (!x)
2485                 return 0;
2486         /* XXX: we dont support tunnel mode for now until
2487          * we resolve the dst issue */
2488         if (x->props.mode != XFRM_MODE_TRANSPORT)
2489                 return 0;
2490
2491         spin_lock(&x->lock);
2492
2493         err = x->outer_mode->output(x, skb);
2494         if (err)
2495                 goto error;
2496         err = x->type->output(x, skb);
2497         if (err)
2498                 goto error;
2499
2500         x->curlft.bytes += skb->len;
2501         x->curlft.packets++;
2502 error:
2503         spin_unlock(&x->lock);
2504         return err;
2505 }
2506
2507 static void free_SAs(struct pktgen_dev *pkt_dev)
2508 {
2509         if (pkt_dev->cflows) {
2510                 /* let go of the SAs if we have them */
2511                 int i;
2512                 for (i = 0; i < pkt_dev->cflows; i++) {
2513                         struct xfrm_state *x = pkt_dev->flows[i].x;
2514                         if (x) {
2515                                 xfrm_state_put(x);
2516                                 pkt_dev->flows[i].x = NULL;
2517                         }
2518                 }
2519         }
2520 }
2521
2522 static int process_ipsec(struct pktgen_dev *pkt_dev,
2523                               struct sk_buff *skb, __be16 protocol)
2524 {
2525         if (pkt_dev->flags & F_IPSEC_ON) {
2526                 struct xfrm_state *x = pkt_dev->flows[pkt_dev->curfl].x;
2527                 int nhead = 0;
2528                 if (x) {
2529                         int ret;
2530                         __u8 *eth;
2531                         nhead = x->props.header_len - skb_headroom(skb);
2532                         if (nhead > 0) {
2533                                 ret = pskb_expand_head(skb, nhead, 0, GFP_ATOMIC);
2534                                 if (ret < 0) {
2535                                         pr_err("Error expanding ipsec packet %d\n",
2536                                                ret);
2537                                         goto err;
2538                                 }
2539                         }
2540
2541                         /* ipsec is not expecting ll header */
2542                         skb_pull(skb, ETH_HLEN);
2543                         ret = pktgen_output_ipsec(skb, pkt_dev);
2544                         if (ret) {
2545                                 pr_err("Error creating ipsec packet %d\n", ret);
2546                                 goto err;
2547                         }
2548                         /* restore ll */
2549                         eth = (__u8 *) skb_push(skb, ETH_HLEN);
2550                         memcpy(eth, pkt_dev->hh, 12);
2551                         *(u16 *) &eth[12] = protocol;
2552                 }
2553         }
2554         return 1;
2555 err:
2556         kfree_skb(skb);
2557         return 0;
2558 }
2559 #endif
2560
2561 static void mpls_push(__be32 *mpls, struct pktgen_dev *pkt_dev)
2562 {
2563         unsigned int i;
2564         for (i = 0; i < pkt_dev->nr_labels; i++)
2565                 *mpls++ = pkt_dev->labels[i] & ~MPLS_STACK_BOTTOM;
2566
2567         mpls--;
2568         *mpls |= MPLS_STACK_BOTTOM;
2569 }
2570
2571 static inline __be16 build_tci(unsigned int id, unsigned int cfi,
2572                                unsigned int prio)
2573 {
2574         return htons(id | (cfi << 12) | (prio << 13));
2575 }
2576
2577 static void pktgen_finalize_skb(struct pktgen_dev *pkt_dev, struct sk_buff *skb,
2578                                 int datalen)
2579 {
2580         struct timeval timestamp;
2581         struct pktgen_hdr *pgh;
2582
2583         pgh = (struct pktgen_hdr *)skb_put(skb, sizeof(*pgh));
2584         datalen -= sizeof(*pgh);
2585
2586         if (pkt_dev->nfrags <= 0) {
2587                 memset(skb_put(skb, datalen), 0, datalen);
2588         } else {
2589                 int frags = pkt_dev->nfrags;
2590                 int i, len;
2591                 int frag_len;
2592
2593
2594                 if (frags > MAX_SKB_FRAGS)
2595                         frags = MAX_SKB_FRAGS;
2596                 len = datalen - frags * PAGE_SIZE;
2597                 if (len > 0) {
2598                         memset(skb_put(skb, len), 0, len);
2599                         datalen = frags * PAGE_SIZE;
2600                 }
2601
2602                 i = 0;
2603                 frag_len = (datalen/frags) < PAGE_SIZE ?
2604                            (datalen/frags) : PAGE_SIZE;
2605                 while (datalen > 0) {
2606                         if (unlikely(!pkt_dev->page)) {
2607                                 int node = numa_node_id();
2608
2609                                 if (pkt_dev->node >= 0 && (pkt_dev->flags & F_NODE))
2610                                         node = pkt_dev->node;
2611                                 pkt_dev->page = alloc_pages_node(node, GFP_KERNEL | __GFP_ZERO, 0);
2612                                 if (!pkt_dev->page)
2613                                         break;
2614                         }
2615                         get_page(pkt_dev->page);
2616                         skb_frag_set_page(skb, i, pkt_dev->page);
2617                         skb_shinfo(skb)->frags[i].page_offset = 0;
2618                         /*last fragment, fill rest of data*/
2619                         if (i == (frags - 1))
2620                                 skb_frag_size_set(&skb_shinfo(skb)->frags[i],
2621                                     (datalen < PAGE_SIZE ? datalen : PAGE_SIZE));
2622                         else
2623                                 skb_frag_size_set(&skb_shinfo(skb)->frags[i], frag_len);
2624                         datalen -= skb_frag_size(&skb_shinfo(skb)->frags[i]);
2625                         skb->len += skb_frag_size(&skb_shinfo(skb)->frags[i]);
2626                         skb->data_len += skb_frag_size(&skb_shinfo(skb)->frags[i]);
2627                         i++;
2628                         skb_shinfo(skb)->nr_frags = i;
2629                 }
2630         }
2631
2632         /* Stamp the time, and sequence number,
2633          * convert them to network byte order
2634          */
2635         pgh->pgh_magic = htonl(PKTGEN_MAGIC);
2636         pgh->seq_num = htonl(pkt_dev->seq_num);
2637
2638         do_gettimeofday(&timestamp);
2639         pgh->tv_sec = htonl(timestamp.tv_sec);
2640         pgh->tv_usec = htonl(timestamp.tv_usec);
2641 }
2642
2643 static struct sk_buff *fill_packet_ipv4(struct net_device *odev,
2644                                         struct pktgen_dev *pkt_dev)
2645 {
2646         struct sk_buff *skb = NULL;
2647         __u8 *eth;
2648         struct udphdr *udph;
2649         int datalen, iplen;
2650         struct iphdr *iph;
2651         __be16 protocol = htons(ETH_P_IP);
2652         __be32 *mpls;
2653         __be16 *vlan_tci = NULL;                 /* Encapsulates priority and VLAN ID */
2654         __be16 *vlan_encapsulated_proto = NULL;  /* packet type ID field (or len) for VLAN tag */
2655         __be16 *svlan_tci = NULL;                /* Encapsulates priority and SVLAN ID */
2656         __be16 *svlan_encapsulated_proto = NULL; /* packet type ID field (or len) for SVLAN tag */
2657         u16 queue_map;
2658
2659         if (pkt_dev->nr_labels)
2660                 protocol = htons(ETH_P_MPLS_UC);
2661
2662         if (pkt_dev->vlan_id != 0xffff)
2663                 protocol = htons(ETH_P_8021Q);
2664
2665         /* Update any of the values, used when we're incrementing various
2666          * fields.
2667          */
2668         mod_cur_headers(pkt_dev);
2669         queue_map = pkt_dev->cur_queue_map;
2670
2671         datalen = (odev->hard_header_len + 16) & ~0xf;
2672
2673         if (pkt_dev->flags & F_NODE) {
2674                 int node;
2675
2676                 if (pkt_dev->node >= 0)
2677                         node = pkt_dev->node;
2678                 else
2679                         node =  numa_node_id();
2680
2681                 skb = __alloc_skb(NET_SKB_PAD + pkt_dev->cur_pkt_size + 64
2682                                   + datalen + pkt_dev->pkt_overhead, GFP_NOWAIT, 0, node);
2683                 if (likely(skb)) {
2684                         skb_reserve(skb, NET_SKB_PAD);
2685                         skb->dev = odev;
2686                 }
2687         }
2688         else
2689           skb = __netdev_alloc_skb(odev,
2690                                    pkt_dev->cur_pkt_size + 64
2691                                    + datalen + pkt_dev->pkt_overhead, GFP_NOWAIT);
2692
2693         if (!skb) {
2694                 sprintf(pkt_dev->result, "No memory");
2695                 return NULL;
2696         }
2697         prefetchw(skb->data);
2698
2699         skb_reserve(skb, datalen);
2700
2701         /*  Reserve for ethernet and IP header  */
2702         eth = (__u8 *) skb_push(skb, 14);
2703         mpls = (__be32 *)skb_put(skb, pkt_dev->nr_labels*sizeof(__u32));
2704         if (pkt_dev->nr_labels)
2705                 mpls_push(mpls, pkt_dev);
2706
2707         if (pkt_dev->vlan_id != 0xffff) {
2708                 if (pkt_dev->svlan_id != 0xffff) {
2709                         svlan_tci = (__be16 *)skb_put(skb, sizeof(__be16));
2710                         *svlan_tci = build_tci(pkt_dev->svlan_id,
2711                                                pkt_dev->svlan_cfi,
2712                                                pkt_dev->svlan_p);
2713                         svlan_encapsulated_proto = (__be16 *)skb_put(skb, sizeof(__be16));
2714                         *svlan_encapsulated_proto = htons(ETH_P_8021Q);
2715                 }
2716                 vlan_tci = (__be16 *)skb_put(skb, sizeof(__be16));
2717                 *vlan_tci = build_tci(pkt_dev->vlan_id,
2718                                       pkt_dev->vlan_cfi,
2719                                       pkt_dev->vlan_p);
2720                 vlan_encapsulated_proto = (__be16 *)skb_put(skb, sizeof(__be16));
2721                 *vlan_encapsulated_proto = htons(ETH_P_IP);
2722         }
2723
2724         skb->network_header = skb->tail;
2725         skb->transport_header = skb->network_header + sizeof(struct iphdr);
2726         skb_put(skb, sizeof(struct iphdr) + sizeof(struct udphdr));
2727         skb_set_queue_mapping(skb, queue_map);
2728         skb->priority = pkt_dev->skb_priority;
2729
2730         iph = ip_hdr(skb);
2731         udph = udp_hdr(skb);
2732
2733         memcpy(eth, pkt_dev->hh, 12);
2734         *(__be16 *) & eth[12] = protocol;
2735
2736         /* Eth + IPh + UDPh + mpls */
2737         datalen = pkt_dev->cur_pkt_size - 14 - 20 - 8 -
2738                   pkt_dev->pkt_overhead;
2739         if (datalen < 0 || datalen < sizeof(struct pktgen_hdr))
2740                 datalen = sizeof(struct pktgen_hdr);
2741
2742         udph->source = htons(pkt_dev->cur_udp_src);
2743         udph->dest = htons(pkt_dev->cur_udp_dst);
2744         udph->len = htons(datalen + 8); /* DATA + udphdr */
2745         udph->check = 0;        /* No checksum */
2746
2747         iph->ihl = 5;
2748         iph->version = 4;
2749         iph->ttl = 32;
2750         iph->tos = pkt_dev->tos;
2751         iph->protocol = IPPROTO_UDP;    /* UDP */
2752         iph->saddr = pkt_dev->cur_saddr;
2753         iph->daddr = pkt_dev->cur_daddr;
2754         iph->id = htons(pkt_dev->ip_id);
2755         pkt_dev->ip_id++;
2756         iph->frag_off = 0;
2757         iplen = 20 + 8 + datalen;
2758         iph->tot_len = htons(iplen);
2759         iph->check = 0;
2760         iph->check = ip_fast_csum((void *)iph, iph->ihl);
2761         skb->protocol = protocol;
2762         skb->mac_header = (skb->network_header - ETH_HLEN -
2763                            pkt_dev->pkt_overhead);
2764         skb->dev = odev;
2765         skb->pkt_type = PACKET_HOST;
2766         pktgen_finalize_skb(pkt_dev, skb, datalen);
2767
2768 #ifdef CONFIG_XFRM
2769         if (!process_ipsec(pkt_dev, skb, protocol))
2770                 return NULL;
2771 #endif
2772
2773         return skb;
2774 }
2775
2776 /*
2777  * scan_ip6, fmt_ip taken from dietlibc-0.21
2778  * Author Felix von Leitner <felix-dietlibc@fefe.de>
2779  *
2780  * Slightly modified for kernel.
2781  * Should be candidate for net/ipv4/utils.c
2782  * --ro
2783  */
2784
2785 static unsigned int scan_ip6(const char *s, char ip[16])
2786 {
2787         unsigned int i;
2788         unsigned int len = 0;
2789         unsigned long u;
2790         char suffix[16];
2791         unsigned int prefixlen = 0;
2792         unsigned int suffixlen = 0;
2793         __be32 tmp;
2794         char *pos;
2795
2796         for (i = 0; i < 16; i++)
2797                 ip[i] = 0;
2798
2799         for (;;) {
2800                 if (*s == ':') {
2801                         len++;
2802                         if (s[1] == ':') {      /* Found "::", skip to part 2 */
2803                                 s += 2;
2804                                 len++;
2805                                 break;
2806                         }
2807                         s++;
2808                 }
2809
2810                 u = simple_strtoul(s, &pos, 16);
2811                 i = pos - s;
2812                 if (!i)
2813                         return 0;
2814                 if (prefixlen == 12 && s[i] == '.') {
2815
2816                         /* the last 4 bytes may be written as IPv4 address */
2817
2818                         tmp = in_aton(s);
2819                         memcpy((struct in_addr *)(ip + 12), &tmp, sizeof(tmp));
2820                         return i + len;
2821                 }
2822                 ip[prefixlen++] = (u >> 8);
2823                 ip[prefixlen++] = (u & 255);
2824                 s += i;
2825                 len += i;
2826                 if (prefixlen == 16)
2827                         return len;
2828         }
2829
2830 /* part 2, after "::" */
2831         for (;;) {
2832                 if (*s == ':') {
2833                         if (suffixlen == 0)
2834                                 break;
2835                         s++;
2836                         len++;
2837                 } else if (suffixlen != 0)
2838                         break;
2839
2840                 u = simple_strtol(s, &pos, 16);
2841                 i = pos - s;
2842                 if (!i) {
2843                         if (*s)
2844                                 len--;
2845                         break;
2846                 }
2847                 if (suffixlen + prefixlen <= 12 && s[i] == '.') {
2848                         tmp = in_aton(s);
2849                         memcpy((struct in_addr *)(suffix + suffixlen), &tmp,
2850                                sizeof(tmp));
2851                         suffixlen += 4;
2852                         len += strlen(s);
2853                         break;
2854                 }
2855                 suffix[suffixlen++] = (u >> 8);
2856                 suffix[suffixlen++] = (u & 255);
2857                 s += i;
2858                 len += i;
2859                 if (prefixlen + suffixlen == 16)
2860                         break;
2861         }
2862         for (i = 0; i < suffixlen; i++)
2863                 ip[16 - suffixlen + i] = suffix[i];
2864         return len;
2865 }
2866
2867 static struct sk_buff *fill_packet_ipv6(struct net_device *odev,
2868                                         struct pktgen_dev *pkt_dev)
2869 {
2870         struct sk_buff *skb = NULL;
2871         __u8 *eth;
2872         struct udphdr *udph;
2873         int datalen;
2874         struct ipv6hdr *iph;
2875         __be16 protocol = htons(ETH_P_IPV6);
2876         __be32 *mpls;
2877         __be16 *vlan_tci = NULL;                 /* Encapsulates priority and VLAN ID */
2878         __be16 *vlan_encapsulated_proto = NULL;  /* packet type ID field (or len) for VLAN tag */
2879         __be16 *svlan_tci = NULL;                /* Encapsulates priority and SVLAN ID */
2880         __be16 *svlan_encapsulated_proto = NULL; /* packet type ID field (or len) for SVLAN tag */
2881         u16 queue_map;
2882
2883         if (pkt_dev->nr_labels)
2884                 protocol = htons(ETH_P_MPLS_UC);
2885
2886         if (pkt_dev->vlan_id != 0xffff)
2887                 protocol = htons(ETH_P_8021Q);
2888
2889         /* Update any of the values, used when we're incrementing various
2890          * fields.
2891          */
2892         mod_cur_headers(pkt_dev);
2893         queue_map = pkt_dev->cur_queue_map;
2894
2895         skb = __netdev_alloc_skb(odev,
2896                                  pkt_dev->cur_pkt_size + 64
2897                                  + 16 + pkt_dev->pkt_overhead, GFP_NOWAIT);
2898         if (!skb) {
2899                 sprintf(pkt_dev->result, "No memory");
2900                 return NULL;
2901         }
2902         prefetchw(skb->data);
2903
2904         skb_reserve(skb, 16);
2905
2906         /*  Reserve for ethernet and IP header  */
2907         eth = (__u8 *) skb_push(skb, 14);
2908         mpls = (__be32 *)skb_put(skb, pkt_dev->nr_labels*sizeof(__u32));
2909         if (pkt_dev->nr_labels)
2910                 mpls_push(mpls, pkt_dev);
2911
2912         if (pkt_dev->vlan_id != 0xffff) {
2913                 if (pkt_dev->svlan_id != 0xffff) {
2914                         svlan_tci = (__be16 *)skb_put(skb, sizeof(__be16));
2915                         *svlan_tci = build_tci(pkt_dev->svlan_id,
2916                                                pkt_dev->svlan_cfi,
2917                                                pkt_dev->svlan_p);
2918                         svlan_encapsulated_proto = (__be16 *)skb_put(skb, sizeof(__be16));
2919                         *svlan_encapsulated_proto = htons(ETH_P_8021Q);
2920                 }
2921                 vlan_tci = (__be16 *)skb_put(skb, sizeof(__be16));
2922                 *vlan_tci = build_tci(pkt_dev->vlan_id,
2923                                       pkt_dev->vlan_cfi,
2924                                       pkt_dev->vlan_p);
2925                 vlan_encapsulated_proto = (__be16 *)skb_put(skb, sizeof(__be16));
2926                 *vlan_encapsulated_proto = htons(ETH_P_IPV6);
2927         }
2928
2929         skb->network_header = skb->tail;
2930         skb->transport_header = skb->network_header + sizeof(struct ipv6hdr);
2931         skb_put(skb, sizeof(struct ipv6hdr) + sizeof(struct udphdr));
2932         skb_set_queue_mapping(skb, queue_map);
2933         skb->priority = pkt_dev->skb_priority;
2934         iph = ipv6_hdr(skb);
2935         udph = udp_hdr(skb);
2936
2937         memcpy(eth, pkt_dev->hh, 12);
2938         *(__be16 *) &eth[12] = protocol;
2939
2940         /* Eth + IPh + UDPh + mpls */
2941         datalen = pkt_dev->cur_pkt_size - 14 -
2942                   sizeof(struct ipv6hdr) - sizeof(struct udphdr) -
2943                   pkt_dev->pkt_overhead;
2944
2945         if (datalen < 0 || datalen < sizeof(struct pktgen_hdr)) {
2946                 datalen = sizeof(struct pktgen_hdr);
2947                 net_info_ratelimited("increased datalen to %d\n", datalen);
2948         }
2949
2950         udph->source = htons(pkt_dev->cur_udp_src);
2951         udph->dest = htons(pkt_dev->cur_udp_dst);
2952         udph->len = htons(datalen + sizeof(struct udphdr));
2953         udph->check = 0;        /* No checksum */
2954
2955         *(__be32 *) iph = htonl(0x60000000);    /* Version + flow */
2956
2957         if (pkt_dev->traffic_class) {
2958                 /* Version + traffic class + flow (0) */
2959                 *(__be32 *)iph |= htonl(0x60000000 | (pkt_dev->traffic_class << 20));
2960         }
2961
2962         iph->hop_limit = 32;
2963
2964         iph->payload_len = htons(sizeof(struct udphdr) + datalen);
2965         iph->nexthdr = IPPROTO_UDP;
2966
2967         iph->daddr = pkt_dev->cur_in6_daddr;
2968         iph->saddr = pkt_dev->cur_in6_saddr;
2969
2970         skb->mac_header = (skb->network_header - ETH_HLEN -
2971                            pkt_dev->pkt_overhead);
2972         skb->protocol = protocol;
2973         skb->dev = odev;
2974         skb->pkt_type = PACKET_HOST;
2975
2976         pktgen_finalize_skb(pkt_dev, skb, datalen);
2977
2978         return skb;
2979 }
2980
2981 static struct sk_buff *fill_packet(struct net_device *odev,
2982                                    struct pktgen_dev *pkt_dev)
2983 {
2984         if (pkt_dev->flags & F_IPV6)
2985                 return fill_packet_ipv6(odev, pkt_dev);
2986         else
2987                 return fill_packet_ipv4(odev, pkt_dev);
2988 }
2989
2990 static void pktgen_clear_counters(struct pktgen_dev *pkt_dev)
2991 {
2992         pkt_dev->seq_num = 1;
2993         pkt_dev->idle_acc = 0;
2994         pkt_dev->sofar = 0;
2995         pkt_dev->tx_bytes = 0;
2996         pkt_dev->errors = 0;
2997 }
2998
2999 /* Set up structure for sending pkts, clear counters */
3000
3001 static void pktgen_run(struct pktgen_thread *t)
3002 {
3003         struct pktgen_dev *pkt_dev;
3004         int started = 0;
3005
3006         func_enter();
3007
3008         if_lock(t);
3009         list_for_each_entry(pkt_dev, &t->if_list, list) {
3010
3011                 /*
3012                  * setup odev and create initial packet.
3013                  */
3014                 pktgen_setup_inject(pkt_dev);
3015
3016                 if (pkt_dev->odev) {
3017                         pktgen_clear_counters(pkt_dev);
3018                         pkt_dev->running = 1;   /* Cranke yeself! */
3019                         pkt_dev->skb = NULL;
3020                         pkt_dev->started_at =
3021                                 pkt_dev->next_tx = ktime_now();
3022
3023                         set_pkt_overhead(pkt_dev);
3024
3025                         strcpy(pkt_dev->result, "Starting");
3026                         started++;
3027                 } else
3028                         strcpy(pkt_dev->result, "Error starting");
3029         }
3030         if_unlock(t);
3031         if (started)
3032                 t->control &= ~(T_STOP);
3033 }
3034
3035 static void pktgen_stop_all_threads_ifs(void)
3036 {
3037         struct pktgen_thread *t;
3038
3039         func_enter();
3040
3041         mutex_lock(&pktgen_thread_lock);
3042
3043         list_for_each_entry(t, &pktgen_threads, th_list)
3044                 t->control |= T_STOP;
3045
3046         mutex_unlock(&pktgen_thread_lock);
3047 }
3048
3049 static int thread_is_running(const struct pktgen_thread *t)
3050 {
3051         const struct pktgen_dev *pkt_dev;
3052
3053         list_for_each_entry(pkt_dev, &t->if_list, list)
3054                 if (pkt_dev->running)
3055                         return 1;
3056         return 0;
3057 }
3058
3059 static int pktgen_wait_thread_run(struct pktgen_thread *t)
3060 {
3061         if_lock(t);
3062
3063         while (thread_is_running(t)) {
3064
3065                 if_unlock(t);
3066
3067                 msleep_interruptible(100);
3068
3069                 if (signal_pending(current))
3070                         goto signal;
3071                 if_lock(t);
3072         }
3073         if_unlock(t);
3074         return 1;
3075 signal:
3076         return 0;
3077 }
3078
3079 static int pktgen_wait_all_threads_run(void)
3080 {
3081         struct pktgen_thread *t;
3082         int sig = 1;
3083
3084         mutex_lock(&pktgen_thread_lock);
3085
3086         list_for_each_entry(t, &pktgen_threads, th_list) {
3087                 sig = pktgen_wait_thread_run(t);
3088                 if (sig == 0)
3089                         break;
3090         }
3091
3092         if (sig == 0)
3093                 list_for_each_entry(t, &pktgen_threads, th_list)
3094                         t->control |= (T_STOP);
3095
3096         mutex_unlock(&pktgen_thread_lock);
3097         return sig;
3098 }
3099
3100 static void pktgen_run_all_threads(void)
3101 {
3102         struct pktgen_thread *t;
3103
3104         func_enter();
3105
3106         mutex_lock(&pktgen_thread_lock);
3107
3108         list_for_each_entry(t, &pktgen_threads, th_list)
3109                 t->control |= (T_RUN);
3110
3111         mutex_unlock(&pktgen_thread_lock);
3112
3113         /* Propagate thread->control  */
3114         schedule_timeout_interruptible(msecs_to_jiffies(125));
3115
3116         pktgen_wait_all_threads_run();
3117 }
3118
3119 static void pktgen_reset_all_threads(void)
3120 {
3121         struct pktgen_thread *t;
3122
3123         func_enter();
3124
3125         mutex_lock(&pktgen_thread_lock);
3126
3127         list_for_each_entry(t, &pktgen_threads, th_list)
3128                 t->control |= (T_REMDEVALL);
3129
3130         mutex_unlock(&pktgen_thread_lock);
3131
3132         /* Propagate thread->control  */
3133         schedule_timeout_interruptible(msecs_to_jiffies(125));
3134
3135         pktgen_wait_all_threads_run();
3136 }
3137
3138 static void show_results(struct pktgen_dev *pkt_dev, int nr_frags)
3139 {
3140         __u64 bps, mbps, pps;
3141         char *p = pkt_dev->result;
3142         ktime_t elapsed = ktime_sub(pkt_dev->stopped_at,
3143                                     pkt_dev->started_at);
3144         ktime_t idle = ns_to_ktime(pkt_dev->idle_acc);
3145
3146         p += sprintf(p, "OK: %llu(c%llu+d%llu) usec, %llu (%dbyte,%dfrags)\n",
3147                      (unsigned long long)ktime_to_us(elapsed),
3148                      (unsigned long long)ktime_to_us(ktime_sub(elapsed, idle)),
3149                      (unsigned long long)ktime_to_us(idle),
3150                      (unsigned long long)pkt_dev->sofar,
3151                      pkt_dev->cur_pkt_size, nr_frags);
3152
3153         pps = div64_u64(pkt_dev->sofar * NSEC_PER_SEC,
3154                         ktime_to_ns(elapsed));
3155
3156         bps = pps * 8 * pkt_dev->cur_pkt_size;
3157
3158         mbps = bps;
3159         do_div(mbps, 1000000);
3160         p += sprintf(p, "  %llupps %lluMb/sec (%llubps) errors: %llu",
3161                      (unsigned long long)pps,
3162                      (unsigned long long)mbps,
3163                      (unsigned long long)bps,
3164                      (unsigned long long)pkt_dev->errors);
3165 }
3166
3167 /* Set stopped-at timer, remove from running list, do counters & statistics */
3168 static int pktgen_stop_device(struct pktgen_dev *pkt_dev)
3169 {
3170         int nr_frags = pkt_dev->skb ? skb_shinfo(pkt_dev->skb)->nr_frags : -1;
3171
3172         if (!pkt_dev->running) {
3173                 pr_warning("interface: %s is already stopped\n",
3174                            pkt_dev->odevname);
3175                 return -EINVAL;
3176         }
3177
3178         kfree_skb(pkt_dev->skb);
3179         pkt_dev->skb = NULL;
3180         pkt_dev->stopped_at = ktime_now();
3181         pkt_dev->running = 0;
3182
3183         show_results(pkt_dev, nr_frags);
3184
3185         return 0;
3186 }
3187
3188 static struct pktgen_dev *next_to_run(struct pktgen_thread *t)
3189 {
3190         struct pktgen_dev *pkt_dev, *best = NULL;
3191
3192         if_lock(t);
3193
3194         list_for_each_entry(pkt_dev, &t->if_list, list) {
3195                 if (!pkt_dev->running)
3196                         continue;
3197                 if (best == NULL)
3198                         best = pkt_dev;
3199                 else if (ktime_lt(pkt_dev->next_tx, best->next_tx))
3200                         best = pkt_dev;
3201         }
3202         if_unlock(t);
3203         return best;
3204 }
3205
3206 static void pktgen_stop(struct pktgen_thread *t)
3207 {
3208         struct pktgen_dev *pkt_dev;
3209
3210         func_enter();
3211
3212         if_lock(t);
3213
3214         list_for_each_entry(pkt_dev, &t->if_list, list) {
3215                 pktgen_stop_device(pkt_dev);
3216         }
3217
3218         if_unlock(t);
3219 }
3220
3221 /*
3222  * one of our devices needs to be removed - find it
3223  * and remove it
3224  */
3225 static void pktgen_rem_one_if(struct pktgen_thread *t)
3226 {
3227         struct list_head *q, *n;
3228         struct pktgen_dev *cur;
3229
3230         func_enter();
3231
3232         if_lock(t);
3233
3234         list_for_each_safe(q, n, &t->if_list) {
3235                 cur = list_entry(q, struct pktgen_dev, list);
3236
3237                 if (!cur->removal_mark)
3238                         continue;
3239
3240                 kfree_skb(cur->skb);
3241                 cur->skb = NULL;
3242
3243                 pktgen_remove_device(t, cur);
3244
3245                 break;
3246         }
3247
3248         if_unlock(t);
3249 }
3250
3251 static void pktgen_rem_all_ifs(struct pktgen_thread *t)
3252 {
3253         struct list_head *q, *n;
3254         struct pktgen_dev *cur;
3255
3256         func_enter();
3257
3258         /* Remove all devices, free mem */
3259
3260         if_lock(t);
3261
3262         list_for_each_safe(q, n, &t->if_list) {
3263                 cur = list_entry(q, struct pktgen_dev, list);
3264
3265                 kfree_skb(cur->skb);
3266                 cur->skb = NULL;
3267
3268                 pktgen_remove_device(t, cur);
3269         }
3270
3271         if_unlock(t);
3272 }
3273
3274 static void pktgen_rem_thread(struct pktgen_thread *t)
3275 {
3276         /* Remove from the thread list */
3277
3278         remove_proc_entry(t->tsk->comm, pg_proc_dir);
3279
3280 }
3281
3282 static void pktgen_resched(struct pktgen_dev *pkt_dev)
3283 {
3284         ktime_t idle_start = ktime_now();
3285         schedule();
3286         pkt_dev->idle_acc += ktime_to_ns(ktime_sub(ktime_now(), idle_start));
3287 }
3288
3289 static void pktgen_wait_for_skb(struct pktgen_dev *pkt_dev)
3290 {
3291         ktime_t idle_start = ktime_now();
3292
3293         while (atomic_read(&(pkt_dev->skb->users)) != 1) {
3294                 if (signal_pending(current))
3295                         break;
3296
3297                 if (need_resched())
3298                         pktgen_resched(pkt_dev);
3299                 else
3300                         cpu_relax();
3301         }
3302         pkt_dev->idle_acc += ktime_to_ns(ktime_sub(ktime_now(), idle_start));
3303 }
3304
3305 static void pktgen_xmit(struct pktgen_dev *pkt_dev)
3306 {
3307         struct net_device *odev = pkt_dev->odev;
3308         netdev_tx_t (*xmit)(struct sk_buff *, struct net_device *)
3309                 = odev->netdev_ops->ndo_start_xmit;
3310         struct netdev_queue *txq;
3311         u16 queue_map;
3312         int ret;
3313
3314         /* If device is offline, then don't send */
3315         if (unlikely(!netif_running(odev) || !netif_carrier_ok(odev))) {
3316                 pktgen_stop_device(pkt_dev);
3317                 return;
3318         }
3319
3320         /* This is max DELAY, this has special meaning of
3321          * "never transmit"
3322          */
3323         if (unlikely(pkt_dev->delay == ULLONG_MAX)) {
3324                 pkt_dev->next_tx = ktime_add_ns(ktime_now(), ULONG_MAX);
3325                 return;
3326         }
3327
3328         /* If no skb or clone count exhausted then get new one */
3329         if (!pkt_dev->skb || (pkt_dev->last_ok &&
3330                               ++pkt_dev->clone_count >= pkt_dev->clone_skb)) {
3331                 /* build a new pkt */
3332                 kfree_skb(pkt_dev->skb);
3333
3334                 pkt_dev->skb = fill_packet(odev, pkt_dev);
3335                 if (pkt_dev->skb == NULL) {
3336                         pr_err("ERROR: couldn't allocate skb in fill_packet\n");
3337                         schedule();
3338                         pkt_dev->clone_count--; /* back out increment, OOM */
3339                         return;
3340                 }
3341                 pkt_dev->last_pkt_size = pkt_dev->skb->len;
3342                 pkt_dev->allocated_skbs++;
3343                 pkt_dev->clone_count = 0;       /* reset counter */
3344         }
3345
3346         if (pkt_dev->delay && pkt_dev->last_ok)
3347                 spin(pkt_dev, pkt_dev->next_tx);
3348
3349         queue_map = skb_get_queue_mapping(pkt_dev->skb);
3350         txq = netdev_get_tx_queue(odev, queue_map);
3351
3352         __netif_tx_lock_bh(txq);
3353
3354         if (unlikely(netif_xmit_frozen_or_stopped(txq))) {
3355                 ret = NETDEV_TX_BUSY;
3356                 pkt_dev->last_ok = 0;
3357                 goto unlock;
3358         }
3359         atomic_inc(&(pkt_dev->skb->users));
3360         ret = (*xmit)(pkt_dev->skb, odev);
3361
3362         switch (ret) {
3363         case NETDEV_TX_OK:
3364                 txq_trans_update(txq);
3365                 pkt_dev->last_ok = 1;
3366                 pkt_dev->sofar++;
3367                 pkt_dev->seq_num++;
3368                 pkt_dev->tx_bytes += pkt_dev->last_pkt_size;
3369                 break;
3370         case NET_XMIT_DROP:
3371         case NET_XMIT_CN:
3372         case NET_XMIT_POLICED:
3373                 /* skb has been consumed */
3374                 pkt_dev->errors++;
3375                 break;
3376         default: /* Drivers are not supposed to return other values! */
3377                 net_info_ratelimited("%s xmit error: %d\n",
3378                                      pkt_dev->odevname, ret);
3379                 pkt_dev->errors++;
3380                 /* fallthru */
3381         case NETDEV_TX_LOCKED:
3382         case NETDEV_TX_BUSY:
3383                 /* Retry it next time */
3384                 atomic_dec(&(pkt_dev->skb->users));
3385                 pkt_dev->last_ok = 0;
3386         }
3387 unlock:
3388         __netif_tx_unlock_bh(txq);
3389
3390         /* If pkt_dev->count is zero, then run forever */
3391         if ((pkt_dev->count != 0) && (pkt_dev->sofar >= pkt_dev->count)) {
3392                 pktgen_wait_for_skb(pkt_dev);
3393
3394                 /* Done with this */
3395                 pktgen_stop_device(pkt_dev);
3396         }
3397 }
3398
3399 /*
3400  * Main loop of the thread goes here
3401  */
3402
3403 static int pktgen_thread_worker(void *arg)
3404 {
3405         DEFINE_WAIT(wait);
3406         struct pktgen_thread *t = arg;
3407         struct pktgen_dev *pkt_dev = NULL;
3408         int cpu = t->cpu;
3409
3410         BUG_ON(smp_processor_id() != cpu);
3411
3412         init_waitqueue_head(&t->queue);
3413         complete(&t->start_done);
3414
3415         pr_debug("starting pktgen/%d:  pid=%d\n", cpu, task_pid_nr(current));
3416
3417         set_current_state(TASK_INTERRUPTIBLE);
3418
3419         set_freezable();
3420
3421         while (!kthread_should_stop()) {
3422                 pkt_dev = next_to_run(t);
3423
3424                 if (unlikely(!pkt_dev && t->control == 0)) {
3425                         if (pktgen_exiting)
3426                                 break;
3427                         wait_event_interruptible_timeout(t->queue,
3428                                                          t->control != 0,
3429                                                          HZ/10);
3430                         try_to_freeze();
3431                         continue;
3432                 }
3433
3434                 __set_current_state(TASK_RUNNING);
3435
3436                 if (likely(pkt_dev)) {
3437                         pktgen_xmit(pkt_dev);
3438
3439                         if (need_resched())
3440                                 pktgen_resched(pkt_dev);
3441                         else
3442                                 cpu_relax();
3443                 }
3444
3445                 if (t->control & T_STOP) {
3446                         pktgen_stop(t);
3447                         t->control &= ~(T_STOP);
3448                 }
3449
3450                 if (t->control & T_RUN) {
3451                         pktgen_run(t);
3452                         t->control &= ~(T_RUN);
3453                 }
3454
3455                 if (t->control & T_REMDEVALL) {
3456                         pktgen_rem_all_ifs(t);
3457                         t->control &= ~(T_REMDEVALL);
3458                 }
3459
3460                 if (t->control & T_REMDEV) {
3461                         pktgen_rem_one_if(t);
3462                         t->control &= ~(T_REMDEV);
3463                 }
3464
3465                 try_to_freeze();
3466
3467                 set_current_state(TASK_INTERRUPTIBLE);
3468         }
3469
3470         pr_debug("%s stopping all device\n", t->tsk->comm);
3471         pktgen_stop(t);
3472
3473         pr_debug("%s removing all device\n", t->tsk->comm);
3474         pktgen_rem_all_ifs(t);
3475
3476         pr_debug("%s removing thread\n", t->tsk->comm);
3477         pktgen_rem_thread(t);
3478
3479         /* Wait for kthread_stop */
3480         while (!kthread_should_stop()) {
3481                 set_current_state(TASK_INTERRUPTIBLE);
3482                 schedule();
3483         }
3484         __set_current_state(TASK_RUNNING);
3485
3486         return 0;
3487 }
3488
3489 static struct pktgen_dev *pktgen_find_dev(struct pktgen_thread *t,
3490                                           const char *ifname, bool exact)
3491 {
3492         struct pktgen_dev *p, *pkt_dev = NULL;
3493         size_t len = strlen(ifname);
3494
3495         if_lock(t);
3496         list_for_each_entry(p, &t->if_list, list)
3497                 if (strncmp(p->odevname, ifname, len) == 0) {
3498                         if (p->odevname[len]) {
3499                                 if (exact || p->odevname[len] != '@')
3500                                         continue;
3501                         }
3502                         pkt_dev = p;
3503                         break;
3504                 }
3505
3506         if_unlock(t);
3507         pr_debug("find_dev(%s) returning %p\n", ifname, pkt_dev);
3508         return pkt_dev;
3509 }
3510
3511 /*
3512  * Adds a dev at front of if_list.
3513  */
3514
3515 static int add_dev_to_thread(struct pktgen_thread *t,
3516                              struct pktgen_dev *pkt_dev)
3517 {
3518         int rv = 0;
3519
3520         if_lock(t);
3521
3522         if (pkt_dev->pg_thread) {
3523                 pr_err("ERROR: already assigned to a thread\n");
3524                 rv = -EBUSY;
3525                 goto out;
3526         }
3527
3528         list_add(&pkt_dev->list, &t->if_list);
3529         pkt_dev->pg_thread = t;
3530         pkt_dev->running = 0;
3531
3532 out:
3533         if_unlock(t);
3534         return rv;
3535 }
3536
3537 /* Called under thread lock */
3538
3539 static int pktgen_add_device(struct pktgen_thread *t, const char *ifname)
3540 {
3541         struct pktgen_dev *pkt_dev;
3542         int err;
3543         int node = cpu_to_node(t->cpu);
3544
3545         /* We don't allow a device to be on several threads */
3546
3547         pkt_dev = __pktgen_NN_threads(ifname, FIND);
3548         if (pkt_dev) {
3549                 pr_err("ERROR: interface already used\n");
3550                 return -EBUSY;
3551         }
3552
3553         pkt_dev = kzalloc_node(sizeof(struct pktgen_dev), GFP_KERNEL, node);
3554         if (!pkt_dev)
3555                 return -ENOMEM;
3556
3557         strcpy(pkt_dev->odevname, ifname);
3558         pkt_dev->flows = vzalloc_node(MAX_CFLOWS * sizeof(struct flow_state),
3559                                       node);
3560         if (pkt_dev->flows == NULL) {
3561                 kfree(pkt_dev);
3562                 return -ENOMEM;
3563         }
3564
3565         pkt_dev->removal_mark = 0;
3566         pkt_dev->nfrags = 0;
3567         pkt_dev->delay = pg_delay_d;
3568         pkt_dev->count = pg_count_d;
3569         pkt_dev->sofar = 0;
3570         pkt_dev->udp_src_min = 9;       /* sink port */
3571         pkt_dev->udp_src_max = 9;
3572         pkt_dev->udp_dst_min = 9;
3573         pkt_dev->udp_dst_max = 9;
3574         pkt_dev->vlan_p = 0;
3575         pkt_dev->vlan_cfi = 0;
3576         pkt_dev->vlan_id = 0xffff;
3577         pkt_dev->svlan_p = 0;
3578         pkt_dev->svlan_cfi = 0;
3579         pkt_dev->svlan_id = 0xffff;
3580         pkt_dev->node = -1;
3581
3582         err = pktgen_setup_dev(pkt_dev, ifname);
3583         if (err)
3584                 goto out1;
3585         if (pkt_dev->odev->priv_flags & IFF_TX_SKB_SHARING)
3586                 pkt_dev->clone_skb = pg_clone_skb_d;
3587
3588         pkt_dev->entry = proc_create_data(ifname, 0600, pg_proc_dir,
3589                                           &pktgen_if_fops, pkt_dev);
3590         if (!pkt_dev->entry) {
3591                 pr_err("cannot create %s/%s procfs entry\n",
3592                        PG_PROC_DIR, ifname);
3593                 err = -EINVAL;
3594                 goto out2;
3595         }
3596 #ifdef CONFIG_XFRM
3597         pkt_dev->ipsmode = XFRM_MODE_TRANSPORT;
3598         pkt_dev->ipsproto = IPPROTO_ESP;
3599 #endif
3600
3601         return add_dev_to_thread(t, pkt_dev);
3602 out2:
3603         dev_put(pkt_dev->odev);
3604 out1:
3605 #ifdef CONFIG_XFRM
3606         free_SAs(pkt_dev);
3607 #endif
3608         vfree(pkt_dev->flows);
3609         kfree(pkt_dev);
3610         return err;
3611 }
3612
3613 static int __init pktgen_create_thread(int cpu)
3614 {
3615         struct pktgen_thread *t;
3616         struct proc_dir_entry *pe;
3617         struct task_struct *p;
3618
3619         t = kzalloc_node(sizeof(struct pktgen_thread), GFP_KERNEL,
3620                          cpu_to_node(cpu));
3621         if (!t) {
3622                 pr_err("ERROR: out of memory, can't create new thread\n");
3623                 return -ENOMEM;
3624         }
3625
3626         spin_lock_init(&t->if_lock);
3627         t->cpu = cpu;
3628
3629         INIT_LIST_HEAD(&t->if_list);
3630
3631         list_add_tail(&t->th_list, &pktgen_threads);
3632         init_completion(&t->start_done);
3633
3634         p = kthread_create_on_node(pktgen_thread_worker,
3635                                    t,
3636                                    cpu_to_node(cpu),
3637                                    "kpktgend_%d", cpu);
3638         if (IS_ERR(p)) {
3639                 pr_err("kernel_thread() failed for cpu %d\n", t->cpu);
3640                 list_del(&t->th_list);
3641                 kfree(t);
3642                 return PTR_ERR(p);
3643         }
3644         kthread_bind(p, cpu);
3645         t->tsk = p;
3646
3647         pe = proc_create_data(t->tsk->comm, 0600, pg_proc_dir,
3648                               &pktgen_thread_fops, t);
3649         if (!pe) {
3650                 pr_err("cannot create %s/%s procfs entry\n",
3651                        PG_PROC_DIR, t->tsk->comm);
3652                 kthread_stop(p);
3653                 list_del(&t->th_list);
3654                 kfree(t);
3655                 return -EINVAL;
3656         }
3657
3658         wake_up_process(p);
3659         wait_for_completion(&t->start_done);
3660
3661         return 0;
3662 }
3663
3664 /*
3665  * Removes a device from the thread if_list.
3666  */
3667 static void _rem_dev_from_if_list(struct pktgen_thread *t,
3668                                   struct pktgen_dev *pkt_dev)
3669 {
3670         struct list_head *q, *n;
3671         struct pktgen_dev *p;
3672
3673         list_for_each_safe(q, n, &t->if_list) {
3674                 p = list_entry(q, struct pktgen_dev, list);
3675                 if (p == pkt_dev)
3676                         list_del(&p->list);
3677         }
3678 }
3679
3680 static int pktgen_remove_device(struct pktgen_thread *t,
3681                                 struct pktgen_dev *pkt_dev)
3682 {
3683
3684         pr_debug("remove_device pkt_dev=%p\n", pkt_dev);
3685
3686         if (pkt_dev->running) {
3687                 pr_warning("WARNING: trying to remove a running interface, stopping it now\n");
3688                 pktgen_stop_device(pkt_dev);
3689         }
3690
3691         /* Dis-associate from the interface */
3692
3693         if (pkt_dev->odev) {
3694                 dev_put(pkt_dev->odev);
3695                 pkt_dev->odev = NULL;
3696         }
3697
3698         /* And update the thread if_list */
3699
3700         _rem_dev_from_if_list(t, pkt_dev);
3701
3702         if (pkt_dev->entry)
3703                 remove_proc_entry(pkt_dev->entry->name, pg_proc_dir);
3704
3705 #ifdef CONFIG_XFRM
3706         free_SAs(pkt_dev);
3707 #endif
3708         vfree(pkt_dev->flows);
3709         if (pkt_dev->page)
3710                 put_page(pkt_dev->page);
3711         kfree(pkt_dev);
3712         return 0;
3713 }
3714
3715 static int __init pg_init(void)
3716 {
3717         int cpu;
3718         struct proc_dir_entry *pe;
3719         int ret = 0;
3720
3721         pr_info("%s", version);
3722
3723         pg_proc_dir = proc_mkdir(PG_PROC_DIR, init_net.proc_net);
3724         if (!pg_proc_dir)
3725                 return -ENODEV;
3726
3727         pe = proc_create(PGCTRL, 0600, pg_proc_dir, &pktgen_fops);
3728         if (pe == NULL) {
3729                 pr_err("ERROR: cannot create %s procfs entry\n", PGCTRL);
3730                 ret = -EINVAL;
3731                 goto remove_dir;
3732         }
3733
3734         register_netdevice_notifier(&pktgen_notifier_block);
3735
3736         for_each_online_cpu(cpu) {
3737                 int err;
3738
3739                 err = pktgen_create_thread(cpu);
3740                 if (err)
3741                         pr_warning("WARNING: Cannot create thread for cpu %d (%d)\n",
3742                                    cpu, err);
3743         }
3744
3745         if (list_empty(&pktgen_threads)) {
3746                 pr_err("ERROR: Initialization failed for all threads\n");
3747                 ret = -ENODEV;
3748                 goto unregister;
3749         }
3750
3751         return 0;
3752
3753  unregister:
3754         unregister_netdevice_notifier(&pktgen_notifier_block);
3755         remove_proc_entry(PGCTRL, pg_proc_dir);
3756  remove_dir:
3757         proc_net_remove(&init_net, PG_PROC_DIR);
3758         return ret;
3759 }
3760
3761 static void __exit pg_cleanup(void)
3762 {
3763         struct pktgen_thread *t;
3764         struct list_head *q, *n;
3765         LIST_HEAD(list);
3766
3767         /* Stop all interfaces & threads */
3768         pktgen_exiting = true;
3769
3770         mutex_lock(&pktgen_thread_lock);
3771         list_splice_init(&pktgen_threads, &list);
3772         mutex_unlock(&pktgen_thread_lock);
3773
3774         list_for_each_safe(q, n, &list) {
3775                 t = list_entry(q, struct pktgen_thread, th_list);
3776                 list_del(&t->th_list);
3777                 kthread_stop(t->tsk);
3778                 kfree(t);
3779         }
3780
3781         /* Un-register us from receiving netdevice events */
3782         unregister_netdevice_notifier(&pktgen_notifier_block);
3783
3784         /* Clean up proc file system */
3785         remove_proc_entry(PGCTRL, pg_proc_dir);
3786         proc_net_remove(&init_net, PG_PROC_DIR);
3787 }
3788
3789 module_init(pg_init);
3790 module_exit(pg_cleanup);
3791
3792 MODULE_AUTHOR("Robert Olsson <robert.olsson@its.uu.se>");
3793 MODULE_DESCRIPTION("Packet Generator tool");
3794 MODULE_LICENSE("GPL");
3795 MODULE_VERSION(VERSION);
3796 module_param(pg_count_d, int, 0);
3797 MODULE_PARM_DESC(pg_count_d, "Default number of packets to inject");
3798 module_param(pg_delay_d, int, 0);
3799 MODULE_PARM_DESC(pg_delay_d, "Default delay between packets (nanoseconds)");
3800 module_param(pg_clone_skb_d, int, 0);
3801 MODULE_PARM_DESC(pg_clone_skb_d, "Default number of copies of the same packet");
3802 module_param(debug, int, 0);
3803 MODULE_PARM_DESC(debug, "Enable debugging of pktgen module");