199489599e4d4a0643d6d0d048eff685e3c284df
[oota-llvm.git] / include / llvm / MC / MCInstrItineraries.h
1 //===-- llvm/MC/MCInstrItineraries.h - Scheduling ---------------*- C++ -*-===//
2 //
3 //                     The LLVM Compiler Infrastructure
4 //
5 // This file is distributed under the University of Illinois Open Source
6 // License. See LICENSE.TXT for details.
7 //
8 //===----------------------------------------------------------------------===//
9 //
10 // This file describes the structures used for instruction
11 // itineraries, stages, and operand reads/writes.  This is used by
12 // schedulers to determine instruction stages and latencies.
13 //
14 //===----------------------------------------------------------------------===//
15
16 #ifndef LLVM_MC_MCINSTRITINERARIES_H
17 #define LLVM_MC_MCINSTRITINERARIES_H
18
19 #include <algorithm>
20
21 namespace llvm {
22
23 //===----------------------------------------------------------------------===//
24 /// Instruction stage - These values represent a non-pipelined step in
25 /// the execution of an instruction.  Cycles represents the number of
26 /// discrete time slots needed to complete the stage.  Units represent
27 /// the choice of functional units that can be used to complete the
28 /// stage.  Eg. IntUnit1, IntUnit2. NextCycles indicates how many
29 /// cycles should elapse from the start of this stage to the start of
30 /// the next stage in the itinerary. A value of -1 indicates that the
31 /// next stage should start immediately after the current one.
32 /// For example:
33 ///
34 ///   { 1, x, -1 }
35 ///      indicates that the stage occupies FU x for 1 cycle and that
36 ///      the next stage starts immediately after this one.
37 ///
38 ///   { 2, x|y, 1 }
39 ///      indicates that the stage occupies either FU x or FU y for 2
40 ///      consecuative cycles and that the next stage starts one cycle
41 ///      after this stage starts. That is, the stage requirements
42 ///      overlap in time.
43 ///
44 ///   { 1, x, 0 }
45 ///      indicates that the stage occupies FU x for 1 cycle and that
46 ///      the next stage starts in this same cycle. This can be used to
47 ///      indicate that the instruction requires multiple stages at the
48 ///      same time.
49 ///
50 /// FU reservation can be of two different kinds:
51 ///  - FUs which instruction actually requires
52 ///  - FUs which instruction just reserves. Reserved unit is not available for
53 ///    execution of other instruction. However, several instructions can reserve
54 ///    the same unit several times.
55 /// Such two types of units reservation is used to model instruction domain
56 /// change stalls, FUs using the same resource (e.g. same register file), etc.
57
58 struct InstrStage {
59   enum ReservationKinds {
60     Required = 0,
61     Reserved = 1
62   };
63
64   unsigned Cycles_;  ///< Length of stage in machine cycles
65   unsigned Units_;   ///< Choice of functional units
66   int NextCycles_;   ///< Number of machine cycles to next stage
67   ReservationKinds Kind_; ///< Kind of the FU reservation
68
69   /// getCycles - returns the number of cycles the stage is occupied
70   unsigned getCycles() const {
71     return Cycles_;
72   }
73
74   /// getUnits - returns the choice of FUs
75   unsigned getUnits() const {
76     return Units_;
77   }
78
79   ReservationKinds getReservationKind() const {
80     return Kind_;
81   }
82
83   /// getNextCycles - returns the number of cycles from the start of
84   /// this stage to the start of the next stage in the itinerary
85   unsigned getNextCycles() const {
86     return (NextCycles_ >= 0) ? (unsigned)NextCycles_ : Cycles_;
87   }
88 };
89
90
91 //===----------------------------------------------------------------------===//
92 /// Instruction itinerary - An itinerary represents the scheduling
93 /// information for an instruction. This includes a set of stages
94 /// occupies by the instruction, and the pipeline cycle in which
95 /// operands are read and written.
96 ///
97 struct InstrItinerary {
98   unsigned NumMicroOps;        ///< # of micro-ops, 0 means it's variable
99   unsigned FirstStage;         ///< Index of first stage in itinerary
100   unsigned LastStage;          ///< Index of last + 1 stage in itinerary
101   unsigned FirstOperandCycle;  ///< Index of first operand rd/wr
102   unsigned LastOperandCycle;   ///< Index of last + 1 operand rd/wr
103 };
104
105
106 //===----------------------------------------------------------------------===//
107 /// Instruction itinerary properties - These properties provide general
108 /// information about the microarchitecture to the scheduler.
109 ///
110 struct InstrItineraryProps {
111   // IssueWidth is the maximum number of instructions that may be scheduled in
112   // the same per-cycle group.
113   unsigned IssueWidth;
114
115   // MinLatency is the minimum latency between a register write
116   // followed by a data dependent read. This determines which
117   // instructions may be scheduled in the same per-cycle group. This
118   // is distinct from *expected* latency, which determines the likely
119   // critical path but does not guarantee a pipeline
120   // hazard. MinLatency can always be overridden by the number of
121   // InstrStage cycles.
122   //
123   // (-1) Standard in-order processor.
124   //      Use InstrItinerary OperandCycles as MinLatency.
125   //      If no OperandCycles exist, then use the cycle of the last InstrStage.
126   //
127   //  (0) Out-of-order processor, or in-order with bundled dependencies.
128   //      RAW dependencies may be dispatched in the same cycle.
129   //      Optional InstrItinerary OperandCycles provides expected latency.
130   //
131   // (>0) In-order processor with variable latencies.
132   //      Use the greater of this value or the cycle of the last InstrStage.
133   //      Optional InstrItinerary OperandCycles provides expected latency.
134   //      TODO: can't yet specify both min and expected latency per operand.
135   int MinLatency;
136
137   // LoadLatency is the expected latency of load instructions.
138   //
139   // If MinLatency >= 0, this may be overriden for individual load opcodes by
140   // InstrItinerary OperandCycles.
141   unsigned LoadLatency;
142
143   // HighLatency is the expected latency of "very high latency" operations.
144   // See TargetInstrInfo::isHighLatencyDef().
145   // By default, this is set to an arbitrarily high number of cycles
146   // likely to have some impact on scheduling heuristics.
147   // If MinLatency >= 0, this may be overriden by InstrItinData OperandCycles.
148   unsigned HighLatency;
149
150   InstrItineraryProps(): IssueWidth(1), MinLatency(-1), LoadLatency(4),
151                          HighLatency(10) {}
152
153   InstrItineraryProps(unsigned iw, int ml, unsigned ll, unsigned hl):
154     IssueWidth(iw), MinLatency(ml), LoadLatency(ll), HighLatency(hl) {}
155 };
156
157 //===----------------------------------------------------------------------===//
158 /// Encapsulate all subtarget specific information for scheduling for use with
159 /// SubtargetInfoKV.
160 struct InstrItinerarySubtargetValue {
161   const InstrItineraryProps *Props;
162   const InstrItinerary *Itineraries;
163 };
164
165 //===----------------------------------------------------------------------===//
166 /// Instruction itinerary Data - Itinerary data supplied by a subtarget to be
167 /// used by a target.
168 ///
169 class InstrItineraryData {
170 public:
171   InstrItineraryProps Props;
172   const InstrStage     *Stages;         ///< Array of stages selected
173   const unsigned       *OperandCycles;  ///< Array of operand cycles selected
174   const unsigned       *Forwardings;    ///< Array of pipeline forwarding pathes
175   const InstrItinerary *Itineraries;    ///< Array of itineraries selected
176
177   /// Ctors.
178   ///
179   InstrItineraryData() : Stages(0), OperandCycles(0), Forwardings(0),
180                          Itineraries(0) {}
181
182   InstrItineraryData(const InstrItineraryProps *P, const InstrStage *S,
183                      const unsigned *OS, const unsigned *F,
184                      const InstrItinerary *I)
185     : Props(*P), Stages(S), OperandCycles(OS), Forwardings(F), Itineraries(I) {}
186
187   /// isEmpty - Returns true if there are no itineraries.
188   ///
189   bool isEmpty() const { return Itineraries == 0; }
190
191   /// isEndMarker - Returns true if the index is for the end marker
192   /// itinerary.
193   ///
194   bool isEndMarker(unsigned ItinClassIndx) const {
195     return ((Itineraries[ItinClassIndx].FirstStage == ~0U) &&
196             (Itineraries[ItinClassIndx].LastStage == ~0U));
197   }
198
199   /// beginStage - Return the first stage of the itinerary.
200   ///
201   const InstrStage *beginStage(unsigned ItinClassIndx) const {
202     unsigned StageIdx = Itineraries[ItinClassIndx].FirstStage;
203     return Stages + StageIdx;
204   }
205
206   /// endStage - Return the last+1 stage of the itinerary.
207   ///
208   const InstrStage *endStage(unsigned ItinClassIndx) const {
209     unsigned StageIdx = Itineraries[ItinClassIndx].LastStage;
210     return Stages + StageIdx;
211   }
212
213   /// getStageLatency - Return the total stage latency of the given
214   /// class.  The latency is the maximum completion time for any stage
215   /// in the itinerary.
216   ///
217   unsigned getStageLatency(unsigned ItinClassIndx) const {
218     // If the target doesn't provide itinerary information, use a simple
219     // non-zero default value for all instructions.  Some target's provide a
220     // dummy (Generic) itinerary which should be handled as if it's itinerary is
221     // empty. We identify this by looking for a reference to stage zero (invalid
222     // stage). This is different from beginStage == endStage != 0, which could
223     // be used for zero-latency pseudo ops.
224     if (isEmpty() || Itineraries[ItinClassIndx].FirstStage == 0)
225       return 1;
226
227     // Calculate the maximum completion time for any stage.
228     unsigned Latency = 0, StartCycle = 0;
229     for (const InstrStage *IS = beginStage(ItinClassIndx),
230            *E = endStage(ItinClassIndx); IS != E; ++IS) {
231       Latency = std::max(Latency, StartCycle + IS->getCycles());
232       StartCycle += IS->getNextCycles();
233     }
234
235     return Latency;
236   }
237
238   /// getOperandCycle - Return the cycle for the given class and
239   /// operand. Return -1 if no cycle is specified for the operand.
240   ///
241   int getOperandCycle(unsigned ItinClassIndx, unsigned OperandIdx) const {
242     if (isEmpty())
243       return -1;
244
245     unsigned FirstIdx = Itineraries[ItinClassIndx].FirstOperandCycle;
246     unsigned LastIdx = Itineraries[ItinClassIndx].LastOperandCycle;
247     if ((FirstIdx + OperandIdx) >= LastIdx)
248       return -1;
249
250     return (int)OperandCycles[FirstIdx + OperandIdx];
251   }
252
253   /// hasPipelineForwarding - Return true if there is a pipeline forwarding
254   /// between instructions of itinerary classes DefClass and UseClasses so that
255   /// value produced by an instruction of itinerary class DefClass, operand
256   /// index DefIdx can be bypassed when it's read by an instruction of
257   /// itinerary class UseClass, operand index UseIdx.
258   bool hasPipelineForwarding(unsigned DefClass, unsigned DefIdx,
259                              unsigned UseClass, unsigned UseIdx) const {
260     unsigned FirstDefIdx = Itineraries[DefClass].FirstOperandCycle;
261     unsigned LastDefIdx = Itineraries[DefClass].LastOperandCycle;
262     if ((FirstDefIdx + DefIdx) >= LastDefIdx)
263       return false;
264     if (Forwardings[FirstDefIdx + DefIdx] == 0)
265       return false;
266
267     unsigned FirstUseIdx = Itineraries[UseClass].FirstOperandCycle;
268     unsigned LastUseIdx = Itineraries[UseClass].LastOperandCycle;
269     if ((FirstUseIdx + UseIdx) >= LastUseIdx)
270       return false;
271
272     return Forwardings[FirstDefIdx + DefIdx] ==
273       Forwardings[FirstUseIdx + UseIdx];
274   }
275
276   /// getOperandLatency - Compute and return the use operand latency of a given
277   /// itinerary class and operand index if the value is produced by an
278   /// instruction of the specified itinerary class and def operand index.
279   int getOperandLatency(unsigned DefClass, unsigned DefIdx,
280                         unsigned UseClass, unsigned UseIdx) const {
281     if (isEmpty())
282       return -1;
283
284     int DefCycle = getOperandCycle(DefClass, DefIdx);
285     if (DefCycle == -1)
286       return -1;
287
288     int UseCycle = getOperandCycle(UseClass, UseIdx);
289     if (UseCycle == -1)
290       return -1;
291
292     UseCycle = DefCycle - UseCycle + 1;
293     if (UseCycle > 0 &&
294         hasPipelineForwarding(DefClass, DefIdx, UseClass, UseIdx))
295       // FIXME: This assumes one cycle benefit for every pipeline forwarding.
296       --UseCycle;
297     return UseCycle;
298   }
299
300   /// isMicroCoded - Return true if the instructions in the given class decode
301   /// to more than one micro-ops.
302   bool isMicroCoded(unsigned ItinClassIndx) const {
303     if (isEmpty())
304       return false;
305     return Itineraries[ItinClassIndx].NumMicroOps != 1;
306   }
307 };
308
309
310 } // End llvm namespace
311
312 #endif