Rewrite the SDep class, and simplify some of the related code.
[oota-llvm.git] / lib / CodeGen / SelectionDAG / ScheduleDAGList.cpp
1 //===---- ScheduleDAGList.cpp - Implement a list scheduler for isel DAG ---===//
2 //
3 //                     The LLVM Compiler Infrastructure
4 //
5 // This file is distributed under the University of Illinois Open Source
6 // License. See LICENSE.TXT for details.
7 //
8 //===----------------------------------------------------------------------===//
9 //
10 // This implements a top-down list scheduler, using standard algorithms.
11 // The basic approach uses a priority queue of available nodes to schedule.
12 // One at a time, nodes are taken from the priority queue (thus in priority
13 // order), checked for legality to schedule, and emitted if legal.
14 //
15 // Nodes may not be legal to schedule either due to structural hazards (e.g.
16 // pipeline or resource constraints) or because an input to the instruction has
17 // not completed execution.
18 //
19 //===----------------------------------------------------------------------===//
20
21 #define DEBUG_TYPE "pre-RA-sched"
22 #include "llvm/CodeGen/LatencyPriorityQueue.h"
23 #include "llvm/CodeGen/ScheduleDAGSDNodes.h"
24 #include "llvm/CodeGen/SchedulerRegistry.h"
25 #include "llvm/CodeGen/SelectionDAGISel.h"
26 #include "llvm/Target/TargetRegisterInfo.h"
27 #include "llvm/Target/TargetData.h"
28 #include "llvm/Target/TargetMachine.h"
29 #include "llvm/Target/TargetInstrInfo.h"
30 #include "llvm/Support/Debug.h"
31 #include "llvm/Support/Compiler.h"
32 #include "llvm/ADT/PriorityQueue.h"
33 #include "llvm/ADT/Statistic.h"
34 #include <climits>
35 using namespace llvm;
36
37 STATISTIC(NumNoops , "Number of noops inserted");
38 STATISTIC(NumStalls, "Number of pipeline stalls");
39
40 static RegisterScheduler
41   tdListDAGScheduler("list-td", "Top-down list scheduler",
42                      createTDListDAGScheduler);
43    
44 namespace {
45 //===----------------------------------------------------------------------===//
46 /// ScheduleDAGList - The actual list scheduler implementation.  This supports
47 /// top-down scheduling.
48 ///
49 class VISIBILITY_HIDDEN ScheduleDAGList : public ScheduleDAGSDNodes {
50 private:
51   /// AvailableQueue - The priority queue to use for the available SUnits.
52   ///
53   SchedulingPriorityQueue *AvailableQueue;
54   
55   /// PendingQueue - This contains all of the instructions whose operands have
56   /// been issued, but their results are not ready yet (due to the latency of
57   /// the operation).  Once the operands become available, the instruction is
58   /// added to the AvailableQueue.
59   std::vector<SUnit*> PendingQueue;
60
61   /// HazardRec - The hazard recognizer to use.
62   HazardRecognizer *HazardRec;
63
64 public:
65   ScheduleDAGList(SelectionDAG *dag, MachineBasicBlock *bb,
66                   const TargetMachine &tm,
67                   SchedulingPriorityQueue *availqueue,
68                   HazardRecognizer *HR)
69     : ScheduleDAGSDNodes(dag, bb, tm),
70       AvailableQueue(availqueue), HazardRec(HR) {
71     }
72
73   ~ScheduleDAGList() {
74     delete HazardRec;
75     delete AvailableQueue;
76   }
77
78   void Schedule();
79
80 private:
81   void ReleaseSucc(SUnit *SU, const SDep &D);
82   void ScheduleNodeTopDown(SUnit *SU, unsigned CurCycle);
83   void ListScheduleTopDown();
84 };
85 }  // end anonymous namespace
86
87 HazardRecognizer::~HazardRecognizer() {}
88
89
90 /// Schedule - Schedule the DAG using list scheduling.
91 void ScheduleDAGList::Schedule() {
92   DOUT << "********** List Scheduling **********\n";
93   
94   // Build scheduling units.
95   BuildSchedUnits();
96
97   AvailableQueue->initNodes(SUnits);
98   
99   ListScheduleTopDown();
100   
101   AvailableQueue->releaseState();
102 }
103
104 //===----------------------------------------------------------------------===//
105 //  Top-Down Scheduling
106 //===----------------------------------------------------------------------===//
107
108 /// ReleaseSucc - Decrement the NumPredsLeft count of a successor. Add it to
109 /// the PendingQueue if the count reaches zero. Also update its cycle bound.
110 void ScheduleDAGList::ReleaseSucc(SUnit *SU, const SDep &D) {
111   SUnit *SuccSU = D.getSUnit();
112   --SuccSU->NumPredsLeft;
113   
114 #ifndef NDEBUG
115   if (SuccSU->NumPredsLeft < 0) {
116     cerr << "*** Scheduling failed! ***\n";
117     SuccSU->dump(this);
118     cerr << " has been released too many times!\n";
119     assert(0);
120   }
121 #endif
122   
123   // Compute the cycle when this SUnit actually becomes available.  This
124   // is the max of the start time of all predecessors plus their latencies.
125   unsigned PredDoneCycle = SU->Cycle + SU->Latency;
126   SuccSU->CycleBound = std::max(SuccSU->CycleBound, PredDoneCycle);
127   
128   if (SuccSU->NumPredsLeft == 0) {
129     PendingQueue.push_back(SuccSU);
130   }
131 }
132
133 /// ScheduleNodeTopDown - Add the node to the schedule. Decrement the pending
134 /// count of its successors. If a successor pending count is zero, add it to
135 /// the Available queue.
136 void ScheduleDAGList::ScheduleNodeTopDown(SUnit *SU, unsigned CurCycle) {
137   DOUT << "*** Scheduling [" << CurCycle << "]: ";
138   DEBUG(SU->dump(this));
139   
140   Sequence.push_back(SU);
141   SU->Cycle = CurCycle;
142
143   // Top down: release successors.
144   for (SUnit::succ_iterator I = SU->Succs.begin(), E = SU->Succs.end();
145        I != E; ++I)
146     ReleaseSucc(SU, *I);
147
148   SU->isScheduled = true;
149   AvailableQueue->ScheduledNode(SU);
150 }
151
152 /// ListScheduleTopDown - The main loop of list scheduling for top-down
153 /// schedulers.
154 void ScheduleDAGList::ListScheduleTopDown() {
155   unsigned CurCycle = 0;
156
157   // All leaves to Available queue.
158   for (unsigned i = 0, e = SUnits.size(); i != e; ++i) {
159     // It is available if it has no predecessors.
160     if (SUnits[i].Preds.empty()) {
161       AvailableQueue->push(&SUnits[i]);
162       SUnits[i].isAvailable = true;
163     }
164   }
165   
166   // While Available queue is not empty, grab the node with the highest
167   // priority. If it is not ready put it back.  Schedule the node.
168   std::vector<SUnit*> NotReady;
169   Sequence.reserve(SUnits.size());
170   while (!AvailableQueue->empty() || !PendingQueue.empty()) {
171     // Check to see if any of the pending instructions are ready to issue.  If
172     // so, add them to the available queue.
173     for (unsigned i = 0, e = PendingQueue.size(); i != e; ++i) {
174       if (PendingQueue[i]->CycleBound == CurCycle) {
175         AvailableQueue->push(PendingQueue[i]);
176         PendingQueue[i]->isAvailable = true;
177         PendingQueue[i] = PendingQueue.back();
178         PendingQueue.pop_back();
179         --i; --e;
180       } else {
181         assert(PendingQueue[i]->CycleBound > CurCycle && "Negative latency?");
182       }
183     }
184     
185     // If there are no instructions available, don't try to issue anything, and
186     // don't advance the hazard recognizer.
187     if (AvailableQueue->empty()) {
188       ++CurCycle;
189       continue;
190     }
191
192     SUnit *FoundSUnit = 0;
193     SDNode *FoundNode = 0;
194     
195     bool HasNoopHazards = false;
196     while (!AvailableQueue->empty()) {
197       SUnit *CurSUnit = AvailableQueue->pop();
198       
199       // Get the node represented by this SUnit.
200       FoundNode = CurSUnit->getNode();
201       
202       // If this is a pseudo op, like copyfromreg, look to see if there is a
203       // real target node flagged to it.  If so, use the target node.
204       while (!FoundNode->isMachineOpcode()) {
205         SDNode *N = FoundNode->getFlaggedNode();
206         if (!N) break;
207         FoundNode = N;
208       }
209     
210       HazardRecognizer::HazardType HT = HazardRec->getHazardType(FoundNode);
211       if (HT == HazardRecognizer::NoHazard) {
212         FoundSUnit = CurSUnit;
213         break;
214       }
215     
216       // Remember if this is a noop hazard.
217       HasNoopHazards |= HT == HazardRecognizer::NoopHazard;
218       
219       NotReady.push_back(CurSUnit);
220     }
221     
222     // Add the nodes that aren't ready back onto the available list.
223     if (!NotReady.empty()) {
224       AvailableQueue->push_all(NotReady);
225       NotReady.clear();
226     }
227
228     // If we found a node to schedule, do it now.
229     if (FoundSUnit) {
230       ScheduleNodeTopDown(FoundSUnit, CurCycle);
231       HazardRec->EmitInstruction(FoundNode);
232
233       // If this is a pseudo-op node, we don't want to increment the current
234       // cycle.
235       if (FoundSUnit->Latency)  // Don't increment CurCycle for pseudo-ops!
236         ++CurCycle;        
237     } else if (!HasNoopHazards) {
238       // Otherwise, we have a pipeline stall, but no other problem, just advance
239       // the current cycle and try again.
240       DOUT << "*** Advancing cycle, no work to do\n";
241       HazardRec->AdvanceCycle();
242       ++NumStalls;
243       ++CurCycle;
244     } else {
245       // Otherwise, we have no instructions to issue and we have instructions
246       // that will fault if we don't do this right.  This is the case for
247       // processors without pipeline interlocks and other cases.
248       DOUT << "*** Emitting noop\n";
249       HazardRec->EmitNoop();
250       Sequence.push_back(0);   // NULL SUnit* -> noop
251       ++NumNoops;
252       ++CurCycle;
253     }
254   }
255
256 #ifndef NDEBUG
257   VerifySchedule(/*isBottomUp=*/false);
258 #endif
259 }
260
261 //===----------------------------------------------------------------------===//
262 //                         Public Constructor Functions
263 //===----------------------------------------------------------------------===//
264
265 /// createTDListDAGScheduler - This creates a top-down list scheduler with a
266 /// new hazard recognizer. This scheduler takes ownership of the hazard
267 /// recognizer and deletes it when done.
268 ScheduleDAG* llvm::createTDListDAGScheduler(SelectionDAGISel *IS,
269                                             SelectionDAG *DAG,
270                                             const TargetMachine *TM,
271                                             MachineBasicBlock *BB, bool Fast) {
272   return new ScheduleDAGList(DAG, BB, *TM,
273                              new LatencyPriorityQueue(),
274                              IS->CreateTargetHazardRecognizer());
275 }