Factor out the code for verifying the work of the scheduler,
[oota-llvm.git] / lib / CodeGen / SelectionDAG / ScheduleDAGList.cpp
1 //===---- ScheduleDAGList.cpp - Implement a list scheduler for isel DAG ---===//
2 //
3 //                     The LLVM Compiler Infrastructure
4 //
5 // This file is distributed under the University of Illinois Open Source
6 // License. See LICENSE.TXT for details.
7 //
8 //===----------------------------------------------------------------------===//
9 //
10 // This implements a top-down list scheduler, using standard algorithms.
11 // The basic approach uses a priority queue of available nodes to schedule.
12 // One at a time, nodes are taken from the priority queue (thus in priority
13 // order), checked for legality to schedule, and emitted if legal.
14 //
15 // Nodes may not be legal to schedule either due to structural hazards (e.g.
16 // pipeline or resource constraints) or because an input to the instruction has
17 // not completed execution.
18 //
19 //===----------------------------------------------------------------------===//
20
21 #define DEBUG_TYPE "pre-RA-sched"
22 #include "llvm/CodeGen/LatencyPriorityQueue.h"
23 #include "llvm/CodeGen/ScheduleDAGSDNodes.h"
24 #include "llvm/CodeGen/SchedulerRegistry.h"
25 #include "llvm/CodeGen/SelectionDAGISel.h"
26 #include "llvm/Target/TargetRegisterInfo.h"
27 #include "llvm/Target/TargetData.h"
28 #include "llvm/Target/TargetMachine.h"
29 #include "llvm/Target/TargetInstrInfo.h"
30 #include "llvm/Support/Debug.h"
31 #include "llvm/Support/Compiler.h"
32 #include "llvm/ADT/PriorityQueue.h"
33 #include "llvm/ADT/Statistic.h"
34 #include <climits>
35 using namespace llvm;
36
37 STATISTIC(NumNoops , "Number of noops inserted");
38 STATISTIC(NumStalls, "Number of pipeline stalls");
39
40 static RegisterScheduler
41   tdListDAGScheduler("list-td", "Top-down list scheduler",
42                      createTDListDAGScheduler);
43    
44 namespace {
45 //===----------------------------------------------------------------------===//
46 /// ScheduleDAGList - The actual list scheduler implementation.  This supports
47 /// top-down scheduling.
48 ///
49 class VISIBILITY_HIDDEN ScheduleDAGList : public ScheduleDAGSDNodes {
50 private:
51   /// AvailableQueue - The priority queue to use for the available SUnits.
52   ///
53   SchedulingPriorityQueue *AvailableQueue;
54   
55   /// PendingQueue - This contains all of the instructions whose operands have
56   /// been issued, but their results are not ready yet (due to the latency of
57   /// the operation).  Once the operands become available, the instruction is
58   /// added to the AvailableQueue.
59   std::vector<SUnit*> PendingQueue;
60
61   /// HazardRec - The hazard recognizer to use.
62   HazardRecognizer *HazardRec;
63
64 public:
65   ScheduleDAGList(SelectionDAG *dag, MachineBasicBlock *bb,
66                   const TargetMachine &tm,
67                   SchedulingPriorityQueue *availqueue,
68                   HazardRecognizer *HR)
69     : ScheduleDAGSDNodes(dag, bb, tm),
70       AvailableQueue(availqueue), HazardRec(HR) {
71     }
72
73   ~ScheduleDAGList() {
74     delete HazardRec;
75     delete AvailableQueue;
76   }
77
78   void Schedule();
79
80 private:
81   void ReleaseSucc(SUnit *SU, SUnit *SuccSU, bool isChain);
82   void ScheduleNodeTopDown(SUnit *SU, unsigned CurCycle);
83   void ListScheduleTopDown();
84 };
85 }  // end anonymous namespace
86
87 HazardRecognizer::~HazardRecognizer() {}
88
89
90 /// Schedule - Schedule the DAG using list scheduling.
91 void ScheduleDAGList::Schedule() {
92   DOUT << "********** List Scheduling **********\n";
93   
94   // Build scheduling units.
95   BuildSchedUnits();
96
97   AvailableQueue->initNodes(SUnits);
98   
99   ListScheduleTopDown();
100   
101   AvailableQueue->releaseState();
102 }
103
104 //===----------------------------------------------------------------------===//
105 //  Top-Down Scheduling
106 //===----------------------------------------------------------------------===//
107
108 /// ReleaseSucc - Decrement the NumPredsLeft count of a successor. Add it to
109 /// the PendingQueue if the count reaches zero. Also update its cycle bound.
110 void ScheduleDAGList::ReleaseSucc(SUnit *SU, SUnit *SuccSU, bool isChain) {
111   --SuccSU->NumPredsLeft;
112   
113 #ifndef NDEBUG
114   if (SuccSU->NumPredsLeft < 0) {
115     cerr << "*** Scheduling failed! ***\n";
116     SuccSU->dump(this);
117     cerr << " has been released too many times!\n";
118     assert(0);
119   }
120 #endif
121   
122   // Compute the cycle when this SUnit actually becomes available.  This
123   // is the max of the start time of all predecessors plus their latencies.
124   // If this is a token edge, we don't need to wait for the latency of the
125   // preceeding instruction (e.g. a long-latency load) unless there is also
126   // some other data dependence.
127   unsigned PredDoneCycle = SU->Cycle;
128   if (!isChain)
129     PredDoneCycle += SU->Latency;
130   else if (SU->Latency)
131     PredDoneCycle += 1;
132   SuccSU->CycleBound = std::max(SuccSU->CycleBound, PredDoneCycle);
133   
134   if (SuccSU->NumPredsLeft == 0) {
135     PendingQueue.push_back(SuccSU);
136   }
137 }
138
139 /// ScheduleNodeTopDown - Add the node to the schedule. Decrement the pending
140 /// count of its successors. If a successor pending count is zero, add it to
141 /// the Available queue.
142 void ScheduleDAGList::ScheduleNodeTopDown(SUnit *SU, unsigned CurCycle) {
143   DOUT << "*** Scheduling [" << CurCycle << "]: ";
144   DEBUG(SU->dump(this));
145   
146   Sequence.push_back(SU);
147   SU->Cycle = CurCycle;
148
149   // Top down: release successors.
150   for (SUnit::succ_iterator I = SU->Succs.begin(), E = SU->Succs.end();
151        I != E; ++I)
152     ReleaseSucc(SU, I->Dep, I->isCtrl);
153
154   SU->isScheduled = true;
155   AvailableQueue->ScheduledNode(SU);
156 }
157
158 /// ListScheduleTopDown - The main loop of list scheduling for top-down
159 /// schedulers.
160 void ScheduleDAGList::ListScheduleTopDown() {
161   unsigned CurCycle = 0;
162
163   // All leaves to Available queue.
164   for (unsigned i = 0, e = SUnits.size(); i != e; ++i) {
165     // It is available if it has no predecessors.
166     if (SUnits[i].Preds.empty()) {
167       AvailableQueue->push(&SUnits[i]);
168       SUnits[i].isAvailable = true;
169     }
170   }
171   
172   // While Available queue is not empty, grab the node with the highest
173   // priority. If it is not ready put it back.  Schedule the node.
174   std::vector<SUnit*> NotReady;
175   Sequence.reserve(SUnits.size());
176   while (!AvailableQueue->empty() || !PendingQueue.empty()) {
177     // Check to see if any of the pending instructions are ready to issue.  If
178     // so, add them to the available queue.
179     for (unsigned i = 0, e = PendingQueue.size(); i != e; ++i) {
180       if (PendingQueue[i]->CycleBound == CurCycle) {
181         AvailableQueue->push(PendingQueue[i]);
182         PendingQueue[i]->isAvailable = true;
183         PendingQueue[i] = PendingQueue.back();
184         PendingQueue.pop_back();
185         --i; --e;
186       } else {
187         assert(PendingQueue[i]->CycleBound > CurCycle && "Negative latency?");
188       }
189     }
190     
191     // If there are no instructions available, don't try to issue anything, and
192     // don't advance the hazard recognizer.
193     if (AvailableQueue->empty()) {
194       ++CurCycle;
195       continue;
196     }
197
198     SUnit *FoundSUnit = 0;
199     SDNode *FoundNode = 0;
200     
201     bool HasNoopHazards = false;
202     while (!AvailableQueue->empty()) {
203       SUnit *CurSUnit = AvailableQueue->pop();
204       
205       // Get the node represented by this SUnit.
206       FoundNode = CurSUnit->getNode();
207       
208       // If this is a pseudo op, like copyfromreg, look to see if there is a
209       // real target node flagged to it.  If so, use the target node.
210       while (!FoundNode->isMachineOpcode()) {
211         SDNode *N = FoundNode->getFlaggedNode();
212         if (!N) break;
213         FoundNode = N;
214       }
215     
216       HazardRecognizer::HazardType HT = HazardRec->getHazardType(FoundNode);
217       if (HT == HazardRecognizer::NoHazard) {
218         FoundSUnit = CurSUnit;
219         break;
220       }
221     
222       // Remember if this is a noop hazard.
223       HasNoopHazards |= HT == HazardRecognizer::NoopHazard;
224       
225       NotReady.push_back(CurSUnit);
226     }
227     
228     // Add the nodes that aren't ready back onto the available list.
229     if (!NotReady.empty()) {
230       AvailableQueue->push_all(NotReady);
231       NotReady.clear();
232     }
233
234     // If we found a node to schedule, do it now.
235     if (FoundSUnit) {
236       ScheduleNodeTopDown(FoundSUnit, CurCycle);
237       HazardRec->EmitInstruction(FoundNode);
238
239       // If this is a pseudo-op node, we don't want to increment the current
240       // cycle.
241       if (FoundSUnit->Latency)  // Don't increment CurCycle for pseudo-ops!
242         ++CurCycle;        
243     } else if (!HasNoopHazards) {
244       // Otherwise, we have a pipeline stall, but no other problem, just advance
245       // the current cycle and try again.
246       DOUT << "*** Advancing cycle, no work to do\n";
247       HazardRec->AdvanceCycle();
248       ++NumStalls;
249       ++CurCycle;
250     } else {
251       // Otherwise, we have no instructions to issue and we have instructions
252       // that will fault if we don't do this right.  This is the case for
253       // processors without pipeline interlocks and other cases.
254       DOUT << "*** Emitting noop\n";
255       HazardRec->EmitNoop();
256       Sequence.push_back(0);   // NULL SUnit* -> noop
257       ++NumNoops;
258       ++CurCycle;
259     }
260   }
261
262 #ifndef NDEBUG
263   VerifySchedule(/*isBottomUp=*/false);
264 #endif
265 }
266
267 //===----------------------------------------------------------------------===//
268 //                         Public Constructor Functions
269 //===----------------------------------------------------------------------===//
270
271 /// createTDListDAGScheduler - This creates a top-down list scheduler with a
272 /// new hazard recognizer. This scheduler takes ownership of the hazard
273 /// recognizer and deletes it when done.
274 ScheduleDAG* llvm::createTDListDAGScheduler(SelectionDAGISel *IS,
275                                             SelectionDAG *DAG,
276                                             const TargetMachine *TM,
277                                             MachineBasicBlock *BB, bool Fast) {
278   return new ScheduleDAGList(DAG, BB, *TM,
279                              new LatencyPriorityQueue(),
280                              IS->CreateTargetHazardRecognizer());
281 }