* Apparently string::find doesn't work right on our sun boxes. Work around this.
[oota-llvm.git] / lib / Transforms / Utils / PromoteMemoryToRegister.cpp
1 //===- PromoteMemoryToRegister.cpp - Convert memory refs to regs ----------===//
2 //
3 // This pass is used to promote memory references to be register references.  A
4 // simple example of the transformation performed by this pass is:
5 //
6 //        FROM CODE                           TO CODE
7 //   %X = alloca int, uint 1                 ret int 42
8 //   store int 42, int *%X
9 //   %Y = load int* %X
10 //   ret int %Y
11 //
12 // To do this transformation, a simple analysis is done to ensure it is safe.
13 // Currently this just loops over all alloca instructions, looking for
14 // instructions that are only used in simple load and stores.
15 //
16 // After this, the code is transformed by...something magical :)
17 //
18 //===----------------------------------------------------------------------===//
19
20 #include "llvm/Transforms/Scalar.h"
21 #include "llvm/Analysis/Dominators.h"
22 #include "llvm/iMemory.h"
23 #include "llvm/iPHINode.h"
24 #include "llvm/iTerminators.h"
25 #include "llvm/Function.h"
26 #include "llvm/Constant.h"
27 #include "llvm/Type.h"
28 #include "Support/Statistic.h"
29
30 using std::vector;
31 using std::map;
32 using std::set;
33
34 namespace {
35   Statistic<> NumPromoted("mem2reg", "Number of alloca's promoted");
36
37   struct PromotePass : public FunctionPass {
38     vector<AllocaInst*>          Allocas;      // the alloca instruction..
39     map<Instruction*, unsigned>  AllocaLookup; // reverse mapping of above
40     
41     vector<vector<BasicBlock*> > PhiNodes;     // index corresponds to Allocas
42     
43     // List of instructions to remove at end of pass
44     vector<Instruction *>        KillList;
45     
46     map<BasicBlock*,vector<PHINode*> > NewPhiNodes; // the PhiNodes we're adding
47
48   public:
49     // runOnFunction - To run this pass, first we calculate the alloca
50     // instructions that are safe for promotion, then we promote each one.
51     //
52     virtual bool runOnFunction(Function &F);
53
54     // getAnalysisUsage - We need dominance frontiers
55     //
56     virtual void getAnalysisUsage(AnalysisUsage &AU) const {
57       AU.addRequired<DominanceFrontier>();
58       AU.preservesCFG();
59     }
60
61   private:
62     void Traverse(BasicBlock *BB, BasicBlock *Pred, vector<Value*> &IncVals,
63                   set<BasicBlock*> &Visited);
64     bool QueuePhiNode(BasicBlock *BB, unsigned AllocaIdx);
65     void FindSafeAllocas(Function &F);
66   };
67
68   RegisterOpt<PromotePass> X("mem2reg", "Promote Memory to Register");
69 }  // end of anonymous namespace
70
71
72 // isSafeAlloca - This predicate controls what types of alloca instructions are
73 // allowed to be promoted...
74 //
75 static inline bool isSafeAlloca(const AllocaInst *AI) {
76   if (AI->isArrayAllocation()) return false;
77
78   // Only allow direct loads and stores...
79   for (Value::use_const_iterator UI = AI->use_begin(), UE = AI->use_end();
80        UI != UE; ++UI)     // Loop over all of the uses of the alloca
81     if (!isa<LoadInst>(*UI))
82       if (const StoreInst *SI = dyn_cast<StoreInst>(*UI)) {
83         if (SI->getOperand(0) == AI)
84           return false;   // Don't allow a store of the AI, only INTO the AI.
85       } else {
86         return false;   // Not a load or store?
87       }
88   
89   return true;
90 }
91
92 // FindSafeAllocas - Find allocas that are safe to promote
93 //
94 void PromotePass::FindSafeAllocas(Function &F) {
95   BasicBlock &BB = F.getEntryNode();  // Get the entry node for the function
96
97   // Look at all instructions in the entry node
98   for (BasicBlock::iterator I = BB.begin(), E = BB.end(); I != E; ++I)
99     if (AllocaInst *AI = dyn_cast<AllocaInst>(&*I))       // Is it an alloca?
100       if (isSafeAlloca(AI)) {   // If safe alloca, add alloca to safe list
101         AllocaLookup[AI] = Allocas.size();  // Keep reverse mapping
102         Allocas.push_back(AI);
103       }
104 }
105
106
107
108 bool PromotePass::runOnFunction(Function &F) {
109   // Calculate the set of safe allocas
110   FindSafeAllocas(F);
111
112   // If there is nothing to do, bail out...
113   if (Allocas.empty()) return false;
114
115   // Add each alloca to the KillList.  Note: KillList is destroyed MOST recently
116   // added to least recently.
117   KillList.assign(Allocas.begin(), Allocas.end());
118
119   // Calculate the set of write-locations for each alloca.  This is analogous to
120   // counting the number of 'redefinitions' of each variable.
121   vector<vector<BasicBlock*> > WriteSets;    // index corresponds to Allocas
122   WriteSets.resize(Allocas.size());
123   for (unsigned i = 0; i != Allocas.size(); ++i) {
124     AllocaInst *AI = Allocas[i];
125     for (Value::use_iterator U =AI->use_begin(), E = AI->use_end(); U != E; ++U)
126       if (StoreInst *SI = dyn_cast<StoreInst>(*U))
127         // jot down the basic-block it came from
128         WriteSets[i].push_back(SI->getParent());
129   }
130
131   // Get dominance frontier information...
132   DominanceFrontier &DF = getAnalysis<DominanceFrontier>();
133
134   // Compute the locations where PhiNodes need to be inserted.  Look at the
135   // dominance frontier of EACH basic-block we have a write in
136   //
137   PhiNodes.resize(Allocas.size());
138   for (unsigned i = 0; i != Allocas.size(); ++i) {
139     for (unsigned j = 0; j != WriteSets[i].size(); j++) {
140       // Look up the DF for this write, add it to PhiNodes
141       DominanceFrontier::const_iterator it = DF.find(WriteSets[i][j]);
142       DominanceFrontier::DomSetType     S = it->second;
143       for (DominanceFrontier::DomSetType::iterator P = S.begin(), PE = S.end();
144            P != PE; ++P)
145         QueuePhiNode(*P, i);
146     }
147     
148     // Perform iterative step
149     for (unsigned k = 0; k != PhiNodes[i].size(); k++) {
150       DominanceFrontier::const_iterator it = DF.find(PhiNodes[i][k]);
151       DominanceFrontier::DomSetType     S = it->second;
152       for (DominanceFrontier::DomSetType::iterator P = S.begin(), PE = S.end();
153            P != PE; ++P)
154         QueuePhiNode(*P, i);
155     }
156   }
157
158   // Set the incoming values for the basic block to be null values for all of
159   // the alloca's.  We do this in case there is a load of a value that has not
160   // been stored yet.  In this case, it will get this null value.
161   //
162   vector<Value *> Values(Allocas.size());
163   for (unsigned i = 0, e = Allocas.size(); i != e; ++i)
164     Values[i] = Constant::getNullValue(Allocas[i]->getAllocatedType());
165
166   // Walks all basic blocks in the function performing the SSA rename algorithm
167   // and inserting the phi nodes we marked as necessary
168   //
169   set<BasicBlock*> Visited;         // The basic blocks we've already visited
170   Traverse(F.begin(), 0, Values, Visited);
171
172   // Remove all instructions marked by being placed in the KillList...
173   //
174   while (!KillList.empty()) {
175     Instruction *I = KillList.back();
176     KillList.pop_back();
177
178     I->getParent()->getInstList().erase(I);
179   }
180
181   NumPromoted += Allocas.size();
182
183   // Purge data structurse so they are available the next iteration...
184   Allocas.clear();
185   AllocaLookup.clear();
186   PhiNodes.clear();
187   NewPhiNodes.clear();
188   return true;
189 }
190
191
192 // QueuePhiNode - queues a phi-node to be added to a basic-block for a specific
193 // Alloca returns true if there wasn't already a phi-node for that variable
194 //
195 bool PromotePass::QueuePhiNode(BasicBlock *BB, unsigned AllocaNo) {
196   // Look up the basic-block in question
197   vector<PHINode*> &BBPNs = NewPhiNodes[BB];
198   if (BBPNs.empty()) BBPNs.resize(Allocas.size());
199
200   // If the BB already has a phi node added for the i'th alloca then we're done!
201   if (BBPNs[AllocaNo]) return false;
202
203   // Create a PhiNode using the dereferenced type... and add the phi-node to the
204   // BasicBlock
205   PHINode *PN = new PHINode(Allocas[AllocaNo]->getAllocatedType(),
206                             Allocas[AllocaNo]->getName()+".mem2reg",
207                             BB->begin());
208   BBPNs[AllocaNo] = PN;
209   PhiNodes[AllocaNo].push_back(BB);
210   return true;
211 }
212
213 void PromotePass::Traverse(BasicBlock *BB, BasicBlock *Pred,
214                            vector<Value*> &IncomingVals,
215                            set<BasicBlock*> &Visited) {
216   // If this is a BB needing a phi node, lookup/create the phinode for each
217   // variable we need phinodes for.
218   vector<PHINode *> &BBPNs = NewPhiNodes[BB];
219   for (unsigned k = 0; k != BBPNs.size(); ++k)
220     if (PHINode *PN = BBPNs[k]) {
221       // at this point we can assume that the array has phi nodes.. let's add
222       // the incoming data
223       PN->addIncoming(IncomingVals[k], Pred);
224
225       // also note that the active variable IS designated by the phi node
226       IncomingVals[k] = PN;
227     }
228
229   // don't revisit nodes
230   if (Visited.count(BB)) return;
231   
232   // mark as visited
233   Visited.insert(BB);
234
235   // keep track of the value of each variable we're watching.. how?
236   for (BasicBlock::iterator II = BB->begin(); II != BB->end(); ++II) {
237     Instruction *I = II; // get the instruction
238
239     if (LoadInst *LI = dyn_cast<LoadInst>(I)) {
240       Value *Ptr = LI->getPointerOperand();
241
242       if (AllocaInst *Src = dyn_cast<AllocaInst>(Ptr)) {
243         map<Instruction*, unsigned>::iterator AI = AllocaLookup.find(Src);
244         if (AI != AllocaLookup.end()) {
245           Value *V = IncomingVals[AI->second];
246
247           // walk the use list of this load and replace all uses with r
248           LI->replaceAllUsesWith(V);
249           KillList.push_back(LI); // Mark the load to be deleted
250         }
251       }
252     } else if (StoreInst *SI = dyn_cast<StoreInst>(I)) {
253       // delete this instruction and mark the name as the current holder of the
254       // value
255       Value *Ptr = SI->getPointerOperand();
256       if (AllocaInst *Dest = dyn_cast<AllocaInst>(Ptr)) {
257         map<Instruction *, unsigned>::iterator ai = AllocaLookup.find(Dest);
258         if (ai != AllocaLookup.end()) {
259           // what value were we writing?
260           IncomingVals[ai->second] = SI->getOperand(0);
261           KillList.push_back(SI);  // Mark the store to be deleted
262         }
263       }
264       
265     } else if (TerminatorInst *TI = dyn_cast<TerminatorInst>(I)) {
266       // Recurse across our successors
267       for (unsigned i = 0; i != TI->getNumSuccessors(); i++) {
268         vector<Value*> OutgoingVals(IncomingVals);
269         Traverse(TI->getSuccessor(i), BB, OutgoingVals, Visited);
270       }
271     }
272   }
273 }
274
275
276 // createPromoteMemoryToRegister - Provide an entry point to create this pass.
277 //
278 Pass *createPromoteMemoryToRegister() {
279   return new PromotePass();
280 }