* Add assertion to ExprTypeConvert to detect error earlier than without it
[oota-llvm.git] / lib / Transforms / LevelRaise.cpp
1 //===- LevelRaise.cpp - Code to change LLVM to higher level -----------------=//
2 //
3 // This file implements the 'raising' part of the LevelChange API.  This is
4 // useful because, in general, it makes the LLVM code terser and easier to
5 // analyze.
6 //
7 //===----------------------------------------------------------------------===//
8
9 #include "llvm/Transforms/LevelChange.h"
10 #include "llvm/Transforms/Utils/Local.h"
11 #include "TransformInternals.h"
12 #include "llvm/iOther.h"
13 #include "llvm/iMemory.h"
14 #include "llvm/Pass.h"
15 #include "llvm/ConstantHandling.h"
16 #include "llvm/Analysis/Expressions.h"
17 #include "llvm/Transforms/Utils/BasicBlockUtils.h"
18 #include "Support/STLExtras.h"
19 #include "Support/StatisticReporter.h"
20 #include <algorithm>
21 using std::cerr;
22
23 static Statistic<> NumLoadStorePeepholes("raise\t\t- Number of load/store peepholes");
24 static Statistic<> NumGEPInstFormed("raise\t\t- Number of other getelementptr's formed");
25 static Statistic<> NumExprTreesConv("raise\t\t- Number of expression trees converted");
26 static Statistic<> NumCastOfCast("raise\t\t- Number of cast-of-self removed");
27 static Statistic<> NumDCEorCP("raise\t\t- Number of insts DCE'd or constprop'd");
28
29
30 #define PRINT_PEEPHOLE(ID, NUM, I)            \
31   DEBUG(std::cerr << "Inst P/H " << ID << "[" << NUM << "] " << I)
32
33 #define PRINT_PEEPHOLE1(ID, I1) do { PRINT_PEEPHOLE(ID, 0, I1); } while (0)
34 #define PRINT_PEEPHOLE2(ID, I1, I2) \
35   do { PRINT_PEEPHOLE(ID, 0, I1); PRINT_PEEPHOLE(ID, 1, I2); } while (0)
36 #define PRINT_PEEPHOLE3(ID, I1, I2, I3) \
37   do { PRINT_PEEPHOLE(ID, 0, I1); PRINT_PEEPHOLE(ID, 1, I2); \
38        PRINT_PEEPHOLE(ID, 2, I3); } while (0)
39 #define PRINT_PEEPHOLE4(ID, I1, I2, I3, I4) \
40   do { PRINT_PEEPHOLE(ID, 0, I1); PRINT_PEEPHOLE(ID, 1, I2); \
41        PRINT_PEEPHOLE(ID, 2, I3); PRINT_PEEPHOLE(ID, 3, I4); } while (0)
42
43
44 // isReinterpretingCast - Return true if the cast instruction specified will
45 // cause the operand to be "reinterpreted".  A value is reinterpreted if the
46 // cast instruction would cause the underlying bits to change.
47 //
48 static inline bool isReinterpretingCast(const CastInst *CI) {
49   return!CI->getOperand(0)->getType()->isLosslesslyConvertableTo(CI->getType());
50 }
51
52
53 // Peephole optimize the following instructions:
54 // %t1 = cast ? to x *
55 // %t2 = add x * %SP, %t1              ;; Constant must be 2nd operand
56 //
57 // Into: %t3 = getelementptr {<...>} * %SP, <element indices>
58 //       %t2 = cast <eltype> * %t3 to {<...>}*
59 //
60 static bool HandleCastToPointer(BasicBlock::iterator BI,
61                                 const PointerType *DestPTy) {
62   CastInst &CI = cast<CastInst>(*BI);
63   if (CI.use_empty()) return false;
64
65   // Scan all of the uses, looking for any uses that are not add
66   // instructions.  If we have non-adds, do not make this transformation.
67   //
68   for (Value::use_iterator I = CI.use_begin(), E = CI.use_end();
69        I != E; ++I) {
70     if (BinaryOperator *BO = dyn_cast<BinaryOperator>(*I)) {
71       if (BO->getOpcode() != Instruction::Add)
72         return false;
73     } else {
74       return false;
75     }
76   }
77
78   std::vector<Value*> Indices;
79   Value *Src = CI.getOperand(0);
80   const Type *Result = ConvertableToGEP(DestPTy, Src, Indices, &BI);
81   if (Result == 0) return false;  // Not convertable...
82
83   PRINT_PEEPHOLE2("cast-add-to-gep:in", Src, CI);
84
85   // If we have a getelementptr capability... transform all of the 
86   // add instruction uses into getelementptr's.
87   while (!CI.use_empty()) {
88     BinaryOperator *I = cast<BinaryOperator>(*CI.use_begin());
89     assert(I->getOpcode() == Instruction::Add && I->getNumOperands() == 2 &&
90            "Use is not a valid add instruction!");
91     
92     // Get the value added to the cast result pointer...
93     Value *OtherPtr = I->getOperand((I->getOperand(0) == &CI) ? 1 : 0);
94
95     Instruction *GEP = new GetElementPtrInst(OtherPtr, Indices, I->getName());
96     PRINT_PEEPHOLE1("cast-add-to-gep:i", I);
97
98     if (GEP->getType() == I->getType()) {
99       // Replace the old add instruction with the shiny new GEP inst
100       ReplaceInstWithInst(I, GEP);
101     } else {
102       // If the type produced by the gep instruction differs from the original
103       // add instruction type, insert a cast now.
104       //
105
106       // Insert the GEP instruction before the old add instruction...
107       I->getParent()->getInstList().insert(I, GEP);
108
109       PRINT_PEEPHOLE1("cast-add-to-gep:o", GEP);
110       GEP = new CastInst(GEP, I->getType());
111
112       // Replace the old add instruction with the shiny new GEP inst
113       ReplaceInstWithInst(I, GEP);
114     }
115
116     PRINT_PEEPHOLE1("cast-add-to-gep:o", GEP);
117   }
118   return true;
119 }
120
121 // Peephole optimize the following instructions:
122 // %t1 = cast ulong <const int> to {<...>} *
123 // %t2 = add {<...>} * %SP, %t1              ;; Constant must be 2nd operand
124 //
125 //    or
126 // %t1 = cast {<...>}* %SP to int*
127 // %t5 = cast ulong <const int> to int*
128 // %t2 = add int* %t1, %t5                   ;; int is same size as field
129 //
130 // Into: %t3 = getelementptr {<...>} * %SP, <element indices>
131 //       %t2 = cast <eltype> * %t3 to {<...>}*
132 //
133 static bool PeepholeOptimizeAddCast(BasicBlock *BB, BasicBlock::iterator &BI,
134                                     Value *AddOp1, CastInst *AddOp2) {
135   const CompositeType *CompTy;
136   Value *OffsetVal = AddOp2->getOperand(0);
137   Value *SrcPtr;  // Of type pointer to struct...
138
139   if ((CompTy = getPointedToComposite(AddOp1->getType()))) {
140     SrcPtr = AddOp1;                      // Handle the first case...
141   } else if (CastInst *AddOp1c = dyn_cast<CastInst>(AddOp1)) {
142     SrcPtr = AddOp1c->getOperand(0);      // Handle the second case...
143     CompTy = getPointedToComposite(SrcPtr->getType());
144   }
145
146   // Only proceed if we have detected all of our conditions successfully...
147   if (!CompTy || !SrcPtr || !OffsetVal->getType()->isIntegral())
148     return false;
149
150   std::vector<Value*> Indices;
151   if (!ConvertableToGEP(SrcPtr->getType(), OffsetVal, Indices, &BI))
152     return false;  // Not convertable... perhaps next time
153
154   if (getPointedToComposite(AddOp1->getType())) {  // case 1
155     PRINT_PEEPHOLE2("add-to-gep1:in", AddOp2, *BI);
156   } else {
157     PRINT_PEEPHOLE3("add-to-gep2:in", AddOp1, AddOp2, *BI);
158   }
159
160   GetElementPtrInst *GEP = new GetElementPtrInst(SrcPtr, Indices,
161                                                  AddOp2->getName());
162   BI = ++BB->getInstList().insert(BI, GEP);
163
164   Instruction *NCI = new CastInst(GEP, AddOp1->getType());
165   ReplaceInstWithInst(BB->getInstList(), BI, NCI);
166   PRINT_PEEPHOLE2("add-to-gep:out", GEP, NCI);
167   return true;
168 }
169
170 static bool PeepholeOptimize(BasicBlock *BB, BasicBlock::iterator &BI) {
171   Instruction *I = BI;
172
173   if (CastInst *CI = dyn_cast<CastInst>(I)) {
174     Value       *Src    = CI->getOperand(0);
175     Instruction *SrcI   = dyn_cast<Instruction>(Src); // Nonnull if instr source
176     const Type  *DestTy = CI->getType();
177
178     // Peephole optimize the following instruction:
179     // %V2 = cast <ty> %V to <ty>
180     //
181     // Into: <nothing>
182     //
183     if (DestTy == Src->getType()) {   // Check for a cast to same type as src!!
184       PRINT_PEEPHOLE1("cast-of-self-ty", CI);
185       CI->replaceAllUsesWith(Src);
186       if (!Src->hasName() && CI->hasName()) {
187         std::string Name = CI->getName();
188         CI->setName("");
189         Src->setName(Name, BB->getParent()->getSymbolTable());
190       }
191
192       // DCE the instruction now, to avoid having the iterative version of DCE
193       // have to worry about it.
194       //
195       BI = BB->getInstList().erase(BI);
196
197       ++NumCastOfCast;
198       return true;
199     }
200
201     // Check to see if it's a cast of an instruction that does not depend on the
202     // specific type of the operands to do it's job.
203     if (!isReinterpretingCast(CI)) {
204       ValueTypeCache ConvertedTypes;
205
206       // Check to see if we can convert the source of the cast to match the
207       // destination type of the cast...
208       //
209       ConvertedTypes[CI] = CI->getType();  // Make sure the cast doesn't change
210       if (ExpressionConvertableToType(Src, DestTy, ConvertedTypes)) {
211         PRINT_PEEPHOLE3("CAST-SRC-EXPR-CONV:in ", Src, CI, BB->getParent());
212           
213         DEBUG(cerr << "\nCONVERTING SRC EXPR TYPE:\n");
214         ValueMapCache ValueMap;
215         Value *E = ConvertExpressionToType(Src, DestTy, ValueMap);
216         if (Constant *CPV = dyn_cast<Constant>(E))
217           CI->replaceAllUsesWith(CPV);
218
219         BI = BB->begin();  // Rescan basic block.  BI might be invalidated.
220         PRINT_PEEPHOLE1("CAST-SRC-EXPR-CONV:out", E);
221         DEBUG(cerr << "DONE CONVERTING SRC EXPR TYPE: \n" << BB->getParent());
222         ++NumExprTreesConv;
223         return true;
224       }
225
226       // Check to see if we can convert the users of the cast value to match the
227       // source type of the cast...
228       //
229       ConvertedTypes.clear();
230       ConvertedTypes[CI] = Src->getType();  // Make sure the cast _does_ change
231       if (ValueConvertableToType(CI, Src->getType(), ConvertedTypes)) {
232         PRINT_PEEPHOLE3("CAST-DEST-EXPR-CONV:in ", Src, CI, BB->getParent());
233
234         DEBUG(cerr << "\nCONVERTING EXPR TYPE:\n");
235         ValueMapCache ValueMap;
236         ConvertValueToNewType(CI, Src, ValueMap);  // This will delete CI!
237
238         BI = BB->begin();  // Rescan basic block.  BI might be invalidated.
239         PRINT_PEEPHOLE1("CAST-DEST-EXPR-CONV:out", Src);
240         DEBUG(cerr << "DONE CONVERTING EXPR TYPE: \n\n" << BB->getParent());
241         ++NumExprTreesConv;
242         return true;
243       }
244     }
245
246     // Otherwise find out it this cast is a cast to a pointer type, which is
247     // then added to some other pointer, then loaded or stored through.  If
248     // so, convert the add into a getelementptr instruction...
249     //
250     if (const PointerType *DestPTy = dyn_cast<PointerType>(DestTy)) {
251       if (HandleCastToPointer(BI, DestPTy)) {
252         BI = BB->begin();  // Rescan basic block.  BI might be invalidated.
253         ++NumGEPInstFormed;
254         return true;
255       }
256     }
257
258     // Check to see if we are casting from a structure pointer to a pointer to
259     // the first element of the structure... to avoid munching other peepholes,
260     // we only let this happen if there are no add uses of the cast.
261     //
262     // Peephole optimize the following instructions:
263     // %t1 = cast {<...>} * %StructPtr to <ty> *
264     //
265     // Into: %t2 = getelementptr {<...>} * %StructPtr, <0, 0, 0, ...>
266     //       %t1 = cast <eltype> * %t1 to <ty> *
267     //
268     if (const CompositeType *CTy = getPointedToComposite(Src->getType()))
269       if (const PointerType *DestPTy = dyn_cast<PointerType>(DestTy)) {
270
271         // Loop over uses of the cast, checking for add instructions.  If an add
272         // exists, this is probably a part of a more complex GEP, so we don't
273         // want to mess around with the cast.
274         //
275         bool HasAddUse = false;
276         for (Value::use_iterator I = CI->use_begin(), E = CI->use_end();
277              I != E; ++I)
278           if (isa<Instruction>(*I) &&
279               cast<Instruction>(*I)->getOpcode() == Instruction::Add) {
280             HasAddUse = true; break;
281           }
282
283         // If it doesn't have an add use, check to see if the dest type is
284         // losslessly convertable to one of the types in the start of the struct
285         // type.
286         //
287         if (!HasAddUse) {
288           const Type *DestPointedTy = DestPTy->getElementType();
289           unsigned Depth = 1;
290           const CompositeType *CurCTy = CTy;
291           const Type *ElTy = 0;
292
293           // Build the index vector, full of all zeros
294           std::vector<Value*> Indices;
295           Indices.push_back(ConstantUInt::get(Type::UIntTy, 0));
296           while (CurCTy && !isa<PointerType>(CurCTy)) {
297             if (const StructType *CurSTy = dyn_cast<StructType>(CurCTy)) {
298               // Check for a zero element struct type... if we have one, bail.
299               if (CurSTy->getElementTypes().size() == 0) break;
300             
301               // Grab the first element of the struct type, which must lie at
302               // offset zero in the struct.
303               //
304               ElTy = CurSTy->getElementTypes()[0];
305             } else {
306               ElTy = cast<ArrayType>(CurCTy)->getElementType();
307             }
308
309             // Insert a zero to index through this type...
310             Indices.push_back(ConstantUInt::get(CurCTy->getIndexType(), 0));
311
312             // Did we find what we're looking for?
313             if (ElTy->isLosslesslyConvertableTo(DestPointedTy)) break;
314             
315             // Nope, go a level deeper.
316             ++Depth;
317             CurCTy = dyn_cast<CompositeType>(ElTy);
318             ElTy = 0;
319           }
320           
321           // Did we find what we were looking for? If so, do the transformation
322           if (ElTy) {
323             PRINT_PEEPHOLE1("cast-for-first:in", CI);
324
325             // Insert the new T cast instruction... stealing old T's name
326             GetElementPtrInst *GEP = new GetElementPtrInst(Src, Indices,
327                                                            CI->getName());
328             CI->setName("");
329             BI = ++BB->getInstList().insert(BI, GEP);
330
331             // Make the old cast instruction reference the new GEP instead of
332             // the old src value.
333             //
334             CI->setOperand(0, GEP);
335             
336             PRINT_PEEPHOLE2("cast-for-first:out", GEP, CI);
337             ++NumGEPInstFormed;
338             return true;
339           }
340         }
341       }
342
343   } else if (StoreInst *SI = dyn_cast<StoreInst>(I)) {
344     Value *Val     = SI->getOperand(0);
345     Value *Pointer = SI->getPointerOperand();
346     
347     // Peephole optimize the following instructions:
348     // %t = cast <T1>* %P to <T2> * ;; If T1 is losslessly convertable to T2
349     // store <T2> %V, <T2>* %t
350     //
351     // Into: 
352     // %t = cast <T2> %V to <T1>
353     // store <T1> %t2, <T1>* %P
354     //
355     // Note: This is not taken care of by expr conversion because there might
356     // not be a cast available for the store to convert the incoming value of.
357     // This code is basically here to make sure that pointers don't have casts
358     // if possible.
359     //
360     if (CastInst *CI = dyn_cast<CastInst>(Pointer))
361       if (Value *CastSrc = CI->getOperand(0)) // CSPT = CastSrcPointerType
362         if (const PointerType *CSPT = dyn_cast<PointerType>(CastSrc->getType()))
363           // convertable types?
364           if (Val->getType()->isLosslesslyConvertableTo(CSPT->getElementType()) &&
365               !SI->hasIndices()) {      // No subscripts yet!
366             PRINT_PEEPHOLE3("st-src-cast:in ", Pointer, Val, SI);
367
368             // Insert the new T cast instruction... stealing old T's name
369             CastInst *NCI = new CastInst(Val, CSPT->getElementType(),
370                                          CI->getName());
371             CI->setName("");
372             BI = ++BB->getInstList().insert(BI, NCI);
373
374             // Replace the old store with a new one!
375             ReplaceInstWithInst(BB->getInstList(), BI,
376                                 SI = new StoreInst(NCI, CastSrc));
377             PRINT_PEEPHOLE3("st-src-cast:out", NCI, CastSrc, SI);
378             ++NumLoadStorePeepholes;
379             return true;
380           }
381
382   } else if (LoadInst *LI = dyn_cast<LoadInst>(I)) {
383     Value *Pointer = LI->getOperand(0);
384     const Type *PtrElType =
385       cast<PointerType>(Pointer->getType())->getElementType();
386     
387     // Peephole optimize the following instructions:
388     // %Val = cast <T1>* to <T2>*    ;; If T1 is losslessly convertable to T2
389     // %t = load <T2>* %P
390     //
391     // Into: 
392     // %t = load <T1>* %P
393     // %Val = cast <T1> to <T2>
394     //
395     // Note: This is not taken care of by expr conversion because there might
396     // not be a cast available for the store to convert the incoming value of.
397     // This code is basically here to make sure that pointers don't have casts
398     // if possible.
399     //
400     if (CastInst *CI = dyn_cast<CastInst>(Pointer))
401       if (Value *CastSrc = CI->getOperand(0)) // CSPT = CastSrcPointerType
402         if (const PointerType *CSPT = dyn_cast<PointerType>(CastSrc->getType()))
403           // convertable types?
404           if (PtrElType->isLosslesslyConvertableTo(CSPT->getElementType()) &&
405               !LI->hasIndices()) {      // No subscripts yet!
406             PRINT_PEEPHOLE2("load-src-cast:in ", Pointer, LI);
407
408             // Create the new load instruction... loading the pre-casted value
409             LoadInst *NewLI = new LoadInst(CastSrc, LI->getName());
410             
411             // Insert the new T cast instruction... stealing old T's name
412             CastInst *NCI = new CastInst(NewLI, LI->getType(), CI->getName());
413             BI = ++BB->getInstList().insert(BI, NewLI);
414
415             // Replace the old store with a new one!
416             ReplaceInstWithInst(BB->getInstList(), BI, NCI);
417             PRINT_PEEPHOLE3("load-src-cast:out", NCI, CastSrc, NewLI);
418             ++NumLoadStorePeepholes;
419             return true;
420           }
421
422   } else if (I->getOpcode() == Instruction::Add &&
423              isa<CastInst>(I->getOperand(1))) {
424
425     if (PeepholeOptimizeAddCast(BB, BI, I->getOperand(0),
426                                 cast<CastInst>(I->getOperand(1)))) {
427       ++NumGEPInstFormed;
428       return true;
429     }
430   }
431
432   return false;
433 }
434
435
436
437
438 static bool DoRaisePass(Function &F) {
439   bool Changed = false;
440   for (Function::iterator BB = F.begin(), BBE = F.end(); BB != BBE; ++BB)
441     for (BasicBlock::iterator BI = BB->begin(); BI != BB->end();) {
442       DEBUG(cerr << "Processing: " << *BI);
443       if (dceInstruction(BI) || doConstantPropogation(BI)) {
444         Changed = true; 
445         ++NumDCEorCP;
446         DEBUG(cerr << "***\t\t^^-- DeadCode Elinated!\n");
447       } else if (PeepholeOptimize(BB, BI)) {
448         Changed = true;
449       } else {
450         ++BI;
451       }
452     }
453
454   return Changed;
455 }
456
457
458 // RaisePointerReferences::doit - Raise a function representation to a higher
459 // level.
460 //
461 static bool doRPR(Function &F) {
462   DEBUG(cerr << "\n\n\nStarting to work on Function '" << F.getName() << "'\n");
463
464   // Insert casts for all incoming pointer pointer values that are treated as
465   // arrays...
466   //
467   bool Changed = false, LocalChange;
468   
469   do {
470     DEBUG(cerr << "Looping: \n" << F);
471
472     // Iterate over the function, refining it, until it converges on a stable
473     // state
474     LocalChange = false;
475     while (DoRaisePass(F)) LocalChange = true;
476     Changed |= LocalChange;
477
478   } while (LocalChange);
479
480   return Changed;
481 }
482
483 namespace {
484   struct RaisePointerReferences : public FunctionPass {
485     const char *getPassName() const { return "Raise Pointer References"; }
486
487     virtual bool runOnFunction(Function &F) { return doRPR(F); }
488
489     virtual void getAnalysisUsage(AnalysisUsage &AU) const {
490       AU.preservesCFG();
491     }
492   };
493 }
494
495 Pass *createRaisePointerReferencesPass() {
496   return new RaisePointerReferences();
497 }
498
499