Fix a problem where lib/Target/TargetInstrInfo.h would include and use
[oota-llvm.git] / lib / Target / CellSPU / SPURegisterInfo.cpp
1 //===- SPURegisterInfo.cpp - Cell SPU Register Information ----------------===//
2 //
3 //                     The LLVM Compiler Infrastructure
4 //
5 // This file is distributed under the University of Illinois Open Source
6 // License. See LICENSE.TXT for details.
7 //
8 //===----------------------------------------------------------------------===//
9 //
10 // This file contains the Cell implementation of the MRegisterInfo class.
11 //
12 //===----------------------------------------------------------------------===//
13
14 #define DEBUG_TYPE "reginfo"
15 #include "SPU.h"
16 #include "SPURegisterInfo.h"
17 #include "SPURegisterNames.h"
18 #include "SPUInstrBuilder.h"
19 #include "SPUSubtarget.h"
20 #include "SPUMachineFunction.h"
21 #include "SPUFrameInfo.h"
22 #include "llvm/Constants.h"
23 #include "llvm/Type.h"
24 #include "llvm/CodeGen/ValueTypes.h"
25 #include "llvm/CodeGen/MachineInstrBuilder.h"
26 #include "llvm/CodeGen/MachineModuleInfo.h"
27 #include "llvm/CodeGen/MachineFunction.h"
28 #include "llvm/CodeGen/MachineFrameInfo.h"
29 #include "llvm/CodeGen/MachineLocation.h"
30 #include "llvm/CodeGen/MachineRegisterInfo.h"
31 #include "llvm/CodeGen/SelectionDAGNodes.h"
32 #include "llvm/CodeGen/ValueTypes.h"
33 #include "llvm/Target/TargetFrameInfo.h"
34 #include "llvm/Target/TargetInstrInfo.h"
35 #include "llvm/Target/TargetMachine.h"
36 #include "llvm/Target/TargetOptions.h"
37 #include "llvm/Support/CommandLine.h"
38 #include "llvm/Support/Debug.h"
39 #include "llvm/Support/MathExtras.h"
40 #include "llvm/ADT/BitVector.h"
41 #include "llvm/ADT/STLExtras.h"
42 #include <cstdlib>
43 #include <iostream>
44
45 using namespace llvm;
46
47 /// getRegisterNumbering - Given the enum value for some register, e.g.
48 /// PPC::F14, return the number that it corresponds to (e.g. 14).
49 unsigned SPURegisterInfo::getRegisterNumbering(unsigned RegEnum) {
50   using namespace SPU;
51   switch (RegEnum) {
52   case SPU::R0: return 0;
53   case SPU::R1: return 1;
54   case SPU::R2: return 2;
55   case SPU::R3: return 3;
56   case SPU::R4: return 4;
57   case SPU::R5: return 5;
58   case SPU::R6: return 6;
59   case SPU::R7: return 7;
60   case SPU::R8: return 8;
61   case SPU::R9: return 9;
62   case SPU::R10: return 10;
63   case SPU::R11: return 11;
64   case SPU::R12: return 12;
65   case SPU::R13: return 13;
66   case SPU::R14: return 14;
67   case SPU::R15: return 15;
68   case SPU::R16: return 16;
69   case SPU::R17: return 17;
70   case SPU::R18: return 18;
71   case SPU::R19: return 19;
72   case SPU::R20: return 20;
73   case SPU::R21: return 21;
74   case SPU::R22: return 22;
75   case SPU::R23: return 23;
76   case SPU::R24: return 24;
77   case SPU::R25: return 25;
78   case SPU::R26: return 26;
79   case SPU::R27: return 27;
80   case SPU::R28: return 28;
81   case SPU::R29: return 29;
82   case SPU::R30: return 30;
83   case SPU::R31: return 31;
84   case SPU::R32: return 32;
85   case SPU::R33: return 33;
86   case SPU::R34: return 34;
87   case SPU::R35: return 35;
88   case SPU::R36: return 36;
89   case SPU::R37: return 37;
90   case SPU::R38: return 38;
91   case SPU::R39: return 39;
92   case SPU::R40: return 40;
93   case SPU::R41: return 41;
94   case SPU::R42: return 42;
95   case SPU::R43: return 43;
96   case SPU::R44: return 44;
97   case SPU::R45: return 45;
98   case SPU::R46: return 46;
99   case SPU::R47: return 47;
100   case SPU::R48: return 48;
101   case SPU::R49: return 49;
102   case SPU::R50: return 50;
103   case SPU::R51: return 51;
104   case SPU::R52: return 52;
105   case SPU::R53: return 53;
106   case SPU::R54: return 54;
107   case SPU::R55: return 55;
108   case SPU::R56: return 56;
109   case SPU::R57: return 57;
110   case SPU::R58: return 58;
111   case SPU::R59: return 59;
112   case SPU::R60: return 60;
113   case SPU::R61: return 61;
114   case SPU::R62: return 62;
115   case SPU::R63: return 63;
116   case SPU::R64: return 64;
117   case SPU::R65: return 65;
118   case SPU::R66: return 66;
119   case SPU::R67: return 67;
120   case SPU::R68: return 68;
121   case SPU::R69: return 69;
122   case SPU::R70: return 70;
123   case SPU::R71: return 71;
124   case SPU::R72: return 72;
125   case SPU::R73: return 73;
126   case SPU::R74: return 74;
127   case SPU::R75: return 75;
128   case SPU::R76: return 76;
129   case SPU::R77: return 77;
130   case SPU::R78: return 78;
131   case SPU::R79: return 79;
132   case SPU::R80: return 80;
133   case SPU::R81: return 81;
134   case SPU::R82: return 82;
135   case SPU::R83: return 83;
136   case SPU::R84: return 84;
137   case SPU::R85: return 85;
138   case SPU::R86: return 86;
139   case SPU::R87: return 87;
140   case SPU::R88: return 88;
141   case SPU::R89: return 89;
142   case SPU::R90: return 90;
143   case SPU::R91: return 91;
144   case SPU::R92: return 92;
145   case SPU::R93: return 93;
146   case SPU::R94: return 94;
147   case SPU::R95: return 95;
148   case SPU::R96: return 96;
149   case SPU::R97: return 97;
150   case SPU::R98: return 98;
151   case SPU::R99: return 99;
152   case SPU::R100: return 100;
153   case SPU::R101: return 101;
154   case SPU::R102: return 102;
155   case SPU::R103: return 103;
156   case SPU::R104: return 104;
157   case SPU::R105: return 105;
158   case SPU::R106: return 106;
159   case SPU::R107: return 107;
160   case SPU::R108: return 108;
161   case SPU::R109: return 109;
162   case SPU::R110: return 110;
163   case SPU::R111: return 111;
164   case SPU::R112: return 112;
165   case SPU::R113: return 113;
166   case SPU::R114: return 114;
167   case SPU::R115: return 115;
168   case SPU::R116: return 116;
169   case SPU::R117: return 117;
170   case SPU::R118: return 118;
171   case SPU::R119: return 119;
172   case SPU::R120: return 120;
173   case SPU::R121: return 121;
174   case SPU::R122: return 122;
175   case SPU::R123: return 123;
176   case SPU::R124: return 124;
177   case SPU::R125: return 125;
178   case SPU::R126: return 126;
179   case SPU::R127: return 127;
180   default:
181     std::cerr << "Unhandled reg in SPURegisterInfo::getRegisterNumbering!\n";
182     abort();
183   }
184 }
185
186 SPURegisterInfo::SPURegisterInfo(const SPUSubtarget &subtarget,
187                                  const TargetInstrInfo &tii) :
188   SPUGenRegisterInfo(SPU::ADJCALLSTACKDOWN, SPU::ADJCALLSTACKUP),
189   Subtarget(subtarget),
190   TII(tii)
191 {
192 }
193
194 void
195 SPURegisterInfo::storeRegToStackSlot(MachineBasicBlock &MBB,
196                                      MachineBasicBlock::iterator MI,
197                                      unsigned SrcReg, bool isKill, int FrameIdx,
198                                      const TargetRegisterClass *RC) const
199 {
200   MachineOpCode opc;
201   if (RC == SPU::GPRCRegisterClass) {
202     opc = (FrameIdx < SPUFrameInfo::maxFrameOffset())
203       ? SPU::STQDr128
204       : SPU::STQXr128;
205   } else if (RC == SPU::R64CRegisterClass) {
206     opc = (FrameIdx < SPUFrameInfo::maxFrameOffset())
207       ? SPU::STQDr64
208       : SPU::STQXr64;
209   } else if (RC == SPU::R64FPRegisterClass) {
210     opc = (FrameIdx < SPUFrameInfo::maxFrameOffset())
211       ? SPU::STQDr64
212       : SPU::STQXr64;
213   } else if (RC == SPU::R32CRegisterClass) {
214     opc = (FrameIdx < SPUFrameInfo::maxFrameOffset())
215       ? SPU::STQDr32
216       : SPU::STQXr32;
217   } else if (RC == SPU::R32FPRegisterClass) {
218     opc = (FrameIdx < SPUFrameInfo::maxFrameOffset())
219       ? SPU::STQDr32
220       : SPU::STQXr32;
221   } else if (RC == SPU::R16CRegisterClass) {
222     opc = (FrameIdx < SPUFrameInfo::maxFrameOffset()) ?
223       SPU::STQDr16
224       : SPU::STQXr16;
225   } else {
226     assert(0 && "Unknown regclass!");
227     abort();
228   }
229
230   addFrameReference(BuildMI(MBB, MI, TII.get(opc))
231                     .addReg(SrcReg, false, false, isKill), FrameIdx);
232 }
233
234 void SPURegisterInfo::storeRegToAddr(MachineFunction &MF, unsigned SrcReg,
235                                      bool isKill,
236                                      SmallVectorImpl<MachineOperand> &Addr,
237                                      const TargetRegisterClass *RC,
238                                      SmallVectorImpl<MachineInstr*> &NewMIs) const {
239   cerr << "storeRegToAddr() invoked!\n";
240   abort();
241
242   if (Addr[0].isFrameIndex()) {
243     /* do what storeRegToStackSlot does here */
244   } else {
245     unsigned Opc = 0;
246     if (RC == SPU::GPRCRegisterClass) {
247       /* Opc = PPC::STW; */
248     } else if (RC == SPU::R16CRegisterClass) {
249       /* Opc = PPC::STD; */
250     } else if (RC == SPU::R32CRegisterClass) {
251       /* Opc = PPC::STFD; */
252     } else if (RC == SPU::R32FPRegisterClass) {
253       /* Opc = PPC::STFD; */
254     } else if (RC == SPU::R64FPRegisterClass) {
255       /* Opc = PPC::STFS; */
256     } else if (RC == SPU::VECREGRegisterClass) {
257       /* Opc = PPC::STVX; */
258     } else {
259       assert(0 && "Unknown regclass!");
260       abort();
261     }
262     MachineInstrBuilder MIB = BuildMI(TII.get(Opc))
263       .addReg(SrcReg, false, false, isKill);
264     for (unsigned i = 0, e = Addr.size(); i != e; ++i) {
265       MachineOperand &MO = Addr[i];
266       if (MO.isRegister())
267         MIB.addReg(MO.getReg());
268       else if (MO.isImmediate())
269         MIB.addImm(MO.getImm());
270       else
271         MIB.addFrameIndex(MO.getIndex());
272     }
273     NewMIs.push_back(MIB);
274   }
275 }
276
277 void
278 SPURegisterInfo::loadRegFromStackSlot(MachineBasicBlock &MBB,
279                                         MachineBasicBlock::iterator MI,
280                                         unsigned DestReg, int FrameIdx,
281                                         const TargetRegisterClass *RC) const
282 {
283   MachineOpCode opc;
284   if (RC == SPU::GPRCRegisterClass) {
285     opc = (FrameIdx < SPUFrameInfo::maxFrameOffset())
286       ? SPU::LQDr128
287       : SPU::LQXr128;
288   } else if (RC == SPU::R64CRegisterClass) {
289     opc = (FrameIdx < SPUFrameInfo::maxFrameOffset())
290       ? SPU::LQDr64
291       : SPU::LQXr64;
292   } else if (RC == SPU::R64FPRegisterClass) {
293     opc = (FrameIdx < SPUFrameInfo::maxFrameOffset())
294       ? SPU::LQDr64
295       : SPU::LQXr64;
296   } else if (RC == SPU::R32CRegisterClass) {
297     opc = (FrameIdx < SPUFrameInfo::maxFrameOffset())
298       ? SPU::LQDr32
299       : SPU::LQXr32;
300   } else if (RC == SPU::R32FPRegisterClass) {
301     opc = (FrameIdx < SPUFrameInfo::maxFrameOffset())
302       ? SPU::LQDr32
303       : SPU::LQXr32;
304   } else if (RC == SPU::R16CRegisterClass) {
305     opc = (FrameIdx < SPUFrameInfo::maxFrameOffset())
306       ? SPU::LQDr16
307       : SPU::LQXr16;
308   } else {
309     assert(0 && "Unknown regclass in loadRegFromStackSlot!");
310     abort();
311   }
312
313   addFrameReference(BuildMI(MBB, MI, TII.get(opc)).addReg(DestReg), FrameIdx);
314 }
315
316 /*!
317   \note We are really pessimistic here about what kind of a load we're doing.
318  */
319 void SPURegisterInfo::loadRegFromAddr(MachineFunction &MF, unsigned DestReg,
320                                       SmallVectorImpl<MachineOperand> &Addr,
321                                       const TargetRegisterClass *RC,
322                                       SmallVectorImpl<MachineInstr*> &NewMIs)
323     const {
324   cerr << "loadRegToAddr() invoked!\n";
325   abort();
326
327   if (Addr[0].isFrameIndex()) {
328     /* do what loadRegFromStackSlot does here... */
329   } else {
330     unsigned Opc = 0;
331     if (RC == SPU::R8CRegisterClass) {
332       /* do brilliance here */
333     } else if (RC == SPU::R16CRegisterClass) {
334       /* Opc = PPC::LWZ; */
335     } else if (RC == SPU::R32CRegisterClass) {
336       /* Opc = PPC::LD; */
337     } else if (RC == SPU::R32FPRegisterClass) {
338       /* Opc = PPC::LFD; */
339     } else if (RC == SPU::R64FPRegisterClass) {
340       /* Opc = PPC::LFS; */
341     } else if (RC == SPU::VECREGRegisterClass) {
342       /* Opc = PPC::LVX; */
343     } else if (RC == SPU::GPRCRegisterClass) {
344       /* Opc = something else! */
345     } else {
346       assert(0 && "Unknown regclass!");
347       abort();
348     }
349     MachineInstrBuilder MIB = BuildMI(TII.get(Opc), DestReg);
350     for (unsigned i = 0, e = Addr.size(); i != e; ++i) {
351       MachineOperand &MO = Addr[i];
352       if (MO.isRegister())
353         MIB.addReg(MO.getReg());
354       else if (MO.isImmediate())
355         MIB.addImm(MO.getImm());
356       else
357         MIB.addFrameIndex(MO.getIndex());
358     }
359     NewMIs.push_back(MIB);
360   }
361 }
362
363 void SPURegisterInfo::reMaterialize(MachineBasicBlock &MBB,
364                                     MachineBasicBlock::iterator I,
365                                     unsigned DestReg,
366                                     const MachineInstr *Orig) const {
367   MachineInstr *MI = Orig->clone();
368   MI->getOperand(0).setReg(DestReg);
369   MBB.insert(I, MI);
370 }
371
372 // SPU's 128-bit registers used for argument passing:
373 static const unsigned SPU_ArgRegs[] = {
374   SPU::R3,  SPU::R4,  SPU::R5,  SPU::R6,  SPU::R7,  SPU::R8,  SPU::R9,
375   SPU::R10, SPU::R11, SPU::R12, SPU::R13, SPU::R14, SPU::R15, SPU::R16,
376   SPU::R17, SPU::R18, SPU::R19, SPU::R20, SPU::R21, SPU::R22, SPU::R23,
377   SPU::R24, SPU::R25, SPU::R26, SPU::R27, SPU::R28, SPU::R29, SPU::R30,
378   SPU::R31, SPU::R32, SPU::R33, SPU::R34, SPU::R35, SPU::R36, SPU::R37,
379   SPU::R38, SPU::R39, SPU::R40, SPU::R41, SPU::R42, SPU::R43, SPU::R44,
380   SPU::R45, SPU::R46, SPU::R47, SPU::R48, SPU::R49, SPU::R50, SPU::R51,
381   SPU::R52, SPU::R53, SPU::R54, SPU::R55, SPU::R56, SPU::R57, SPU::R58,
382   SPU::R59, SPU::R60, SPU::R61, SPU::R62, SPU::R63, SPU::R64, SPU::R65,
383   SPU::R66, SPU::R67, SPU::R68, SPU::R69, SPU::R70, SPU::R71, SPU::R72,
384   SPU::R73, SPU::R74, SPU::R75, SPU::R76, SPU::R77, SPU::R78, SPU::R79
385 };
386
387 const unsigned *
388 SPURegisterInfo::getArgRegs()
389 {
390   return SPU_ArgRegs;
391 }
392
393 const unsigned
394 SPURegisterInfo::getNumArgRegs()
395 {
396   return sizeof(SPU_ArgRegs) / sizeof(SPU_ArgRegs[0]);
397 }
398
399 const unsigned *
400 SPURegisterInfo::getCalleeSavedRegs(const MachineFunction *MF) const
401 {
402   // Cell ABI calling convention
403   static const unsigned SPU_CalleeSaveRegs[] = {
404     SPU::R80, SPU::R81, SPU::R82, SPU::R83,
405     SPU::R84, SPU::R85, SPU::R86, SPU::R87,
406     SPU::R88, SPU::R89, SPU::R90, SPU::R91,
407     SPU::R92, SPU::R93, SPU::R94, SPU::R95,
408     SPU::R96, SPU::R97, SPU::R98, SPU::R99,
409     SPU::R100, SPU::R101, SPU::R102, SPU::R103,
410     SPU::R104, SPU::R105, SPU::R106, SPU::R107,
411     SPU::R108, SPU::R109, SPU::R110, SPU::R111,
412     SPU::R112, SPU::R113, SPU::R114, SPU::R115,
413     SPU::R116, SPU::R117, SPU::R118, SPU::R119,
414     SPU::R120, SPU::R121, SPU::R122, SPU::R123,
415     SPU::R124, SPU::R125, SPU::R126, SPU::R127,
416     SPU::R2,    /* environment pointer */
417     SPU::R1,    /* stack pointer */
418     SPU::R0,    /* link register */
419     0 /* end */
420   };
421   
422   return SPU_CalleeSaveRegs;
423 }
424
425 const TargetRegisterClass* const*
426 SPURegisterInfo::getCalleeSavedRegClasses(const MachineFunction *MF) const
427 {
428   // Cell ABI Calling Convention
429   static const TargetRegisterClass * const SPU_CalleeSaveRegClasses[] = {
430     &SPU::GPRCRegClass, &SPU::GPRCRegClass, &SPU::GPRCRegClass,
431     &SPU::GPRCRegClass, &SPU::GPRCRegClass, &SPU::GPRCRegClass,
432     &SPU::GPRCRegClass, &SPU::GPRCRegClass, &SPU::GPRCRegClass,
433     &SPU::GPRCRegClass, &SPU::GPRCRegClass, &SPU::GPRCRegClass,
434     &SPU::GPRCRegClass, &SPU::GPRCRegClass, &SPU::GPRCRegClass,
435     &SPU::GPRCRegClass, &SPU::GPRCRegClass, &SPU::GPRCRegClass,
436     &SPU::GPRCRegClass, &SPU::GPRCRegClass, &SPU::GPRCRegClass,
437     &SPU::GPRCRegClass, &SPU::GPRCRegClass, &SPU::GPRCRegClass,
438     &SPU::GPRCRegClass, &SPU::GPRCRegClass, &SPU::GPRCRegClass,
439     &SPU::GPRCRegClass, &SPU::GPRCRegClass, &SPU::GPRCRegClass,
440     &SPU::GPRCRegClass, &SPU::GPRCRegClass, &SPU::GPRCRegClass,
441     &SPU::GPRCRegClass, &SPU::GPRCRegClass, &SPU::GPRCRegClass,
442     &SPU::GPRCRegClass, &SPU::GPRCRegClass, &SPU::GPRCRegClass,
443     &SPU::GPRCRegClass, &SPU::GPRCRegClass, &SPU::GPRCRegClass,
444     &SPU::GPRCRegClass, &SPU::GPRCRegClass, &SPU::GPRCRegClass,
445     &SPU::GPRCRegClass, &SPU::GPRCRegClass, &SPU::GPRCRegClass,
446     &SPU::GPRCRegClass, /* environment pointer */
447     &SPU::GPRCRegClass, /* stack pointer */
448     &SPU::GPRCRegClass, /* link register */
449     0 /* end */
450   };
451  
452   return SPU_CalleeSaveRegClasses;
453 }
454
455 /*!
456  R0 (link register), R1 (stack pointer) and R2 (environment pointer -- this is
457  generally unused) are the Cell's reserved registers
458  */
459 BitVector SPURegisterInfo::getReservedRegs(const MachineFunction &MF) const {
460   BitVector Reserved(getNumRegs());
461   Reserved.set(SPU::R0);                // LR
462   Reserved.set(SPU::R1);                // SP
463   Reserved.set(SPU::R2);                // environment pointer
464   return Reserved;
465 }
466
467 /// foldMemoryOperand - SPU, like PPC, can only fold spills into
468 /// copy instructions, turning them into load/store instructions.
469 MachineInstr *
470 SPURegisterInfo::foldMemoryOperand(MachineInstr *MI,
471                                    SmallVectorImpl<unsigned> &Ops,
472                                    int FrameIndex) const
473 {
474 #if SOMEDAY_SCOTT_LOOKS_AT_ME_AGAIN
475   if (Ops.size() != 1) return NULL;
476
477   unsigned OpNum = Ops[0];
478   unsigned Opc = MI->getOpcode();
479   MachineInstr *NewMI = 0;
480   
481   if ((Opc == SPU::ORr32
482        || Opc == SPU::ORv4i32)
483        && MI->getOperand(1).getReg() == MI->getOperand(2).getReg()) {
484     if (OpNum == 0) {  // move -> store
485       unsigned InReg = MI->getOperand(1).getReg();
486       if (FrameIndex < SPUFrameInfo::maxFrameOffset()) {
487         NewMI = addFrameReference(BuildMI(TII.get(SPU::STQDr32)).addReg(InReg),
488                                   FrameIndex);
489       }
490     } else {           // move -> load
491       unsigned OutReg = MI->getOperand(0).getReg();
492       Opc = (FrameIndex < SPUFrameInfo::maxFrameOffset()) ? SPU::STQDr32 : SPU::STQXr32;
493       NewMI = addFrameReference(BuildMI(TII.get(Opc), OutReg), FrameIndex);
494     }
495   }
496
497   if (NewMI)
498     NewMI->copyKillDeadInfo(MI);
499
500   return NewMI;
501 #else
502   return 0;
503 #endif
504 }
505
506 /// General-purpose load/store fold to operand code
507 MachineInstr *
508 SPURegisterInfo::foldMemoryOperand(MachineInstr *MI,
509                                    SmallVectorImpl<unsigned> &Ops,
510                                    MachineInstr *LoadMI) const
511 {
512   return 0;
513 }
514
515 //===----------------------------------------------------------------------===//
516 // Stack Frame Processing methods
517 //===----------------------------------------------------------------------===//
518
519 // needsFP - Return true if the specified function should have a dedicated frame
520 // pointer register.  This is true if the function has variable sized allocas or
521 // if frame pointer elimination is disabled.
522 //
523 static bool needsFP(const MachineFunction &MF) {
524   const MachineFrameInfo *MFI = MF.getFrameInfo();
525   return NoFramePointerElim || MFI->hasVarSizedObjects();
526 }
527
528 //--------------------------------------------------------------------------
529 // hasFP - Return true if the specified function actually has a dedicated frame
530 // pointer register.  This is true if the function needs a frame pointer and has
531 // a non-zero stack size.
532 bool
533 SPURegisterInfo::hasFP(const MachineFunction &MF) const {
534   const MachineFrameInfo *MFI = MF.getFrameInfo();
535   return MFI->getStackSize() && needsFP(MF);
536 }
537
538 //--------------------------------------------------------------------------
539 void
540 SPURegisterInfo::eliminateCallFramePseudoInstr(MachineFunction &MF,
541                                                MachineBasicBlock &MBB,
542                                                MachineBasicBlock::iterator I)
543   const
544 {
545   // Simply discard ADJCALLSTACKDOWN, ADJCALLSTACKUP instructions.
546   MBB.erase(I);
547 }
548
549 void
550 SPURegisterInfo::eliminateFrameIndex(MachineBasicBlock::iterator II, int SPAdj,
551                                      RegScavenger *RS) const
552 {
553   unsigned i = 0;
554   MachineInstr &MI = *II;
555   MachineBasicBlock &MBB = *MI.getParent();
556   MachineFunction &MF = *MBB.getParent();
557   MachineFrameInfo *MFI = MF.getFrameInfo();
558
559   while (!MI.getOperand(i).isFrameIndex()) {
560     ++i;
561     assert(i < MI.getNumOperands() && "Instr doesn't have FrameIndex operand!");
562   }
563
564   MachineOperand &SPOp = MI.getOperand(i);
565   int FrameIndex = SPOp.getIndex();
566
567   // Now add the frame object offset to the offset from r1.
568   int Offset = MFI->getObjectOffset(FrameIndex);
569
570   // Most instructions, except for generated FrameIndex additions using AIr32,
571   // have the immediate in operand 1. AIr32, in this case, has the immediate
572   // in operand 2.
573   unsigned OpNo = (MI.getOpcode() != SPU::AIr32 ? 1 : 2);
574   MachineOperand &MO = MI.getOperand(OpNo);
575
576   // Offset is biased by $lr's slot at the bottom.
577   Offset += MO.getImm() + MFI->getStackSize() + SPUFrameInfo::minStackSize();
578   assert((Offset & 0xf) == 0
579          && "16-byte alignment violated in eliminateFrameIndex");
580
581   // Replace the FrameIndex with base register with $sp (aka $r1)
582   SPOp.ChangeToRegister(SPU::R1, false);
583   if (Offset > SPUFrameInfo::maxFrameOffset()
584       || Offset < SPUFrameInfo::minFrameOffset()) {
585     cerr << "Large stack adjustment ("
586          << Offset 
587          << ") in SPURegisterInfo::eliminateFrameIndex.";
588   } else {
589     MO.ChangeToImmediate(Offset);
590   }
591 }
592
593 /// determineFrameLayout - Determine the size of the frame and maximum call
594 /// frame size.
595 void
596 SPURegisterInfo::determineFrameLayout(MachineFunction &MF) const
597 {
598   MachineFrameInfo *MFI = MF.getFrameInfo();
599
600   // Get the number of bytes to allocate from the FrameInfo
601   unsigned FrameSize = MFI->getStackSize();
602   
603   // Get the alignments provided by the target, and the maximum alignment
604   // (if any) of the fixed frame objects.
605   unsigned TargetAlign = MF.getTarget().getFrameInfo()->getStackAlignment();
606   unsigned Align = std::max(TargetAlign, MFI->getMaxAlignment());
607   assert(isPowerOf2_32(Align) && "Alignment is not power of 2");
608   unsigned AlignMask = Align - 1;
609
610   // Get the maximum call frame size of all the calls.
611   unsigned maxCallFrameSize = MFI->getMaxCallFrameSize();
612     
613   // If we have dynamic alloca then maxCallFrameSize needs to be aligned so
614   // that allocations will be aligned.
615   if (MFI->hasVarSizedObjects())
616     maxCallFrameSize = (maxCallFrameSize + AlignMask) & ~AlignMask;
617
618   // Update maximum call frame size.
619   MFI->setMaxCallFrameSize(maxCallFrameSize);
620   
621   // Include call frame size in total.
622   FrameSize += maxCallFrameSize;
623
624   // Make sure the frame is aligned.
625   FrameSize = (FrameSize + AlignMask) & ~AlignMask;
626
627   // Update frame info.
628   MFI->setStackSize(FrameSize);
629 }
630
631 void SPURegisterInfo::processFunctionBeforeCalleeSavedScan(MachineFunction &MF,
632                                                            RegScavenger *RS)
633   const {
634 #if 0
635   //  Save and clear the LR state.
636   SPUFunctionInfo *FI = MF.getInfo<SPUFunctionInfo>();
637   FI->setUsesLR(MF.getRegInfo().isPhysRegUsed(LR));
638 #endif
639   // Mark LR and SP unused, since the prolog spills them to stack and
640   // we don't want anyone else to spill them for us.
641   //
642   // Also, unless R2 is really used someday, don't spill it automatically.
643   MF.getRegInfo().setPhysRegUnused(SPU::R0);
644   MF.getRegInfo().setPhysRegUnused(SPU::R1);
645   MF.getRegInfo().setPhysRegUnused(SPU::R2);
646 }
647
648 void SPURegisterInfo::emitPrologue(MachineFunction &MF) const
649 {
650   MachineBasicBlock &MBB = MF.front();   // Prolog goes in entry BB
651   MachineBasicBlock::iterator MBBI = MBB.begin();
652   MachineFrameInfo *MFI = MF.getFrameInfo();
653   MachineModuleInfo *MMI = MFI->getMachineModuleInfo();
654   
655   // Prepare for debug frame info.
656   bool hasDebugInfo = MMI && MMI->hasDebugInfo();
657   unsigned FrameLabelId = 0;
658   
659   // Move MBBI back to the beginning of the function.
660   MBBI = MBB.begin();
661   
662   // Work out frame sizes.
663   determineFrameLayout(MF);
664   int FrameSize = MFI->getStackSize();
665   
666   assert((FrameSize & 0xf) == 0
667          && "SPURegisterInfo::emitPrologue: FrameSize not aligned");
668
669   if (FrameSize > 0) {
670     FrameSize = -(FrameSize + SPUFrameInfo::minStackSize());
671     if (hasDebugInfo) {
672       // Mark effective beginning of when frame pointer becomes valid.
673       FrameLabelId = MMI->NextLabelID();
674       BuildMI(MBB, MBBI, TII.get(ISD::LABEL)).addImm(FrameLabelId);
675     }
676   
677     // Adjust stack pointer, spilling $lr -> 16($sp) and $sp -> -FrameSize($sp)
678     // for the ABI
679     BuildMI(MBB, MBBI, TII.get(SPU::STQDr32), SPU::R0).addImm(16)
680       .addReg(SPU::R1);
681     if (isS10Constant(FrameSize)) {
682       // Spill $sp to adjusted $sp
683       BuildMI(MBB, MBBI, TII.get(SPU::STQDr32), SPU::R1).addImm(FrameSize)
684         .addReg(SPU::R1);
685       // Adjust $sp by required amout
686       BuildMI(MBB, MBBI, TII.get(SPU::AIr32), SPU::R1).addReg(SPU::R1)
687         .addImm(FrameSize);
688     } else if (FrameSize <= (1 << 16) - 1 && FrameSize >= -(1 << 16)) {
689       // Frame size can be loaded into ILr32n, so temporarily spill $r2 and use
690       // $r2 to adjust $sp:
691       BuildMI(MBB, MBBI, TII.get(SPU::STQDr128), SPU::R2)
692         .addImm(-16)
693         .addReg(SPU::R1);
694       BuildMI(MBB, MBBI, TII.get(SPU::ILr32), SPU::R2)
695         .addImm(FrameSize);
696       BuildMI(MBB, MBBI, TII.get(SPU::STQDr32), SPU::R1)
697         .addReg(SPU::R2)
698         .addReg(SPU::R1);
699       BuildMI(MBB, MBBI, TII.get(SPU::Ar32), SPU::R1)
700         .addReg(SPU::R1)
701         .addReg(SPU::R2);
702       BuildMI(MBB, MBBI, TII.get(SPU::SFIr32), SPU::R2)
703         .addReg(SPU::R2)
704         .addImm(16);
705       BuildMI(MBB, MBBI, TII.get(SPU::LQXr128), SPU::R2)
706         .addReg(SPU::R2)
707         .addReg(SPU::R1);
708     } else {
709       cerr << "Unhandled frame size: " << FrameSize << "\n";
710       abort();
711     }
712  
713     if (hasDebugInfo) {
714       std::vector<MachineMove> &Moves = MMI->getFrameMoves();
715     
716       // Show update of SP.
717       MachineLocation SPDst(MachineLocation::VirtualFP);
718       MachineLocation SPSrc(MachineLocation::VirtualFP, -FrameSize);
719       Moves.push_back(MachineMove(FrameLabelId, SPDst, SPSrc));
720     
721       // Add callee saved registers to move list.
722       const std::vector<CalleeSavedInfo> &CSI = MFI->getCalleeSavedInfo();
723       for (unsigned I = 0, E = CSI.size(); I != E; ++I) {
724         int Offset = MFI->getObjectOffset(CSI[I].getFrameIdx());
725         unsigned Reg = CSI[I].getReg();
726         if (Reg == SPU::R0) continue;
727         MachineLocation CSDst(MachineLocation::VirtualFP, Offset);
728         MachineLocation CSSrc(Reg);
729         Moves.push_back(MachineMove(FrameLabelId, CSDst, CSSrc));
730       }
731     
732       // Mark effective beginning of when frame pointer is ready.
733       unsigned ReadyLabelId = MMI->NextLabelID();
734       BuildMI(MBB, MBBI, TII.get(ISD::LABEL)).addImm(ReadyLabelId);
735     
736       MachineLocation FPDst(SPU::R1);
737       MachineLocation FPSrc(MachineLocation::VirtualFP);
738       Moves.push_back(MachineMove(ReadyLabelId, FPDst, FPSrc));
739     }
740   } else {
741     // This is a leaf function -- insert a branch hint iff there are
742     // sufficient number instructions in the basic block. Note that
743     // this is just a best guess based on the basic block's size.
744     if (MBB.size() >= (unsigned) SPUFrameInfo::branchHintPenalty()) {
745       MachineBasicBlock::iterator MBBI = prior(MBB.end());
746       // Insert terminator label
747       unsigned BranchLabelId = MMI->NextLabelID();
748       BuildMI(MBB, MBBI, TII.get(SPU::LABEL)).addImm(BranchLabelId);
749     }
750   }
751 }
752
753 void
754 SPURegisterInfo::emitEpilogue(MachineFunction &MF, MachineBasicBlock &MBB) const
755 {
756   MachineBasicBlock::iterator MBBI = prior(MBB.end());
757   const MachineFrameInfo *MFI = MF.getFrameInfo();
758   int FrameSize = MFI->getStackSize();
759   int LinkSlotOffset = SPUFrameInfo::stackSlotSize();
760
761   assert(MBBI->getOpcode() == SPU::RET &&
762          "Can only insert epilog into returning blocks");
763   assert((FrameSize & 0xf) == 0
764          && "SPURegisterInfo::emitEpilogue: FrameSize not aligned");
765   if (FrameSize > 0) {
766     FrameSize = FrameSize + SPUFrameInfo::minStackSize();
767     if (isS10Constant(FrameSize + LinkSlotOffset)) {
768       // Reload $lr, adjust $sp by required amount
769       // Note: We do this to slightly improve dual issue -- not by much, but it
770       // is an opportunity for dual issue.
771       BuildMI(MBB, MBBI, TII.get(SPU::LQDr128), SPU::R0)
772         .addImm(FrameSize + LinkSlotOffset)
773         .addReg(SPU::R1);
774       BuildMI(MBB, MBBI, TII.get(SPU::AIr32), SPU::R1)
775         .addReg(SPU::R1)
776         .addImm(FrameSize);
777     } else if (FrameSize <= (1 << 16) - 1 && FrameSize >= -(1 << 16)) {
778       // Frame size can be loaded into ILr32n, so temporarily spill $r2 and use
779       // $r2 to adjust $sp:
780       BuildMI(MBB, MBBI, TII.get(SPU::STQDr128), SPU::R2)
781         .addImm(16)
782         .addReg(SPU::R1);
783       BuildMI(MBB, MBBI, TII.get(SPU::ILr32), SPU::R2)
784         .addImm(FrameSize);
785       BuildMI(MBB, MBBI, TII.get(SPU::Ar32), SPU::R1)
786         .addReg(SPU::R1)
787         .addReg(SPU::R2);
788       BuildMI(MBB, MBBI, TII.get(SPU::LQDr128), SPU::R0)
789         .addImm(16)
790         .addReg(SPU::R2);
791       BuildMI(MBB, MBBI, TII.get(SPU::SFIr32), SPU::R2).
792         addReg(SPU::R2)
793         .addImm(16);
794       BuildMI(MBB, MBBI, TII.get(SPU::LQXr128), SPU::R2)
795         .addReg(SPU::R2)
796         .addReg(SPU::R1);
797     } else {
798       cerr << "Unhandled frame size: " << FrameSize << "\n";
799       abort();
800     }
801    }
802 }
803
804 unsigned
805 SPURegisterInfo::getRARegister() const
806 {
807   return SPU::R0;
808 }
809
810 unsigned
811 SPURegisterInfo::getFrameRegister(MachineFunction &MF) const
812 {
813   return SPU::R1;
814 }
815
816 void
817 SPURegisterInfo::getInitialFrameState(std::vector<MachineMove> &Moves) const
818 {
819   // Initial state of the frame pointer is R1.
820   MachineLocation Dst(MachineLocation::VirtualFP);
821   MachineLocation Src(SPU::R1, 0);
822   Moves.push_back(MachineMove(0, Dst, Src));
823 }
824
825
826 int
827 SPURegisterInfo::getDwarfRegNum(unsigned RegNum, bool isEH) const {
828   // FIXME: Most probably dwarf numbers differs for Linux and Darwin
829   return SPUGenRegisterInfo::getDwarfRegNumFull(RegNum, 0);
830 }
831
832 #include "SPUGenRegisterInfo.inc"