Breaking up the PowerPC target into 32- and 64-bit subparts, Part I: 32-bit.
[oota-llvm.git] / lib / Target / PowerPC / PPCAsmPrinter.cpp
index 27ae6bde37a5e344db1b74f2aeb5980e90445066..5f3b5de7c6c9f0493907ff8bbc99fb8d0d5a2d96 100644 (file)
@@ -1,4 +1,4 @@
-//===-- PPC32/Printer.cpp - Convert X86 LLVM code to Intel assembly ---------===//
+//===-- PPC32AsmPrinter.cpp - Print machine instrs to PowerPC assembly ----===//
 // 
 //                     The LLVM Compiler Infrastructure
 //
@@ -7,29 +7,33 @@
 // 
 //===----------------------------------------------------------------------===//
 //
-// This file contains a printer that converts from our internal
-// representation of machine-dependent LLVM code to Intel-format
-// assembly language. This printer is the output mechanism used
-// by `llc' and `lli -print-machineinstrs' on X86.
+// This file contains a printer that converts from our internal representation
+// of machine-dependent LLVM code to PowerPC assembly language. This printer is
+// the output mechanism used by `llc'.
+//
+// Documentation at http://developer.apple.com/documentation/DeveloperTools/
+// Reference/Assembler/ASMIntroduction/chapter_1_section_1.html
 //
 //===----------------------------------------------------------------------===//
 
-#include <set>
-
+#define DEBUG_TYPE "asmprinter"
 #include "PowerPC.h"
 #include "PowerPCInstrInfo.h"
+#include "PPC32TargetMachine.h"
 #include "llvm/Constants.h"
 #include "llvm/DerivedTypes.h"
 #include "llvm/Module.h"
 #include "llvm/Assembly/Writer.h"
-#include "llvm/CodeGen/MachineFunctionPass.h"
 #include "llvm/CodeGen/MachineConstantPool.h"
+#include "llvm/CodeGen/MachineFunctionPass.h"
 #include "llvm/CodeGen/MachineInstr.h"
 #include "llvm/Target/TargetMachine.h"
 #include "llvm/Support/Mangler.h"
+#include "Support/CommandLine.h"
+#include "Support/Debug.h"
 #include "Support/Statistic.h"
 #include "Support/StringExtras.h"
-#include "Support/CommandLine.h"
+#include <set>
 
 namespace llvm {
 
@@ -44,22 +48,16 @@ namespace {
     /// Target machine description which we query for reg. names, data
     /// layout, etc.
     ///
-    TargetMachine &TM;
+    PPC32TargetMachine &TM;
 
     /// Name-mangler for global names.
     ///
     Mangler *Mang;
-    std::set< std::string > Stubs;
+    std::set<std::string> FnStubs, GVStubs, LinkOnceStubs;
     std::set<std::string> Strings;
 
-    Printer(std::ostream &o, TargetMachine &tm) : O(o), TM(tm) { }
-
-    /// We name each basic block in a Function with a unique number, so
-    /// that we can consistently refer to them later. This is cleared
-    /// at the beginning of each call to runOnMachineFunction().
-    ///
-    typedef std::map<const Value *, unsigned> ValueMapTy;
-    ValueMapTy NumberForBB;
+    Printer(std::ostream &o, TargetMachine &tm) : O(o),
+      TM(reinterpret_cast<PPC32TargetMachine&>(tm)), LabelNumber(0) {}
 
     /// Cache of mangled name for current function. This is
     /// recalculated at the beginning of each call to
@@ -67,13 +65,17 @@ namespace {
     ///
     std::string CurrentFnName;
 
+    /// Unique incrementer for label values for referencing Global values.
+    ///
+    unsigned LabelNumber;
+  
     virtual const char *getPassName() const {
-      return "PowerPC Assembly Printer";
+      return "PPC32 Assembly Printer";
     }
 
     void printMachineInstruction(const MachineInstr *MI);
-    void printOp(const MachineOperand &MO,
-                bool elideOffsetKeyword = false);
+    void printOp(const MachineOperand &MO, bool elideOffsetKeyword = false);
+    void printImmOp(const MachineOperand &MO, unsigned ArgType);
     void printConstantPool(MachineConstantPool *MCP);
     bool runOnMachineFunction(MachineFunction &F);    
     bool doInitialization(Module &M);
@@ -83,12 +85,12 @@ namespace {
   };
 } // end of anonymous namespace
 
-/// createPPCCodePrinterPass - Returns a pass that prints the X86
+/// createPPC32AsmPrinterPass - Returns a pass that prints the PPC
 /// assembly code for a MachineFunction to the given output stream,
 /// using the given target machine description.  This should work
-/// regardless of whether the function is in SSA form.
+/// regardless of whether the function is in SSA form or not.
 ///
-FunctionPass *createPPCCodePrinterPass(std::ostream &o,TargetMachine &tm){
+FunctionPass *createPPC32AsmPrinter(std::ostream &o,TargetMachine &tm) {
   return new Printer(o, tm);
 }
 
@@ -130,7 +132,7 @@ static void printAsCString(std::ostream &O, const ConstantArray *CVA) {
     } else if (isprint(C)) {
       O << C;
     } else {
-      switch(C) {
+      switch (C) {
       case '\b': O << "\\b"; break;
       case '\f': O << "\\f"; break;
       case '\n': O << "\\n"; break;
@@ -160,13 +162,13 @@ void Printer::emitConstantValueOnly(const Constant *CV) {
     O << CI->getValue();
   else if (const ConstantUInt *CI = dyn_cast<ConstantUInt>(CV))
     O << CI->getValue();
-  else if (const ConstantPointerRef *CPR = dyn_cast<ConstantPointerRef>(CV))
+  else if (const GlobalValue *GV = dyn_cast<GlobalValue>(CV))
     // This is a constant address for a global variable or function.  Use the
     // name of the variable or function as the address value.
-    O << Mang->getValueName(CPR->getValue());
+    O << Mang->getValueName(GV);
   else if (const ConstantExpr *CE = dyn_cast<ConstantExpr>(CV)) {
     const TargetData &TD = TM.getTargetData();
-    switch(CE->getOpcode()) {
+    switch (CE->getOpcode()) {
     case Instruction::GetElementPtr: {
       // generate a symbolic expression for the byte address
       const Constant *ptrVal = CE->getOperand(0);
@@ -223,31 +225,26 @@ void Printer::emitConstantValueOnly(const Constant *CV) {
 void Printer::emitGlobalConstant(const Constant *CV) {  
   const TargetData &TD = TM.getTargetData();
 
-  if (CV->isNullValue()) {
-    O << "\t.space\t " << TD.getTypeSize(CV->getType()) << "\n";      
-    return;
-  } else if (const ConstantArray *CVA = dyn_cast<ConstantArray>(CV)) {
+  if (const ConstantArray *CVA = dyn_cast<ConstantArray>(CV)) {
     if (isStringCompatible(CVA)) {
-      O << ".ascii";
+      O << "\t.ascii ";
       printAsCString(O, CVA);
       O << "\n";
     } else { // Not a string.  Print the values in successive locations
-      const std::vector<Use> &constValues = CVA->getValues();
-      for (unsigned i=0; i < constValues.size(); i++)
-        emitGlobalConstant(cast<Constant>(constValues[i].get()));
+      for (unsigned i=0, e = CVA->getNumOperands(); i != e; i++)
+        emitGlobalConstant(CVA->getOperand(i));
     }
     return;
   } else if (const ConstantStruct *CVS = dyn_cast<ConstantStruct>(CV)) {
     // Print the fields in successive locations. Pad to align if needed!
     const StructLayout *cvsLayout = TD.getStructLayout(CVS->getType());
-    const std::vector<Use>& constValues = CVS->getValues();
     unsigned sizeSoFar = 0;
-    for (unsigned i=0, N = constValues.size(); i < N; i++) {
-      const Constant* field = cast<Constant>(constValues[i].get());
+    for (unsigned i = 0, e = CVS->getNumOperands(); i != e; i++) {
+      const Constant* field = CVS->getOperand(i);
 
       // Check if padding is needed and insert one or more 0s.
       unsigned fieldSize = TD.getTypeSize(field->getType());
-      unsigned padSize = ((i == N-1? cvsLayout->StructSize
+      unsigned padSize = ((i == e-1? cvsLayout->StructSize
                            : cvsLayout->MemberOffsets[i+1])
                           - cvsLayout->MemberOffsets[i]) - fieldSize;
       sizeSoFar += fieldSize + padSize;
@@ -274,7 +271,7 @@ void Printer::emitGlobalConstant(const Constant *CV) {
         unsigned UVal;
       } U;
       U.FVal = Val;
-      O << ".long\t" << U.UVal << "\t# float " << Val << "\n";
+      O << ".long\t" << U.UVal << "\t; float " << Val << "\n";
       return;
     }
     case Type::DoubleTyID: {
@@ -282,32 +279,35 @@ void Printer::emitGlobalConstant(const Constant *CV) {
         double FVal;
         uint64_t UVal;
         struct {
-               uint32_t MSWord;
-               uint32_t LSWord;
+          uint32_t MSWord;
+          uint32_t LSWord;
         } T;
       } U;
       U.FVal = Val;
       
-      O << ".long\t" << U.T.MSWord << "\t# double most significant word " << Val << "\n";
-      O << ".long\t" << U.T.LSWord << "\t# double least significant word" << Val << "\n";
+      O << ".long\t" << U.T.MSWord << "\t; double most significant word " 
+        << Val << "\n";
+      O << ".long\t" << U.T.LSWord << "\t; double least significant word " 
+        << Val << "\n";
       return;
     }
     }
-  } else if (CV->getType()->getPrimitiveSize() == 64) {
-    const ConstantInt *CI = dyn_cast<ConstantInt>(CV);
-    if(CI) {
-       union DU {                            // Abide by C TBAA rules
+  } else if (CV->getType() == Type::ULongTy || CV->getType() == Type::LongTy) {
+    if (const ConstantInt *CI = dyn_cast<ConstantInt>(CV)) {
+      union DU {                            // Abide by C TBAA rules
         int64_t UVal;
         struct {
-               uint32_t MSWord;
-               uint32_t LSWord;
+          uint32_t MSWord;
+          uint32_t LSWord;
         } T;
       } U;
       U.UVal = CI->getRawValue();
         
-      O << ".long\t" << U.T.MSWord << "\t# Double-word most significant word " << U.UVal << "\n";
-      O << ".long\t" << U.T.LSWord << "\t# Double-word least significant word" << U.UVal << "\n";
-      return;    
+      O << ".long\t" << U.T.MSWord << "\t; Double-word most significant word " 
+        << U.UVal << "\n";
+      O << ".long\t" << U.T.LSWord << "\t; Double-word least significant word " 
+        << U.UVal << "\n";
+      return;
     }
   }
 
@@ -326,11 +326,16 @@ void Printer::emitGlobalConstant(const Constant *CV) {
     O << ".long";
     break;
   case Type::ULongTyID: case Type::LongTyID:    
-       assert (0 && "Should have already output double-word constant.");
+    assert (0 && "Should have already output double-word constant.");
   case Type::FloatTyID: case Type::DoubleTyID:
     assert (0 && "Should have already output floating point constant.");
   default:
-    assert (0 && "Can't handle printing this type of thing");
+    if (CV == Constant::getNullValue(type)) {  // Zero initializer?
+      O << ".space\t" << TD.getTypeSize(type) << "\n";      
+      return;
+    }
+    std::cerr << "Can't handle printing: " << *CV;
+    abort();
     break;
   }
   O << "\t";
@@ -353,7 +358,7 @@ void Printer::printConstantPool(MachineConstantPool *MCP) {
     O << "\t.const\n";
     O << "\t.align " << (unsigned)TD.getTypeAlignment(CP[i]->getType())
       << "\n";
-    O << ".CPI" << CurrentFnName << "_" << i << ":\t\t\t\t\t#"
+    O << ".CPI" << CurrentFnName << "_" << i << ":\t\t\t\t\t;"
       << *CP[i] << "\n";
     emitGlobalConstant(CP[i]);
   }
@@ -363,10 +368,6 @@ void Printer::printConstantPool(MachineConstantPool *MCP) {
 /// method to print assembly for each instruction.
 ///
 bool Printer::runOnMachineFunction(MachineFunction &MF) {
-  // BBNumber is used here so that a given Printer will never give two
-  // BBs the same name. (If you have a better way, please let me know!)
-  static unsigned BBNumber = 0;
-
   O << "\n\n";
   // What's my mangled name?
   CurrentFnName = Mang->getValueName(MF.getFunction());
@@ -377,39 +378,30 @@ bool Printer::runOnMachineFunction(MachineFunction &MF) {
   // Print out labels for the function.
   O << "\t.text\n"; 
   O << "\t.globl\t" << CurrentFnName << "\n";
-  O << "\t.align 5\n";
+  O << "\t.align 2\n";
   O << CurrentFnName << ":\n";
 
-  // Number each basic block so that we can consistently refer to them
-  // in PC-relative references.
-  NumberForBB.clear();
-  for (MachineFunction::const_iterator I = MF.begin(), E = MF.end();
-       I != E; ++I) {
-    NumberForBB[I->getBasicBlock()] = BBNumber++;
-  }
-
   // Print out code for the function.
   for (MachineFunction::const_iterator I = MF.begin(), E = MF.end();
        I != E; ++I) {
     // Print a label for the basic block.
-    O << "L" << NumberForBB[I->getBasicBlock()] << ":\t# "
+    O << ".LBB" << CurrentFnName << "_" << I->getNumber() << ":\t; "
       << I->getBasicBlock()->getName() << "\n";
     for (MachineBasicBlock::const_iterator II = I->begin(), E = I->end();
-        II != E; ++II) {
+      II != E; ++II) {
       // Print the assembly for the instruction.
       O << "\t";
       printMachineInstruction(II);
     }
   }
+  ++LabelNumber;
 
   // We didn't modify anything.
   return false;
 }
 
-
-
 void Printer::printOp(const MachineOperand &MO,
-                     bool elideOffsetKeyword /* = false */) {
+                      bool elideOffsetKeyword /* = false */) {
   const MRegisterInfo &RI = *TM.getRegisterInfo();
   int new_symbol;
   
@@ -421,173 +413,198 @@ void Printer::printOp(const MachineOperand &MO,
     }
     // FALLTHROUGH
   case MachineOperand::MO_MachineRegister:
-      O << RI.get(MO.getReg()).Name;
-      return;
+  case MachineOperand::MO_CCRegister:
+    O << LowercaseString(RI.get(MO.getReg()).Name);
+    return;
 
   case MachineOperand::MO_SignExtendedImmed:
   case MachineOperand::MO_UnextendedImmed:
-    O << (int)MO.getImmedValue();
+    std::cerr << "printOp() does not handle immediate values\n";
+    abort();
     return;
+
+  case MachineOperand::MO_PCRelativeDisp:
+    std::cerr << "Shouldn't use addPCDisp() when building PPC MachineInstrs";
+    abort();
+    return;
+    
   case MachineOperand::MO_MachineBasicBlock: {
     MachineBasicBlock *MBBOp = MO.getMachineBasicBlock();
     O << ".LBB" << Mang->getValueName(MBBOp->getParent()->getFunction())
-      << "_" << MBBOp->getNumber () << "\t# "
-      << MBBOp->getBasicBlock ()->getName ();
+      << "_" << MBBOp->getNumber() << "\t; "
+      << MBBOp->getBasicBlock()->getName();
     return;
   }
-  case MachineOperand::MO_PCRelativeDisp:
-    std::cerr << "Shouldn't use addPCDisp() when building PPC MachineInstrs";
-    abort ();
+
+  case MachineOperand::MO_ConstantPoolIndex:
+    O << ".CPI" << CurrentFnName << "_" << MO.getConstantPoolIndex();
     return;
+
+  case MachineOperand::MO_ExternalSymbol:
+    O << MO.getSymbolName();
+    return;
+
   case MachineOperand::MO_GlobalAddress:
     if (!elideOffsetKeyword) {
-               if(isa<Function>(MO.getGlobal())) {
-                       Stubs.insert(Mang->getValueName(MO.getGlobal()));
-                       O << "L" << Mang->getValueName(MO.getGlobal()) << "$stub";
-               } else {
-                       O << Mang->getValueName(MO.getGlobal());
-               }
+      GlobalValue *GV = MO.getGlobal();
+      std::string Name = Mang->getValueName(GV);
+
+      // Dynamically-resolved functions need a stub for the function
+      Function *F = dyn_cast<Function>(GV);
+      if (F && F->isExternal() &&
+          TM.CalledFunctions.find(F) != TM.CalledFunctions.end()) {
+        FnStubs.insert(Name);
+        O << "L" << Name << "$stub";
+        return;
+      }
+            
+      // External global variables need a non-lazily-resolved stub
+      if (!GV->hasInternalLinkage() &&
+          TM.AddressTaken.find(GV) != TM.AddressTaken.end()) {
+        GVStubs.insert(Name);
+        O << "L" << Name << "$non_lazy_ptr";
+        return;
+      }
+            
+      O << Mang->getValueName(GV);
     }
     return;
-  case MachineOperand::MO_ExternalSymbol:
-    O << MO.getSymbolName();
-    return;
+    
   default:
-    O << "<unknown operand type>"; return;    
+    O << "<unknown operand type: " << MO.getType() << ">";
+    return;
   }
 }
 
-#if 0
-static inline
-unsigned int ValidOpcodes(const MachineInstr *MI, unsigned int ArgType[5]) {
-       int i;
-       unsigned int retval = 1;
-       
-       for(i = 0; i<5; i++) {
-               switch(ArgType[i]) {
-                       case none:
-                               break;
-                       case Gpr:
-                       case Gpr0:
-                               Type::UIntTy
-                       case Simm16:
-                       case Zimm16:
-                       case PCRelimm24:
-                       case Imm24:
-                       case Imm5:
-                       case PCRelimm14:
-                       case Imm14:
-                       case Imm2:
-                       case Crf:
-                       case Imm3:
-                       case Imm1:
-                       case Fpr:
-                       case Imm4:
-                       case Imm8:
-                       case Disimm16:
-                       case Spr:
-                       case Sgr:
-       };
-               
-               }
-       }
+void Printer::printImmOp(const MachineOperand &MO, unsigned ArgType) {
+  int Imm = MO.getImmedValue();
+  if (ArgType == PPCII::Simm16 || ArgType == PPCII::Disimm16) {
+    O << (short)Imm;
+  } else if (ArgType == PPCII::Zimm16) {
+    O << (unsigned short)Imm;
+  } else {
+    O << Imm;
+  }
 }
-#endif
 
-/// printMachineInstruction -- Print out a single PPC32 LLVM instruction
+/// printMachineInstruction -- Print out a single PPC LLVM instruction
 /// MI in Darwin syntax to the current output stream.
 ///
 void Printer::printMachineInstruction(const MachineInstr *MI) {
   unsigned Opcode = MI->getOpcode();
   const TargetInstrInfo &TII = *TM.getInstrInfo();
   const TargetInstrDescriptor &Desc = TII.get(Opcode);
-  unsigned int i;
-  
-  unsigned int ArgCount = Desc.TSFlags & PPC32II::ArgCountMask;
-  unsigned int ArgType[5];
-
-
-  ArgType[0] = (Desc.TSFlags>>PPC32II::Arg0TypeShift) & PPC32II::ArgTypeMask;
-  ArgType[1] = (Desc.TSFlags>>PPC32II::Arg1TypeShift) & PPC32II::ArgTypeMask;
-  ArgType[2] = (Desc.TSFlags>>PPC32II::Arg2TypeShift) & PPC32II::ArgTypeMask;
-  ArgType[3] = (Desc.TSFlags>>PPC32II::Arg3TypeShift) & PPC32II::ArgTypeMask;
-  ArgType[4] = (Desc.TSFlags>>PPC32II::Arg4TypeShift) & PPC32II::ArgTypeMask;
-  
-  assert ( ((Desc.TSFlags & PPC32II::VMX) == 0) && "Instruction requires VMX support");
-  assert ( ((Desc.TSFlags & PPC32II::PPC64) == 0) && "Instruction requires 64 bit support");
-  //assert ( ValidOpcodes(MI, ArgType) && "Instruction has invalid inputs");
+  unsigned i;
+
+  unsigned ArgCount = MI->getNumOperands();
+  unsigned ArgType[] = {
+    (Desc.TSFlags >> PPCII::Arg0TypeShift) & PPCII::ArgTypeMask,
+    (Desc.TSFlags >> PPCII::Arg1TypeShift) & PPCII::ArgTypeMask,
+    (Desc.TSFlags >> PPCII::Arg2TypeShift) & PPCII::ArgTypeMask,
+    (Desc.TSFlags >> PPCII::Arg3TypeShift) & PPCII::ArgTypeMask,
+    (Desc.TSFlags >> PPCII::Arg4TypeShift) & PPCII::ArgTypeMask
+  };
+  assert(((Desc.TSFlags & PPCII::VMX) == 0) &&
+         "Instruction requires VMX support");
+  assert(((Desc.TSFlags & PPCII::PPC64) == 0) &&
+         "Instruction requires 64 bit support");
   ++EmittedInsts;
 
-  if(Opcode == PPC32::MovePCtoLR) {
-    O << "mflr r0\n";
-    O << "bcl 20,31,L" << CurrentFnName << "$pb\n";
-    O  << "L" << CurrentFnName << "$pb:\n";
+  // CALLpcrel and CALLindirect are handled specially here to print only the
+  // appropriate number of args that the assembler expects.  This is because
+  // may have many arguments appended to record the uses of registers that are
+  // holding arguments to the called function.
+  if (Opcode == PPC::COND_BRANCH) {
+    std::cerr << "Error: untranslated conditional branch psuedo instruction!\n";
+    abort();
+  } else if (Opcode == PPC::IMPLICIT_DEF) {
+    O << "; IMPLICIT DEF ";
+    printOp(MI->getOperand(0));
+    O << "\n";
     return;
-  }
-
-  O << TII.getName(MI->getOpcode()) << " ";
-  std::cout << TII.getName(MI->getOpcode()) << " expects " << ArgCount << " args\n";
-
-  if(Opcode == PPC32::LOADLoAddr) {
+  } else if (Opcode == PPC::CALLpcrel) {
+    O << TII.getName(Opcode) << " ";
     printOp(MI->getOperand(0));
+    O << "\n";
+    return;
+  } else if (Opcode == PPC::CALLindirect) {
+    O << TII.getName(Opcode) << " ";
+    printImmOp(MI->getOperand(0), ArgType[0]);
     O << ", ";
-    printOp(MI->getOperand(1));
-    O << ", lo16(";
-    printOp(MI->getOperand(2));
-    O << "-L" << CurrentFnName << "$pb)\n";
+    printImmOp(MI->getOperand(1), ArgType[0]);
+    O << "\n";
+    return;
+  } else if (Opcode == PPC::MovePCtoLR) {
+    // FIXME: should probably be converted to cout.width and cout.fill
+    O << "bl \"L0000" << LabelNumber << "$pb\"\n";
+    O << "\"L0000" << LabelNumber << "$pb\":\n";
+    O << "\tmflr ";
+    printOp(MI->getOperand(0));
+    O << "\n";
     return;
   }
 
-  if(Opcode == PPC32::LOADHiAddr) {
+  O << TII.getName(Opcode) << " ";
+  if (Opcode == PPC::LOADLoDirect || Opcode == PPC::LOADLoIndirect) {
+    printOp(MI->getOperand(0));
+    O << ", lo16(";
+    printOp(MI->getOperand(2));
+    O << "-\"L0000" << LabelNumber << "$pb\")";
+    O << "(";
+    if (MI->getOperand(1).getReg() == PPC::R0)
+      O << "0";
+    else
+      printOp(MI->getOperand(1));
+    O << ")\n";
+  } else if (Opcode == PPC::LOADHiAddr) {
     printOp(MI->getOperand(0));
     O << ", ";
-    printOp(MI->getOperand(1));
+    if (MI->getOperand(1).getReg() == PPC::R0)
+      O << "0";
+    else
+      printOp(MI->getOperand(1));
     O << ", ha16(" ;
     printOp(MI->getOperand(2));
-     O << "-L" << CurrentFnName << "$pb)\n";
-    return;
-  }
-  
-  if( (ArgCount == 3) && (ArgType[1] == PPC32II::Disimm16) ) {
+     O << "-\"L0000" << LabelNumber << "$pb\")\n";
+  } else if (ArgCount == 3 && ArgType[1] == PPCII::Disimm16) {
     printOp(MI->getOperand(0));
     O << ", ";
-    printOp(MI->getOperand(1));
+    printImmOp(MI->getOperand(1), ArgType[1]);
     O << "(";
-    if((ArgType[2] == PPC32II::Gpr0) && (MI->getOperand(2).getReg() == PPC32::R0)) {
-       O << "0";
-    } else {
-       printOp(MI->getOperand(2));
-    }
+    if (MI->getOperand(2).hasAllocatedReg() &&
+        MI->getOperand(2).getReg() == PPC::R0)
+      O << "0";
+    else
+      printOp(MI->getOperand(2));
     O << ")\n";
   } else {
-    for(i = 0; i< ArgCount; i++) {
-        if( (ArgType[i] == PPC32II::Gpr0) && ((MI->getOperand(i).getReg()) == PPC32::R0)) {
-            O << "0";
-        } else {
-               //std::cout << "DEBUG " << (*(TM.getRegisterInfo())).get(MI->getOperand(i).getReg()).Name << "\n";
-            printOp(MI->getOperand(i));
-        }
-        if( ArgCount - 1 == i) {
-            O << "\n";
-        } else {
-            O << ", ";
-        }
+    for (i = 0; i < ArgCount; ++i) {
+      // addi and friends
+      if (i == 1 && ArgCount == 3 && ArgType[2] == PPCII::Simm16 &&
+          MI->getOperand(1).hasAllocatedReg() && 
+          MI->getOperand(1).getReg() == PPC::R0) {
+        O << "0";
+      // for long branch support, bc $+8
+      } else if (i == 1 && ArgCount == 2 && MI->getOperand(1).isImmediate() &&
+                 TII.isBranch(MI->getOpcode())) {
+        O << "$+8";
+        assert(8 == MI->getOperand(i).getImmedValue()
+          && "branch off PC not to pc+8?");
+        //printOp(MI->getOperand(i));
+      } else if (MI->getOperand(i).isImmediate()) {
+        printImmOp(MI->getOperand(i), ArgType[i]);
+      } else {
+        printOp(MI->getOperand(i));
+      }
+      if (ArgCount - 1 == i)
+        O << "\n";
+      else
+        O << ", ";
     }
   }
-  
-  return;  
 }
 
 bool Printer::doInitialization(Module &M) {
-  // Tell gas we are outputting Intel syntax (not AT&T syntax) assembly.
-  //
-  // Bug: gas in `intel_syntax noprefix' mode interprets the symbol `Sp' in an
-  // instruction as a reference to the register named sp, and if you try to
-  // reference a symbol `Sp' (e.g. `mov ECX, OFFSET Sp') then it gets lowercased
-  // before being looked up in the symbol table. This creates spurious
-  // `undefined symbol' errors when linking. Workaround: Do not use `noprefix'
-  // mode, and decorate all register names with percent signs.
- // O << "\t.intel_syntax\n";
   Mang = new Mangler(M, true);
   return false; // success
 }
@@ -617,28 +634,32 @@ bool Printer::doFinalization(Module &M) {
       unsigned Size = TD.getTypeSize(C->getType());
       unsigned Align = TD.getTypeAlignment(C->getType());
 
-      if (C->isNullValue() && 
-          (I->hasLinkOnceLinkage() || I->hasInternalLinkage() ||
-           I->hasWeakLinkage() /* FIXME: Verify correct */)) {
+      if (C->isNullValue() && /* FIXME: Verify correct */
+          (I->hasInternalLinkage() || I->hasWeakLinkage())) {
         SwitchSection(O, CurSection, ".data");
         if (I->hasInternalLinkage())
-          O << "\t.local " << name << "\n";
-        
-        O << "\t.comm " << name << "," << TD.getTypeSize(C->getType())
-          << "," << (unsigned)TD.getTypeAlignment(C->getType());
-        O << "\t\t# ";
+          O << ".lcomm " << name << "," << TD.getTypeSize(C->getType())
+            << "," << (unsigned)TD.getTypeAlignment(C->getType());
+        else 
+          O << ".comm " << name << "," << TD.getTypeSize(C->getType());
+        O << "\t\t; ";
         WriteAsOperand(O, I, true, true, &M);
         O << "\n";
       } else {
         switch (I->getLinkage()) {
         case GlobalValue::LinkOnceLinkage:
+          O << ".section __TEXT,__textcoal_nt,coalesced,no_toc\n"
+            << ".weak_definition " << name << '\n'
+            << ".private_extern " << name << '\n'
+            << ".section __DATA,__datacoal_nt,coalesced,no_toc\n";
+          LinkOnceStubs.insert(name);
+          break;  
         case GlobalValue::WeakLinkage:   // FIXME: Verify correct for weak.
           // Nonnull linkonce -> weak
           O << "\t.weak " << name << "\n";
           SwitchSection(O, CurSection, "");
           O << "\t.section\t.llvm.linkonce.d." << name << ",\"aw\",@progbits\n";
           break;
-        
         case GlobalValue::AppendingLinkage:
           // FIXME: appending linkage variables should go into a section of
           // their name or something.  For now, just emit them as external.
@@ -647,15 +668,12 @@ bool Printer::doFinalization(Module &M) {
           O << "\t.globl " << name << "\n";
           // FALL THROUGH
         case GlobalValue::InternalLinkage:
-          if (C->isNullValue())
-            SwitchSection(O, CurSection, ".bss");
-          else
-            SwitchSection(O, CurSection, ".data");
+          SwitchSection(O, CurSection, ".data");
           break;
         }
 
         O << "\t.align " << Align << "\n";
-        O << name << ":\t\t\t\t# ";
+        O << name << ":\t\t\t\t; ";
         WriteAsOperand(O, I, true, true, &M);
         O << " = ";
         WriteAsOperand(O, C, false, false, &M);
@@ -663,30 +681,53 @@ bool Printer::doFinalization(Module &M) {
         emitGlobalConstant(C);
       }
     }
-        
-    for(std::set<std::string>::iterator i = Stubs.begin(); i != Stubs.end(); ++i) {
-       O << ".data\n";     
-               O << ".section __TEXT,__picsymbolstub1,symbol_stubs,pure_instructions,32\n";
-               O << "\t.align 2\n";
-       O << "L" << *i << "$stub:\n";
-       O << "\t.indirect_symbol " << *i << "\n";
-       O << "\tmflr r0\n";
-       O << "\tbcl 20,31,L0$" << *i << "\n";
-       O << "L0$" << *i << ":\n";
-       O << "\tmflr r11\n";
-       O << "\taddis r11,r11,ha16(L" << *i << "$lazy_ptr-L0$" << *i << ")\n";
-       O << "\tmtlr r0\n";
-       O << "\tlwzu r12,lo16(L" << *i << "$lazy_ptr-L0$" << *i << ")(r11)\n";
-       O << "\tmtctr r12\n";
-       O << "\tbctr\n";
-       O << ".data\n";
-               O << ".lazy_symbol_pointer\n";
-               O << "L" << *i << "$lazy_ptr:\n";
-        O << ".indirect_symbol " << *i << "\n";
-        O << ".long dyld_stub_binding_helper\n";
-
-       }
 
+  // Output stubs for link-once variables
+  if (LinkOnceStubs.begin() != LinkOnceStubs.end())
+    O << ".data\n.align 2\n";
+  for (std::set<std::string>::iterator i = LinkOnceStubs.begin(), 
+         e = LinkOnceStubs.end(); i != e; ++i) {
+    O << *i << "$non_lazy_ptr:\n"
+      << "\t.long\t" << *i << '\n';
+  }
+  
+  // Output stubs for dynamically-linked functions
+  for (std::set<std::string>::iterator i = FnStubs.begin(), e = FnStubs.end(); 
+       i != e; ++i)
+  {
+    O << ".data\n";
+    O << ".section __TEXT,__picsymbolstub1,symbol_stubs,pure_instructions,32\n";
+    O << "\t.align 2\n";
+    O << "L" << *i << "$stub:\n";
+    O << "\t.indirect_symbol " << *i << "\n";
+    O << "\tmflr r0\n";
+    O << "\tbcl 20,31,L0$" << *i << "\n";
+    O << "L0$" << *i << ":\n";
+    O << "\tmflr r11\n";
+    O << "\taddis r11,r11,ha16(L" << *i << "$lazy_ptr-L0$" << *i << ")\n";
+    O << "\tmtlr r0\n";
+    O << "\tlwzu r12,lo16(L" << *i << "$lazy_ptr-L0$" << *i << ")(r11)\n";
+    O << "\tmtctr r12\n";
+    O << "\tbctr\n";
+    O << ".data\n";
+    O << ".lazy_symbol_pointer\n";
+    O << "L" << *i << "$lazy_ptr:\n";
+    O << "\t.indirect_symbol " << *i << "\n";
+    O << "\t.long dyld_stub_binding_helper\n";
+  }
+
+  O << "\n";
+
+  // Output stubs for external global variables
+  if (GVStubs.begin() != GVStubs.end())
+    O << ".data\n.non_lazy_symbol_pointer\n";
+  for (std::set<std::string>::iterator i = GVStubs.begin(), e = GVStubs.end(); 
+       i != e; ++i) {
+    O << "L" << *i << "$non_lazy_ptr:\n";
+    O << "\t.indirect_symbol " << *i << "\n";
+    O << "\t.long\t0\n";
+  }
+  
   delete Mang;
   return false; // success
 }