b0e9705f0a7c8cc3e045f984f0418a405f8681fd
[oota-llvm.git] / lib / MC / MCAsmStreamer.cpp
1 //===- lib/MC/MCAsmStreamer.cpp - Text Assembly Output --------------------===//
2 //
3 //                     The LLVM Compiler Infrastructure
4 //
5 // This file is distributed under the University of Illinois Open Source
6 // License. See LICENSE.TXT for details.
7 //
8 //===----------------------------------------------------------------------===//
9
10 #include "llvm/MC/MCStreamer.h"
11 #include "llvm/MC/MCAsmInfo.h"
12 #include "llvm/MC/MCCodeEmitter.h"
13 #include "llvm/MC/MCContext.h"
14 #include "llvm/MC/MCExpr.h"
15 #include "llvm/MC/MCInst.h"
16 #include "llvm/MC/MCInstPrinter.h"
17 #include "llvm/MC/MCSectionMachO.h"
18 #include "llvm/MC/MCSymbol.h"
19 #include "llvm/ADT/SmallString.h"
20 #include "llvm/ADT/Twine.h"
21 #include "llvm/Support/ErrorHandling.h"
22 #include "llvm/Support/MathExtras.h"
23 #include "llvm/Support/Format.h"
24 #include "llvm/Support/FormattedStream.h"
25 using namespace llvm;
26
27 namespace {
28
29 class MCAsmStreamer : public MCStreamer {
30   formatted_raw_ostream &OS;
31   const MCAsmInfo &MAI;
32   bool IsLittleEndian, IsVerboseAsm;
33   MCInstPrinter *InstPrinter;
34   MCCodeEmitter *Emitter;
35   
36   SmallString<128> CommentToEmit;
37   raw_svector_ostream CommentStream;
38 public:
39   MCAsmStreamer(MCContext &Context, formatted_raw_ostream &os,
40                 const MCAsmInfo &mai,
41                 bool isLittleEndian, bool isVerboseAsm, MCInstPrinter *printer,
42                 MCCodeEmitter *emitter)
43     : MCStreamer(Context), OS(os), MAI(mai), IsLittleEndian(isLittleEndian),
44       IsVerboseAsm(isVerboseAsm), InstPrinter(printer), Emitter(emitter),
45       CommentStream(CommentToEmit) {}
46   ~MCAsmStreamer() {}
47
48   bool isLittleEndian() const { return IsLittleEndian; }
49   
50   
51   inline void EmitEOL() {
52     // If we don't have any comments, just emit a \n.
53     if (!IsVerboseAsm) {
54       OS << '\n';
55       return;
56     }
57     EmitCommentsAndEOL();
58   }
59   void EmitCommentsAndEOL();
60   
61   /// AddComment - Add a comment that can be emitted to the generated .s
62   /// file if applicable as a QoI issue to make the output of the compiler
63   /// more readable.  This only affects the MCAsmStreamer, and only when
64   /// verbose assembly output is enabled.
65   virtual void AddComment(const Twine &T);
66   
67   /// GetCommentOS - Return a raw_ostream that comments can be written to.
68   /// Unlike AddComment, you are required to terminate comments with \n if you
69   /// use this method.
70   virtual raw_ostream &GetCommentOS() {
71     if (!IsVerboseAsm)
72       return nulls();  // Discard comments unless in verbose asm mode.
73     return CommentStream;
74   }
75   
76   /// AddBlankLine - Emit a blank line to a .s file to pretty it up.
77   virtual void AddBlankLine() {
78     EmitEOL();
79   }
80   
81   /// @name MCStreamer Interface
82   /// @{
83
84   virtual void SwitchSection(const MCSection *Section);
85
86   virtual void EmitLabel(MCSymbol *Symbol);
87
88   virtual void EmitAssemblerFlag(AssemblerFlag Flag);
89
90   virtual void EmitAssignment(MCSymbol *Symbol, const MCExpr *Value);
91
92   virtual void EmitSymbolAttribute(MCSymbol *Symbol, SymbolAttr Attribute);
93
94   virtual void EmitSymbolDesc(MCSymbol *Symbol, unsigned DescValue);
95
96   virtual void EmitCommonSymbol(MCSymbol *Symbol, unsigned Size,
97                                 unsigned ByteAlignment);
98
99   virtual void EmitZerofill(const MCSection *Section, MCSymbol *Symbol = 0,
100                             unsigned Size = 0, unsigned ByteAlignment = 0);
101
102   virtual void EmitBytes(StringRef Data, unsigned AddrSpace);
103
104   virtual void EmitValue(const MCExpr *Value, unsigned Size,unsigned AddrSpace);
105   virtual void EmitIntValue(uint64_t Value, unsigned Size, unsigned AddrSpace);
106
107   virtual void EmitFill(uint64_t NumBytes, uint8_t FillValue,
108                         unsigned AddrSpace);
109
110   virtual void EmitValueToAlignment(unsigned ByteAlignment, int64_t Value = 0,
111                                     unsigned ValueSize = 1,
112                                     unsigned MaxBytesToEmit = 0);
113
114   virtual void EmitValueToOffset(const MCExpr *Offset,
115                                  unsigned char Value = 0);
116   
117   virtual void EmitInstruction(const MCInst &Inst);
118
119   virtual void Finish();
120   
121   /// @}
122 };
123
124 } // end anonymous namespace.
125
126 /// AddComment - Add a comment that can be emitted to the generated .s
127 /// file if applicable as a QoI issue to make the output of the compiler
128 /// more readable.  This only affects the MCAsmStreamer, and only when
129 /// verbose assembly output is enabled.
130 void MCAsmStreamer::AddComment(const Twine &T) {
131   if (!IsVerboseAsm) return;
132   
133   // Make sure that CommentStream is flushed.
134   CommentStream.flush();
135   
136   T.toVector(CommentToEmit);
137   // Each comment goes on its own line.
138   CommentToEmit.push_back('\n');
139   
140   // Tell the comment stream that the vector changed underneath it.
141   CommentStream.resync();
142 }
143
144 void MCAsmStreamer::EmitCommentsAndEOL() {
145   if (CommentToEmit.empty() && CommentStream.GetNumBytesInBuffer() == 0) {
146     OS << '\n';
147     return;
148   }
149   
150   CommentStream.flush();
151   StringRef Comments = CommentToEmit.str();
152   
153   assert(Comments.back() == '\n' &&
154          "Comment array not newline terminated");
155   do {
156     // Emit a line of comments.
157     OS.PadToColumn(MAI.getCommentColumn());
158     size_t Position = Comments.find('\n');
159     OS << MAI.getCommentString() << ' ' << Comments.substr(0, Position) << '\n';
160     
161     Comments = Comments.substr(Position+1);
162   } while (!Comments.empty());
163   
164   CommentToEmit.clear();
165   // Tell the comment stream that the vector changed underneath it.
166   CommentStream.resync();
167 }
168
169
170 static inline int64_t truncateToSize(int64_t Value, unsigned Bytes) {
171   assert(Bytes && "Invalid size!");
172   return Value & ((uint64_t) (int64_t) -1 >> (64 - Bytes * 8));
173 }
174
175 static inline const MCExpr *truncateToSize(const MCExpr *Value,
176                                            unsigned Bytes) {
177   // FIXME: Do we really need this routine?
178   return Value;
179 }
180
181 void MCAsmStreamer::SwitchSection(const MCSection *Section) {
182   assert(Section && "Cannot switch to a null section!");
183   if (Section != CurSection) {
184     CurSection = Section;
185     Section->PrintSwitchToSection(MAI, OS);
186   }
187 }
188
189 void MCAsmStreamer::EmitLabel(MCSymbol *Symbol) {
190   assert(Symbol->isUndefined() && "Cannot define a symbol twice!");
191   assert(CurSection && "Cannot emit before setting section!");
192
193   OS << *Symbol << ":";
194   EmitEOL();
195   Symbol->setSection(*CurSection);
196 }
197
198 void MCAsmStreamer::EmitAssemblerFlag(AssemblerFlag Flag) {
199   switch (Flag) {
200   default: assert(0 && "Invalid flag!");
201   case SubsectionsViaSymbols: OS << ".subsections_via_symbols"; break;
202   }
203   EmitEOL();
204 }
205
206 void MCAsmStreamer::EmitAssignment(MCSymbol *Symbol, const MCExpr *Value) {
207   // Only absolute symbols can be redefined.
208   assert((Symbol->isUndefined() || Symbol->isAbsolute()) &&
209          "Cannot define a symbol twice!");
210
211   OS << *Symbol << " = " << *Value;
212   EmitEOL();
213
214   // FIXME: Lift context changes into super class.
215   // FIXME: Set associated section.
216   Symbol->setValue(Value);
217 }
218
219 void MCAsmStreamer::EmitSymbolAttribute(MCSymbol *Symbol,
220                                         SymbolAttr Attribute) {
221   switch (Attribute) {
222   case Global:         OS << MAI.getGlobalDirective(); break; // .globl
223   case Hidden:         OS << ".hidden ";          break;
224   case IndirectSymbol: OS << ".indirect_symbol "; break;
225   case Internal:       OS << ".internal ";        break;
226   case LazyReference:  OS << ".lazy_reference ";  break;
227   case Local:          OS << ".local ";           break;
228   case NoDeadStrip:    OS << ".no_dead_strip ";   break;
229   case PrivateExtern:  OS << ".private_extern ";  break;
230   case Protected:      OS << ".protected ";       break;
231   case Reference:      OS << ".reference ";       break;
232   case Weak:           OS << ".weak ";            break;
233   case WeakDefinition: OS << ".weak_definition "; break;
234   case WeakReference:  OS << MAI.getWeakRefDirective(); break;// .weak_reference
235   }
236
237   OS << *Symbol;
238   EmitEOL();
239 }
240
241 void MCAsmStreamer::EmitSymbolDesc(MCSymbol *Symbol, unsigned DescValue) {
242   OS << ".desc" << ' ' << *Symbol << ',' << DescValue;
243   EmitEOL();
244 }
245
246 void MCAsmStreamer::EmitCommonSymbol(MCSymbol *Symbol, unsigned Size,
247                                      unsigned ByteAlignment) {
248   OS << MAI.getCOMMDirective() << *Symbol << ',' << Size;
249   if (ByteAlignment != 0 && MAI.getCOMMDirectiveTakesAlignment()) {
250     if (MAI.getAlignmentIsInBytes())
251       OS << ',' << ByteAlignment;
252     else
253       OS << ',' << Log2_32(ByteAlignment);
254   }
255   EmitEOL();
256 }
257
258 void MCAsmStreamer::EmitZerofill(const MCSection *Section, MCSymbol *Symbol,
259                                  unsigned Size, unsigned ByteAlignment) {
260   // Note: a .zerofill directive does not switch sections.
261   OS << ".zerofill ";
262   
263   // This is a mach-o specific directive.
264   const MCSectionMachO *MOSection = ((const MCSectionMachO*)Section);
265   OS << MOSection->getSegmentName() << "," << MOSection->getSectionName();
266   
267   if (Symbol != NULL) {
268     OS << ',' << *Symbol << ',' << Size;
269     if (ByteAlignment != 0)
270       OS << ',' << Log2_32(ByteAlignment);
271   }
272   EmitEOL();
273 }
274
275 static inline char toOctal(int X) { return (X&7)+'0'; }
276
277 void MCAsmStreamer::EmitBytes(StringRef Data, unsigned AddrSpace) {
278   assert(CurSection && "Cannot emit contents before setting section!");
279   if (Data.empty()) return;
280   
281   if (Data.size() == 1) {
282     OS << MAI.getData8bitsDirective(AddrSpace);
283     OS << (unsigned)(unsigned char)Data[0];
284     EmitEOL();
285     return;
286   }
287
288   // If the data ends with 0 and the target supports .asciz, use it, otherwise
289   // use .ascii
290   if (MAI.getAscizDirective() && Data.back() == 0) {
291     OS << MAI.getAscizDirective();
292     Data = Data.substr(0, Data.size()-1);
293   } else {
294     OS << MAI.getAsciiDirective();
295   }
296
297   OS << " \"";
298   for (unsigned i = 0, e = Data.size(); i != e; ++i) {
299     unsigned char C = Data[i];
300     if (C == '"' || C == '\\') {
301       OS << '\\' << (char)C;
302       continue;
303     }
304     
305     if (isprint((unsigned char)C)) {
306       OS << (char)C;
307       continue;
308     }
309     
310     switch (C) {
311     case '\b': OS << "\\b"; break;
312     case '\f': OS << "\\f"; break;
313     case '\n': OS << "\\n"; break;
314     case '\r': OS << "\\r"; break;
315     case '\t': OS << "\\t"; break;
316     default:
317       OS << '\\';
318       OS << toOctal(C >> 6);
319       OS << toOctal(C >> 3);
320       OS << toOctal(C >> 0);
321       break;
322     }
323   }
324   OS << '"';
325   EmitEOL();
326 }
327
328 /// EmitIntValue - Special case of EmitValue that avoids the client having
329 /// to pass in a MCExpr for constant integers.
330 void MCAsmStreamer::EmitIntValue(uint64_t Value, unsigned Size,
331                                  unsigned AddrSpace) {
332   assert(CurSection && "Cannot emit contents before setting section!");
333   const char *Directive = 0;
334   switch (Size) {
335   default: break;
336   case 1: Directive = MAI.getData8bitsDirective(AddrSpace); break;
337   case 2: Directive = MAI.getData16bitsDirective(AddrSpace); break;
338   case 4: Directive = MAI.getData32bitsDirective(AddrSpace); break;
339   case 8:
340     Directive = MAI.getData64bitsDirective(AddrSpace);
341     // If the target doesn't support 64-bit data, emit as two 32-bit halves.
342     if (Directive) break;
343     if (isLittleEndian()) {
344       EmitIntValue((uint32_t)(Value >> 0 ), 4, AddrSpace);
345       EmitIntValue((uint32_t)(Value >> 32), 4, AddrSpace);
346     } else {
347       EmitIntValue((uint32_t)(Value >> 32), 4, AddrSpace);
348       EmitIntValue((uint32_t)(Value >> 0 ), 4, AddrSpace);
349     }
350     return;
351   }
352   
353   assert(Directive && "Invalid size for machine code value!");
354   OS << Directive << truncateToSize(Value, Size);
355   EmitEOL();
356 }
357
358 void MCAsmStreamer::EmitValue(const MCExpr *Value, unsigned Size,
359                               unsigned AddrSpace) {
360   assert(CurSection && "Cannot emit contents before setting section!");
361   const char *Directive = 0;
362   switch (Size) {
363   default: break;
364   case 1: Directive = MAI.getData8bitsDirective(AddrSpace); break;
365   case 2: Directive = MAI.getData16bitsDirective(AddrSpace); break;
366   case 4: Directive = MAI.getData32bitsDirective(AddrSpace); break;
367   case 8: Directive = MAI.getData64bitsDirective(AddrSpace); break;
368   }
369   
370   assert(Directive && "Invalid size for machine code value!");
371   OS << Directive << *truncateToSize(Value, Size);
372   EmitEOL();
373 }
374
375 /// EmitFill - Emit NumBytes bytes worth of the value specified by
376 /// FillValue.  This implements directives such as '.space'.
377 void MCAsmStreamer::EmitFill(uint64_t NumBytes, uint8_t FillValue,
378                              unsigned AddrSpace) {
379   if (NumBytes == 0) return;
380   
381   if (AddrSpace == 0)
382     if (const char *ZeroDirective = MAI.getZeroDirective()) {
383       OS << ZeroDirective << NumBytes;
384       if (FillValue != 0)
385         OS << ',' << (int)FillValue;
386       EmitEOL();
387       return;
388     }
389
390   // Emit a byte at a time.
391   MCStreamer::EmitFill(NumBytes, FillValue, AddrSpace);
392 }
393
394 void MCAsmStreamer::EmitValueToAlignment(unsigned ByteAlignment, int64_t Value,
395                                          unsigned ValueSize,
396                                          unsigned MaxBytesToEmit) {
397   // Some assemblers don't support non-power of two alignments, so we always
398   // emit alignments as a power of two if possible.
399   if (isPowerOf2_32(ByteAlignment)) {
400     switch (ValueSize) {
401     default: llvm_unreachable("Invalid size for machine code value!");
402     case 1: OS << MAI.getAlignDirective(); break;
403     // FIXME: use MAI for this!
404     case 2: OS << ".p2alignw "; break;
405     case 4: OS << ".p2alignl "; break;
406     case 8: llvm_unreachable("Unsupported alignment size!");
407     }
408     
409     if (MAI.getAlignmentIsInBytes())
410       OS << ByteAlignment;
411     else
412       OS << Log2_32(ByteAlignment);
413
414     if (Value || MaxBytesToEmit) {
415       OS << ", 0x";
416       OS.write_hex(truncateToSize(Value, ValueSize));
417
418       if (MaxBytesToEmit) 
419         OS << ", " << MaxBytesToEmit;
420     }
421     EmitEOL();
422     return;
423   }
424   
425   // Non-power of two alignment.  This is not widely supported by assemblers.
426   // FIXME: Parameterize this based on MAI.
427   switch (ValueSize) {
428   default: llvm_unreachable("Invalid size for machine code value!");
429   case 1: OS << ".balign";  break;
430   case 2: OS << ".balignw"; break;
431   case 4: OS << ".balignl"; break;
432   case 8: llvm_unreachable("Unsupported alignment size!");
433   }
434
435   OS << ' ' << ByteAlignment;
436   OS << ", " << truncateToSize(Value, ValueSize);
437   if (MaxBytesToEmit) 
438     OS << ", " << MaxBytesToEmit;
439   EmitEOL();
440 }
441
442 void MCAsmStreamer::EmitValueToOffset(const MCExpr *Offset,
443                                       unsigned char Value) {
444   // FIXME: Verify that Offset is associated with the current section.
445   OS << ".org " << *Offset << ", " << (unsigned) Value;
446   EmitEOL();
447 }
448
449 void MCAsmStreamer::EmitInstruction(const MCInst &Inst) {
450   assert(CurSection && "Cannot emit contents before setting section!");
451
452   // If we have an AsmPrinter, use that to print.
453   if (InstPrinter) {
454     InstPrinter->printInst(&Inst);
455     EmitEOL();
456
457     // Show the encoding if we have a code emitter.
458     if (Emitter) {
459       SmallString<256> Code;
460       raw_svector_ostream VecOS(Code);
461       Emitter->EncodeInstruction(Inst, VecOS);
462       VecOS.flush();
463   
464       OS.indent(20);
465       OS << " # encoding: [";
466       for (unsigned i = 0, e = Code.size(); i != e; ++i) {
467         if (i)
468           OS << ',';
469         OS << format("%#04x", uint8_t(Code[i]));
470       }
471       OS << "]\n";
472     }
473
474     return;
475   }
476
477   // Otherwise fall back to a structural printing for now. Eventually we should
478   // always have access to the target specific printer.
479   Inst.print(OS, &MAI);
480   EmitEOL();
481 }
482
483 void MCAsmStreamer::Finish() {
484   OS.flush();
485 }
486     
487 MCStreamer *llvm::createAsmStreamer(MCContext &Context,
488                                     formatted_raw_ostream &OS,
489                                     const MCAsmInfo &MAI, bool isLittleEndian,
490                                     bool isVerboseAsm, MCInstPrinter *IP,
491                                     MCCodeEmitter *CE) {
492   return new MCAsmStreamer(Context, OS, MAI, isLittleEndian, isVerboseAsm,
493                            IP, CE);
494 }