add some comments: MCContext owns the MCSections, but it bump pointer allocates
[oota-llvm.git] / lib / MC / MCAsmStreamer.cpp
1 //===- lib/MC/MCAsmStreamer.cpp - Text Assembly Output --------------------===//
2 //
3 //                     The LLVM Compiler Infrastructure
4 //
5 // This file is distributed under the University of Illinois Open Source
6 // License. See LICENSE.TXT for details.
7 //
8 //===----------------------------------------------------------------------===//
9
10 #include "llvm/MC/MCStreamer.h"
11
12 #include "llvm/MC/MCContext.h"
13 #include "llvm/MC/MCInst.h"
14 #include "llvm/MC/MCSectionMachO.h"
15 #include "llvm/MC/MCSymbol.h"
16 #include "llvm/MC/MCValue.h"
17 #include "llvm/Support/ErrorHandling.h"
18 #include "llvm/Support/raw_ostream.h"
19
20 using namespace llvm;
21
22 namespace {
23
24   class MCAsmStreamer : public MCStreamer {
25     raw_ostream &OS;
26
27     MCSection *CurSection;
28
29   public:
30     MCAsmStreamer(MCContext &Context, raw_ostream &_OS)
31       : MCStreamer(Context), OS(_OS), CurSection(0) {}
32     ~MCAsmStreamer() {}
33
34     /// @name MCStreamer Interface
35     /// @{
36
37     virtual void SwitchSection(MCSection *Section);
38
39     virtual void EmitLabel(MCSymbol *Symbol);
40
41     virtual void EmitAssemblerFlag(AssemblerFlag Flag);
42
43     virtual void EmitAssignment(MCSymbol *Symbol, const MCValue &Value,
44                                 bool MakeAbsolute = false);
45
46     virtual void EmitSymbolAttribute(MCSymbol *Symbol, SymbolAttr Attribute);
47
48     virtual void EmitSymbolDesc(MCSymbol *Symbol, unsigned DescValue);
49
50     virtual void EmitLocalSymbol(MCSymbol *Symbol, const MCValue &Value);
51
52     virtual void EmitCommonSymbol(MCSymbol *Symbol, unsigned Size,
53                                   unsigned Pow2Alignment, bool IsLocal);
54
55     virtual void EmitZerofill(MCSection *Section, MCSymbol *Symbol = NULL,
56                               unsigned Size = 0, unsigned Pow2Alignment = 0);
57
58     virtual void EmitBytes(const StringRef &Data);
59
60     virtual void EmitValue(const MCValue &Value, unsigned Size);
61
62     virtual void EmitValueToAlignment(unsigned ByteAlignment, int64_t Value = 0,
63                                       unsigned ValueSize = 1,
64                                       unsigned MaxBytesToEmit = 0);
65
66     virtual void EmitValueToOffset(const MCValue &Offset, 
67                                    unsigned char Value = 0);
68     
69     virtual void EmitInstruction(const MCInst &Inst);
70
71     virtual void Finish();
72     
73     /// @}
74   };
75
76 }
77
78 /// NeedsQuoting - Return true if the string \arg Str needs quoting, i.e., it
79 /// does not match [a-zA-Z_.][a-zA-Z0-9_.]*.
80 //
81 // FIXME: This could be more permissive, do we care?
82 static inline bool NeedsQuoting(const StringRef &Str) {
83   if (Str.empty())
84     return true;
85
86   // Check that first character is in [a-zA-Z_.].
87   if (!((Str[0] >= 'a' && Str[0] <= 'z') ||
88         (Str[0] >= 'A' && Str[0] <= 'Z') ||
89         (Str[0] == '_' || Str[0] == '.')))
90     return true;
91
92   // Check subsequent characters are in [a-zA-Z0-9_.].
93   for (unsigned i = 1, e = Str.size(); i != e; ++i)
94     if (!((Str[i] >= 'a' && Str[i] <= 'z') ||
95           (Str[i] >= 'A' && Str[i] <= 'Z') ||
96           (Str[i] >= '0' && Str[i] <= '9') ||
97           (Str[i] == '_' || Str[i] == '.')))
98       return true;
99
100   return false;
101 }
102
103 /// Allow printing symbols directly to a raw_ostream with proper quoting.
104 static inline raw_ostream &operator<<(raw_ostream &os, const MCSymbol *S) {
105   if (NeedsQuoting(S->getName()))
106     return os << '"' << S->getName() << '"';
107   return os << S->getName();
108 }
109
110 /// Allow printing values directly to a raw_ostream.
111 static inline raw_ostream &operator<<(raw_ostream &os, const MCValue &Value) {
112   if (Value.getSymA()) {
113     os << Value.getSymA();
114     if (Value.getSymB())
115       os << " - " << Value.getSymB();
116     if (Value.getConstant())
117       os << " + " << Value.getConstant();
118   } else {
119     assert(!Value.getSymB() && "Invalid machine code value!");
120     os << Value.getConstant();
121   }
122
123   return os;
124 }
125
126 static inline int64_t truncateToSize(int64_t Value, unsigned Bytes) {
127   assert(Bytes && "Invalid size!");
128   return Value & ((uint64_t) (int64_t) -1 >> (64 - Bytes * 8));
129 }
130
131 static inline MCValue truncateToSize(const MCValue &Value, unsigned Bytes) {
132   return MCValue::get(Value.getSymA(), Value.getSymB(), 
133                       truncateToSize(Value.getConstant(), Bytes));
134 }
135
136 void MCAsmStreamer::SwitchSection(MCSection *Section) {
137   if (Section != CurSection) {
138     CurSection = Section;
139
140     // FIXME: Needs TargetAsmInfo!
141     Section->PrintSwitchToSection(*(const TargetAsmInfo*)0, OS);
142   }
143 }
144
145 void MCAsmStreamer::EmitLabel(MCSymbol *Symbol) {
146   assert(Symbol->getSection() == 0 && "Cannot emit a symbol twice!");
147   assert(CurSection && "Cannot emit before setting section!");
148   assert(!getContext().GetSymbolValue(Symbol) && 
149          "Cannot emit symbol which was directly assigned to!");
150
151   OS << Symbol << ":\n";
152   Symbol->setSection(CurSection);
153   Symbol->setExternal(false);
154 }
155
156 void MCAsmStreamer::EmitAssemblerFlag(AssemblerFlag Flag) {
157   switch (Flag) {
158   case SubsectionsViaSymbols: OS << ".subsections_via_symbols"; break;
159   }
160   OS << '\n';
161 }
162
163 void MCAsmStreamer::EmitAssignment(MCSymbol *Symbol, const MCValue &Value,
164                                    bool MakeAbsolute) {
165   assert(!Symbol->getSection() && "Cannot assign to a label!");
166
167   if (MakeAbsolute) {
168     OS << ".set " << Symbol << ", " << Value << '\n';
169   } else {
170     OS << Symbol << " = " << Value << '\n';
171   }
172
173   getContext().SetSymbolValue(Symbol, Value);
174 }
175
176 void MCAsmStreamer::EmitSymbolAttribute(MCSymbol *Symbol, 
177                                         SymbolAttr Attribute) {
178   switch (Attribute) {
179   case Global: OS << ".globl"; break;
180   case Hidden: OS << ".hidden"; break;
181   case IndirectSymbol: OS << ".indirect_symbol"; break;
182   case Internal: OS << ".internal"; break;
183   case LazyReference: OS << ".lazy_reference"; break;
184   case NoDeadStrip: OS << ".no_dead_strip"; break;
185   case PrivateExtern: OS << ".private_extern"; break;
186   case Protected: OS << ".protected"; break;
187   case Reference: OS << ".reference"; break;
188   case Weak: OS << ".weak"; break;
189   case WeakDefinition: OS << ".weak_definition"; break;
190   case WeakReference: OS << ".weak_reference"; break;
191   }
192
193   OS << ' ' << Symbol << '\n';
194 }
195
196 void MCAsmStreamer::EmitSymbolDesc(MCSymbol *Symbol, unsigned DescValue) {
197   OS << ".desc" << ' ' << Symbol << ',' << DescValue << '\n';
198 }
199
200 void MCAsmStreamer::EmitLocalSymbol(MCSymbol *Symbol, const MCValue &Value) {
201   OS << ".lsym" << ' ' << Symbol << ',' << Value << '\n';
202 }
203
204 void MCAsmStreamer::EmitCommonSymbol(MCSymbol *Symbol, unsigned Size,
205                                      unsigned Pow2Alignment, bool IsLocal) {
206   if (IsLocal)
207     OS << ".lcomm";
208   else
209     OS << ".comm";
210   OS << ' ' << Symbol << ',' << Size;
211   if (Pow2Alignment != 0)
212     OS << ',' << Pow2Alignment;
213   OS << '\n';
214 }
215
216 void MCAsmStreamer::EmitZerofill(MCSection *Section, MCSymbol *Symbol,
217                                  unsigned Size, unsigned Pow2Alignment) {
218   // Note: a .zerofill directive does not switch sections
219   // FIXME: Really we would like the segment and section names as well as the
220   // section type to be separate values instead of embedded in the name. Not
221   // all assemblers understand all this stuff though.
222   OS << ".zerofill ";
223   
224   // This is a mach-o specific directive.
225   const MCSectionMachO *MOSection = ((const MCSectionMachO*)Section);
226   OS << '"' << MOSection->getSegmentName() << ","
227      << MOSection->getSectionName() << '"';
228   
229   
230   if (Symbol != NULL) {
231     OS << ',' << Symbol << ',' << Size;
232     if (Pow2Alignment != 0)
233       OS << ',' << Pow2Alignment;
234   }
235   OS << '\n';
236 }
237
238 void MCAsmStreamer::EmitBytes(const StringRef &Data) {
239   assert(CurSection && "Cannot emit contents before setting section!");
240   for (unsigned i = 0, e = Data.size(); i != e; ++i)
241     OS << ".byte " << (unsigned) Data[i] << '\n';
242 }
243
244 void MCAsmStreamer::EmitValue(const MCValue &Value, unsigned Size) {
245   assert(CurSection && "Cannot emit contents before setting section!");
246   // Need target hooks to know how to print this.
247   switch (Size) {
248   default:
249     llvm_unreachable("Invalid size for machine code value!");
250   case 1: OS << ".byte"; break;
251   case 2: OS << ".short"; break;
252   case 4: OS << ".long"; break;
253   case 8: OS << ".quad"; break;
254   }
255
256   OS << ' ' << truncateToSize(Value, Size) << '\n';
257 }
258
259 void MCAsmStreamer::EmitValueToAlignment(unsigned ByteAlignment, int64_t Value,
260                                          unsigned ValueSize,
261                                          unsigned MaxBytesToEmit) {
262   // Some assemblers don't support .balign, so we always emit as .p2align if
263   // this is a power of two. Otherwise we assume the client knows the target
264   // supports .balign and use that.
265   unsigned Pow2 = Log2_32(ByteAlignment);
266   bool IsPow2 = (1U << Pow2) == ByteAlignment;
267
268   switch (ValueSize) {
269   default:
270     llvm_unreachable("Invalid size for machine code value!");
271   case 8:
272     llvm_unreachable("Unsupported alignment size!");
273   case 1: OS << (IsPow2 ? ".p2align" : ".balign"); break;
274   case 2: OS << (IsPow2 ? ".p2alignw" : ".balignw"); break;
275   case 4: OS << (IsPow2 ? ".p2alignl" : ".balignl"); break;
276   }
277
278   OS << ' ' << (IsPow2 ? Pow2 : ByteAlignment);
279
280   OS << ", " << truncateToSize(Value, ValueSize);
281   if (MaxBytesToEmit) 
282     OS << ", " << MaxBytesToEmit;
283   OS << '\n';
284 }
285
286 void MCAsmStreamer::EmitValueToOffset(const MCValue &Offset, 
287                                       unsigned char Value) {
288   // FIXME: Verify that Offset is associated with the current section.
289   OS << ".org " << Offset << ", " << (unsigned) Value << '\n';
290 }
291
292 static raw_ostream &operator<<(raw_ostream &OS, const MCOperand &Op) {
293   if (Op.isReg())
294     return OS << "reg:" << Op.getReg();
295   if (Op.isImm())
296     return OS << "imm:" << Op.getImm();
297   if (Op.isMBBLabel())
298     return OS << "mbblabel:(" 
299               << Op.getMBBLabelFunction() << ", " << Op.getMBBLabelBlock();
300   assert(Op.isMCValue() && "Invalid operand!");
301   return OS << "val:" << Op.getMCValue();
302 }
303
304 void MCAsmStreamer::EmitInstruction(const MCInst &Inst) {
305   assert(CurSection && "Cannot emit contents before setting section!");
306   // FIXME: Implement proper printing.
307   OS << "MCInst("
308      << "opcode=" << Inst.getOpcode() << ", "
309      << "operands=[";
310   for (unsigned i = 0, e = Inst.getNumOperands(); i != e; ++i) {
311     if (i)
312       OS << ", ";
313     OS << Inst.getOperand(i);
314   }
315   OS << "])\n";
316 }
317
318 void MCAsmStreamer::Finish() {
319   OS.flush();
320 }
321     
322 MCStreamer *llvm::createAsmStreamer(MCContext &Context, raw_ostream &OS) {
323   return new MCAsmStreamer(Context, OS);
324 }