Don't reach into the middle of TargetMachine and cache one of its ivars.
[oota-llvm.git] / lib / Target / Mangler.cpp
1 //===-- Mangler.cpp - Self-contained c/asm llvm name mangler --------------===//
2 //
3 //                     The LLVM Compiler Infrastructure
4 //
5 // This file is distributed under the University of Illinois Open Source
6 // License. See LICENSE.TXT for details.
7 //
8 //===----------------------------------------------------------------------===//
9 //
10 // Unified name mangler for assembly backends.
11 //
12 //===----------------------------------------------------------------------===//
13
14 #include "llvm/Target/Mangler.h"
15 #include "llvm/ADT/SmallString.h"
16 #include "llvm/ADT/Twine.h"
17 #include "llvm/IR/DataLayout.h"
18 #include "llvm/IR/DerivedTypes.h"
19 #include "llvm/IR/Function.h"
20 #include "llvm/MC/MCAsmInfo.h"
21 #include "llvm/MC/MCContext.h"
22 #include "llvm/Target/TargetMachine.h"
23 #include "llvm/Support/raw_ostream.h"
24 using namespace llvm;
25
26 static bool isAcceptableChar(char C, bool AllowPeriod, bool AllowUTF8) {
27   if ((C < 'a' || C > 'z') &&
28       (C < 'A' || C > 'Z') &&
29       (C < '0' || C > '9') &&
30       C != '_' && C != '$' && C != '@' &&
31       !(AllowPeriod && C == '.') &&
32       !(AllowUTF8 && (C & 0x80)))
33     return false;
34   return true;
35 }
36
37 static char HexDigit(int V) {
38   return V < 10 ? V+'0' : V+'A'-10;
39 }
40
41 static void MangleLetter(SmallVectorImpl<char> &OutName, unsigned char C) {
42   OutName.push_back('_');
43   OutName.push_back(HexDigit(C >> 4));
44   OutName.push_back(HexDigit(C & 15));
45   OutName.push_back('_');
46 }
47
48 /// NameNeedsEscaping - Return true if the identifier \p Str needs quotes
49 /// for this assembler.
50 static bool NameNeedsEscaping(StringRef Str, const MCAsmInfo &MAI) {
51   assert(!Str.empty() && "Cannot create an empty MCSymbol");
52   
53   // If the first character is a number and the target does not allow this, we
54   // need quotes.
55   if (!MAI.doesAllowNameToStartWithDigit() && Str[0] >= '0' && Str[0] <= '9')
56     return true;
57   
58   // If any of the characters in the string is an unacceptable character, force
59   // quotes.
60   bool AllowPeriod = MAI.doesAllowPeriodsInName();
61   bool AllowUTF8 = MAI.doesAllowUTF8();
62   for (unsigned i = 0, e = Str.size(); i != e; ++i)
63     if (!isAcceptableChar(Str[i], AllowPeriod, AllowUTF8))
64       return true;
65   return false;
66 }
67
68 /// appendMangledName - Add the specified string in mangled form if it uses
69 /// any unusual characters.
70 static void appendMangledName(SmallVectorImpl<char> &OutName, StringRef Str,
71                               const MCAsmInfo &MAI) {
72   // The first character is not allowed to be a number unless the target
73   // explicitly allows it.
74   if (!MAI.doesAllowNameToStartWithDigit() && Str[0] >= '0' && Str[0] <= '9') {
75     MangleLetter(OutName, Str[0]);
76     Str = Str.substr(1);
77   }
78
79   bool AllowPeriod = MAI.doesAllowPeriodsInName();
80   bool AllowUTF8 = MAI.doesAllowUTF8();
81   for (unsigned i = 0, e = Str.size(); i != e; ++i) {
82     if (!isAcceptableChar(Str[i], AllowPeriod, AllowUTF8))
83       MangleLetter(OutName, Str[i]);
84     else
85       OutName.push_back(Str[i]);
86   }
87 }
88
89
90 /// appendMangledQuotedName - On systems that support quoted symbols, we still
91 /// have to escape some (obscure) characters like " and \n which would break the
92 /// assembler's lexing.
93 static void appendMangledQuotedName(SmallVectorImpl<char> &OutName,
94                                    StringRef Str) {
95   for (unsigned i = 0, e = Str.size(); i != e; ++i) {
96     if (Str[i] == '"' || Str[i] == '\n')
97       MangleLetter(OutName, Str[i]);
98     else
99       OutName.push_back(Str[i]);
100   }
101 }
102
103
104 /// getNameWithPrefix - Fill OutName with the name of the appropriate prefix
105 /// and the specified name as the global variable name.  GVName must not be
106 /// empty.
107 void Mangler::getNameWithPrefix(SmallVectorImpl<char> &OutName,
108                                 const Twine &GVName, ManglerPrefixTy PrefixTy) {
109   SmallString<256> TmpData;
110   StringRef Name = GVName.toStringRef(TmpData);
111   assert(!Name.empty() && "getNameWithPrefix requires non-empty name");
112   
113   const MCAsmInfo &MAI = Context.getAsmInfo();
114   
115   // If the global name is not led with \1, add the appropriate prefixes.
116   if (Name[0] == '\1') {
117     Name = Name.substr(1);
118   } else {
119     if (PrefixTy == Mangler::Private) {
120       const char *Prefix = MAI.getPrivateGlobalPrefix();
121       OutName.append(Prefix, Prefix+strlen(Prefix));
122     } else if (PrefixTy == Mangler::LinkerPrivate) {
123       const char *Prefix = MAI.getLinkerPrivateGlobalPrefix();
124       OutName.append(Prefix, Prefix+strlen(Prefix));
125     }
126
127     const char *Prefix = MAI.getGlobalPrefix();
128     if (Prefix[0] == 0)
129       ; // Common noop, no prefix.
130     else if (Prefix[1] == 0)
131       OutName.push_back(Prefix[0]);  // Common, one character prefix.
132     else
133       OutName.append(Prefix, Prefix+strlen(Prefix)); // Arbitrary length prefix.
134   }
135   
136   // If this is a simple string that doesn't need escaping, just append it.
137   if (!NameNeedsEscaping(Name, MAI) ||
138       // If quotes are supported, they can be used unless the string contains
139       // a quote or newline.
140       (MAI.doesAllowQuotesInName() &&
141        Name.find_first_of("\n\"") == StringRef::npos)) {
142     OutName.append(Name.begin(), Name.end());
143     return;
144   }
145   
146   // On systems that do not allow quoted names, we need to mangle most
147   // strange characters.
148   if (!MAI.doesAllowQuotesInName())
149     return appendMangledName(OutName, Name, MAI);
150   
151   // Okay, the system allows quoted strings.  We can quote most anything, the
152   // only characters that need escaping are " and \n.
153   assert(Name.find_first_of("\n\"") != StringRef::npos);
154   return appendMangledQuotedName(OutName, Name);
155 }
156
157 /// AddFastCallStdCallSuffix - Microsoft fastcall and stdcall functions require
158 /// a suffix on their name indicating the number of words of arguments they
159 /// take.
160 static void AddFastCallStdCallSuffix(SmallVectorImpl<char> &OutName,
161                                      const Function *F, const DataLayout &TD) {
162   // Calculate arguments size total.
163   unsigned ArgWords = 0;
164   for (Function::const_arg_iterator AI = F->arg_begin(), AE = F->arg_end();
165        AI != AE; ++AI) {
166     Type *Ty = AI->getType();
167     // 'Dereference' type in case of byval parameter attribute
168     if (AI->hasByValAttr())
169       Ty = cast<PointerType>(Ty)->getElementType();
170     // Size should be aligned to DWORD boundary
171     ArgWords += ((TD.getTypeAllocSize(Ty) + 3)/4)*4;
172   }
173   
174   raw_svector_ostream(OutName) << '@' << ArgWords;
175 }
176
177
178 /// getNameWithPrefix - Fill OutName with the name of the appropriate prefix
179 /// and the specified global variable's name.  If the global variable doesn't
180 /// have a name, this fills in a unique name for the global.
181 void Mangler::getNameWithPrefix(SmallVectorImpl<char> &OutName,
182                                 const GlobalValue *GV,
183                                 bool isImplicitlyPrivate) {
184   ManglerPrefixTy PrefixTy = Mangler::Default;
185   if (GV->hasPrivateLinkage() || isImplicitlyPrivate)
186     PrefixTy = Mangler::Private;
187   else if (GV->hasLinkerPrivateLinkage() || GV->hasLinkerPrivateWeakLinkage())
188     PrefixTy = Mangler::LinkerPrivate;
189   
190   // If this global has a name, handle it simply.
191   if (GV->hasName()) {
192     StringRef Name = GV->getName();
193     getNameWithPrefix(OutName, Name, PrefixTy);
194     // No need to do anything else if the global has the special "do not mangle"
195     // flag in the name.
196     if (Name[0] == 1)
197       return;
198   } else {
199     // Get the ID for the global, assigning a new one if we haven't got one
200     // already.
201     unsigned &ID = AnonGlobalIDs[GV];
202     if (ID == 0) ID = NextAnonGlobalID++;
203   
204     // Must mangle the global into a unique ID.
205     getNameWithPrefix(OutName, "__unnamed_" + Twine(ID), PrefixTy);
206   }
207   
208   // If we are supposed to add a microsoft-style suffix for stdcall/fastcall,
209   // add it.
210   if (Context.getAsmInfo().hasMicrosoftFastStdCallMangling()) {
211     if (const Function *F = dyn_cast<Function>(GV)) {
212       CallingConv::ID CC = F->getCallingConv();
213     
214       // fastcall functions need to start with @.
215       // FIXME: This logic seems unlikely to be right.
216       if (CC == CallingConv::X86_FastCall) {
217         if (OutName[0] == '_')
218           OutName[0] = '@';
219         else
220           OutName.insert(OutName.begin(), '@');
221       }
222     
223       // fastcall and stdcall functions usually need @42 at the end to specify
224       // the argument info.
225       FunctionType *FT = F->getFunctionType();
226       if ((CC == CallingConv::X86_FastCall || CC == CallingConv::X86_StdCall) &&
227           // "Pure" variadic functions do not receive @0 suffix.
228           (!FT->isVarArg() || FT->getNumParams() == 0 ||
229            (FT->getNumParams() == 1 && F->hasStructRetAttr())))
230         AddFastCallStdCallSuffix(OutName, F, *TM->getDataLayout());
231     }
232   }
233 }
234
235 /// getSymbol - Return the MCSymbol for the specified global value.  This
236 /// symbol is the main label that is the address of the global.
237 MCSymbol *Mangler::getSymbol(const GlobalValue *GV) {
238   SmallString<60> NameStr;
239   getNameWithPrefix(NameStr, GV, false);
240   return Context.GetOrCreateSymbol(NameStr.str());
241 }
242
243