[RuntimeDyld] Make sure code-sections aren't under-aligned.
[oota-llvm.git] / lib / ExecutionEngine / RuntimeDyld / RuntimeDyld.cpp
1 //===-- RuntimeDyld.cpp - Run-time dynamic linker for MC-JIT ----*- C++ -*-===//
2 //
3 //                     The LLVM Compiler Infrastructure
4 //
5 // This file is distributed under the University of Illinois Open Source
6 // License. See LICENSE.TXT for details.
7 //
8 //===----------------------------------------------------------------------===//
9 //
10 // Implementation of the MC-JIT runtime dynamic linker.
11 //
12 //===----------------------------------------------------------------------===//
13
14 #include "llvm/ExecutionEngine/RuntimeDyld.h"
15 #include "RuntimeDyldCheckerImpl.h"
16 #include "RuntimeDyldCOFF.h"
17 #include "RuntimeDyldELF.h"
18 #include "RuntimeDyldImpl.h"
19 #include "RuntimeDyldMachO.h"
20 #include "llvm/Object/ELFObjectFile.h"
21 #include "llvm/Object/COFF.h"
22 #include "llvm/Support/MathExtras.h"
23 #include "llvm/Support/MutexGuard.h"
24
25 using namespace llvm;
26 using namespace llvm::object;
27
28 #define DEBUG_TYPE "dyld"
29
30 // Empty out-of-line virtual destructor as the key function.
31 RuntimeDyldImpl::~RuntimeDyldImpl() {}
32
33 // Pin LoadedObjectInfo's vtables to this file.
34 void RuntimeDyld::LoadedObjectInfo::anchor() {}
35
36 namespace llvm {
37
38 void RuntimeDyldImpl::registerEHFrames() {}
39
40 void RuntimeDyldImpl::deregisterEHFrames() {}
41
42 #ifndef NDEBUG
43 static void dumpSectionMemory(const SectionEntry &S, StringRef State) {
44   dbgs() << "----- Contents of section " << S.Name << " " << State << " -----";
45
46   if (S.Address == nullptr) {
47     dbgs() << "\n          <section not emitted>\n";
48     return;
49   }
50
51   const unsigned ColsPerRow = 16;
52
53   uint8_t *DataAddr = S.Address;
54   uint64_t LoadAddr = S.LoadAddress;
55
56   unsigned StartPadding = LoadAddr & (ColsPerRow - 1);
57   unsigned BytesRemaining = S.Size;
58
59   if (StartPadding) {
60     dbgs() << "\n" << format("0x%016" PRIx64,
61                              LoadAddr & ~(uint64_t)(ColsPerRow - 1)) << ":";
62     while (StartPadding--)
63       dbgs() << "   ";
64   }
65
66   while (BytesRemaining > 0) {
67     if ((LoadAddr & (ColsPerRow - 1)) == 0)
68       dbgs() << "\n" << format("0x%016" PRIx64, LoadAddr) << ":";
69
70     dbgs() << " " << format("%02x", *DataAddr);
71
72     ++DataAddr;
73     ++LoadAddr;
74     --BytesRemaining;
75   }
76
77   dbgs() << "\n";
78 }
79 #endif
80
81 // Resolve the relocations for all symbols we currently know about.
82 void RuntimeDyldImpl::resolveRelocations() {
83   MutexGuard locked(lock);
84
85   // First, resolve relocations associated with external symbols.
86   resolveExternalSymbols();
87
88   // Just iterate over the sections we have and resolve all the relocations
89   // in them. Gross overkill, but it gets the job done.
90   for (int i = 0, e = Sections.size(); i != e; ++i) {
91     // The Section here (Sections[i]) refers to the section in which the
92     // symbol for the relocation is located.  The SectionID in the relocation
93     // entry provides the section to which the relocation will be applied.
94     uint64_t Addr = Sections[i].LoadAddress;
95     DEBUG(dbgs() << "Resolving relocations Section #" << i << "\t"
96                  << format("%p", (uintptr_t)Addr) << "\n");
97     DEBUG(dumpSectionMemory(Sections[i], "before relocations"));
98     resolveRelocationList(Relocations[i], Addr);
99     DEBUG(dumpSectionMemory(Sections[i], "after relocations"));
100     Relocations.erase(i);
101   }
102 }
103
104 void RuntimeDyldImpl::mapSectionAddress(const void *LocalAddress,
105                                         uint64_t TargetAddress) {
106   MutexGuard locked(lock);
107   for (unsigned i = 0, e = Sections.size(); i != e; ++i) {
108     if (Sections[i].Address == LocalAddress) {
109       reassignSectionAddress(i, TargetAddress);
110       return;
111     }
112   }
113   llvm_unreachable("Attempting to remap address of unknown section!");
114 }
115
116 static std::error_code getOffset(const SymbolRef &Sym, SectionRef Sec,
117                                  uint64_t &Result) {
118   ErrorOr<uint64_t> AddressOrErr = Sym.getAddress();
119   if (std::error_code EC = AddressOrErr.getError())
120     return EC;
121   Result = *AddressOrErr - Sec.getAddress();
122   return std::error_code();
123 }
124
125 RuntimeDyldImpl::ObjSectionToIDMap
126 RuntimeDyldImpl::loadObjectImpl(const object::ObjectFile &Obj) {
127   MutexGuard locked(lock);
128
129   // Save information about our target
130   Arch = (Triple::ArchType)Obj.getArch();
131   IsTargetLittleEndian = Obj.isLittleEndian();
132   setMipsABI(Obj);
133
134   // Compute the memory size required to load all sections to be loaded
135   // and pass this information to the memory manager
136   if (MemMgr.needsToReserveAllocationSpace()) {
137     uint64_t CodeSize = 0, DataSizeRO = 0, DataSizeRW = 0;
138     computeTotalAllocSize(Obj, CodeSize, DataSizeRO, DataSizeRW);
139     MemMgr.reserveAllocationSpace(CodeSize, DataSizeRO, DataSizeRW);
140   }
141
142   // Used sections from the object file
143   ObjSectionToIDMap LocalSections;
144
145   // Common symbols requiring allocation, with their sizes and alignments
146   CommonSymbolList CommonSymbols;
147
148   // Parse symbols
149   DEBUG(dbgs() << "Parse symbols:\n");
150   for (symbol_iterator I = Obj.symbol_begin(), E = Obj.symbol_end(); I != E;
151        ++I) {
152     uint32_t Flags = I->getFlags();
153
154     bool IsCommon = Flags & SymbolRef::SF_Common;
155     if (IsCommon)
156       CommonSymbols.push_back(*I);
157     else {
158       object::SymbolRef::Type SymType = I->getType();
159
160       if (SymType == object::SymbolRef::ST_Function ||
161           SymType == object::SymbolRef::ST_Data ||
162           SymType == object::SymbolRef::ST_Unknown) {
163
164         ErrorOr<StringRef> NameOrErr = I->getName();
165         Check(NameOrErr.getError());
166         StringRef Name = *NameOrErr;
167         ErrorOr<section_iterator> SIOrErr = I->getSection();
168         Check(SIOrErr.getError());
169         section_iterator SI = *SIOrErr;
170         if (SI == Obj.section_end())
171           continue;
172         uint64_t SectOffset;
173         Check(getOffset(*I, *SI, SectOffset));
174         StringRef SectionData;
175         Check(SI->getContents(SectionData));
176         bool IsCode = SI->isText();
177         unsigned SectionID =
178             findOrEmitSection(Obj, *SI, IsCode, LocalSections);
179         DEBUG(dbgs() << "\tType: " << SymType << " Name: " << Name
180                      << " SID: " << SectionID << " Offset: "
181                      << format("%p", (uintptr_t)SectOffset)
182                      << " flags: " << Flags << "\n");
183         JITSymbolFlags RTDyldSymFlags = JITSymbolFlags::None;
184         if (Flags & SymbolRef::SF_Weak)
185           RTDyldSymFlags |= JITSymbolFlags::Weak;
186         if (Flags & SymbolRef::SF_Exported)
187           RTDyldSymFlags |= JITSymbolFlags::Exported;
188         GlobalSymbolTable[Name] =
189           SymbolTableEntry(SectionID, SectOffset, RTDyldSymFlags);
190       }
191     }
192   }
193
194   // Allocate common symbols
195   emitCommonSymbols(Obj, CommonSymbols);
196
197   // Parse and process relocations
198   DEBUG(dbgs() << "Parse relocations:\n");
199   for (section_iterator SI = Obj.section_begin(), SE = Obj.section_end();
200        SI != SE; ++SI) {
201     unsigned SectionID = 0;
202     StubMap Stubs;
203     section_iterator RelocatedSection = SI->getRelocatedSection();
204
205     if (RelocatedSection == SE)
206       continue;
207
208     relocation_iterator I = SI->relocation_begin();
209     relocation_iterator E = SI->relocation_end();
210
211     if (I == E && !ProcessAllSections)
212       continue;
213
214     bool IsCode = RelocatedSection->isText();
215     SectionID =
216         findOrEmitSection(Obj, *RelocatedSection, IsCode, LocalSections);
217     DEBUG(dbgs() << "\tSectionID: " << SectionID << "\n");
218
219     for (; I != E;)
220       I = processRelocationRef(SectionID, I, Obj, LocalSections, Stubs);
221
222     // If there is an attached checker, notify it about the stubs for this
223     // section so that they can be verified.
224     if (Checker)
225       Checker->registerStubMap(Obj.getFileName(), SectionID, Stubs);
226   }
227
228   // Give the subclasses a chance to tie-up any loose ends.
229   finalizeLoad(Obj, LocalSections);
230
231 //   for (auto E : LocalSections)
232 //     llvm::dbgs() << "Added: " << E.first.getRawDataRefImpl() << " -> " << E.second << "\n";
233
234   return LocalSections;
235 }
236
237 // A helper method for computeTotalAllocSize.
238 // Computes the memory size required to allocate sections with the given sizes,
239 // assuming that all sections are allocated with the given alignment
240 static uint64_t
241 computeAllocationSizeForSections(std::vector<uint64_t> &SectionSizes,
242                                  uint64_t Alignment) {
243   uint64_t TotalSize = 0;
244   for (size_t Idx = 0, Cnt = SectionSizes.size(); Idx < Cnt; Idx++) {
245     uint64_t AlignedSize =
246         (SectionSizes[Idx] + Alignment - 1) / Alignment * Alignment;
247     TotalSize += AlignedSize;
248   }
249   return TotalSize;
250 }
251
252 static bool isRequiredForExecution(const SectionRef Section) {
253   const ObjectFile *Obj = Section.getObject();
254   if (isa<object::ELFObjectFileBase>(Obj))
255     return ELFSectionRef(Section).getFlags() & ELF::SHF_ALLOC;
256   if (auto *COFFObj = dyn_cast<object::COFFObjectFile>(Obj)) {
257     const coff_section *CoffSection = COFFObj->getCOFFSection(Section);
258     // Avoid loading zero-sized COFF sections.
259     // In PE files, VirtualSize gives the section size, and SizeOfRawData
260     // may be zero for sections with content. In Obj files, SizeOfRawData 
261     // gives the section size, and VirtualSize is always zero. Hence
262     // the need to check for both cases below.
263     bool HasContent = (CoffSection->VirtualSize > 0) 
264       || (CoffSection->SizeOfRawData > 0);
265     bool IsDiscardable = CoffSection->Characteristics &
266       (COFF::IMAGE_SCN_MEM_DISCARDABLE | COFF::IMAGE_SCN_LNK_INFO);
267     return HasContent && !IsDiscardable;
268   }
269   
270   assert(isa<MachOObjectFile>(Obj));
271   return true;
272 }
273
274 static bool isReadOnlyData(const SectionRef Section) {
275   const ObjectFile *Obj = Section.getObject();
276   if (isa<object::ELFObjectFileBase>(Obj))
277     return !(ELFSectionRef(Section).getFlags() &
278              (ELF::SHF_WRITE | ELF::SHF_EXECINSTR));
279   if (auto *COFFObj = dyn_cast<object::COFFObjectFile>(Obj))
280     return ((COFFObj->getCOFFSection(Section)->Characteristics &
281              (COFF::IMAGE_SCN_CNT_INITIALIZED_DATA
282              | COFF::IMAGE_SCN_MEM_READ
283              | COFF::IMAGE_SCN_MEM_WRITE))
284              ==
285              (COFF::IMAGE_SCN_CNT_INITIALIZED_DATA
286              | COFF::IMAGE_SCN_MEM_READ));
287
288   assert(isa<MachOObjectFile>(Obj));
289   return false;
290 }
291
292 static bool isZeroInit(const SectionRef Section) {
293   const ObjectFile *Obj = Section.getObject();
294   if (isa<object::ELFObjectFileBase>(Obj))
295     return ELFSectionRef(Section).getType() == ELF::SHT_NOBITS;
296   if (auto *COFFObj = dyn_cast<object::COFFObjectFile>(Obj))
297     return COFFObj->getCOFFSection(Section)->Characteristics &
298             COFF::IMAGE_SCN_CNT_UNINITIALIZED_DATA;
299
300   auto *MachO = cast<MachOObjectFile>(Obj);
301   unsigned SectionType = MachO->getSectionType(Section);
302   return SectionType == MachO::S_ZEROFILL ||
303          SectionType == MachO::S_GB_ZEROFILL;
304 }
305
306 // Compute an upper bound of the memory size that is required to load all
307 // sections
308 void RuntimeDyldImpl::computeTotalAllocSize(const ObjectFile &Obj,
309                                             uint64_t &CodeSize,
310                                             uint64_t &DataSizeRO,
311                                             uint64_t &DataSizeRW) {
312   // Compute the size of all sections required for execution
313   std::vector<uint64_t> CodeSectionSizes;
314   std::vector<uint64_t> ROSectionSizes;
315   std::vector<uint64_t> RWSectionSizes;
316   uint64_t MaxAlignment = sizeof(void *);
317
318   // Collect sizes of all sections to be loaded;
319   // also determine the max alignment of all sections
320   for (section_iterator SI = Obj.section_begin(), SE = Obj.section_end();
321        SI != SE; ++SI) {
322     const SectionRef &Section = *SI;
323
324     bool IsRequired = isRequiredForExecution(Section);
325
326     // Consider only the sections that are required to be loaded for execution
327     if (IsRequired) {
328       StringRef Name;
329       uint64_t DataSize = Section.getSize();
330       uint64_t Alignment64 = Section.getAlignment();
331       bool IsCode = Section.isText();
332       bool IsReadOnly = isReadOnlyData(Section);
333       Check(Section.getName(Name));
334       unsigned Alignment = (unsigned)Alignment64 & 0xffffffffL;
335
336       uint64_t StubBufSize = computeSectionStubBufSize(Obj, Section);
337       uint64_t SectionSize = DataSize + StubBufSize;
338
339       // The .eh_frame section (at least on Linux) needs an extra four bytes
340       // padded
341       // with zeroes added at the end.  For MachO objects, this section has a
342       // slightly different name, so this won't have any effect for MachO
343       // objects.
344       if (Name == ".eh_frame")
345         SectionSize += 4;
346
347       if (!SectionSize)
348         SectionSize = 1;
349
350       if (IsCode) {
351         CodeSectionSizes.push_back(SectionSize);
352       } else if (IsReadOnly) {
353         ROSectionSizes.push_back(SectionSize);
354       } else {
355         RWSectionSizes.push_back(SectionSize);
356       }
357
358       // update the max alignment
359       if (Alignment > MaxAlignment) {
360         MaxAlignment = Alignment;
361       }
362     }
363   }
364
365   // Compute the size of all common symbols
366   uint64_t CommonSize = 0;
367   for (symbol_iterator I = Obj.symbol_begin(), E = Obj.symbol_end(); I != E;
368        ++I) {
369     uint32_t Flags = I->getFlags();
370     if (Flags & SymbolRef::SF_Common) {
371       // Add the common symbols to a list.  We'll allocate them all below.
372       uint64_t Size = I->getCommonSize();
373       CommonSize += Size;
374     }
375   }
376   if (CommonSize != 0) {
377     RWSectionSizes.push_back(CommonSize);
378   }
379
380   // Compute the required allocation space for each different type of sections
381   // (code, read-only data, read-write data) assuming that all sections are
382   // allocated with the max alignment. Note that we cannot compute with the
383   // individual alignments of the sections, because then the required size
384   // depends on the order, in which the sections are allocated.
385   CodeSize = computeAllocationSizeForSections(CodeSectionSizes, MaxAlignment);
386   DataSizeRO = computeAllocationSizeForSections(ROSectionSizes, MaxAlignment);
387   DataSizeRW = computeAllocationSizeForSections(RWSectionSizes, MaxAlignment);
388 }
389
390 // compute stub buffer size for the given section
391 unsigned RuntimeDyldImpl::computeSectionStubBufSize(const ObjectFile &Obj,
392                                                     const SectionRef &Section) {
393   unsigned StubSize = getMaxStubSize();
394   if (StubSize == 0) {
395     return 0;
396   }
397   // FIXME: this is an inefficient way to handle this. We should computed the
398   // necessary section allocation size in loadObject by walking all the sections
399   // once.
400   unsigned StubBufSize = 0;
401   for (section_iterator SI = Obj.section_begin(), SE = Obj.section_end();
402        SI != SE; ++SI) {
403     section_iterator RelSecI = SI->getRelocatedSection();
404     if (!(RelSecI == Section))
405       continue;
406
407     for (const RelocationRef &Reloc : SI->relocations()) {
408       (void)Reloc;
409       StubBufSize += StubSize;
410     }
411   }
412
413   // Get section data size and alignment
414   uint64_t DataSize = Section.getSize();
415   uint64_t Alignment64 = Section.getAlignment();
416
417   // Add stubbuf size alignment
418   unsigned Alignment = (unsigned)Alignment64 & 0xffffffffL;
419   unsigned StubAlignment = getStubAlignment();
420   unsigned EndAlignment = (DataSize | Alignment) & -(DataSize | Alignment);
421   if (StubAlignment > EndAlignment)
422     StubBufSize += StubAlignment - EndAlignment;
423   return StubBufSize;
424 }
425
426 uint64_t RuntimeDyldImpl::readBytesUnaligned(uint8_t *Src,
427                                              unsigned Size) const {
428   uint64_t Result = 0;
429   if (IsTargetLittleEndian) {
430     Src += Size - 1;
431     while (Size--)
432       Result = (Result << 8) | *Src--;
433   } else
434     while (Size--)
435       Result = (Result << 8) | *Src++;
436
437   return Result;
438 }
439
440 void RuntimeDyldImpl::writeBytesUnaligned(uint64_t Value, uint8_t *Dst,
441                                           unsigned Size) const {
442   if (IsTargetLittleEndian) {
443     while (Size--) {
444       *Dst++ = Value & 0xFF;
445       Value >>= 8;
446     }
447   } else {
448     Dst += Size - 1;
449     while (Size--) {
450       *Dst-- = Value & 0xFF;
451       Value >>= 8;
452     }
453   }
454 }
455
456 void RuntimeDyldImpl::emitCommonSymbols(const ObjectFile &Obj,
457                                         CommonSymbolList &CommonSymbols) {
458   if (CommonSymbols.empty())
459     return;
460
461   uint64_t CommonSize = 0;
462   CommonSymbolList SymbolsToAllocate;
463
464   DEBUG(dbgs() << "Processing common symbols...\n");
465
466   for (const auto &Sym : CommonSymbols) {
467     ErrorOr<StringRef> NameOrErr = Sym.getName();
468     Check(NameOrErr.getError());
469     StringRef Name = *NameOrErr;
470
471     // Skip common symbols already elsewhere.
472     if (GlobalSymbolTable.count(Name) ||
473         Resolver.findSymbolInLogicalDylib(Name)) {
474       DEBUG(dbgs() << "\tSkipping already emitted common symbol '" << Name
475                    << "'\n");
476       continue;
477     }
478
479     uint32_t Align = Sym.getAlignment();
480     uint64_t Size = Sym.getCommonSize();
481
482     CommonSize += Align + Size;
483     SymbolsToAllocate.push_back(Sym);
484   }
485
486   // Allocate memory for the section
487   unsigned SectionID = Sections.size();
488   uint8_t *Addr = MemMgr.allocateDataSection(CommonSize, sizeof(void *),
489                                              SectionID, StringRef(), false);
490   if (!Addr)
491     report_fatal_error("Unable to allocate memory for common symbols!");
492   uint64_t Offset = 0;
493   Sections.push_back(SectionEntry("<common symbols>", Addr, CommonSize, 0));
494   memset(Addr, 0, CommonSize);
495
496   DEBUG(dbgs() << "emitCommonSection SectionID: " << SectionID << " new addr: "
497                << format("%p", Addr) << " DataSize: " << CommonSize << "\n");
498
499   // Assign the address of each symbol
500   for (auto &Sym : SymbolsToAllocate) {
501     uint32_t Align = Sym.getAlignment();
502     uint64_t Size = Sym.getCommonSize();
503     ErrorOr<StringRef> NameOrErr = Sym.getName();
504     Check(NameOrErr.getError());
505     StringRef Name = *NameOrErr;
506     if (Align) {
507       // This symbol has an alignment requirement.
508       uint64_t AlignOffset = OffsetToAlignment((uint64_t)Addr, Align);
509       Addr += AlignOffset;
510       Offset += AlignOffset;
511     }
512     uint32_t Flags = Sym.getFlags();
513     JITSymbolFlags RTDyldSymFlags = JITSymbolFlags::None;
514     if (Flags & SymbolRef::SF_Weak)
515       RTDyldSymFlags |= JITSymbolFlags::Weak;
516     if (Flags & SymbolRef::SF_Exported)
517       RTDyldSymFlags |= JITSymbolFlags::Exported;
518     DEBUG(dbgs() << "Allocating common symbol " << Name << " address "
519                  << format("%p", Addr) << "\n");
520     GlobalSymbolTable[Name] =
521       SymbolTableEntry(SectionID, Offset, RTDyldSymFlags);
522     Offset += Size;
523     Addr += Size;
524   }
525
526   if (Checker)
527     Checker->registerSection(Obj.getFileName(), SectionID);
528 }
529
530 unsigned RuntimeDyldImpl::emitSection(const ObjectFile &Obj,
531                                       const SectionRef &Section, bool IsCode) {
532
533   StringRef data;
534   uint64_t Alignment64 = Section.getAlignment();
535
536   unsigned Alignment = (unsigned)Alignment64 & 0xffffffffL;
537   unsigned PaddingSize = 0;
538   unsigned StubBufSize = 0;
539   StringRef Name;
540   bool IsRequired = isRequiredForExecution(Section);
541   bool IsVirtual = Section.isVirtual();
542   bool IsZeroInit = isZeroInit(Section);
543   bool IsReadOnly = isReadOnlyData(Section);
544   uint64_t DataSize = Section.getSize();
545   Check(Section.getName(Name));
546
547   StubBufSize = computeSectionStubBufSize(Obj, Section);
548
549   // The .eh_frame section (at least on Linux) needs an extra four bytes padded
550   // with zeroes added at the end.  For MachO objects, this section has a
551   // slightly different name, so this won't have any effect for MachO objects.
552   if (Name == ".eh_frame")
553     PaddingSize = 4;
554
555   uintptr_t Allocate;
556   unsigned SectionID = Sections.size();
557   uint8_t *Addr;
558   const char *pData = nullptr;
559
560   // In either case, set the location of the unrelocated section in memory,
561   // since we still process relocations for it even if we're not applying them.
562   Check(Section.getContents(data));
563   // Virtual sections have no data in the object image, so leave pData = 0
564   if (!IsVirtual)
565     pData = data.data();
566
567   // Code section alignment needs to be at least as high as stub alignment or
568   // padding calculations may by incorrect when the section is remapped to a
569   // higher alignment.
570   if (IsCode)
571     Alignment = std::max(Alignment, getStubAlignment());
572
573   // Some sections, such as debug info, don't need to be loaded for execution.
574   // Leave those where they are.
575   if (IsRequired) {
576     Allocate = DataSize + PaddingSize + StubBufSize;
577     if (!Allocate)
578       Allocate = 1;
579     Addr = IsCode ? MemMgr.allocateCodeSection(Allocate, Alignment, SectionID,
580                                                Name)
581                   : MemMgr.allocateDataSection(Allocate, Alignment, SectionID,
582                                                Name, IsReadOnly);
583     if (!Addr)
584       report_fatal_error("Unable to allocate section memory!");
585
586     // Zero-initialize or copy the data from the image
587     if (IsZeroInit || IsVirtual)
588       memset(Addr, 0, DataSize);
589     else
590       memcpy(Addr, pData, DataSize);
591
592     // Fill in any extra bytes we allocated for padding
593     if (PaddingSize != 0) {
594       memset(Addr + DataSize, 0, PaddingSize);
595       // Update the DataSize variable so that the stub offset is set correctly.
596       DataSize += PaddingSize;
597     }
598
599     DEBUG(dbgs() << "emitSection SectionID: " << SectionID << " Name: " << Name
600                  << " obj addr: " << format("%p", pData)
601                  << " new addr: " << format("%p", Addr)
602                  << " DataSize: " << DataSize << " StubBufSize: " << StubBufSize
603                  << " Allocate: " << Allocate << "\n");
604   } else {
605     // Even if we didn't load the section, we need to record an entry for it
606     // to handle later processing (and by 'handle' I mean don't do anything
607     // with these sections).
608     Allocate = 0;
609     Addr = nullptr;
610     DEBUG(dbgs() << "emitSection SectionID: " << SectionID << " Name: " << Name
611                  << " obj addr: " << format("%p", data.data()) << " new addr: 0"
612                  << " DataSize: " << DataSize << " StubBufSize: " << StubBufSize
613                  << " Allocate: " << Allocate << "\n");
614   }
615
616   Sections.push_back(SectionEntry(Name, Addr, DataSize, (uintptr_t)pData));
617
618   if (Checker)
619     Checker->registerSection(Obj.getFileName(), SectionID);
620
621   return SectionID;
622 }
623
624 unsigned RuntimeDyldImpl::findOrEmitSection(const ObjectFile &Obj,
625                                             const SectionRef &Section,
626                                             bool IsCode,
627                                             ObjSectionToIDMap &LocalSections) {
628
629   unsigned SectionID = 0;
630   ObjSectionToIDMap::iterator i = LocalSections.find(Section);
631   if (i != LocalSections.end())
632     SectionID = i->second;
633   else {
634     SectionID = emitSection(Obj, Section, IsCode);
635     LocalSections[Section] = SectionID;
636   }
637   return SectionID;
638 }
639
640 void RuntimeDyldImpl::addRelocationForSection(const RelocationEntry &RE,
641                                               unsigned SectionID) {
642   Relocations[SectionID].push_back(RE);
643 }
644
645 void RuntimeDyldImpl::addRelocationForSymbol(const RelocationEntry &RE,
646                                              StringRef SymbolName) {
647   // Relocation by symbol.  If the symbol is found in the global symbol table,
648   // create an appropriate section relocation.  Otherwise, add it to
649   // ExternalSymbolRelocations.
650   RTDyldSymbolTable::const_iterator Loc = GlobalSymbolTable.find(SymbolName);
651   if (Loc == GlobalSymbolTable.end()) {
652     ExternalSymbolRelocations[SymbolName].push_back(RE);
653   } else {
654     // Copy the RE since we want to modify its addend.
655     RelocationEntry RECopy = RE;
656     const auto &SymInfo = Loc->second;
657     RECopy.Addend += SymInfo.getOffset();
658     Relocations[SymInfo.getSectionID()].push_back(RECopy);
659   }
660 }
661
662 uint8_t *RuntimeDyldImpl::createStubFunction(uint8_t *Addr,
663                                              unsigned AbiVariant) {
664   if (Arch == Triple::aarch64 || Arch == Triple::aarch64_be) {
665     // This stub has to be able to access the full address space,
666     // since symbol lookup won't necessarily find a handy, in-range,
667     // PLT stub for functions which could be anywhere.
668     // Stub can use ip0 (== x16) to calculate address
669     writeBytesUnaligned(0xd2e00010, Addr,    4); // movz ip0, #:abs_g3:<addr>
670     writeBytesUnaligned(0xf2c00010, Addr+4,  4); // movk ip0, #:abs_g2_nc:<addr>
671     writeBytesUnaligned(0xf2a00010, Addr+8,  4); // movk ip0, #:abs_g1_nc:<addr>
672     writeBytesUnaligned(0xf2800010, Addr+12, 4); // movk ip0, #:abs_g0_nc:<addr>
673     writeBytesUnaligned(0xd61f0200, Addr+16, 4); // br ip0
674
675     return Addr;
676   } else if (Arch == Triple::arm || Arch == Triple::armeb) {
677     // TODO: There is only ARM far stub now. We should add the Thumb stub,
678     // and stubs for branches Thumb - ARM and ARM - Thumb.
679     writeBytesUnaligned(0xe51ff004, Addr, 4); // ldr pc,<label>
680     return Addr + 4;
681   } else if (IsMipsO32ABI) {
682     // 0:   3c190000        lui     t9,%hi(addr).
683     // 4:   27390000        addiu   t9,t9,%lo(addr).
684     // 8:   03200008        jr      t9.
685     // c:   00000000        nop.
686     const unsigned LuiT9Instr = 0x3c190000, AdduiT9Instr = 0x27390000;
687     const unsigned JrT9Instr = 0x03200008, NopInstr = 0x0;
688
689     writeBytesUnaligned(LuiT9Instr, Addr, 4);
690     writeBytesUnaligned(AdduiT9Instr, Addr+4, 4);
691     writeBytesUnaligned(JrT9Instr, Addr+8, 4);
692     writeBytesUnaligned(NopInstr, Addr+12, 4);
693     return Addr;
694   } else if (Arch == Triple::ppc64 || Arch == Triple::ppc64le) {
695     // Depending on which version of the ELF ABI is in use, we need to
696     // generate one of two variants of the stub.  They both start with
697     // the same sequence to load the target address into r12.
698     writeInt32BE(Addr,    0x3D800000); // lis   r12, highest(addr)
699     writeInt32BE(Addr+4,  0x618C0000); // ori   r12, higher(addr)
700     writeInt32BE(Addr+8,  0x798C07C6); // sldi  r12, r12, 32
701     writeInt32BE(Addr+12, 0x658C0000); // oris  r12, r12, h(addr)
702     writeInt32BE(Addr+16, 0x618C0000); // ori   r12, r12, l(addr)
703     if (AbiVariant == 2) {
704       // PowerPC64 stub ELFv2 ABI: The address points to the function itself.
705       // The address is already in r12 as required by the ABI.  Branch to it.
706       writeInt32BE(Addr+20, 0xF8410018); // std   r2,  24(r1)
707       writeInt32BE(Addr+24, 0x7D8903A6); // mtctr r12
708       writeInt32BE(Addr+28, 0x4E800420); // bctr
709     } else {
710       // PowerPC64 stub ELFv1 ABI: The address points to a function descriptor.
711       // Load the function address on r11 and sets it to control register. Also
712       // loads the function TOC in r2 and environment pointer to r11.
713       writeInt32BE(Addr+20, 0xF8410028); // std   r2,  40(r1)
714       writeInt32BE(Addr+24, 0xE96C0000); // ld    r11, 0(r12)
715       writeInt32BE(Addr+28, 0xE84C0008); // ld    r2,  0(r12)
716       writeInt32BE(Addr+32, 0x7D6903A6); // mtctr r11
717       writeInt32BE(Addr+36, 0xE96C0010); // ld    r11, 16(r2)
718       writeInt32BE(Addr+40, 0x4E800420); // bctr
719     }
720     return Addr;
721   } else if (Arch == Triple::systemz) {
722     writeInt16BE(Addr,    0xC418);     // lgrl %r1,.+8
723     writeInt16BE(Addr+2,  0x0000);
724     writeInt16BE(Addr+4,  0x0004);
725     writeInt16BE(Addr+6,  0x07F1);     // brc 15,%r1
726     // 8-byte address stored at Addr + 8
727     return Addr;
728   } else if (Arch == Triple::x86_64) {
729     *Addr      = 0xFF; // jmp
730     *(Addr+1)  = 0x25; // rip
731     // 32-bit PC-relative address of the GOT entry will be stored at Addr+2
732   } else if (Arch == Triple::x86) {
733     *Addr      = 0xE9; // 32-bit pc-relative jump.
734   }
735   return Addr;
736 }
737
738 // Assign an address to a symbol name and resolve all the relocations
739 // associated with it.
740 void RuntimeDyldImpl::reassignSectionAddress(unsigned SectionID,
741                                              uint64_t Addr) {
742   // The address to use for relocation resolution is not
743   // the address of the local section buffer. We must be doing
744   // a remote execution environment of some sort. Relocations can't
745   // be applied until all the sections have been moved.  The client must
746   // trigger this with a call to MCJIT::finalize() or
747   // RuntimeDyld::resolveRelocations().
748   //
749   // Addr is a uint64_t because we can't assume the pointer width
750   // of the target is the same as that of the host. Just use a generic
751   // "big enough" type.
752   DEBUG(dbgs() << "Reassigning address for section "
753                << SectionID << " (" << Sections[SectionID].Name << "): "
754                << format("0x%016" PRIx64, Sections[SectionID].LoadAddress) << " -> "
755                << format("0x%016" PRIx64, Addr) << "\n");
756   Sections[SectionID].LoadAddress = Addr;
757 }
758
759 void RuntimeDyldImpl::resolveRelocationList(const RelocationList &Relocs,
760                                             uint64_t Value) {
761   for (unsigned i = 0, e = Relocs.size(); i != e; ++i) {
762     const RelocationEntry &RE = Relocs[i];
763     // Ignore relocations for sections that were not loaded
764     if (Sections[RE.SectionID].Address == nullptr)
765       continue;
766     resolveRelocation(RE, Value);
767   }
768 }
769
770 void RuntimeDyldImpl::resolveExternalSymbols() {
771   while (!ExternalSymbolRelocations.empty()) {
772     StringMap<RelocationList>::iterator i = ExternalSymbolRelocations.begin();
773
774     StringRef Name = i->first();
775     if (Name.size() == 0) {
776       // This is an absolute symbol, use an address of zero.
777       DEBUG(dbgs() << "Resolving absolute relocations."
778                    << "\n");
779       RelocationList &Relocs = i->second;
780       resolveRelocationList(Relocs, 0);
781     } else {
782       uint64_t Addr = 0;
783       RTDyldSymbolTable::const_iterator Loc = GlobalSymbolTable.find(Name);
784       if (Loc == GlobalSymbolTable.end()) {
785         // This is an external symbol, try to get its address from the symbol
786         // resolver.
787         Addr = Resolver.findSymbol(Name.data()).getAddress();
788         // The call to getSymbolAddress may have caused additional modules to
789         // be loaded, which may have added new entries to the
790         // ExternalSymbolRelocations map.  Consquently, we need to update our
791         // iterator.  This is also why retrieval of the relocation list
792         // associated with this symbol is deferred until below this point.
793         // New entries may have been added to the relocation list.
794         i = ExternalSymbolRelocations.find(Name);
795       } else {
796         // We found the symbol in our global table.  It was probably in a
797         // Module that we loaded previously.
798         const auto &SymInfo = Loc->second;
799         Addr = getSectionLoadAddress(SymInfo.getSectionID()) +
800                SymInfo.getOffset();
801       }
802
803       // FIXME: Implement error handling that doesn't kill the host program!
804       if (!Addr)
805         report_fatal_error("Program used external function '" + Name +
806                            "' which could not be resolved!");
807
808       // If Resolver returned UINT64_MAX, the client wants to handle this symbol
809       // manually and we shouldn't resolve its relocations.
810       if (Addr != UINT64_MAX) {
811         DEBUG(dbgs() << "Resolving relocations Name: " << Name << "\t"
812                      << format("0x%lx", Addr) << "\n");
813         // This list may have been updated when we called getSymbolAddress, so
814         // don't change this code to get the list earlier.
815         RelocationList &Relocs = i->second;
816         resolveRelocationList(Relocs, Addr);
817       }
818     }
819
820     ExternalSymbolRelocations.erase(i);
821   }
822 }
823
824 //===----------------------------------------------------------------------===//
825 // RuntimeDyld class implementation
826
827 uint64_t RuntimeDyld::LoadedObjectInfo::getSectionLoadAddress(
828                                           const object::SectionRef &Sec) const {
829
830 //   llvm::dbgs() << "Searching for " << Sec.getRawDataRefImpl() << " in:\n";
831 //   for (auto E : ObjSecToIDMap)
832 //     llvm::dbgs() << "Added: " << E.first.getRawDataRefImpl() << " -> " << E.second << "\n";
833
834   auto I = ObjSecToIDMap.find(Sec);
835   if (I != ObjSecToIDMap.end()) {
836 //    llvm::dbgs() << "Found ID " << I->second << " for Sec: " << Sec.getRawDataRefImpl() << ", LoadAddress = " << RTDyld.Sections[I->second].LoadAddress << "\n";
837     return RTDyld.Sections[I->second].LoadAddress;
838   } else {
839 //    llvm::dbgs() << "Not found.\n";
840   }
841
842   return 0;
843 }
844
845 void RuntimeDyld::MemoryManager::anchor() {}
846 void RuntimeDyld::SymbolResolver::anchor() {}
847
848 RuntimeDyld::RuntimeDyld(RuntimeDyld::MemoryManager &MemMgr,
849                          RuntimeDyld::SymbolResolver &Resolver)
850     : MemMgr(MemMgr), Resolver(Resolver) {
851   // FIXME: There's a potential issue lurking here if a single instance of
852   // RuntimeDyld is used to load multiple objects.  The current implementation
853   // associates a single memory manager with a RuntimeDyld instance.  Even
854   // though the public class spawns a new 'impl' instance for each load,
855   // they share a single memory manager.  This can become a problem when page
856   // permissions are applied.
857   Dyld = nullptr;
858   ProcessAllSections = false;
859   Checker = nullptr;
860 }
861
862 RuntimeDyld::~RuntimeDyld() {}
863
864 static std::unique_ptr<RuntimeDyldCOFF>
865 createRuntimeDyldCOFF(Triple::ArchType Arch, RuntimeDyld::MemoryManager &MM,
866                       RuntimeDyld::SymbolResolver &Resolver,
867                       bool ProcessAllSections, RuntimeDyldCheckerImpl *Checker) {
868   std::unique_ptr<RuntimeDyldCOFF> Dyld =
869     RuntimeDyldCOFF::create(Arch, MM, Resolver);
870   Dyld->setProcessAllSections(ProcessAllSections);
871   Dyld->setRuntimeDyldChecker(Checker);
872   return Dyld;
873 }
874
875 static std::unique_ptr<RuntimeDyldELF>
876 createRuntimeDyldELF(RuntimeDyld::MemoryManager &MM,
877                      RuntimeDyld::SymbolResolver &Resolver,
878                      bool ProcessAllSections, RuntimeDyldCheckerImpl *Checker) {
879   std::unique_ptr<RuntimeDyldELF> Dyld(new RuntimeDyldELF(MM, Resolver));
880   Dyld->setProcessAllSections(ProcessAllSections);
881   Dyld->setRuntimeDyldChecker(Checker);
882   return Dyld;
883 }
884
885 static std::unique_ptr<RuntimeDyldMachO>
886 createRuntimeDyldMachO(Triple::ArchType Arch, RuntimeDyld::MemoryManager &MM,
887                        RuntimeDyld::SymbolResolver &Resolver,
888                        bool ProcessAllSections,
889                        RuntimeDyldCheckerImpl *Checker) {
890   std::unique_ptr<RuntimeDyldMachO> Dyld =
891     RuntimeDyldMachO::create(Arch, MM, Resolver);
892   Dyld->setProcessAllSections(ProcessAllSections);
893   Dyld->setRuntimeDyldChecker(Checker);
894   return Dyld;
895 }
896
897 std::unique_ptr<RuntimeDyld::LoadedObjectInfo>
898 RuntimeDyld::loadObject(const ObjectFile &Obj) {
899   if (!Dyld) {
900     if (Obj.isELF())
901       Dyld = createRuntimeDyldELF(MemMgr, Resolver, ProcessAllSections, Checker);
902     else if (Obj.isMachO())
903       Dyld = createRuntimeDyldMachO(
904                static_cast<Triple::ArchType>(Obj.getArch()), MemMgr, Resolver,
905                ProcessAllSections, Checker);
906     else if (Obj.isCOFF())
907       Dyld = createRuntimeDyldCOFF(
908                static_cast<Triple::ArchType>(Obj.getArch()), MemMgr, Resolver,
909                ProcessAllSections, Checker);
910     else
911       report_fatal_error("Incompatible object format!");
912   }
913
914   if (!Dyld->isCompatibleFile(Obj))
915     report_fatal_error("Incompatible object format!");
916
917   return Dyld->loadObject(Obj);
918 }
919
920 void *RuntimeDyld::getSymbolLocalAddress(StringRef Name) const {
921   if (!Dyld)
922     return nullptr;
923   return Dyld->getSymbolLocalAddress(Name);
924 }
925
926 RuntimeDyld::SymbolInfo RuntimeDyld::getSymbol(StringRef Name) const {
927   if (!Dyld)
928     return nullptr;
929   return Dyld->getSymbol(Name);
930 }
931
932 void RuntimeDyld::resolveRelocations() { Dyld->resolveRelocations(); }
933
934 void RuntimeDyld::reassignSectionAddress(unsigned SectionID, uint64_t Addr) {
935   Dyld->reassignSectionAddress(SectionID, Addr);
936 }
937
938 void RuntimeDyld::mapSectionAddress(const void *LocalAddress,
939                                     uint64_t TargetAddress) {
940   Dyld->mapSectionAddress(LocalAddress, TargetAddress);
941 }
942
943 bool RuntimeDyld::hasError() { return Dyld->hasError(); }
944
945 StringRef RuntimeDyld::getErrorString() { return Dyld->getErrorString(); }
946
947 void RuntimeDyld::registerEHFrames() {
948   if (Dyld)
949     Dyld->registerEHFrames();
950 }
951
952 void RuntimeDyld::deregisterEHFrames() {
953   if (Dyld)
954     Dyld->deregisterEHFrames();
955 }
956
957 } // end namespace llvm