]> Gitweb @ Texas Instruments - Open Source Git Repositories - git.TI.com/gitweb - opencl/llvm.git/blob - tools/llvm-objdump/MachODump.cpp
Adds the next bit of support for llvm-objdump’s -private-headers for executable Mach...
[opencl/llvm.git] / tools / llvm-objdump / MachODump.cpp
1 //===-- MachODump.cpp - Object file dumping utility for llvm --------------===//
2 //
3 //                     The LLVM Compiler Infrastructure
4 //
5 // This file is distributed under the University of Illinois Open Source
6 // License. See LICENSE.TXT for details.
7 //
8 //===----------------------------------------------------------------------===//
9 //
10 // This file implements the MachO-specific dumper for llvm-objdump.
11 //
12 //===----------------------------------------------------------------------===//
14 #include "llvm-objdump.h"
15 #include "llvm/ADT/STLExtras.h"
16 #include "llvm/ADT/StringExtras.h"
17 #include "llvm/ADT/Triple.h"
18 #include "llvm/DebugInfo/DIContext.h"
19 #include "llvm/MC/MCAsmInfo.h"
20 #include "llvm/MC/MCContext.h"
21 #include "llvm/MC/MCDisassembler.h"
22 #include "llvm/MC/MCInst.h"
23 #include "llvm/MC/MCInstPrinter.h"
24 #include "llvm/MC/MCInstrAnalysis.h"
25 #include "llvm/MC/MCInstrDesc.h"
26 #include "llvm/MC/MCInstrInfo.h"
27 #include "llvm/MC/MCRegisterInfo.h"
28 #include "llvm/MC/MCSubtargetInfo.h"
29 #include "llvm/Object/MachO.h"
30 #include "llvm/Support/Casting.h"
31 #include "llvm/Support/CommandLine.h"
32 #include "llvm/Support/Debug.h"
33 #include "llvm/Support/Endian.h"
34 #include "llvm/Support/Format.h"
35 #include "llvm/Support/GraphWriter.h"
36 #include "llvm/Support/MachO.h"
37 #include "llvm/Support/MemoryBuffer.h"
38 #include "llvm/Support/TargetRegistry.h"
39 #include "llvm/Support/TargetSelect.h"
40 #include "llvm/Support/raw_ostream.h"
41 #include <algorithm>
42 #include <cstring>
43 #include <system_error>
44 using namespace llvm;
45 using namespace object;
47 static cl::opt<bool>
48   UseDbg("g", cl::desc("Print line information from debug info if available"));
50 static cl::opt<std::string>
51   DSYMFile("dsym", cl::desc("Use .dSYM file for debug info"));
53 static std::string ThumbTripleName;
55 static const Target *GetTarget(const MachOObjectFile *MachOObj,
56                                const char **McpuDefault,
57                                const Target **ThumbTarget) {
58   // Figure out the target triple.
59   if (TripleName.empty()) {
60     llvm::Triple TT("unknown-unknown-unknown");
61     llvm::Triple ThumbTriple = Triple();
62     TT = MachOObj->getArch(McpuDefault, &ThumbTriple);
63     TripleName = TT.str();
64     ThumbTripleName = ThumbTriple.str();
65   }
67   // Get the target specific parser.
68   std::string Error;
69   const Target *TheTarget = TargetRegistry::lookupTarget(TripleName, Error);
70   if (TheTarget && ThumbTripleName.empty())
71     return TheTarget;
73   *ThumbTarget = TargetRegistry::lookupTarget(ThumbTripleName, Error);
74   if (*ThumbTarget)
75     return TheTarget;
77   errs() << "llvm-objdump: error: unable to get target for '";
78   if (!TheTarget)
79     errs() << TripleName;
80   else
81     errs() << ThumbTripleName;
82   errs() << "', see --version and --triple.\n";
83   return nullptr;
84 }
86 struct SymbolSorter {
87   bool operator()(const SymbolRef &A, const SymbolRef &B) {
88     SymbolRef::Type AType, BType;
89     A.getType(AType);
90     B.getType(BType);
92     uint64_t AAddr, BAddr;
93     if (AType != SymbolRef::ST_Function)
94       AAddr = 0;
95     else
96       A.getAddress(AAddr);
97     if (BType != SymbolRef::ST_Function)
98       BAddr = 0;
99     else
100       B.getAddress(BAddr);
101     return AAddr < BAddr;
102   }
103 };
105 // Types for the storted data in code table that is built before disassembly
106 // and the predicate function to sort them.
107 typedef std::pair<uint64_t, DiceRef> DiceTableEntry;
108 typedef std::vector<DiceTableEntry> DiceTable;
109 typedef DiceTable::iterator dice_table_iterator;
111 static bool
112 compareDiceTableEntries(const DiceTableEntry i,
113                         const DiceTableEntry j) {
114   return i.first == j.first;
117 static void DumpDataInCode(const char *bytes, uint64_t Size,
118                            unsigned short Kind) {
119   uint64_t Value;
121   switch (Kind) {
122   case MachO::DICE_KIND_DATA:
123     switch (Size) {
124     case 4:
125       Value = bytes[3] << 24 |
126               bytes[2] << 16 |
127               bytes[1] << 8 |
128               bytes[0];
129       outs() << "\t.long " << Value;
130       break;
131     case 2:
132       Value = bytes[1] << 8 |
133               bytes[0];
134       outs() << "\t.short " << Value;
135       break;
136     case 1:
137       Value = bytes[0];
138       outs() << "\t.byte " << Value;
139       break;
140     }
141     outs() << "\t@ KIND_DATA\n";
142     break;
143   case MachO::DICE_KIND_JUMP_TABLE8:
144     Value = bytes[0];
145     outs() << "\t.byte " << Value << "\t@ KIND_JUMP_TABLE8";
146     break;
147   case MachO::DICE_KIND_JUMP_TABLE16:
148     Value = bytes[1] << 8 |
149             bytes[0];
150     outs() << "\t.short " << Value << "\t@ KIND_JUMP_TABLE16";
151     break;
152   case MachO::DICE_KIND_JUMP_TABLE32:
153     Value = bytes[3] << 24 |
154             bytes[2] << 16 |
155             bytes[1] << 8 |
156             bytes[0];
157     outs() << "\t.long " << Value << "\t@ KIND_JUMP_TABLE32";
158     break;
159   default:
160     outs() << "\t@ data in code kind = " << Kind << "\n";
161     break;
162   }
165 static void getSectionsAndSymbols(const MachO::mach_header Header,
166                                   MachOObjectFile *MachOObj,
167                                   std::vector<SectionRef> &Sections,
168                                   std::vector<SymbolRef> &Symbols,
169                                   SmallVectorImpl<uint64_t> &FoundFns,
170                                   uint64_t &BaseSegmentAddress) {
171   for (const SymbolRef &Symbol : MachOObj->symbols())
172     Symbols.push_back(Symbol);
174   for (const SectionRef &Section : MachOObj->sections()) {
175     StringRef SectName;
176     Section.getName(SectName);
177     Sections.push_back(Section);
178   }
180   MachOObjectFile::LoadCommandInfo Command =
181       MachOObj->getFirstLoadCommandInfo();
182   bool BaseSegmentAddressSet = false;
183   for (unsigned i = 0; ; ++i) {
184     if (Command.C.cmd == MachO::LC_FUNCTION_STARTS) {
185       // We found a function starts segment, parse the addresses for later
186       // consumption.
187       MachO::linkedit_data_command LLC =
188         MachOObj->getLinkeditDataLoadCommand(Command);
190       MachOObj->ReadULEB128s(LLC.dataoff, FoundFns);
191     }
192     else if (Command.C.cmd == MachO::LC_SEGMENT) {
193       MachO::segment_command SLC =
194         MachOObj->getSegmentLoadCommand(Command);
195       StringRef SegName = SLC.segname;
196       if(!BaseSegmentAddressSet && SegName != "__PAGEZERO") {
197         BaseSegmentAddressSet = true;
198         BaseSegmentAddress = SLC.vmaddr;
199       }
200     }
202     if (i == Header.ncmds - 1)
203       break;
204     else
205       Command = MachOObj->getNextLoadCommandInfo(Command);
206   }
209 static void DisassembleInputMachO2(StringRef Filename,
210                                    MachOObjectFile *MachOOF);
212 void llvm::DisassembleInputMachO(StringRef Filename) {
213   ErrorOr<std::unique_ptr<MemoryBuffer>> BuffOrErr =
214       MemoryBuffer::getFileOrSTDIN(Filename);
215   if (std::error_code EC = BuffOrErr.getError()) {
216     errs() << "llvm-objdump: " << Filename << ": " << EC.message() << "\n";
217     return;
218   }
219   std::unique_ptr<MemoryBuffer> Buff = std::move(BuffOrErr.get());
221   std::unique_ptr<MachOObjectFile> MachOOF = std::move(
222       ObjectFile::createMachOObjectFile(Buff.get()->getMemBufferRef()).get());
224   DisassembleInputMachO2(Filename, MachOOF.get());
227 static void DisassembleInputMachO2(StringRef Filename,
228                                    MachOObjectFile *MachOOF) {
229   const char *McpuDefault = nullptr;
230   const Target *ThumbTarget = nullptr;
231   const Target *TheTarget = GetTarget(MachOOF, &McpuDefault, &ThumbTarget);
232   if (!TheTarget) {
233     // GetTarget prints out stuff.
234     return;
235   }
236   if (MCPU.empty() && McpuDefault)
237     MCPU = McpuDefault;
239   std::unique_ptr<const MCInstrInfo> InstrInfo(TheTarget->createMCInstrInfo());
240   std::unique_ptr<MCInstrAnalysis> InstrAnalysis(
241       TheTarget->createMCInstrAnalysis(InstrInfo.get()));
242   std::unique_ptr<const MCInstrInfo> ThumbInstrInfo;
243   std::unique_ptr<MCInstrAnalysis> ThumbInstrAnalysis;
244   if (ThumbTarget) {
245     ThumbInstrInfo.reset(ThumbTarget->createMCInstrInfo());
246     ThumbInstrAnalysis.reset(
247         ThumbTarget->createMCInstrAnalysis(ThumbInstrInfo.get()));
248   }
250   // Package up features to be passed to target/subtarget
251   std::string FeaturesStr;
252   if (MAttrs.size()) {
253     SubtargetFeatures Features;
254     for (unsigned i = 0; i != MAttrs.size(); ++i)
255       Features.AddFeature(MAttrs[i]);
256     FeaturesStr = Features.getString();
257   }
259   // Set up disassembler.
260   std::unique_ptr<const MCRegisterInfo> MRI(
261       TheTarget->createMCRegInfo(TripleName));
262   std::unique_ptr<const MCAsmInfo> AsmInfo(
263       TheTarget->createMCAsmInfo(*MRI, TripleName));
264   std::unique_ptr<const MCSubtargetInfo> STI(
265       TheTarget->createMCSubtargetInfo(TripleName, MCPU, FeaturesStr));
266   MCContext Ctx(AsmInfo.get(), MRI.get(), nullptr);
267   std::unique_ptr<const MCDisassembler> DisAsm(
268       TheTarget->createMCDisassembler(*STI, Ctx));
269   int AsmPrinterVariant = AsmInfo->getAssemblerDialect();
270   std::unique_ptr<MCInstPrinter> IP(TheTarget->createMCInstPrinter(
271       AsmPrinterVariant, *AsmInfo, *InstrInfo, *MRI, *STI));
273   if (!InstrAnalysis || !AsmInfo || !STI || !DisAsm || !IP) {
274     errs() << "error: couldn't initialize disassembler for target "
275            << TripleName << '\n';
276     return;
277   }
279   // Set up thumb disassembler.
280   std::unique_ptr<const MCRegisterInfo> ThumbMRI;
281   std::unique_ptr<const MCAsmInfo> ThumbAsmInfo;
282   std::unique_ptr<const MCSubtargetInfo> ThumbSTI;
283   std::unique_ptr<const MCDisassembler> ThumbDisAsm;
284   std::unique_ptr<MCInstPrinter> ThumbIP;
285   std::unique_ptr<MCContext> ThumbCtx;
286   if (ThumbTarget) {
287     ThumbMRI.reset(ThumbTarget->createMCRegInfo(ThumbTripleName));
288     ThumbAsmInfo.reset(
289         ThumbTarget->createMCAsmInfo(*ThumbMRI, ThumbTripleName));
290     ThumbSTI.reset(
291         ThumbTarget->createMCSubtargetInfo(ThumbTripleName, MCPU, FeaturesStr));
292     ThumbCtx.reset(new MCContext(ThumbAsmInfo.get(), ThumbMRI.get(), nullptr));
293     ThumbDisAsm.reset(ThumbTarget->createMCDisassembler(*ThumbSTI, *ThumbCtx));
294     int ThumbAsmPrinterVariant = ThumbAsmInfo->getAssemblerDialect();
295     ThumbIP.reset(ThumbTarget->createMCInstPrinter(
296         ThumbAsmPrinterVariant, *ThumbAsmInfo, *ThumbInstrInfo, *ThumbMRI,
297         *ThumbSTI));
298   }
300   if (ThumbTarget && (!ThumbInstrAnalysis || !ThumbAsmInfo || !ThumbSTI ||
301                       !ThumbDisAsm || !ThumbIP)) {
302     errs() << "error: couldn't initialize disassembler for target "
303            << ThumbTripleName << '\n';
304     return;
305   }
307   outs() << '\n' << Filename << ":\n\n";
309   MachO::mach_header Header = MachOOF->getHeader();
311   // FIXME: Using the -cfg command line option, this code used to be able to
312   // annotate relocations with the referenced symbol's name, and if this was
313   // inside a __[cf]string section, the data it points to. This is now replaced
314   // by the upcoming MCSymbolizer, which needs the appropriate setup done above.
315   std::vector<SectionRef> Sections;
316   std::vector<SymbolRef> Symbols;
317   SmallVector<uint64_t, 8> FoundFns;
318   uint64_t BaseSegmentAddress;
320   getSectionsAndSymbols(Header, MachOOF, Sections, Symbols, FoundFns,
321                         BaseSegmentAddress);
323   // Sort the symbols by address, just in case they didn't come in that way.
324   std::sort(Symbols.begin(), Symbols.end(), SymbolSorter());
326   // Build a data in code table that is sorted on by the address of each entry.
327   uint64_t BaseAddress = 0;
328   if (Header.filetype == MachO::MH_OBJECT)
329     Sections[0].getAddress(BaseAddress);
330   else
331     BaseAddress = BaseSegmentAddress;
332   DiceTable Dices;
333   for (dice_iterator DI = MachOOF->begin_dices(), DE = MachOOF->end_dices();
334        DI != DE; ++DI) {
335     uint32_t Offset;
336     DI->getOffset(Offset);
337     Dices.push_back(std::make_pair(BaseAddress + Offset, *DI));
338   }
339   array_pod_sort(Dices.begin(), Dices.end());
341 #ifndef NDEBUG
342   raw_ostream &DebugOut = DebugFlag ? dbgs() : nulls();
343 #else
344   raw_ostream &DebugOut = nulls();
345 #endif
347   std::unique_ptr<DIContext> diContext;
348   ObjectFile *DbgObj = MachOOF;
349   // Try to find debug info and set up the DIContext for it.
350   if (UseDbg) {
351     // A separate DSym file path was specified, parse it as a macho file,
352     // get the sections and supply it to the section name parsing machinery.
353     if (!DSYMFile.empty()) {
354       ErrorOr<std::unique_ptr<MemoryBuffer>> BufOrErr =
355           MemoryBuffer::getFileOrSTDIN(DSYMFile);
356       if (std::error_code EC = BufOrErr.getError()) {
357         errs() << "llvm-objdump: " << Filename << ": " << EC.message() << '\n';
358         return;
359       }
360       DbgObj =
361           ObjectFile::createMachOObjectFile(BufOrErr.get()->getMemBufferRef())
362               .get()
363               .release();
364     }
366     // Setup the DIContext
367     diContext.reset(DIContext::getDWARFContext(*DbgObj));
368   }
370   for (unsigned SectIdx = 0; SectIdx != Sections.size(); SectIdx++) {
372     bool SectIsText = false;
373     Sections[SectIdx].isText(SectIsText);
374     if (SectIsText == false)
375       continue;
377     StringRef SectName;
378     if (Sections[SectIdx].getName(SectName) ||
379         SectName != "__text")
380       continue; // Skip non-text sections
382     DataRefImpl DR = Sections[SectIdx].getRawDataRefImpl();
384     StringRef SegmentName = MachOOF->getSectionFinalSegmentName(DR);
385     if (SegmentName != "__TEXT")
386       continue;
388     StringRef Bytes;
389     Sections[SectIdx].getContents(Bytes);
390     StringRefMemoryObject memoryObject(Bytes);
391     bool symbolTableWorked = false;
393     // Parse relocations.
394     std::vector<std::pair<uint64_t, SymbolRef>> Relocs;
395     for (const RelocationRef &Reloc : Sections[SectIdx].relocations()) {
396       uint64_t RelocOffset, SectionAddress;
397       Reloc.getOffset(RelocOffset);
398       Sections[SectIdx].getAddress(SectionAddress);
399       RelocOffset -= SectionAddress;
401       symbol_iterator RelocSym = Reloc.getSymbol();
403       Relocs.push_back(std::make_pair(RelocOffset, *RelocSym));
404     }
405     array_pod_sort(Relocs.begin(), Relocs.end());
407     // Disassemble symbol by symbol.
408     for (unsigned SymIdx = 0; SymIdx != Symbols.size(); SymIdx++) {
409       StringRef SymName;
410       Symbols[SymIdx].getName(SymName);
412       SymbolRef::Type ST;
413       Symbols[SymIdx].getType(ST);
414       if (ST != SymbolRef::ST_Function)
415         continue;
417       // Make sure the symbol is defined in this section.
418       bool containsSym = false;
419       Sections[SectIdx].containsSymbol(Symbols[SymIdx], containsSym);
420       if (!containsSym)
421         continue;
423       // Start at the address of the symbol relative to the section's address.
424       uint64_t SectionAddress = 0;
425       uint64_t Start = 0;
426       Sections[SectIdx].getAddress(SectionAddress);
427       Symbols[SymIdx].getAddress(Start);
428       Start -= SectionAddress;
430       // Stop disassembling either at the beginning of the next symbol or at
431       // the end of the section.
432       bool containsNextSym = false;
433       uint64_t NextSym = 0;
434       uint64_t NextSymIdx = SymIdx+1;
435       while (Symbols.size() > NextSymIdx) {
436         SymbolRef::Type NextSymType;
437         Symbols[NextSymIdx].getType(NextSymType);
438         if (NextSymType == SymbolRef::ST_Function) {
439           Sections[SectIdx].containsSymbol(Symbols[NextSymIdx],
440                                            containsNextSym);
441           Symbols[NextSymIdx].getAddress(NextSym);
442           NextSym -= SectionAddress;
443           break;
444         }
445         ++NextSymIdx;
446       }
448       uint64_t SectSize;
449       Sections[SectIdx].getSize(SectSize);
450       uint64_t End = containsNextSym ?  NextSym : SectSize;
451       uint64_t Size;
453       symbolTableWorked = true;
455       DataRefImpl Symb = Symbols[SymIdx].getRawDataRefImpl();
456       bool isThumb =
457           (MachOOF->getSymbolFlags(Symb) & SymbolRef::SF_Thumb) && ThumbTarget;
459       outs() << SymName << ":\n";
460       DILineInfo lastLine;
461       for (uint64_t Index = Start; Index < End; Index += Size) {
462         MCInst Inst;
464         uint64_t SectAddress = 0;
465         Sections[SectIdx].getAddress(SectAddress);
466         outs() << format("%8" PRIx64 ":\t", SectAddress + Index);
468         // Check the data in code table here to see if this is data not an
469         // instruction to be disassembled.
470         DiceTable Dice;
471         Dice.push_back(std::make_pair(SectAddress + Index, DiceRef()));
472         dice_table_iterator DTI = std::search(Dices.begin(), Dices.end(),
473                                               Dice.begin(), Dice.end(),
474                                               compareDiceTableEntries);
475         if (DTI != Dices.end()){
476           uint16_t Length;
477           DTI->second.getLength(Length);
478           DumpBytes(StringRef(Bytes.data() + Index, Length));
479           uint16_t Kind;
480           DTI->second.getKind(Kind);
481           DumpDataInCode(Bytes.data() + Index, Length, Kind);
482           continue;
483         }
485         bool gotInst;
486         if (isThumb)
487           gotInst = ThumbDisAsm->getInstruction(Inst, Size, memoryObject, Index,
488                                      DebugOut, nulls());
489         else
490           gotInst = DisAsm->getInstruction(Inst, Size, memoryObject, Index,
491                                      DebugOut, nulls());
492         if (gotInst) {
493           DumpBytes(StringRef(Bytes.data() + Index, Size));
494           if (isThumb)
495             ThumbIP->printInst(&Inst, outs(), "");
496           else
497             IP->printInst(&Inst, outs(), "");
499           // Print debug info.
500           if (diContext) {
501             DILineInfo dli =
502               diContext->getLineInfoForAddress(SectAddress + Index);
503             // Print valid line info if it changed.
504             if (dli != lastLine && dli.Line != 0)
505               outs() << "\t## " << dli.FileName << ':' << dli.Line << ':'
506                      << dli.Column;
507             lastLine = dli;
508           }
509           outs() << "\n";
510         } else {
511           errs() << "llvm-objdump: warning: invalid instruction encoding\n";
512           if (Size == 0)
513             Size = 1; // skip illegible bytes
514         }
515       }
516     }
517     if (!symbolTableWorked) {
518       // Reading the symbol table didn't work, disassemble the whole section. 
519       uint64_t SectAddress;
520       Sections[SectIdx].getAddress(SectAddress);
521       uint64_t SectSize;
522       Sections[SectIdx].getSize(SectSize);
523       uint64_t InstSize;
524       for (uint64_t Index = 0; Index < SectSize; Index += InstSize) {
525         MCInst Inst;
527         if (DisAsm->getInstruction(Inst, InstSize, memoryObject, Index,
528                                    DebugOut, nulls())) {
529           outs() << format("%8" PRIx64 ":\t", SectAddress + Index);
530           DumpBytes(StringRef(Bytes.data() + Index, InstSize));
531           IP->printInst(&Inst, outs(), "");
532           outs() << "\n";
533         } else {
534           errs() << "llvm-objdump: warning: invalid instruction encoding\n";
535           if (InstSize == 0)
536             InstSize = 1; // skip illegible bytes
537         }
538       }
539     }
540   }
544 //===----------------------------------------------------------------------===//
545 // __compact_unwind section dumping
546 //===----------------------------------------------------------------------===//
548 namespace {
550 template <typename T> static uint64_t readNext(const char *&Buf) {
551     using llvm::support::little;
552     using llvm::support::unaligned;
554     uint64_t Val = support::endian::read<T, little, unaligned>(Buf);
555     Buf += sizeof(T);
556     return Val;
557   }
559 struct CompactUnwindEntry {
560   uint32_t OffsetInSection;
562   uint64_t FunctionAddr;
563   uint32_t Length;
564   uint32_t CompactEncoding;
565   uint64_t PersonalityAddr;
566   uint64_t LSDAAddr;
568   RelocationRef FunctionReloc;
569   RelocationRef PersonalityReloc;
570   RelocationRef LSDAReloc;
572   CompactUnwindEntry(StringRef Contents, unsigned Offset, bool Is64)
573     : OffsetInSection(Offset) {
574     if (Is64)
575       read<uint64_t>(Contents.data() + Offset);
576     else
577       read<uint32_t>(Contents.data() + Offset);
578   }
580 private:
581   template<typename UIntPtr>
582   void read(const char *Buf) {
583     FunctionAddr = readNext<UIntPtr>(Buf);
584     Length = readNext<uint32_t>(Buf);
585     CompactEncoding = readNext<uint32_t>(Buf);
586     PersonalityAddr = readNext<UIntPtr>(Buf);
587     LSDAAddr = readNext<UIntPtr>(Buf);
588   }
589 };
592 /// Given a relocation from __compact_unwind, consisting of the RelocationRef
593 /// and data being relocated, determine the best base Name and Addend to use for
594 /// display purposes.
595 ///
596 /// 1. An Extern relocation will directly reference a symbol (and the data is
597 ///    then already an addend), so use that.
598 /// 2. Otherwise the data is an offset in the object file's layout; try to find
599 //     a symbol before it in the same section, and use the offset from there.
600 /// 3. Finally, if all that fails, fall back to an offset from the start of the
601 ///    referenced section.
602 static void findUnwindRelocNameAddend(const MachOObjectFile *Obj,
603                                       std::map<uint64_t, SymbolRef> &Symbols,
604                                       const RelocationRef &Reloc,
605                                       uint64_t Addr,
606                                       StringRef &Name, uint64_t &Addend) {
607   if (Reloc.getSymbol() != Obj->symbol_end()) {
608     Reloc.getSymbol()->getName(Name);
609     Addend = Addr;
610     return;
611   }
613   auto RE = Obj->getRelocation(Reloc.getRawDataRefImpl());
614   SectionRef RelocSection = Obj->getRelocationSection(RE);
616   uint64_t SectionAddr;
617   RelocSection.getAddress(SectionAddr);
619   auto Sym = Symbols.upper_bound(Addr);
620   if (Sym == Symbols.begin()) {
621     // The first symbol in the object is after this reference, the best we can
622     // do is section-relative notation.
623     RelocSection.getName(Name);
624     Addend = Addr - SectionAddr;
625     return;
626   }
628   // Go back one so that SymbolAddress <= Addr.
629   --Sym;
631   section_iterator SymSection = Obj->section_end();
632   Sym->second.getSection(SymSection);
633   if (RelocSection == *SymSection) {
634     // There's a valid symbol in the same section before this reference.
635     Sym->second.getName(Name);
636     Addend = Addr - Sym->first;
637     return;
638   }
640   // There is a symbol before this reference, but it's in a different
641   // section. Probably not helpful to mention it, so use the section name.
642   RelocSection.getName(Name);
643   Addend = Addr - SectionAddr;
646 static void printUnwindRelocDest(const MachOObjectFile *Obj,
647                                  std::map<uint64_t, SymbolRef> &Symbols,
648                                  const RelocationRef &Reloc,
649                                  uint64_t Addr) {
650   StringRef Name;
651   uint64_t Addend;
653   findUnwindRelocNameAddend(Obj, Symbols, Reloc, Addr, Name, Addend);
655   outs() << Name;
656   if (Addend)
657     outs() << " + " << format("0x%" PRIx64, Addend);
660 static void
661 printMachOCompactUnwindSection(const MachOObjectFile *Obj,
662                                std::map<uint64_t, SymbolRef> &Symbols,
663                                const SectionRef &CompactUnwind) {
665   assert(Obj->isLittleEndian() &&
666          "There should not be a big-endian .o with __compact_unwind");
668   bool Is64 = Obj->is64Bit();
669   uint32_t PointerSize = Is64 ? sizeof(uint64_t) : sizeof(uint32_t);
670   uint32_t EntrySize = 3 * PointerSize + 2 * sizeof(uint32_t);
672   StringRef Contents;
673   CompactUnwind.getContents(Contents);
675   SmallVector<CompactUnwindEntry, 4> CompactUnwinds;
677   // First populate the initial raw offsets, encodings and so on from the entry.
678   for (unsigned Offset = 0; Offset < Contents.size(); Offset += EntrySize) {
679     CompactUnwindEntry Entry(Contents.data(), Offset, Is64);
680     CompactUnwinds.push_back(Entry);
681   }
683   // Next we need to look at the relocations to find out what objects are
684   // actually being referred to.
685   for (const RelocationRef &Reloc : CompactUnwind.relocations()) {
686     uint64_t RelocAddress;
687     Reloc.getOffset(RelocAddress);
689     uint32_t EntryIdx = RelocAddress / EntrySize;
690     uint32_t OffsetInEntry = RelocAddress - EntryIdx * EntrySize;
691     CompactUnwindEntry &Entry = CompactUnwinds[EntryIdx];
693     if (OffsetInEntry == 0)
694       Entry.FunctionReloc = Reloc;
695     else if (OffsetInEntry == PointerSize + 2 * sizeof(uint32_t))
696       Entry.PersonalityReloc = Reloc;
697     else if (OffsetInEntry == 2 * PointerSize + 2 * sizeof(uint32_t))
698       Entry.LSDAReloc = Reloc;
699     else
700       llvm_unreachable("Unexpected relocation in __compact_unwind section");
701   }
703   // Finally, we're ready to print the data we've gathered.
704   outs() << "Contents of __compact_unwind section:\n";
705   for (auto &Entry : CompactUnwinds) {
706     outs() << "  Entry at offset "
707            << format("0x%" PRIx32, Entry.OffsetInSection) << ":\n";
709     // 1. Start of the region this entry applies to.
710     outs() << "    start:                "
711            << format("0x%" PRIx64, Entry.FunctionAddr) << ' ';
712     printUnwindRelocDest(Obj, Symbols, Entry.FunctionReloc,
713                          Entry.FunctionAddr);
714     outs() << '\n';
716     // 2. Length of the region this entry applies to.
717     outs() << "    length:               "
718            << format("0x%" PRIx32, Entry.Length) << '\n';
719     // 3. The 32-bit compact encoding.
720     outs() << "    compact encoding:     "
721            << format("0x%08" PRIx32, Entry.CompactEncoding) << '\n';
723     // 4. The personality function, if present.
724     if (Entry.PersonalityReloc.getObjectFile()) {
725       outs() << "    personality function: "
726              << format("0x%" PRIx64, Entry.PersonalityAddr) << ' ';
727       printUnwindRelocDest(Obj, Symbols, Entry.PersonalityReloc,
728                            Entry.PersonalityAddr);
729       outs() << '\n';
730     }
732     // 5. This entry's language-specific data area.
733     if (Entry.LSDAReloc.getObjectFile()) {
734       outs() << "    LSDA:                 "
735              << format("0x%" PRIx64, Entry.LSDAAddr) << ' ';
736       printUnwindRelocDest(Obj, Symbols, Entry.LSDAReloc, Entry.LSDAAddr);
737       outs() << '\n';
738     }
739   }
742 //===----------------------------------------------------------------------===//
743 // __unwind_info section dumping
744 //===----------------------------------------------------------------------===//
746 static void printRegularSecondLevelUnwindPage(const char *PageStart) {
747   const char *Pos = PageStart;
748   uint32_t Kind = readNext<uint32_t>(Pos);
749   (void)Kind;
750   assert(Kind == 2 && "kind for a regular 2nd level index should be 2");
752   uint16_t EntriesStart = readNext<uint16_t>(Pos);
753   uint16_t NumEntries = readNext<uint16_t>(Pos);
755   Pos = PageStart + EntriesStart;
756   for (unsigned i = 0; i < NumEntries; ++i) {
757     uint32_t FunctionOffset = readNext<uint32_t>(Pos);
758     uint32_t Encoding = readNext<uint32_t>(Pos);
760     outs() << "      [" << i << "]: "
761            << "function offset="
762            << format("0x%08" PRIx32, FunctionOffset) << ", "
763            << "encoding="
764            << format("0x%08" PRIx32, Encoding)
765            << '\n';
766   }
769 static void printCompressedSecondLevelUnwindPage(
770     const char *PageStart, uint32_t FunctionBase,
771     const SmallVectorImpl<uint32_t> &CommonEncodings) {
772   const char *Pos = PageStart;
773   uint32_t Kind = readNext<uint32_t>(Pos);
774   (void)Kind;
775   assert(Kind == 3 && "kind for a compressed 2nd level index should be 3");
777   uint16_t EntriesStart = readNext<uint16_t>(Pos);
778   uint16_t NumEntries = readNext<uint16_t>(Pos);
780   uint16_t EncodingsStart = readNext<uint16_t>(Pos);
781   readNext<uint16_t>(Pos);
782   const auto *PageEncodings = reinterpret_cast<const support::ulittle32_t *>(
783       PageStart + EncodingsStart);
785   Pos = PageStart + EntriesStart;
786   for (unsigned i = 0; i < NumEntries; ++i) {
787     uint32_t Entry = readNext<uint32_t>(Pos);
788     uint32_t FunctionOffset = FunctionBase + (Entry & 0xffffff);
789     uint32_t EncodingIdx = Entry >> 24;
791     uint32_t Encoding;
792     if (EncodingIdx < CommonEncodings.size())
793       Encoding = CommonEncodings[EncodingIdx];
794     else
795       Encoding = PageEncodings[EncodingIdx - CommonEncodings.size()];
797     outs() << "      [" << i << "]: "
798            << "function offset="
799            << format("0x%08" PRIx32, FunctionOffset) << ", "
800            << "encoding[" << EncodingIdx << "]="
801            << format("0x%08" PRIx32, Encoding)
802            << '\n';
803   }
806 static void
807 printMachOUnwindInfoSection(const MachOObjectFile *Obj,
808                             std::map<uint64_t, SymbolRef> &Symbols,
809                             const SectionRef &UnwindInfo) {
811   assert(Obj->isLittleEndian() &&
812          "There should not be a big-endian .o with __unwind_info");
814   outs() << "Contents of __unwind_info section:\n";
816   StringRef Contents;
817   UnwindInfo.getContents(Contents);
818   const char *Pos = Contents.data();
820   //===----------------------------------
821   // Section header
822   //===----------------------------------
824   uint32_t Version = readNext<uint32_t>(Pos);
825   outs() << "  Version:                                   "
826          << format("0x%" PRIx32, Version) << '\n';
827   assert(Version == 1 && "only understand version 1");
829   uint32_t CommonEncodingsStart = readNext<uint32_t>(Pos);
830   outs() << "  Common encodings array section offset:     "
831          << format("0x%" PRIx32, CommonEncodingsStart) << '\n';
832   uint32_t NumCommonEncodings = readNext<uint32_t>(Pos);
833   outs() << "  Number of common encodings in array:       "
834          << format("0x%" PRIx32, NumCommonEncodings) << '\n';
836   uint32_t PersonalitiesStart = readNext<uint32_t>(Pos);
837   outs() << "  Personality function array section offset: "
838          << format("0x%" PRIx32, PersonalitiesStart) << '\n';
839   uint32_t NumPersonalities = readNext<uint32_t>(Pos);
840   outs() << "  Number of personality functions in array:  "
841          << format("0x%" PRIx32, NumPersonalities) << '\n';
843   uint32_t IndicesStart = readNext<uint32_t>(Pos);
844   outs() << "  Index array section offset:                "
845          << format("0x%" PRIx32, IndicesStart) << '\n';
846   uint32_t NumIndices = readNext<uint32_t>(Pos);
847   outs() << "  Number of indices in array:                "
848          << format("0x%" PRIx32, NumIndices) << '\n';
850   //===----------------------------------
851   // A shared list of common encodings
852   //===----------------------------------
854   // These occupy indices in the range [0, N] whenever an encoding is referenced
855   // from a compressed 2nd level index table. In practice the linker only
856   // creates ~128 of these, so that indices are available to embed encodings in
857   // the 2nd level index.
859   SmallVector<uint32_t, 64> CommonEncodings;
860   outs() << "  Common encodings: (count = " << NumCommonEncodings << ")\n";
861   Pos = Contents.data() + CommonEncodingsStart;
862   for (unsigned i = 0; i < NumCommonEncodings; ++i) {
863     uint32_t Encoding = readNext<uint32_t>(Pos);
864     CommonEncodings.push_back(Encoding);
866     outs() << "    encoding[" << i << "]: " << format("0x%08" PRIx32, Encoding)
867            << '\n';
868   }
871   //===----------------------------------
872   // Personality functions used in this executable
873   //===----------------------------------
875   // There should be only a handful of these (one per source language,
876   // roughly). Particularly since they only get 2 bits in the compact encoding.
878   outs() << "  Personality functions: (count = " << NumPersonalities << ")\n";
879   Pos = Contents.data() + PersonalitiesStart;
880   for (unsigned i = 0; i < NumPersonalities; ++i) {
881     uint32_t PersonalityFn = readNext<uint32_t>(Pos);
882     outs() << "    personality[" << i + 1
883            << "]: " << format("0x%08" PRIx32, PersonalityFn) << '\n';
884   }
886   //===----------------------------------
887   // The level 1 index entries
888   //===----------------------------------
890   // These specify an approximate place to start searching for the more detailed
891   // information, sorted by PC.
893   struct IndexEntry {
894     uint32_t FunctionOffset;
895     uint32_t SecondLevelPageStart;
896     uint32_t LSDAStart;
897   };
899   SmallVector<IndexEntry, 4> IndexEntries;
901   outs() << "  Top level indices: (count = " << NumIndices << ")\n";
902   Pos = Contents.data() + IndicesStart;
903   for (unsigned i = 0; i < NumIndices; ++i) {
904     IndexEntry Entry;
906     Entry.FunctionOffset = readNext<uint32_t>(Pos);
907     Entry.SecondLevelPageStart = readNext<uint32_t>(Pos);
908     Entry.LSDAStart = readNext<uint32_t>(Pos);
909     IndexEntries.push_back(Entry);
911     outs() << "    [" << i << "]: "
912            << "function offset="
913            << format("0x%08" PRIx32, Entry.FunctionOffset) << ", "
914            << "2nd level page offset="
915            << format("0x%08" PRIx32, Entry.SecondLevelPageStart) << ", "
916            << "LSDA offset="
917            << format("0x%08" PRIx32, Entry.LSDAStart) << '\n';
918   }
921   //===----------------------------------
922   // Next come the LSDA tables
923   //===----------------------------------
925   // The LSDA layout is rather implicit: it's a contiguous array of entries from
926   // the first top-level index's LSDAOffset to the last (sentinel).
928   outs() << "  LSDA descriptors:\n";
929   Pos = Contents.data() + IndexEntries[0].LSDAStart;
930   int NumLSDAs = (IndexEntries.back().LSDAStart - IndexEntries[0].LSDAStart) /
931                  (2 * sizeof(uint32_t));
932   for (int i = 0; i < NumLSDAs; ++i) {
933     uint32_t FunctionOffset = readNext<uint32_t>(Pos);
934     uint32_t LSDAOffset = readNext<uint32_t>(Pos);
935     outs() << "    [" << i << "]: "
936            << "function offset="
937            << format("0x%08" PRIx32, FunctionOffset) << ", "
938            << "LSDA offset="
939            << format("0x%08" PRIx32, LSDAOffset) << '\n';
940   }
942   //===----------------------------------
943   // Finally, the 2nd level indices
944   //===----------------------------------
946   // Generally these are 4K in size, and have 2 possible forms:
947   //   + Regular stores up to 511 entries with disparate encodings
948   //   + Compressed stores up to 1021 entries if few enough compact encoding
949   //     values are used.
950   outs() << "  Second level indices:\n";
951   for (unsigned i = 0; i < IndexEntries.size() - 1; ++i) {
952     // The final sentinel top-level index has no associated 2nd level page
953     if (IndexEntries[i].SecondLevelPageStart == 0)
954       break;
956     outs() << "    Second level index[" << i << "]: "
957            << "offset in section="
958            << format("0x%08" PRIx32, IndexEntries[i].SecondLevelPageStart)
959            << ", "
960            << "base function offset="
961            << format("0x%08" PRIx32, IndexEntries[i].FunctionOffset) << '\n';
963     Pos = Contents.data() + IndexEntries[i].SecondLevelPageStart;
964     uint32_t Kind = *reinterpret_cast<const support::ulittle32_t *>(Pos);
965     if (Kind == 2)
966       printRegularSecondLevelUnwindPage(Pos);
967     else if (Kind == 3)
968       printCompressedSecondLevelUnwindPage(Pos, IndexEntries[i].FunctionOffset,
969                                            CommonEncodings);
970     else
971       llvm_unreachable("Do not know how to print this kind of 2nd level page");
973   }
976 void llvm::printMachOUnwindInfo(const MachOObjectFile *Obj) {
977   std::map<uint64_t, SymbolRef> Symbols;
978   for (const SymbolRef &SymRef : Obj->symbols()) {
979     // Discard any undefined or absolute symbols. They're not going to take part
980     // in the convenience lookup for unwind info and just take up resources.
981     section_iterator Section = Obj->section_end();
982     SymRef.getSection(Section);
983     if (Section == Obj->section_end())
984       continue;
986     uint64_t Addr;
987     SymRef.getAddress(Addr);
988     Symbols.insert(std::make_pair(Addr, SymRef));
989   }
991   for (const SectionRef &Section : Obj->sections()) {
992     StringRef SectName;
993     Section.getName(SectName);
994     if (SectName == "__compact_unwind")
995       printMachOCompactUnwindSection(Obj, Symbols, Section);
996     else if (SectName == "__unwind_info")
997       printMachOUnwindInfoSection(Obj, Symbols, Section);
998     else if (SectName == "__eh_frame")
999       outs() << "llvm-objdump: warning: unhandled __eh_frame section\n";
1001   }
1004 static void PrintMachHeader(uint32_t magic, uint32_t cputype,
1005                             uint32_t cpusubtype, uint32_t filetype,
1006                             uint32_t ncmds, uint32_t sizeofcmds, uint32_t flags,
1007                             bool verbose) {
1008   outs() << "Mach header\n";
1009   outs() << "      magic cputype cpusubtype  caps    filetype ncmds "
1010             "sizeofcmds      flags\n";
1011   if (verbose) {
1012     if (magic == MachO::MH_MAGIC)
1013       outs() << "   MH_MAGIC";
1014     else if (magic == MachO::MH_MAGIC_64)
1015       outs() << "MH_MAGIC_64";
1016     else
1017       outs() << format(" 0x%08" PRIx32, magic);
1018     switch (cputype) {
1019     case MachO::CPU_TYPE_I386:
1020       outs() << "    I386";
1021       switch (cpusubtype & ~MachO::CPU_SUBTYPE_MASK) {
1022       case MachO::CPU_SUBTYPE_I386_ALL:
1023         outs() << "        ALL";
1024         break;
1025       default:
1026         outs() << format(" %10d", cpusubtype & ~MachO::CPU_SUBTYPE_MASK);
1027         break;
1028       }
1029       break;
1030     case MachO::CPU_TYPE_X86_64:
1031       outs() << "  X86_64";
1032     case MachO::CPU_SUBTYPE_X86_64_ALL:
1033       outs() << "        ALL";
1034       break;
1035     case MachO::CPU_SUBTYPE_X86_64_H:
1036       outs() << "    Haswell";
1037       outs() << format(" %10d", cpusubtype & ~MachO::CPU_SUBTYPE_MASK);
1038       break;
1039     case MachO::CPU_TYPE_ARM:
1040       outs() << "     ARM";
1041       switch (cpusubtype & ~MachO::CPU_SUBTYPE_MASK) {
1042       case MachO::CPU_SUBTYPE_ARM_ALL:
1043         outs() << "        ALL";
1044         break;
1045       case MachO::CPU_SUBTYPE_ARM_V4T:
1046         outs() << "        V4T";
1047         break;
1048       case MachO::CPU_SUBTYPE_ARM_V5TEJ:
1049         outs() << "      V5TEJ";
1050         break;
1051       case MachO::CPU_SUBTYPE_ARM_XSCALE:
1052         outs() << "     XSCALE";
1053         break;
1054       case MachO::CPU_SUBTYPE_ARM_V6:
1055         outs() << "         V6";
1056         break;
1057       case MachO::CPU_SUBTYPE_ARM_V6M:
1058         outs() << "        V6M";
1059         break;
1060       case MachO::CPU_SUBTYPE_ARM_V7:
1061         outs() << "         V7";
1062         break;
1063       case MachO::CPU_SUBTYPE_ARM_V7EM:
1064         outs() << "       V7EM";
1065         break;
1066       case MachO::CPU_SUBTYPE_ARM_V7K:
1067         outs() << "        V7K";
1068         break;
1069       case MachO::CPU_SUBTYPE_ARM_V7M:
1070         outs() << "        V7M";
1071         break;
1072       case MachO::CPU_SUBTYPE_ARM_V7S:
1073         outs() << "        V7S";
1074         break;
1075       default:
1076         outs() << format(" %10d", cpusubtype & ~MachO::CPU_SUBTYPE_MASK);
1077         break;
1078       }
1079       break;
1080     case MachO::CPU_TYPE_ARM64:
1081       outs() << "   ARM64";
1082       switch (cpusubtype & ~MachO::CPU_SUBTYPE_MASK) {
1083       case MachO::CPU_SUBTYPE_ARM64_ALL:
1084         outs() << "        ALL";
1085         break;
1086       default:
1087         outs() << format(" %10d", cpusubtype & ~MachO::CPU_SUBTYPE_MASK);
1088         break;
1089       }
1090       break;
1091     case MachO::CPU_TYPE_POWERPC:
1092       outs() << "     PPC";
1093       switch (cpusubtype & ~MachO::CPU_SUBTYPE_MASK) {
1094       case MachO::CPU_SUBTYPE_POWERPC_ALL:
1095         outs() << "        ALL";
1096         break;
1097       default:
1098         outs() << format(" %10d", cpusubtype & ~MachO::CPU_SUBTYPE_MASK);
1099         break;
1100       }
1101       break;
1102     case MachO::CPU_TYPE_POWERPC64:
1103       outs() << "   PPC64";
1104       switch (cpusubtype & ~MachO::CPU_SUBTYPE_MASK) {
1105       case MachO::CPU_SUBTYPE_POWERPC_ALL:
1106         outs() << "        ALL";
1107         break;
1108       default:
1109         outs() << format(" %10d", cpusubtype & ~MachO::CPU_SUBTYPE_MASK);
1110         break;
1111       }
1112       break;
1113     }
1114     if ((cpusubtype & MachO::CPU_SUBTYPE_MASK) == MachO::CPU_SUBTYPE_LIB64) {
1115       outs() << " LIB64";
1116     } else {
1117       outs() << format("  0x%02" PRIx32,
1118                        (cpusubtype & MachO::CPU_SUBTYPE_MASK) >> 24);
1119     }
1120     switch (filetype) {
1121     case MachO::MH_OBJECT:
1122       outs() << "      OBJECT";
1123       break;
1124     case MachO::MH_EXECUTE:
1125       outs() << "     EXECUTE";
1126       break;
1127     case MachO::MH_FVMLIB:
1128       outs() << "      FVMLIB";
1129       break;
1130     case MachO::MH_CORE:
1131       outs() << "        CORE";
1132       break;
1133     case MachO::MH_PRELOAD:
1134       outs() << "     PRELOAD";
1135       break;
1136     case MachO::MH_DYLIB:
1137       outs() << "       DYLIB";
1138       break;
1139     case MachO::MH_DYLIB_STUB:
1140       outs() << "  DYLIB_STUB";
1141       break;
1142     case MachO::MH_DYLINKER:
1143       outs() << "    DYLINKER";
1144       break;
1145     case MachO::MH_BUNDLE:
1146       outs() << "      BUNDLE";
1147       break;
1148     case MachO::MH_DSYM:
1149       outs() << "        DSYM";
1150       break;
1151     case MachO::MH_KEXT_BUNDLE:
1152       outs() << "  KEXTBUNDLE";
1153       break;
1154     default:
1155       outs() << format("  %10u", filetype);
1156       break;
1157     }
1158     outs() << format(" %5u", ncmds);
1159     outs() << format(" %10u", sizeofcmds);
1160     uint32_t f = flags;
1161     if (f & MachO::MH_NOUNDEFS) {
1162       outs() << "   NOUNDEFS";
1163       f &= ~MachO::MH_NOUNDEFS;
1164     }
1165     if (f & MachO::MH_INCRLINK) {
1166       outs() << " INCRLINK";
1167       f &= ~MachO::MH_INCRLINK;
1168     }
1169     if (f & MachO::MH_DYLDLINK) {
1170       outs() << " DYLDLINK";
1171       f &= ~MachO::MH_DYLDLINK;
1172     }
1173     if (f & MachO::MH_BINDATLOAD) {
1174       outs() << " BINDATLOAD";
1175       f &= ~MachO::MH_BINDATLOAD;
1176     }
1177     if (f & MachO::MH_PREBOUND) {
1178       outs() << " PREBOUND";
1179       f &= ~MachO::MH_PREBOUND;
1180     }
1181     if (f & MachO::MH_SPLIT_SEGS) {
1182       outs() << " SPLIT_SEGS";
1183       f &= ~MachO::MH_SPLIT_SEGS;
1184     }
1185     if (f & MachO::MH_LAZY_INIT) {
1186       outs() << " LAZY_INIT";
1187       f &= ~MachO::MH_LAZY_INIT;
1188     }
1189     if (f & MachO::MH_TWOLEVEL) {
1190       outs() << " TWOLEVEL";
1191       f &= ~MachO::MH_TWOLEVEL;
1192     }
1193     if (f & MachO::MH_FORCE_FLAT) {
1194       outs() << " FORCE_FLAT";
1195       f &= ~MachO::MH_FORCE_FLAT;
1196     }
1197     if (f & MachO::MH_NOMULTIDEFS) {
1198       outs() << " NOMULTIDEFS";
1199       f &= ~MachO::MH_NOMULTIDEFS;
1200     }
1201     if (f & MachO::MH_NOFIXPREBINDING) {
1202       outs() << " NOFIXPREBINDING";
1203       f &= ~MachO::MH_NOFIXPREBINDING;
1204     }
1205     if (f & MachO::MH_PREBINDABLE) {
1206       outs() << " PREBINDABLE";
1207       f &= ~MachO::MH_PREBINDABLE;
1208     }
1209     if (f & MachO::MH_ALLMODSBOUND) {
1210       outs() << " ALLMODSBOUND";
1211       f &= ~MachO::MH_ALLMODSBOUND;
1212     }
1213     if (f & MachO::MH_SUBSECTIONS_VIA_SYMBOLS) {
1214       outs() << " SUBSECTIONS_VIA_SYMBOLS";
1215       f &= ~MachO::MH_SUBSECTIONS_VIA_SYMBOLS;
1216     }
1217     if (f & MachO::MH_CANONICAL) {
1218       outs() << " CANONICAL";
1219       f &= ~MachO::MH_CANONICAL;
1220     }
1221     if (f & MachO::MH_WEAK_DEFINES) {
1222       outs() << " WEAK_DEFINES";
1223       f &= ~MachO::MH_WEAK_DEFINES;
1224     }
1225     if (f & MachO::MH_BINDS_TO_WEAK) {
1226       outs() << " BINDS_TO_WEAK";
1227       f &= ~MachO::MH_BINDS_TO_WEAK;
1228     }
1229     if (f & MachO::MH_ALLOW_STACK_EXECUTION) {
1230       outs() << " ALLOW_STACK_EXECUTION";
1231       f &= ~MachO::MH_ALLOW_STACK_EXECUTION;
1232     }
1233     if (f & MachO::MH_DEAD_STRIPPABLE_DYLIB) {
1234       outs() << " DEAD_STRIPPABLE_DYLIB";
1235       f &= ~MachO::MH_DEAD_STRIPPABLE_DYLIB;
1236     }
1237     if (f & MachO::MH_PIE) {
1238       outs() << " PIE";
1239       f &= ~MachO::MH_PIE;
1240     }
1241     if (f & MachO::MH_NO_REEXPORTED_DYLIBS) {
1242       outs() << " NO_REEXPORTED_DYLIBS";
1243       f &= ~MachO::MH_NO_REEXPORTED_DYLIBS;
1244     }
1245     if (f & MachO::MH_HAS_TLV_DESCRIPTORS) {
1246       outs() << " MH_HAS_TLV_DESCRIPTORS";
1247       f &= ~MachO::MH_HAS_TLV_DESCRIPTORS;
1248     }
1249     if (f & MachO::MH_NO_HEAP_EXECUTION) {
1250       outs() << " MH_NO_HEAP_EXECUTION";
1251       f &= ~MachO::MH_NO_HEAP_EXECUTION;
1252     }
1253     if (f & MachO::MH_APP_EXTENSION_SAFE) {
1254       outs() << " APP_EXTENSION_SAFE";
1255       f &= ~MachO::MH_APP_EXTENSION_SAFE;
1256     }
1257     if (f != 0 || flags == 0)
1258       outs() << format(" 0x%08" PRIx32, f);
1259   } else {
1260     outs() << format(" 0x%08" PRIx32, magic);
1261     outs() << format(" %7d", cputype);
1262     outs() << format(" %10d", cpusubtype & ~MachO::CPU_SUBTYPE_MASK);
1263     outs() << format("  0x%02" PRIx32,
1264                      (cpusubtype & MachO::CPU_SUBTYPE_MASK) >> 24);
1265     outs() << format("  %10u", filetype);
1266     outs() << format(" %5u", ncmds);
1267     outs() << format(" %10u", sizeofcmds);
1268     outs() << format(" 0x%08" PRIx32, flags);
1269   }
1270   outs() << "\n";
1273 static void PrintSegmentCommand(uint32_t cmd, uint32_t cmdsize,
1274                                 StringRef SegName, uint64_t vmaddr,
1275                                 uint64_t vmsize, uint64_t fileoff,
1276                                 uint64_t filesize, uint32_t maxprot,
1277                                 uint32_t initprot, uint32_t nsects,
1278                                 uint32_t flags, uint32_t object_size,
1279                                 bool verbose) {
1280   uint64_t expected_cmdsize;
1281   if (cmd == MachO::LC_SEGMENT) {
1282     outs() << "      cmd LC_SEGMENT\n";
1283     expected_cmdsize = nsects;
1284     expected_cmdsize *= sizeof(struct MachO::section);
1285     expected_cmdsize += sizeof(struct MachO::segment_command);
1286   } else {
1287     outs() << "      cmd LC_SEGMENT_64\n";
1288     expected_cmdsize = nsects;
1289     expected_cmdsize *= sizeof(struct MachO::section_64);
1290     expected_cmdsize += sizeof(struct MachO::segment_command_64);
1291   }
1292   outs() << "  cmdsize " << cmdsize;
1293   if (cmdsize != expected_cmdsize)
1294     outs() << " Inconsistent size\n";
1295   else
1296     outs() << "\n";
1297   outs() << "  segname " << SegName << "\n";
1298   if (cmd == MachO::LC_SEGMENT_64) {
1299     outs() << "   vmaddr " << format("0x%016" PRIx64, vmaddr) << "\n";
1300     outs() << "   vmsize " << format("0x%016" PRIx64, vmsize) << "\n";
1301   } else {
1302     outs() << "   vmaddr " << format("0x%08" PRIx32, vmaddr) << "\n";
1303     outs() << "   vmsize " << format("0x%08" PRIx32, vmsize) << "\n";
1304   }
1305   outs() << "  fileoff " << fileoff;
1306   if (fileoff > object_size)
1307     outs() << " (past end of file)\n";
1308   else
1309     outs() << "\n";
1310   outs() << " filesize " << filesize;
1311   if (fileoff + filesize > object_size)
1312     outs() << " (past end of file)\n";
1313   else
1314     outs() << "\n";
1315   if (verbose) {
1316     if ((maxprot &
1317          ~(MachO::VM_PROT_READ | MachO::VM_PROT_WRITE |
1318            MachO::VM_PROT_EXECUTE)) != 0)
1319       outs() << "  maxprot ?" << format("0x%08" PRIx32, maxprot) << "\n";
1320     else {
1321       if (maxprot & MachO::VM_PROT_READ)
1322         outs() << "  maxprot r";
1323       else
1324         outs() << "  maxprot -";
1325       if (maxprot & MachO::VM_PROT_WRITE)
1326         outs() << "w";
1327       else
1328         outs() << "-";
1329       if (maxprot & MachO::VM_PROT_EXECUTE)
1330         outs() << "x\n";
1331       else
1332         outs() << "-\n";
1333     }
1334     if ((initprot &
1335          ~(MachO::VM_PROT_READ | MachO::VM_PROT_WRITE |
1336            MachO::VM_PROT_EXECUTE)) != 0)
1337       outs() << "  initprot ?" << format("0x%08" PRIx32, initprot) << "\n";
1338     else {
1339       if (initprot & MachO::VM_PROT_READ)
1340         outs() << " initprot r";
1341       else
1342         outs() << " initprot -";
1343       if (initprot & MachO::VM_PROT_WRITE)
1344         outs() << "w";
1345       else
1346         outs() << "-";
1347       if (initprot & MachO::VM_PROT_EXECUTE)
1348         outs() << "x\n";
1349       else
1350         outs() << "-\n";
1351     }
1352   } else {
1353     outs() << "  maxprot " << format("0x%08" PRIx32, maxprot) << "\n";
1354     outs() << " initprot " << format("0x%08" PRIx32, initprot) << "\n";
1355   }
1356   outs() << "   nsects " << nsects << "\n";
1357   if (verbose) {
1358     outs() << "    flags";
1359     if (flags == 0)
1360       outs() << " (none)\n";
1361     else {
1362       if (flags & MachO::SG_HIGHVM) {
1363         outs() << " HIGHVM";
1364         flags &= ~MachO::SG_HIGHVM;
1365       }
1366       if (flags & MachO::SG_FVMLIB) {
1367         outs() << " FVMLIB";
1368         flags &= ~MachO::SG_FVMLIB;
1369       }
1370       if (flags & MachO::SG_NORELOC) {
1371         outs() << " NORELOC";
1372         flags &= ~MachO::SG_NORELOC;
1373       }
1374       if (flags & MachO::SG_PROTECTED_VERSION_1) {
1375         outs() << " PROTECTED_VERSION_1";
1376         flags &= ~MachO::SG_PROTECTED_VERSION_1;
1377       }
1378       if (flags)
1379         outs() << format(" 0x%08" PRIx32, flags) << " (unknown flags)\n";
1380       else
1381         outs() << "\n";
1382     }
1383   } else {
1384     outs() << "    flags " << format("0x%" PRIx32, flags) << "\n";
1385   }
1388 static void PrintSection(const char *sectname, const char *segname,
1389                          uint64_t addr, uint64_t size, uint32_t offset,
1390                          uint32_t align, uint32_t reloff, uint32_t nreloc,
1391                          uint32_t flags, uint32_t reserved1, uint32_t reserved2,
1392                          uint32_t cmd, const char *sg_segname,
1393                          uint32_t filetype, uint32_t object_size,
1394                          bool verbose) {
1395   outs() << "Section\n";
1396   outs() << "  sectname " << format("%.16s\n", sectname);
1397   outs() << "   segname " << format("%.16s", segname);
1398   if (filetype != MachO::MH_OBJECT && strncmp(sg_segname, segname, 16) != 0)
1399     outs() << " (does not match segment)\n";
1400   else
1401     outs() << "\n";
1402   if (cmd == MachO::LC_SEGMENT_64) {
1403     outs() << "      addr " << format("0x%016" PRIx64, addr) << "\n";
1404     outs() << "      size " << format("0x%016" PRIx64, size);
1405   } else {
1406     outs() << "      addr " << format("0x%08" PRIx32, addr) << "\n";
1407     outs() << "      size " << format("0x%08" PRIx32, size);
1408   }
1409   if ((flags & MachO::S_ZEROFILL) != 0 && offset + size > object_size)
1410     outs() << " (past end of file)\n";
1411   else
1412     outs() << "\n";
1413   outs() << "    offset " << offset;
1414   if (offset > object_size)
1415     outs() << " (past end of file)\n";
1416   else
1417     outs() << "\n";
1418   uint32_t align_shifted = 1 << align;
1419   outs() << "     align 2^" << align << " (" << align_shifted << ")\n";
1420   outs() << "    reloff " << reloff;
1421   if (reloff > object_size)
1422     outs() << " (past end of file)\n";
1423   else
1424     outs() << "\n";
1425   outs() << "    nreloc " << nreloc;
1426   if (reloff + nreloc * sizeof(struct MachO::relocation_info) > object_size)
1427     outs() << " (past end of file)\n";
1428   else
1429     outs() << "\n";
1430   uint32_t section_type = flags & MachO::SECTION_TYPE;
1431   if (verbose) {
1432     outs() << "      type";
1433     if (section_type == MachO::S_REGULAR)
1434       outs() << " S_REGULAR\n";
1435     else if (section_type == MachO::S_ZEROFILL)
1436       outs() << " S_ZEROFILL\n";
1437     else if (section_type == MachO::S_CSTRING_LITERALS)
1438       outs() << " S_CSTRING_LITERALS\n";
1439     else if (section_type == MachO::S_4BYTE_LITERALS)
1440       outs() << " S_4BYTE_LITERALS\n";
1441     else if (section_type == MachO::S_8BYTE_LITERALS)
1442       outs() << " S_8BYTE_LITERALS\n";
1443     else if (section_type == MachO::S_16BYTE_LITERALS)
1444       outs() << " S_16BYTE_LITERALS\n";
1445     else if (section_type == MachO::S_LITERAL_POINTERS)
1446       outs() << " S_LITERAL_POINTERS\n";
1447     else if (section_type == MachO::S_NON_LAZY_SYMBOL_POINTERS)
1448       outs() << " S_NON_LAZY_SYMBOL_POINTERS\n";
1449     else if (section_type == MachO::S_LAZY_SYMBOL_POINTERS)
1450       outs() << " S_LAZY_SYMBOL_POINTERS\n";
1451     else if (section_type == MachO::S_SYMBOL_STUBS)
1452       outs() << " S_SYMBOL_STUBS\n";
1453     else if (section_type == MachO::S_MOD_INIT_FUNC_POINTERS)
1454       outs() << " S_MOD_INIT_FUNC_POINTERS\n";
1455     else if (section_type == MachO::S_MOD_TERM_FUNC_POINTERS)
1456       outs() << " S_MOD_TERM_FUNC_POINTERS\n";
1457     else if (section_type == MachO::S_COALESCED)
1458       outs() << " S_COALESCED\n";
1459     else if (section_type == MachO::S_INTERPOSING)
1460       outs() << " S_INTERPOSING\n";
1461     else if (section_type == MachO::S_DTRACE_DOF)
1462       outs() << " S_DTRACE_DOF\n";
1463     else if (section_type == MachO::S_LAZY_DYLIB_SYMBOL_POINTERS)
1464       outs() << " S_LAZY_DYLIB_SYMBOL_POINTERS\n";
1465     else if (section_type == MachO::S_THREAD_LOCAL_REGULAR)
1466       outs() << " S_THREAD_LOCAL_REGULAR\n";
1467     else if (section_type == MachO::S_THREAD_LOCAL_ZEROFILL)
1468       outs() << " S_THREAD_LOCAL_ZEROFILL\n";
1469     else if (section_type == MachO::S_THREAD_LOCAL_VARIABLES)
1470       outs() << " S_THREAD_LOCAL_VARIABLES\n";
1471     else if (section_type == MachO::S_THREAD_LOCAL_VARIABLE_POINTERS)
1472       outs() << " S_THREAD_LOCAL_VARIABLE_POINTERS\n";
1473     else if (section_type == MachO::S_THREAD_LOCAL_INIT_FUNCTION_POINTERS)
1474       outs() << " S_THREAD_LOCAL_INIT_FUNCTION_POINTERS\n";
1475     else
1476       outs() << format("0x%08" PRIx32, section_type) << "\n";
1477     outs() << "attributes";
1478     uint32_t section_attributes = flags & MachO::SECTION_ATTRIBUTES;
1479     if (section_attributes & MachO::S_ATTR_PURE_INSTRUCTIONS)
1480       outs() << " PURE_INSTRUCTIONS";
1481     if (section_attributes & MachO::S_ATTR_NO_TOC)
1482       outs() << " NO_TOC";
1483     if (section_attributes & MachO::S_ATTR_STRIP_STATIC_SYMS)
1484       outs() << " STRIP_STATIC_SYMS";
1485     if (section_attributes & MachO::S_ATTR_NO_DEAD_STRIP)
1486       outs() << " NO_DEAD_STRIP";
1487     if (section_attributes & MachO::S_ATTR_LIVE_SUPPORT)
1488       outs() << " LIVE_SUPPORT";
1489     if (section_attributes & MachO::S_ATTR_SELF_MODIFYING_CODE)
1490       outs() << " SELF_MODIFYING_CODE";
1491     if (section_attributes & MachO::S_ATTR_DEBUG)
1492       outs() << " DEBUG";
1493     if (section_attributes & MachO::S_ATTR_SOME_INSTRUCTIONS)
1494       outs() << " SOME_INSTRUCTIONS";
1495     if (section_attributes & MachO::S_ATTR_EXT_RELOC)
1496       outs() << " EXT_RELOC";
1497     if (section_attributes & MachO::S_ATTR_LOC_RELOC)
1498       outs() << " LOC_RELOC";
1499     if (section_attributes == 0)
1500       outs() << " (none)";
1501     outs() << "\n";
1502   } else
1503     outs() << "     flags " << format("0x%08" PRIx32, flags) << "\n";
1504   outs() << " reserved1 " << reserved1;
1505   if (section_type == MachO::S_SYMBOL_STUBS ||
1506       section_type == MachO::S_LAZY_SYMBOL_POINTERS ||
1507       section_type == MachO::S_LAZY_DYLIB_SYMBOL_POINTERS ||
1508       section_type == MachO::S_NON_LAZY_SYMBOL_POINTERS ||
1509       section_type == MachO::S_THREAD_LOCAL_VARIABLE_POINTERS)
1510     outs() << " (index into indirect symbol table)\n";
1511   else
1512     outs() << "\n";
1513   outs() << " reserved2 " << reserved2;
1514   if (section_type == MachO::S_SYMBOL_STUBS)
1515     outs() << " (size of stubs)\n";
1516   else
1517     outs() << "\n";
1520 static void PrintSymtabLoadCommand(MachO::symtab_command st, uint32_t cputype,
1521                                    uint32_t object_size) {
1522   outs() << "     cmd LC_SYMTAB\n";
1523   outs() << " cmdsize " << st.cmdsize;
1524   if (st.cmdsize != sizeof(struct MachO::symtab_command))
1525     outs() << " Incorrect size\n";
1526   else
1527     outs() << "\n";
1528   outs() << "  symoff " << st.symoff;
1529   if (st.symoff > object_size)
1530     outs() << " (past end of file)\n";
1531   else
1532     outs() << "\n";
1533   outs() << "   nsyms " << st.nsyms;
1534   uint64_t big_size;
1535   if (cputype & MachO::CPU_ARCH_ABI64) {
1536     big_size = st.nsyms;
1537     big_size *= sizeof(struct MachO::nlist_64);
1538     big_size += st.symoff;
1539     if (big_size > object_size)
1540       outs() << " (past end of file)\n";
1541     else
1542       outs() << "\n";
1543   } else {
1544     big_size = st.nsyms;
1545     big_size *= sizeof(struct MachO::nlist);
1546     big_size += st.symoff;
1547     if (big_size > object_size)
1548       outs() << " (past end of file)\n";
1549     else
1550       outs() << "\n";
1551   }
1552   outs() << "  stroff " << st.stroff;
1553   if (st.stroff > object_size)
1554     outs() << " (past end of file)\n";
1555   else
1556     outs() << "\n";
1557   outs() << " strsize " << st.strsize;
1558   big_size = st.stroff;
1559   big_size += st.strsize;
1560   if (big_size > object_size)
1561     outs() << " (past end of file)\n";
1562   else
1563     outs() << "\n";
1566 static void PrintDysymtabLoadCommand(MachO::dysymtab_command dyst,
1567                                      uint32_t nsyms, uint32_t object_size,
1568                                      uint32_t cputype) {
1569   outs() << "            cmd LC_DYSYMTAB\n";
1570   outs() << "        cmdsize " << dyst.cmdsize;
1571   if (dyst.cmdsize != sizeof(struct MachO::dysymtab_command))
1572     outs() << " Incorrect size\n";
1573   else
1574     outs() << "\n";
1575   outs() << "      ilocalsym " << dyst.ilocalsym;
1576   if (dyst.ilocalsym > nsyms)
1577     outs() << " (greater than the number of symbols)\n";
1578   else
1579     outs() << "\n";
1580   outs() << "      nlocalsym " << dyst.nlocalsym;
1581   uint64_t big_size;
1582   big_size = dyst.ilocalsym;
1583   big_size += dyst.nlocalsym;
1584   if (big_size > nsyms)
1585     outs() << " (past the end of the symbol table)\n";
1586   else
1587     outs() << "\n";
1588   outs() << "     iextdefsym " << dyst.iextdefsym;
1589   if (dyst.iextdefsym > nsyms)
1590     outs() << " (greater than the number of symbols)\n";
1591   else
1592     outs() << "\n";
1593   outs() << "     nextdefsym " << dyst.nextdefsym;
1594   big_size = dyst.iextdefsym;
1595   big_size += dyst.nextdefsym;
1596   if (big_size > nsyms)
1597     outs() << " (past the end of the symbol table)\n";
1598   else
1599     outs() << "\n";
1600   outs() << "      iundefsym " << dyst.iundefsym;
1601   if (dyst.iundefsym > nsyms)
1602     outs() << " (greater than the number of symbols)\n";
1603   else
1604     outs() << "\n";
1605   outs() << "      nundefsym " << dyst.nundefsym;
1606   big_size = dyst.iundefsym;
1607   big_size += dyst.nundefsym;
1608   if (big_size > nsyms)
1609     outs() << " (past the end of the symbol table)\n";
1610   else
1611     outs() << "\n";
1612   outs() << "         tocoff " << dyst.tocoff;
1613   if (dyst.tocoff > object_size)
1614     outs() << " (past end of file)\n";
1615   else
1616     outs() << "\n";
1617   outs() << "           ntoc " << dyst.ntoc;
1618   big_size = dyst.ntoc;
1619   big_size *= sizeof(struct MachO::dylib_table_of_contents);
1620   big_size += dyst.tocoff;
1621   if (big_size > object_size)
1622     outs() << " (past end of file)\n";
1623   else
1624     outs() << "\n";
1625   outs() << "      modtaboff " << dyst.modtaboff;
1626   if (dyst.modtaboff > object_size)
1627     outs() << " (past end of file)\n";
1628   else
1629     outs() << "\n";
1630   outs() << "        nmodtab " << dyst.nmodtab;
1631   uint64_t modtabend;
1632   if (cputype & MachO::CPU_ARCH_ABI64) {
1633     modtabend = dyst.nmodtab;
1634     modtabend *= sizeof(struct MachO::dylib_module_64);
1635     modtabend += dyst.modtaboff;
1636   } else {
1637     modtabend = dyst.nmodtab;
1638     modtabend *= sizeof(struct MachO::dylib_module);
1639     modtabend += dyst.modtaboff;
1640   }
1641   if (modtabend > object_size)
1642     outs() << " (past end of file)\n";
1643   else
1644     outs() << "\n";
1645   outs() << "   extrefsymoff " << dyst.extrefsymoff;
1646   if (dyst.extrefsymoff > object_size)
1647     outs() << " (past end of file)\n";
1648   else
1649     outs() << "\n";
1650   outs() << "    nextrefsyms " << dyst.nextrefsyms;
1651   big_size = dyst.nextrefsyms;
1652   big_size *= sizeof(struct MachO::dylib_reference);
1653   big_size += dyst.extrefsymoff;
1654   if (big_size > object_size)
1655     outs() << " (past end of file)\n";
1656   else
1657     outs() << "\n";
1658   outs() << " indirectsymoff " << dyst.indirectsymoff;
1659   if (dyst.indirectsymoff > object_size)
1660     outs() << " (past end of file)\n";
1661   else
1662     outs() << "\n";
1663   outs() << "  nindirectsyms " << dyst.nindirectsyms;
1664   big_size = dyst.nindirectsyms;
1665   big_size *= sizeof(uint32_t);
1666   big_size += dyst.indirectsymoff;
1667   if (big_size > object_size)
1668     outs() << " (past end of file)\n";
1669   else
1670     outs() << "\n";
1671   outs() << "      extreloff " << dyst.extreloff;
1672   if (dyst.extreloff > object_size)
1673     outs() << " (past end of file)\n";
1674   else
1675     outs() << "\n";
1676   outs() << "        nextrel " << dyst.nextrel;
1677   big_size = dyst.nextrel;
1678   big_size *= sizeof(struct MachO::relocation_info);
1679   big_size += dyst.extreloff;
1680   if (big_size > object_size)
1681     outs() << " (past end of file)\n";
1682   else
1683     outs() << "\n";
1684   outs() << "      locreloff " << dyst.locreloff;
1685   if (dyst.locreloff > object_size)
1686     outs() << " (past end of file)\n";
1687   else
1688     outs() << "\n";
1689   outs() << "        nlocrel " << dyst.nlocrel;
1690   big_size = dyst.nlocrel;
1691   big_size *= sizeof(struct MachO::relocation_info);
1692   big_size += dyst.locreloff;
1693   if (big_size > object_size)
1694     outs() << " (past end of file)\n";
1695   else
1696     outs() << "\n";
1699 static void PrintDyldInfoLoadCommand(MachO::dyld_info_command dc,
1700                                      uint32_t object_size) {
1701   if (dc.cmd == MachO::LC_DYLD_INFO)
1702     outs() << "            cmd LC_DYLD_INFO\n";
1703   else
1704     outs() << "            cmd LC_DYLD_INFO_ONLY\n";
1705   outs() << "        cmdsize " << dc.cmdsize;
1706   if (dc.cmdsize != sizeof(struct MachO::dyld_info_command))
1707     outs() << " Incorrect size\n";
1708   else
1709     outs() << "\n";
1710   outs() << "     rebase_off " << dc.rebase_off;
1711   if (dc.rebase_off > object_size)
1712     outs() << " (past end of file)\n";
1713   else
1714     outs() << "\n";
1715   outs() << "    rebase_size " << dc.rebase_size;
1716   uint64_t big_size;
1717   big_size = dc.rebase_off;
1718   big_size += dc.rebase_size;
1719   if (big_size > object_size)
1720     outs() << " (past end of file)\n";
1721   else
1722     outs() << "\n";
1723   outs() << "       bind_off " << dc.bind_off;
1724   if (dc.bind_off > object_size)
1725     outs() << " (past end of file)\n";
1726   else
1727     outs() << "\n";
1728   outs() << "      bind_size " << dc.bind_size;
1729   big_size = dc.bind_off;
1730   big_size += dc.bind_size;
1731   if (big_size > object_size)
1732     outs() << " (past end of file)\n";
1733   else
1734     outs() << "\n";
1735   outs() << "  weak_bind_off " << dc.weak_bind_off;
1736   if (dc.weak_bind_off > object_size)
1737     outs() << " (past end of file)\n";
1738   else
1739     outs() << "\n";
1740   outs() << " weak_bind_size " << dc.weak_bind_size;
1741   big_size = dc.weak_bind_off;
1742   big_size += dc.weak_bind_size;
1743   if (big_size > object_size)
1744     outs() << " (past end of file)\n";
1745   else
1746     outs() << "\n";
1747   outs() << "  lazy_bind_off " << dc.lazy_bind_off;
1748   if (dc.lazy_bind_off > object_size)
1749     outs() << " (past end of file)\n";
1750   else
1751     outs() << "\n";
1752   outs() << " lazy_bind_size " << dc.lazy_bind_size;
1753   big_size = dc.lazy_bind_off;
1754   big_size += dc.lazy_bind_size;
1755   if (big_size > object_size)
1756     outs() << " (past end of file)\n";
1757   else
1758     outs() << "\n";
1759   outs() << "     export_off " << dc.export_off;
1760   if (dc.export_off > object_size)
1761     outs() << " (past end of file)\n";
1762   else
1763     outs() << "\n";
1764   outs() << "    export_size " << dc.export_size;
1765   big_size = dc.export_off;
1766   big_size += dc.export_size;
1767   if (big_size > object_size)
1768     outs() << " (past end of file)\n";
1769   else
1770     outs() << "\n";
1773 static void PrintDyldLoadCommand(MachO::dylinker_command dyld,
1774                                  const char *Ptr) {
1775   if (dyld.cmd == MachO::LC_ID_DYLINKER)
1776     outs() << "          cmd LC_ID_DYLINKER\n";
1777   else if (dyld.cmd == MachO::LC_LOAD_DYLINKER)
1778     outs() << "          cmd LC_LOAD_DYLINKER\n";
1779   else if (dyld.cmd == MachO::LC_DYLD_ENVIRONMENT)
1780     outs() << "          cmd LC_DYLD_ENVIRONMENT\n";
1781   else
1782     outs() << "          cmd ?(" << dyld.cmd << ")\n";
1783   outs() << "      cmdsize " << dyld.cmdsize;
1784   if (dyld.cmdsize < sizeof(struct MachO::dylinker_command))
1785     outs() << " Incorrect size\n";
1786   else
1787     outs() << "\n";
1788   if (dyld.name >= dyld.cmdsize)
1789     outs() << "         name ?(bad offset " << dyld.name << ")\n";
1790   else {
1791     const char *P = (const char *)(Ptr)+dyld.name;
1792     outs() << "         name " << P << " (offset " << dyld.name << ")\n";
1793   }
1796 static void PrintUuidLoadCommand(MachO::uuid_command uuid) {
1797   outs() << "     cmd LC_UUID\n";
1798   outs() << " cmdsize " << uuid.cmdsize;
1799   if (uuid.cmdsize != sizeof(struct MachO::uuid_command))
1800     outs() << " Incorrect size\n";
1801   else
1802     outs() << "\n";
1803   outs() << "    uuid ";
1804   outs() << format("%02" PRIX32, uuid.uuid[0]);
1805   outs() << format("%02" PRIX32, uuid.uuid[1]);
1806   outs() << format("%02" PRIX32, uuid.uuid[2]);
1807   outs() << format("%02" PRIX32, uuid.uuid[3]);
1808   outs() << "-";
1809   outs() << format("%02" PRIX32, uuid.uuid[4]);
1810   outs() << format("%02" PRIX32, uuid.uuid[5]);
1811   outs() << "-";
1812   outs() << format("%02" PRIX32, uuid.uuid[6]);
1813   outs() << format("%02" PRIX32, uuid.uuid[7]);
1814   outs() << "-";
1815   outs() << format("%02" PRIX32, uuid.uuid[8]);
1816   outs() << format("%02" PRIX32, uuid.uuid[9]);
1817   outs() << "-";
1818   outs() << format("%02" PRIX32, uuid.uuid[10]);
1819   outs() << format("%02" PRIX32, uuid.uuid[11]);
1820   outs() << format("%02" PRIX32, uuid.uuid[12]);
1821   outs() << format("%02" PRIX32, uuid.uuid[13]);
1822   outs() << format("%02" PRIX32, uuid.uuid[14]);
1823   outs() << format("%02" PRIX32, uuid.uuid[15]);
1824   outs() << "\n";
1827 static void PrintVersionMinLoadCommand(MachO::version_min_command vd) {
1828   if (vd.cmd == MachO::LC_VERSION_MIN_MACOSX)
1829     outs() << "      cmd LC_VERSION_MIN_MACOSX\n";
1830   else if (vd.cmd == MachO::LC_VERSION_MIN_IPHONEOS)
1831     outs() << "      cmd LC_VERSION_MIN_IPHONEOS\n";
1832   else
1833     outs() << "      cmd " << vd.cmd << " (?)\n";
1834   outs() << "  cmdsize " << vd.cmdsize;
1835   if (vd.cmdsize != sizeof(struct MachO::version_min_command))
1836     outs() << " Incorrect size\n";
1837   else
1838     outs() << "\n";
1839   outs() << "  version " << ((vd.version >> 16) & 0xffff) << "."
1840          << ((vd.version >> 8) & 0xff);
1841   if ((vd.version & 0xff) != 0)
1842     outs() << "." << (vd.version & 0xff);
1843   outs() << "\n";
1844   if (vd.sdk == 0)
1845     outs() << "      sdk n/a\n";
1846   else {
1847     outs() << "      sdk " << ((vd.sdk >> 16) & 0xffff) << "."
1848            << ((vd.sdk >> 8) & 0xff);
1849   }
1850   if ((vd.sdk & 0xff) != 0)
1851     outs() << "." << (vd.sdk & 0xff);
1852   outs() << "\n";
1855 static void PrintSourceVersionCommand(MachO::source_version_command sd) {
1856   outs() << "      cmd LC_SOURCE_VERSION\n";
1857   outs() << "  cmdsize " << sd.cmdsize;
1858   if (sd.cmdsize != sizeof(struct MachO::source_version_command))
1859     outs() << " Incorrect size\n";
1860   else
1861     outs() << "\n";
1862   uint64_t a = (sd.version >> 40) & 0xffffff;
1863   uint64_t b = (sd.version >> 30) & 0x3ff;
1864   uint64_t c = (sd.version >> 20) & 0x3ff;
1865   uint64_t d = (sd.version >> 10) & 0x3ff;
1866   uint64_t e = sd.version & 0x3ff;
1867   outs() << "  version " << a << "." << b;
1868   if (e != 0)
1869     outs() << "." << c << "." << d << "." << e;
1870   else if (d != 0)
1871     outs() << "." << c << "." << d;
1872   else if (c != 0)
1873     outs() << "." << c;
1874   outs() << "\n";
1877 static void PrintEntryPointCommand(MachO::entry_point_command ep) {
1878   outs() << "       cmd LC_MAIN\n";
1879   outs() << "   cmdsize " << ep.cmdsize;
1880   if (ep.cmdsize != sizeof(struct MachO::entry_point_command))
1881     outs() << " Incorrect size\n";
1882   else
1883     outs() << "\n";
1884   outs() << "  entryoff " << ep.entryoff << "\n";
1885   outs() << " stacksize " << ep.stacksize << "\n";
1888 static void PrintDylibCommand(MachO::dylib_command dl, const char *Ptr) {
1889   if (dl.cmd == MachO::LC_ID_DYLIB)
1890     outs() << "          cmd LC_ID_DYLIB\n";
1891   else if (dl.cmd == MachO::LC_LOAD_DYLIB)
1892     outs() << "          cmd LC_LOAD_DYLIB\n";
1893   else if (dl.cmd == MachO::LC_LOAD_WEAK_DYLIB)
1894     outs() << "          cmd LC_LOAD_WEAK_DYLIB\n";
1895   else if (dl.cmd == MachO::LC_REEXPORT_DYLIB)
1896     outs() << "          cmd LC_REEXPORT_DYLIB\n";
1897   else if (dl.cmd == MachO::LC_LAZY_LOAD_DYLIB)
1898     outs() << "          cmd LC_LAZY_LOAD_DYLIB\n";
1899   else if (dl.cmd == MachO::LC_LOAD_UPWARD_DYLIB)
1900     outs() << "          cmd LC_LOAD_UPWARD_DYLIB\n";
1901   else
1902     outs() << "          cmd " << dl.cmd << " (unknown)\n";
1903   outs() << "      cmdsize " << dl.cmdsize;
1904   if (dl.cmdsize < sizeof(struct MachO::dylib_command))
1905     outs() << " Incorrect size\n";
1906   else
1907     outs() << "\n";
1908   if (dl.dylib.name < dl.cmdsize) {
1909     const char *P = (const char *)(Ptr)+dl.dylib.name;
1910     outs() << "         name " << P << " (offset " << dl.dylib.name << ")\n";
1911   } else {
1912     outs() << "         name ?(bad offset " << dl.dylib.name << ")\n";
1913   }
1914   outs() << "   time stamp " << dl.dylib.timestamp << " ";
1915   time_t t = dl.dylib.timestamp;
1916   outs() << ctime(&t);
1917   outs() << "      current version ";
1918   if (dl.dylib.current_version == 0xffffffff)
1919     outs() << "n/a\n";
1920   else
1921     outs() << ((dl.dylib.current_version >> 16) & 0xffff) << "."
1922            << ((dl.dylib.current_version >> 8) & 0xff) << "."
1923            << (dl.dylib.current_version & 0xff) << "\n";
1924   outs() << "compatibility version ";
1925   if (dl.dylib.compatibility_version == 0xffffffff)
1926     outs() << "n/a\n";
1927   else
1928     outs() << ((dl.dylib.compatibility_version >> 16) & 0xffff) << "."
1929            << ((dl.dylib.compatibility_version >> 8) & 0xff) << "."
1930            << (dl.dylib.compatibility_version & 0xff) << "\n";
1933 static void PrintLinkEditDataCommand(MachO::linkedit_data_command ld,
1934                                      uint32_t object_size) {
1935   if (ld.cmd == MachO::LC_CODE_SIGNATURE)
1936     outs() << "      cmd LC_FUNCTION_STARTS\n";
1937   else if (ld.cmd == MachO::LC_SEGMENT_SPLIT_INFO)
1938     outs() << "      cmd LC_SEGMENT_SPLIT_INFO\n";
1939   else if (ld.cmd == MachO::LC_FUNCTION_STARTS)
1940     outs() << "      cmd LC_FUNCTION_STARTS\n";
1941   else if (ld.cmd == MachO::LC_DATA_IN_CODE)
1942     outs() << "      cmd LC_DATA_IN_CODE\n";
1943   else if (ld.cmd == MachO::LC_DYLIB_CODE_SIGN_DRS)
1944     outs() << "      cmd LC_DYLIB_CODE_SIGN_DRS\n";
1945   else if (ld.cmd == MachO::LC_LINKER_OPTIMIZATION_HINT)
1946     outs() << "      cmd LC_LINKER_OPTIMIZATION_HINT\n";
1947   else
1948     outs() << "      cmd " << ld.cmd << " (?)\n";
1949   outs() << "  cmdsize " << ld.cmdsize;
1950   if (ld.cmdsize != sizeof(struct MachO::linkedit_data_command))
1951     outs() << " Incorrect size\n";
1952   else
1953     outs() << "\n";
1954   outs() << "  dataoff " << ld.dataoff;
1955   if (ld.dataoff > object_size)
1956     outs() << " (past end of file)\n";
1957   else
1958     outs() << "\n";
1959   outs() << " datasize " << ld.datasize;
1960   uint64_t big_size = ld.dataoff;
1961   big_size += ld.datasize;
1962   if (big_size > object_size)
1963     outs() << " (past end of file)\n";
1964   else
1965     outs() << "\n";
1968 static void PrintLoadCommands(const MachOObjectFile *Obj, uint32_t ncmds,
1969                               uint32_t filetype, uint32_t cputype,
1970                               bool verbose) {
1971   StringRef Buf = Obj->getData();
1972   MachOObjectFile::LoadCommandInfo Command = Obj->getFirstLoadCommandInfo();
1973   for (unsigned i = 0;; ++i) {
1974     outs() << "Load command " << i << "\n";
1975     if (Command.C.cmd == MachO::LC_SEGMENT) {
1976       MachO::segment_command SLC = Obj->getSegmentLoadCommand(Command);
1977       const char *sg_segname = SLC.segname;
1978       PrintSegmentCommand(SLC.cmd, SLC.cmdsize, SLC.segname, SLC.vmaddr,
1979                           SLC.vmsize, SLC.fileoff, SLC.filesize, SLC.maxprot,
1980                           SLC.initprot, SLC.nsects, SLC.flags, Buf.size(),
1981                           verbose);
1982       for (unsigned j = 0; j < SLC.nsects; j++) {
1983         MachO::section_64 S = Obj->getSection64(Command, j);
1984         PrintSection(S.sectname, S.segname, S.addr, S.size, S.offset, S.align,
1985                      S.reloff, S.nreloc, S.flags, S.reserved1, S.reserved2,
1986                      SLC.cmd, sg_segname, filetype, Buf.size(), verbose);
1987       }
1988     } else if (Command.C.cmd == MachO::LC_SEGMENT_64) {
1989       MachO::segment_command_64 SLC_64 = Obj->getSegment64LoadCommand(Command);
1990       const char *sg_segname = SLC_64.segname;
1991       PrintSegmentCommand(SLC_64.cmd, SLC_64.cmdsize, SLC_64.segname,
1992                           SLC_64.vmaddr, SLC_64.vmsize, SLC_64.fileoff,
1993                           SLC_64.filesize, SLC_64.maxprot, SLC_64.initprot,
1994                           SLC_64.nsects, SLC_64.flags, Buf.size(), verbose);
1995       for (unsigned j = 0; j < SLC_64.nsects; j++) {
1996         MachO::section_64 S_64 = Obj->getSection64(Command, j);
1997         PrintSection(S_64.sectname, S_64.segname, S_64.addr, S_64.size,
1998                      S_64.offset, S_64.align, S_64.reloff, S_64.nreloc,
1999                      S_64.flags, S_64.reserved1, S_64.reserved2, SLC_64.cmd,
2000                      sg_segname, filetype, Buf.size(), verbose);
2001       }
2002     } else if (Command.C.cmd == MachO::LC_SYMTAB) {
2003       MachO::symtab_command Symtab = Obj->getSymtabLoadCommand();
2004       PrintSymtabLoadCommand(Symtab, cputype, Buf.size());
2005     } else if (Command.C.cmd == MachO::LC_DYSYMTAB) {
2006       MachO::dysymtab_command Dysymtab = Obj->getDysymtabLoadCommand();
2007       MachO::symtab_command Symtab = Obj->getSymtabLoadCommand();
2008       PrintDysymtabLoadCommand(Dysymtab, Symtab.nsyms, Buf.size(), cputype);
2009     } else if (Command.C.cmd == MachO::LC_DYLD_INFO ||
2010                Command.C.cmd == MachO::LC_DYLD_INFO_ONLY) {
2011       MachO::dyld_info_command DyldInfo = Obj->getDyldInfoLoadCommand(Command);
2012       PrintDyldInfoLoadCommand(DyldInfo, Buf.size());
2013     } else if (Command.C.cmd == MachO::LC_LOAD_DYLINKER ||
2014                Command.C.cmd == MachO::LC_ID_DYLINKER ||
2015                Command.C.cmd == MachO::LC_DYLD_ENVIRONMENT) {
2016       MachO::dylinker_command Dyld = Obj->getDylinkerCommand(Command);
2017       PrintDyldLoadCommand(Dyld, Command.Ptr);
2018     } else if (Command.C.cmd == MachO::LC_UUID) {
2019       MachO::uuid_command Uuid = Obj->getUuidCommand(Command);
2020       PrintUuidLoadCommand(Uuid);
2021     } else if (Command.C.cmd == MachO::LC_VERSION_MIN_MACOSX) {
2022       MachO::version_min_command Vd = Obj->getVersionMinLoadCommand(Command);
2023       PrintVersionMinLoadCommand(Vd);
2024     } else if (Command.C.cmd == MachO::LC_SOURCE_VERSION) {
2025       MachO::source_version_command Sd = Obj->getSourceVersionCommand(Command);
2026       PrintSourceVersionCommand(Sd);
2027     } else if (Command.C.cmd == MachO::LC_MAIN) {
2028       MachO::entry_point_command Ep = Obj->getEntryPointCommand(Command);
2029       PrintEntryPointCommand(Ep);
2030     } else if (Command.C.cmd == MachO::LC_LOAD_DYLIB) {
2031       MachO::dylib_command Dl = Obj->getDylibIDLoadCommand(Command);
2032       PrintDylibCommand(Dl, Command.Ptr);
2033     } else if (Command.C.cmd == MachO::LC_CODE_SIGNATURE ||
2034                Command.C.cmd == MachO::LC_SEGMENT_SPLIT_INFO ||
2035                Command.C.cmd == MachO::LC_FUNCTION_STARTS ||
2036                Command.C.cmd == MachO::LC_DATA_IN_CODE ||
2037                Command.C.cmd == MachO::LC_DYLIB_CODE_SIGN_DRS ||
2038                Command.C.cmd == MachO::LC_LINKER_OPTIMIZATION_HINT) {
2039       MachO::linkedit_data_command Ld =
2040           Obj->getLinkeditDataLoadCommand(Command);
2041       PrintLinkEditDataCommand(Ld, Buf.size());
2042     } else {
2043       outs() << "      cmd ?(" << format("0x%08" PRIx32, Command.C.cmd)
2044              << ")\n";
2045       outs() << "  cmdsize " << Command.C.cmdsize << "\n";
2046       // TODO: get and print the raw bytes of the load command.
2047     }
2048     // TODO: print all the other kinds of load commands.
2049     if (i == ncmds - 1)
2050       break;
2051     else
2052       Command = Obj->getNextLoadCommandInfo(Command);
2053   }
2056 static void getAndPrintMachHeader(const MachOObjectFile *Obj, uint32_t &ncmds,
2057                                   uint32_t &filetype, uint32_t &cputype,
2058                                   bool verbose) {
2059   if (Obj->is64Bit()) {
2060     MachO::mach_header_64 H_64;
2061     H_64 = Obj->getHeader64();
2062     PrintMachHeader(H_64.magic, H_64.cputype, H_64.cpusubtype, H_64.filetype,
2063                     H_64.ncmds, H_64.sizeofcmds, H_64.flags, verbose);
2064     ncmds = H_64.ncmds;
2065     filetype = H_64.filetype;
2066     cputype = H_64.cputype;
2067   } else {
2068     MachO::mach_header H;
2069     H = Obj->getHeader();
2070     PrintMachHeader(H.magic, H.cputype, H.cpusubtype, H.filetype, H.ncmds,
2071                     H.sizeofcmds, H.flags, verbose);
2072     ncmds = H.ncmds;
2073     filetype = H.filetype;
2074     cputype = H.cputype;
2075   }
2078 void llvm::printMachOFileHeader(const object::ObjectFile *Obj) {
2079   const MachOObjectFile *file = dyn_cast<const MachOObjectFile>(Obj);
2080   uint32_t ncmds = 0;
2081   uint32_t filetype = 0;
2082   uint32_t cputype = 0;
2083   getAndPrintMachHeader(file, ncmds, filetype, cputype, true);
2084   PrintLoadCommands(file, ncmds, filetype, cputype, true);
2087 //===----------------------------------------------------------------------===//
2088 // export trie dumping
2089 //===----------------------------------------------------------------------===//
2091 void llvm::printMachOExportsTrie(const object::MachOObjectFile *Obj) {
2092   for (const llvm::object::ExportEntry &Entry : Obj->exports()) {
2093     uint64_t Flags = Entry.flags();
2094     bool ReExport = (Flags & MachO::EXPORT_SYMBOL_FLAGS_REEXPORT);
2095     bool WeakDef = (Flags & MachO::EXPORT_SYMBOL_FLAGS_WEAK_DEFINITION);
2096     bool ThreadLocal = ((Flags & MachO::EXPORT_SYMBOL_FLAGS_KIND_MASK) ==
2097                         MachO::EXPORT_SYMBOL_FLAGS_KIND_THREAD_LOCAL);
2098     bool Abs = ((Flags & MachO::EXPORT_SYMBOL_FLAGS_KIND_MASK) ==
2099                 MachO::EXPORT_SYMBOL_FLAGS_KIND_ABSOLUTE);
2100     bool Resolver = (Flags & MachO::EXPORT_SYMBOL_FLAGS_STUB_AND_RESOLVER);
2101     if (ReExport)
2102       outs() << "[re-export] ";
2103     else
2104       outs()
2105           << format("0x%08llX  ", Entry.address()); // FIXME:add in base address
2106     outs() << Entry.name();
2107     if (WeakDef || ThreadLocal || Resolver || Abs) {
2108       bool NeedsComma = false;
2109       outs() << " [";
2110       if (WeakDef) {
2111         outs() << "weak_def";
2112         NeedsComma = true;
2113       }
2114       if (ThreadLocal) {
2115         if (NeedsComma)
2116           outs() << ", ";
2117         outs() << "per-thread";
2118         NeedsComma = true;
2119       }
2120       if (Abs) {
2121         if (NeedsComma)
2122           outs() << ", ";
2123         outs() << "absolute";
2124         NeedsComma = true;
2125       }
2126       if (Resolver) {
2127         if (NeedsComma)
2128           outs() << ", ";
2129         outs() << format("resolver=0x%08llX", Entry.other());
2130         NeedsComma = true;
2131       }
2132       outs() << "]";
2133     }
2134     if (ReExport) {
2135       StringRef DylibName = "unknown";
2136       int Ordinal = Entry.other() - 1;
2137       Obj->getLibraryShortNameByIndex(Ordinal, DylibName);
2138       if (Entry.otherName().empty())
2139         outs() << " (from " << DylibName << ")";
2140       else
2141         outs() << " (" << Entry.otherName() << " from " << DylibName << ")";
2142     }
2143     outs() << "\n";
2144   }