550fa5765c5c2aa75aa983d3858592b2870c7c51
[oota-llvm.git] / lib / Support / Host.cpp
1 //===-- Host.cpp - Implement OS Host Concept --------------------*- C++ -*-===//
2 //
3 //                     The LLVM Compiler Infrastructure
4 //
5 // This file is distributed under the University of Illinois Open Source
6 // License. See LICENSE.TXT for details.
7 //
8 //===----------------------------------------------------------------------===//
9 //
10 //  This header file implements the operating system Host concept.
11 //
12 //===----------------------------------------------------------------------===//
13
14 #include "llvm/ADT/SmallVector.h"
15 #include "llvm/ADT/StringRef.h"
16 #include "llvm/ADT/StringSwitch.h"
17 #include "llvm/Support/DataStream.h"
18 #include "llvm/Support/Debug.h"
19 #include "llvm/Support/Host.h"
20 #include "llvm/Support/raw_ostream.h"
21 #include "llvm/Config/config.h"
22 #include <string.h>
23
24 // Include the platform-specific parts of this class.
25 #ifdef LLVM_ON_UNIX
26 #include "Unix/Host.inc"
27 #endif
28 #ifdef LLVM_ON_WIN32
29 #include "Windows/Host.inc"
30 #endif
31 #ifdef _MSC_VER
32 #include <intrin.h>
33 #endif
34 #if defined(__APPLE__) && (defined(__ppc__) || defined(__powerpc__))
35 #include <mach/mach.h>
36 #include <mach/mach_host.h>
37 #include <mach/host_info.h>
38 #include <mach/machine.h>
39 #endif
40
41 //===----------------------------------------------------------------------===//
42 //
43 //  Implementations of the CPU detection routines
44 //
45 //===----------------------------------------------------------------------===//
46
47 using namespace llvm;
48
49 #if defined(i386) || defined(__i386__) || defined(__x86__) || defined(_M_IX86)\
50  || defined(__x86_64__) || defined(_M_AMD64) || defined (_M_X64)
51
52 /// GetX86CpuIDAndInfo - Execute the specified cpuid and return the 4 values in the
53 /// specified arguments.  If we can't run cpuid on the host, return true.
54 static bool GetX86CpuIDAndInfo(unsigned value, unsigned *rEAX,
55                             unsigned *rEBX, unsigned *rECX, unsigned *rEDX) {
56 #if defined(__x86_64__) || defined(_M_AMD64) || defined (_M_X64)
57   #if defined(__GNUC__)
58     // gcc doesn't know cpuid would clobber ebx/rbx. Preseve it manually.
59     asm ("movq\t%%rbx, %%rsi\n\t"
60          "cpuid\n\t"
61          "xchgq\t%%rbx, %%rsi\n\t"
62          : "=a" (*rEAX),
63            "=S" (*rEBX),
64            "=c" (*rECX),
65            "=d" (*rEDX)
66          :  "a" (value));
67     return false;
68   #elif defined(_MSC_VER)
69     int registers[4];
70     __cpuid(registers, value);
71     *rEAX = registers[0];
72     *rEBX = registers[1];
73     *rECX = registers[2];
74     *rEDX = registers[3];
75     return false;
76   #else
77     return true;
78   #endif
79 #elif defined(i386) || defined(__i386__) || defined(__x86__) || defined(_M_IX86)
80   #if defined(__GNUC__)
81     asm ("movl\t%%ebx, %%esi\n\t"
82          "cpuid\n\t"
83          "xchgl\t%%ebx, %%esi\n\t"
84          : "=a" (*rEAX),
85            "=S" (*rEBX),
86            "=c" (*rECX),
87            "=d" (*rEDX)
88          :  "a" (value));
89     return false;
90   #elif defined(_MSC_VER)
91     __asm {
92       mov   eax,value
93       cpuid
94       mov   esi,rEAX
95       mov   dword ptr [esi],eax
96       mov   esi,rEBX
97       mov   dword ptr [esi],ebx
98       mov   esi,rECX
99       mov   dword ptr [esi],ecx
100       mov   esi,rEDX
101       mov   dword ptr [esi],edx
102     }
103     return false;
104 // pedantic #else returns to appease -Wunreachable-code (so we don't generate
105 // postprocessed code that looks like "return true; return false;")
106   #else
107     return true;
108   #endif
109 #else
110   return true;
111 #endif
112 }
113
114 static void DetectX86FamilyModel(unsigned EAX, unsigned &Family,
115                                  unsigned &Model) {
116   Family = (EAX >> 8) & 0xf; // Bits 8 - 11
117   Model  = (EAX >> 4) & 0xf; // Bits 4 - 7
118   if (Family == 6 || Family == 0xf) {
119     if (Family == 0xf)
120       // Examine extended family ID if family ID is F.
121       Family += (EAX >> 20) & 0xff;    // Bits 20 - 27
122     // Examine extended model ID if family ID is 6 or F.
123     Model += ((EAX >> 16) & 0xf) << 4; // Bits 16 - 19
124   }
125 }
126
127 std::string sys::getHostCPUName() {
128   unsigned EAX = 0, EBX = 0, ECX = 0, EDX = 0;
129   if (GetX86CpuIDAndInfo(0x1, &EAX, &EBX, &ECX, &EDX))
130     return "generic";
131   unsigned Family = 0;
132   unsigned Model  = 0;
133   DetectX86FamilyModel(EAX, Family, Model);
134
135   bool HasSSE3 = (ECX & 0x1);
136   GetX86CpuIDAndInfo(0x80000001, &EAX, &EBX, &ECX, &EDX);
137   bool Em64T = (EDX >> 29) & 0x1;
138
139   union {
140     unsigned u[3];
141     char     c[12];
142   } text;
143
144   GetX86CpuIDAndInfo(0, &EAX, text.u+0, text.u+2, text.u+1);
145   if (memcmp(text.c, "GenuineIntel", 12) == 0) {
146     switch (Family) {
147     case 3:
148       return "i386";
149     case 4:
150       switch (Model) {
151       case 0: // Intel486 DX processors
152       case 1: // Intel486 DX processors
153       case 2: // Intel486 SX processors
154       case 3: // Intel487 processors, IntelDX2 OverDrive processors,
155               // IntelDX2 processors
156       case 4: // Intel486 SL processor
157       case 5: // IntelSX2 processors
158       case 7: // Write-Back Enhanced IntelDX2 processors
159       case 8: // IntelDX4 OverDrive processors, IntelDX4 processors
160       default: return "i486";
161       }
162     case 5:
163       switch (Model) {
164       case  1: // Pentium OverDrive processor for Pentium processor (60, 66),
165                // Pentium processors (60, 66)
166       case  2: // Pentium OverDrive processor for Pentium processor (75, 90,
167                // 100, 120, 133), Pentium processors (75, 90, 100, 120, 133,
168                // 150, 166, 200)
169       case  3: // Pentium OverDrive processors for Intel486 processor-based
170                // systems
171         return "pentium";
172
173       case  4: // Pentium OverDrive processor with MMX technology for Pentium
174                // processor (75, 90, 100, 120, 133), Pentium processor with
175                // MMX technology (166, 200)
176         return "pentium-mmx";
177
178       default: return "pentium";
179       }
180     case 6:
181       switch (Model) {
182       case  1: // Pentium Pro processor
183         return "pentiumpro";
184
185       case  3: // Intel Pentium II OverDrive processor, Pentium II processor,
186                // model 03
187       case  5: // Pentium II processor, model 05, Pentium II Xeon processor,
188                // model 05, and Intel Celeron processor, model 05
189       case  6: // Celeron processor, model 06
190         return "pentium2";
191
192       case  7: // Pentium III processor, model 07, and Pentium III Xeon
193                // processor, model 07
194       case  8: // Pentium III processor, model 08, Pentium III Xeon processor,
195                // model 08, and Celeron processor, model 08
196       case 10: // Pentium III Xeon processor, model 0Ah
197       case 11: // Pentium III processor, model 0Bh
198         return "pentium3";
199
200       case  9: // Intel Pentium M processor, Intel Celeron M processor model 09.
201       case 13: // Intel Pentium M processor, Intel Celeron M processor, model
202                // 0Dh. All processors are manufactured using the 90 nm process.
203         return "pentium-m";
204
205       case 14: // Intel Core Duo processor, Intel Core Solo processor, model
206                // 0Eh. All processors are manufactured using the 65 nm process.
207         return "yonah";
208
209       case 15: // Intel Core 2 Duo processor, Intel Core 2 Duo mobile
210                // processor, Intel Core 2 Quad processor, Intel Core 2 Quad
211                // mobile processor, Intel Core 2 Extreme processor, Intel
212                // Pentium Dual-Core processor, Intel Xeon processor, model
213                // 0Fh. All processors are manufactured using the 65 nm process.
214       case 22: // Intel Celeron processor model 16h. All processors are
215                // manufactured using the 65 nm process
216         return "core2";
217
218       case 21: // Intel EP80579 Integrated Processor and Intel EP80579
219                // Integrated Processor with Intel QuickAssist Technology
220         return "i686"; // FIXME: ???
221
222       case 23: // Intel Core 2 Extreme processor, Intel Xeon processor, model
223                // 17h. All processors are manufactured using the 45 nm process.
224                //
225                // 45nm: Penryn , Wolfdale, Yorkfield (XE)
226         return "penryn";
227
228       case 26: // Intel Core i7 processor and Intel Xeon processor. All
229                // processors are manufactured using the 45 nm process.
230       case 29: // Intel Xeon processor MP. All processors are manufactured using
231                // the 45 nm process.
232       case 30: // Intel(R) Core(TM) i7 CPU         870  @ 2.93GHz.
233                // As found in a Summer 2010 model iMac.
234       case 37: // Intel Core i7, laptop version.
235       case 44: // Intel Core i7 processor and Intel Xeon processor. All
236                // processors are manufactured using the 32 nm process.
237         return "corei7";
238
239       // SandyBridge:
240       case 42: // Intel Core i7 processor. All processors are manufactured
241                // using the 32 nm process.
242       case 45:
243         return "corei7-avx";
244
245       // Ivy Bridge:
246       case 58:
247         return "core-avx-i";
248
249       case 28: // Most 45 nm Intel Atom processors
250       case 38: // 45 nm Atom Lincroft
251       case 39: // 32 nm Atom Medfield
252         return "atom";
253
254       default: return (Em64T) ? "x86-64" : "i686";
255       }
256     case 15: {
257       switch (Model) {
258       case  0: // Pentium 4 processor, Intel Xeon processor. All processors are
259                // model 00h and manufactured using the 0.18 micron process.
260       case  1: // Pentium 4 processor, Intel Xeon processor, Intel Xeon
261                // processor MP, and Intel Celeron processor. All processors are
262                // model 01h and manufactured using the 0.18 micron process.
263       case  2: // Pentium 4 processor, Mobile Intel Pentium 4 processor - M,
264                // Intel Xeon processor, Intel Xeon processor MP, Intel Celeron
265                // processor, and Mobile Intel Celeron processor. All processors
266                // are model 02h and manufactured using the 0.13 micron process.
267         return (Em64T) ? "x86-64" : "pentium4";
268
269       case  3: // Pentium 4 processor, Intel Xeon processor, Intel Celeron D
270                // processor. All processors are model 03h and manufactured using
271                // the 90 nm process.
272       case  4: // Pentium 4 processor, Pentium 4 processor Extreme Edition,
273                // Pentium D processor, Intel Xeon processor, Intel Xeon
274                // processor MP, Intel Celeron D processor. All processors are
275                // model 04h and manufactured using the 90 nm process.
276       case  6: // Pentium 4 processor, Pentium D processor, Pentium processor
277                // Extreme Edition, Intel Xeon processor, Intel Xeon processor
278                // MP, Intel Celeron D processor. All processors are model 06h
279                // and manufactured using the 65 nm process.
280         return (Em64T) ? "nocona" : "prescott";
281
282       default:
283         return (Em64T) ? "x86-64" : "pentium4";
284       }
285     }
286
287     default:
288       return "generic";
289     }
290   } else if (memcmp(text.c, "AuthenticAMD", 12) == 0) {
291     // FIXME: this poorly matches the generated SubtargetFeatureKV table.  There
292     // appears to be no way to generate the wide variety of AMD-specific targets
293     // from the information returned from CPUID.
294     switch (Family) {
295       case 4:
296         return "i486";
297       case 5:
298         switch (Model) {
299         case 6:
300         case 7:  return "k6";
301         case 8:  return "k6-2";
302         case 9:
303         case 13: return "k6-3";
304         default: return "pentium";
305         }
306       case 6:
307         switch (Model) {
308         case 4:  return "athlon-tbird";
309         case 6:
310         case 7:
311         case 8:  return "athlon-mp";
312         case 10: return "athlon-xp";
313         default: return "athlon";
314         }
315       case 15:
316         if (HasSSE3)
317           return "k8-sse3";
318         switch (Model) {
319         case 1:  return "opteron";
320         case 5:  return "athlon-fx"; // also opteron
321         default: return "athlon64";
322         }
323       case 16:
324         return "amdfam10";
325       case 20:
326         return "btver1";
327       case 21:
328         return "bdver1";
329     default:
330       return "generic";
331     }
332   }
333   return "generic";
334 }
335 #elif defined(__APPLE__) && (defined(__ppc__) || defined(__powerpc__))
336 std::string sys::getHostCPUName() {
337   host_basic_info_data_t hostInfo;
338   mach_msg_type_number_t infoCount;
339
340   infoCount = HOST_BASIC_INFO_COUNT;
341   host_info(mach_host_self(), HOST_BASIC_INFO, (host_info_t)&hostInfo, 
342             &infoCount);
343             
344   if (hostInfo.cpu_type != CPU_TYPE_POWERPC) return "generic";
345
346   switch(hostInfo.cpu_subtype) {
347   case CPU_SUBTYPE_POWERPC_601:   return "601";
348   case CPU_SUBTYPE_POWERPC_602:   return "602";
349   case CPU_SUBTYPE_POWERPC_603:   return "603";
350   case CPU_SUBTYPE_POWERPC_603e:  return "603e";
351   case CPU_SUBTYPE_POWERPC_603ev: return "603ev";
352   case CPU_SUBTYPE_POWERPC_604:   return "604";
353   case CPU_SUBTYPE_POWERPC_604e:  return "604e";
354   case CPU_SUBTYPE_POWERPC_620:   return "620";
355   case CPU_SUBTYPE_POWERPC_750:   return "750";
356   case CPU_SUBTYPE_POWERPC_7400:  return "7400";
357   case CPU_SUBTYPE_POWERPC_7450:  return "7450";
358   case CPU_SUBTYPE_POWERPC_970:   return "970";
359   default: ;
360   }
361   
362   return "generic";
363 }
364 #elif defined(__linux__) && (defined(__ppc__) || defined(__powerpc__))
365 std::string sys::getHostCPUName() {
366   // Access to the Processor Version Register (PVR) on PowerPC is privileged,
367   // and so we must use an operating-system interface to determine the current
368   // processor type. On Linux, this is exposed through the /proc/cpuinfo file.
369   const char *generic = "generic";
370
371   // Note: We cannot mmap /proc/cpuinfo here and then process the resulting
372   // memory buffer because the 'file' has 0 size (it can be read from only
373   // as a stream).
374
375   std::string Err;
376   DataStreamer *DS = getDataFileStreamer("/proc/cpuinfo", &Err);
377   if (!DS) {
378     DEBUG(dbgs() << "Unable to open /proc/cpuinfo: " << Err << "\n");
379     return generic;
380   }
381
382   // The cpu line is second (after the 'processor: 0' line), so if this
383   // buffer is too small then something has changed (or is wrong).
384   char buffer[1024];
385   size_t CPUInfoSize = DS->GetBytes((unsigned char*) buffer, sizeof(buffer));
386   delete DS;
387
388   const char *CPUInfoStart = buffer;
389   const char *CPUInfoEnd = buffer + CPUInfoSize;
390
391   const char *CIP = CPUInfoStart;
392
393   const char *CPUStart = 0;
394   size_t CPULen = 0;
395
396   // We need to find the first line which starts with cpu, spaces, and a colon.
397   // After the colon, there may be some additional spaces and then the cpu type.
398   while (CIP < CPUInfoEnd && CPUStart == 0) {
399     if (CIP < CPUInfoEnd && *CIP == '\n')
400       ++CIP;
401
402     if (CIP < CPUInfoEnd && *CIP == 'c') {
403       ++CIP;
404       if (CIP < CPUInfoEnd && *CIP == 'p') {
405         ++CIP;
406         if (CIP < CPUInfoEnd && *CIP == 'u') {
407           ++CIP;
408           while (CIP < CPUInfoEnd && (*CIP == ' ' || *CIP == '\t'))
409             ++CIP;
410   
411           if (CIP < CPUInfoEnd && *CIP == ':') {
412             ++CIP;
413             while (CIP < CPUInfoEnd && (*CIP == ' ' || *CIP == '\t'))
414               ++CIP;
415   
416             if (CIP < CPUInfoEnd) {
417               CPUStart = CIP;
418               while (CIP < CPUInfoEnd && (*CIP != ' ' && *CIP != '\t' &&
419                                           *CIP != ',' && *CIP != '\n'))
420                 ++CIP;
421               CPULen = CIP - CPUStart;
422             }
423           }
424         }
425       }
426     }
427
428     if (CPUStart == 0)
429       while (CIP < CPUInfoEnd && *CIP != '\n')
430         ++CIP;
431   }
432
433   if (CPUStart == 0)
434     return generic;
435
436   return StringSwitch<const char *>(StringRef(CPUStart, CPULen))
437     .Case("604e", "604e")
438     .Case("604", "604")
439     .Case("7400", "7400")
440     .Case("7410", "7400")
441     .Case("7447", "7400")
442     .Case("7455", "7450")
443     .Case("G4", "g4")
444     .Case("POWER4", "970")
445     .Case("PPC970FX", "970")
446     .Case("PPC970MP", "970")
447     .Case("G5", "g5")
448     .Case("POWER5", "g5")
449     .Case("A2", "a2")
450     .Case("POWER6", "pwr6")
451     .Case("POWER7", "pwr7")
452     .Default(generic);
453 }
454 #elif defined(__linux__) && defined(__arm__)
455 std::string sys::getHostCPUName() {
456   // The cpuid register on arm is not accessible from user space. On Linux,
457   // it is exposed through the /proc/cpuinfo file.
458   // Note: We cannot mmap /proc/cpuinfo here and then process the resulting
459   // memory buffer because the 'file' has 0 size (it can be read from only
460   // as a stream).
461
462   std::string Err;
463   DataStreamer *DS = getDataFileStreamer("/proc/cpuinfo", &Err);
464   if (!DS) {
465     DEBUG(dbgs() << "Unable to open /proc/cpuinfo: " << Err << "\n");
466     return "generic";
467   }
468
469   // Read 1024 bytes from /proc/cpuinfo, which should contain the CPU part line
470   // in all cases.
471   char buffer[1024];
472   size_t CPUInfoSize = DS->GetBytes((unsigned char*) buffer, sizeof(buffer));
473   delete DS;
474
475   StringRef Str(buffer, CPUInfoSize);
476
477   SmallVector<StringRef, 32> Lines;
478   Str.split(Lines, "\n");
479
480   // Look for the CPU implementer line.
481   StringRef Implementer;
482   for (unsigned I = 0, E = Lines.size(); I != E; ++I)
483     if (Lines[I].startswith("CPU implementer"))
484       Implementer = Lines[I].substr(15).ltrim("\t :");
485
486   if (Implementer == "0x41") // ARM Ltd.
487     // Look for the CPU part line.
488     for (unsigned I = 0, E = Lines.size(); I != E; ++I)
489       if (Lines[I].startswith("CPU part"))
490         // The CPU part is a 3 digit hexadecimal number with a 0x prefix. The
491         // values correspond to the "Part number" in the CP15/c0 register. The
492         // contents are specified in the various processor manuals.
493         return StringSwitch<const char *>(Lines[I].substr(8).ltrim("\t :"))
494           .Case("0x926", "arm926ej-s")
495           .Case("0xb02", "mpcore")
496           .Case("0xb36", "arm1136j-s")
497           .Case("0xb56", "arm1156t2-s")
498           .Case("0xb76", "arm1176jz-s")
499           .Case("0xc08", "cortex-a8")
500           .Case("0xc09", "cortex-a9")
501           .Case("0xc20", "cortex-m0")
502           .Case("0xc23", "cortex-m3")
503           .Case("0xc24", "cortex-m4")
504           .Default("generic");
505
506   return "generic";
507 }
508 #else
509 std::string sys::getHostCPUName() {
510   return "generic";
511 }
512 #endif
513
514 bool sys::getHostCPUFeatures(StringMap<bool> &Features){
515   return false;
516 }