Make the use of the vmla and vmls VFP instructions controllable via cmd line.
[oota-llvm.git] / lib / Target / ARM / ARMSubtarget.cpp
1 //===-- ARMSubtarget.cpp - ARM Subtarget Information ------------*- C++ -*-===//
2 //
3 //                     The LLVM Compiler Infrastructure
4 //
5 // This file is distributed under the University of Illinois Open Source
6 // License. See LICENSE.TXT for details.
7 //
8 //===----------------------------------------------------------------------===//
9 //
10 // This file implements the ARM specific subclass of TargetSubtarget.
11 //
12 //===----------------------------------------------------------------------===//
13
14 #include "ARMSubtarget.h"
15 #include "ARMGenSubtarget.inc"
16 #include "llvm/GlobalValue.h"
17 #include "llvm/Target/TargetOptions.h"
18 #include "llvm/Support/CommandLine.h"
19 #include "llvm/ADT/SmallVector.h"
20 using namespace llvm;
21
22 static cl::opt<bool>
23 ReserveR9("arm-reserve-r9", cl::Hidden,
24           cl::desc("Reserve R9, making it unavailable as GPR"));
25 static cl::opt<bool>
26 UseNEONFP("arm-use-neon-fp",
27           cl::desc("Use NEON for single-precision FP"),
28           cl::init(false), cl::Hidden);
29 static cl::opt<bool>
30 UseVMLxInstructions("arm-use-vmlx",
31                     cl::desc("Use VFP vmla and vmls instructions"),
32                     cl::init(true), cl::Hidden);
33
34 static cl::opt<bool>
35 UseMOVT("arm-use-movt",
36         cl::init(true), cl::Hidden);
37
38 ARMSubtarget::ARMSubtarget(const std::string &TT, const std::string &FS,
39                            bool isT)
40   : ARMArchVersion(V4)
41   , ARMFPUType(None)
42   , UseNEONForSinglePrecisionFP(UseNEONFP)
43   , UseVMLx(UseVMLxInstructions)
44   , IsThumb(isT)
45   , ThumbMode(Thumb1)
46   , PostRAScheduler(false)
47   , IsR9Reserved(ReserveR9)
48   , UseMovt(UseMOVT)
49   , HasFP16(false)
50   , stackAlignment(4)
51   , CPUString("generic")
52   , TargetType(isELF) // Default to ELF unless otherwise specified.
53   , TargetABI(ARM_ABI_APCS) {
54   // default to soft float ABI
55   if (FloatABIType == FloatABI::Default)
56     FloatABIType = FloatABI::Soft;
57
58   // Determine default and user specified characteristics
59
60   // Parse features string.
61   CPUString = ParseSubtargetFeatures(FS, CPUString);
62
63   // When no arch is specified either by CPU or by attributes, make the default
64   // ARMv4T.
65   if (CPUString == "generic" && (FS.empty() || FS == "generic"))
66     ARMArchVersion = V4T;
67
68   // Set the boolean corresponding to the current target triple, or the default
69   // if one cannot be determined, to true.
70   unsigned Len = TT.length();
71   unsigned Idx = 0;
72
73   if (Len >= 5 && TT.substr(0, 4) == "armv")
74     Idx = 4;
75   else if (Len >= 6 && TT.substr(0, 5) == "thumb") {
76     IsThumb = true;
77     if (Len >= 7 && TT[5] == 'v')
78       Idx = 6;
79   }
80   if (Idx) {
81     unsigned SubVer = TT[Idx];
82     if (SubVer >= '7' && SubVer <= '9') {
83       ARMArchVersion = V7A;
84     } else if (SubVer == '6') {
85       ARMArchVersion = V6;
86       if (Len >= Idx+3 && TT[Idx+1] == 't' && TT[Idx+2] == '2')
87         ARMArchVersion = V6T2;
88     } else if (SubVer == '5') {
89       ARMArchVersion = V5T;
90       if (Len >= Idx+3 && TT[Idx+1] == 't' && TT[Idx+2] == 'e')
91         ARMArchVersion = V5TE;
92     } else if (SubVer == '4') {
93       if (Len >= Idx+2 && TT[Idx+1] == 't')
94         ARMArchVersion = V4T;
95       else
96         ARMArchVersion = V4;
97     }
98   }
99
100   // Thumb2 implies at least V6T2.
101   if (ARMArchVersion >= V6T2)
102     ThumbMode = Thumb2;
103   else if (ThumbMode >= Thumb2)
104     ARMArchVersion = V6T2;
105
106   if (Len >= 10) {
107     if (TT.find("-darwin") != std::string::npos)
108       // arm-darwin
109       TargetType = isDarwin;
110   }
111
112   if (TT.find("eabi") != std::string::npos)
113     TargetABI = ARM_ABI_AAPCS;
114
115   if (isAAPCS_ABI())
116     stackAlignment = 8;
117
118   if (isTargetDarwin())
119     IsR9Reserved = ReserveR9 | (ARMArchVersion < V6);
120
121   if (!isThumb() || hasThumb2())
122     PostRAScheduler = true;
123
124   // Set CPU specific features.
125   if (CPUString == "cortex-a8") {
126     // On Cortex-a8, it's faster to perform some single-precision FP
127     // operations with NEON instructions.
128     if (UseNEONFP.getPosition() == 0)
129       UseNEONForSinglePrecisionFP = true;
130   }
131 }
132
133 /// GVIsIndirectSymbol - true if the GV will be accessed via an indirect symbol.
134 bool
135 ARMSubtarget::GVIsIndirectSymbol(GlobalValue *GV, Reloc::Model RelocM) const {
136   if (RelocM == Reloc::Static)
137     return false;
138
139   // Materializable GVs (in JIT lazy compilation mode) do not require an extra
140   // load from stub.
141   bool isDecl = GV->isDeclaration() && !GV->isMaterializable();
142
143   if (!isTargetDarwin()) {
144     // Extra load is needed for all externally visible.
145     if (GV->hasLocalLinkage() || GV->hasHiddenVisibility())
146       return false;
147     return true;
148   } else {
149     if (RelocM == Reloc::PIC_) {
150       // If this is a strong reference to a definition, it is definitely not
151       // through a stub.
152       if (!isDecl && !GV->isWeakForLinker())
153         return false;
154
155       // Unless we have a symbol with hidden visibility, we have to go through a
156       // normal $non_lazy_ptr stub because this symbol might be resolved late.
157       if (!GV->hasHiddenVisibility())  // Non-hidden $non_lazy_ptr reference.
158         return true;
159
160       // If symbol visibility is hidden, we have a stub for common symbol
161       // references and external declarations.
162       if (isDecl || GV->hasCommonLinkage())
163         // Hidden $non_lazy_ptr reference.
164         return true;
165
166       return false;
167     } else {
168       // If this is a strong reference to a definition, it is definitely not
169       // through a stub.
170       if (!isDecl && !GV->isWeakForLinker())
171         return false;
172     
173       // Unless we have a symbol with hidden visibility, we have to go through a
174       // normal $non_lazy_ptr stub because this symbol might be resolved late.
175       if (!GV->hasHiddenVisibility())  // Non-hidden $non_lazy_ptr reference.
176         return true;
177     }
178   }
179
180   return false;
181 }
182
183 bool ARMSubtarget::enablePostRAScheduler(
184            CodeGenOpt::Level OptLevel,
185            TargetSubtarget::AntiDepBreakMode& Mode,
186            RegClassVector& CriticalPathRCs) const {
187   Mode = TargetSubtarget::ANTIDEP_CRITICAL;
188   CriticalPathRCs.clear();
189   CriticalPathRCs.push_back(&ARM::GPRRegClass);
190   return PostRAScheduler && OptLevel >= CodeGenOpt::Default;
191 }