llvm-mc: Move AsmLexer::getCurStrVal to StringRef based API.
[oota-llvm.git] / tools / llvm-mc / AsmLexer.h
1 //===- AsmLexer.h - Lexer for Assembly Files --------------------*- C++ -*-===//
2 //
3 //                     The LLVM Compiler Infrastructure
4 //
5 // This file is distributed under the University of Illinois Open Source
6 // License. See LICENSE.TXT for details.
7 //
8 //===----------------------------------------------------------------------===//
9 //
10 // This class declares the lexer for assembly files.
11 //
12 //===----------------------------------------------------------------------===//
13
14 #ifndef ASMLEXER_H
15 #define ASMLEXER_H
16
17 #include "llvm/ADT/StringRef.h"
18 #include "llvm/MC/MCAsmLexer.h"
19 #include "llvm/Support/DataTypes.h"
20 #include <string>
21 #include <cassert>
22
23 namespace llvm {
24 class MemoryBuffer;
25 class SourceMgr;
26 class SMLoc;
27
28 namespace asmtok {
29   enum TokKind {
30     // Markers
31     Eof, Error,
32
33     // String values.
34     Identifier,
35     Register,
36     String,
37     
38     // Integer values.
39     IntVal,
40     
41     // No-value.
42     EndOfStatement,
43     Colon,
44     Plus, Minus, Tilde,
45     Slash,    // '/'
46     LParen, RParen,
47     Star, Comma, Dollar, Equal, EqualEqual,
48     
49     Pipe, PipePipe, Caret, 
50     Amp, AmpAmp, Exclaim, ExclaimEqual, Percent, 
51     Less, LessEqual, LessLess, LessGreater,
52     Greater, GreaterEqual, GreaterGreater
53   };
54 }
55
56 /// AsmLexer - Lexer class for assembly files.
57 class AsmLexer : public MCAsmLexer {
58   SourceMgr &SrcMgr;
59   
60   const char *CurPtr;
61   const MemoryBuffer *CurBuf;
62   // A llvm::StringSet<>, which provides uniqued and null-terminated strings.
63   void *TheStringSet;
64   
65   // Information about the current token.
66   const char *TokStart;
67   asmtok::TokKind CurKind;
68   const char *CurStrVal;  // This is valid for Identifier.
69   int64_t CurIntVal;
70   
71   /// CurBuffer - This is the current buffer index we're lexing from as managed
72   /// by the SourceMgr object.
73   int CurBuffer;
74   
75   void operator=(const AsmLexer&); // DO NOT IMPLEMENT
76   AsmLexer(const AsmLexer&);       // DO NOT IMPLEMENT
77 public:
78   AsmLexer(SourceMgr &SrcMgr);
79   ~AsmLexer();
80   
81   asmtok::TokKind Lex() {
82     return CurKind = LexToken();
83   }
84   
85   asmtok::TokKind getKind() const { return CurKind; }
86   bool is(asmtok::TokKind K) const { return CurKind == K; }
87   bool isNot(asmtok::TokKind K) const { return CurKind != K; }
88
89   /// getCurStrVal - Get the string for the current token, this includes all
90   /// characters (for example, the quotes on strings) in the token.
91   ///
92   /// The returned StringRef points into the source manager's memory buffer, and
93   /// is safe to store across calls to Lex().
94   StringRef getCurStrVal() const {
95     assert((CurKind == asmtok::Identifier || CurKind == asmtok::Register ||
96             CurKind == asmtok::String) &&
97            "This token doesn't have a string value");
98     return CurStrVal;
99   }
100   int64_t getCurIntVal() const {
101     assert(CurKind == asmtok::IntVal && "This token isn't an integer");
102     return CurIntVal;
103   }
104   
105   SMLoc getLoc() const;
106   
107   /// EnterIncludeFile - Enter the specified file. This returns true on failure.
108   bool EnterIncludeFile(const std::string &Filename);
109   
110   void PrintMessage(SMLoc Loc, const std::string &Msg, const char *Type) const;
111   
112 private:
113   int getNextChar();
114   asmtok::TokKind ReturnError(const char *Loc, const std::string &Msg);
115
116   /// LexToken - Read the next token and return its code.
117   asmtok::TokKind LexToken();
118   asmtok::TokKind LexIdentifier();
119   asmtok::TokKind LexPercent();
120   asmtok::TokKind LexSlash();
121   asmtok::TokKind LexLineComment();
122   asmtok::TokKind LexDigit();
123   asmtok::TokKind LexQuote();
124 };
125   
126 } // end namespace llvm
127
128 #endif