2 weeks ago · eac910740d
--- a/CMakeLists.txt
+++ b/CMakeLists.txt
@@ -10,6 +10,8 @@ set(SRC
 
															     "src/Values.c"
														
 
															     "src/Error.c"
														
 
															     "src/Compiler.c"
														
 
															+    "src/Tokenizer.c"
														
 
															+    "src/Buffer.c"
														
 
															 )
														
 
															 set(COMPILER_ARGUMENTS
														
--- a/src/Buffer.c
+++ b/src/Buffer.c
@@ -0,0 +1,70 @@
 
															+#include "Buffer.h"
														
 
															+
														
 
															+#include <string.h>
														
 
															+
														
 
															+void bufferInit(Buffer* b, u8* data, size_t n) {
														
 
															+    b->data = data;
														
 
															+    b->maxIndex = n;
														
 
															+    b->readIndex = 0;
														
 
															+    b->writeIndex = 0;
														
 
															+}
														
 
															+
														
 
															+void bufferReset(Buffer* b) {
														
 
															+    b->readIndex = 0;
														
 
															+    b->writeIndex = 0;
														
 
															+}
														
 
															+
														
 
															+bool bufferWrite(Buffer* b, const void* p, size_t n) {
														
 
															+    if(b->writeIndex + n > b->maxIndex) {
														
 
															+        return true;
														
 
															+    }
														
 
															+    memcpy(b->data + b->writeIndex, p, n);
														
 
															+    b->writeIndex += n;
														
 
															+    return false;
														
 
															+}
														
 
															+
														
 
															+bool bufferRead(Buffer* b, void* p, size_t n) {
														
 
															+    if(b->readIndex + n > b->writeIndex) {
														
 
															+        return true;
														
 
															+    }
														
 
															+    memcpy(p, b->data + b->readIndex, n);
														
 
															+    b->readIndex += n;
														
 
															+    return false;
														
 
															+}
														
 
															+
														
 
															+#define BUFFER_READ_WRITE_IMPL(Type, type)       \
														
 
															+    bool bufferWrite##Type(Buffer* b, type t) {  \
														
 
															+        return bufferWrite(b, &t, sizeof(type)); \
														
 
															+    }                                            \
														
 
															+    bool bufferRead##Type(Buffer* b, type* t) {  \
														
 
															+        return bufferRead(b, t, sizeof(type));   \
														
 
															+    }
														
 
															+
														
 
															+BUFFER_READ_WRITE_IMPL(I8, i8)
														
 
															+BUFFER_READ_WRITE_IMPL(I16, i16)
														
 
															+BUFFER_READ_WRITE_IMPL(I32, i32)
														
 
															+BUFFER_READ_WRITE_IMPL(I64, i64)
														
 
															+BUFFER_READ_WRITE_IMPL(U8, u8)
														
 
															+BUFFER_READ_WRITE_IMPL(U16, u16)
														
 
															+BUFFER_READ_WRITE_IMPL(U32, u32)
														
 
															+BUFFER_READ_WRITE_IMPL(U64, u64)
														
 
															+
														
 
															+bool bufferIsEmpty(const Buffer* b) {
														
 
															+    return b->readIndex >= b->writeIndex;
														
 
															+}
														
 
															+
														
 
															+size_t bufferGetReadIndex(const Buffer* b) {
														
 
															+    return b->readIndex;
														
 
															+}
														
 
															+
														
 
															+void bufferSetReadIndex(Buffer* b, size_t n) {
														
 
															+    b->readIndex = n;
														
 
															+}
														
 
															+
														
 
															+size_t bufferGetWriteIndex(const Buffer* b) {
														
 
															+    return b->writeIndex;
														
 
															+}
														
 
															+
														
 
															+void bufferSetWriteIndex(Buffer* b, size_t n) {
														
 
															+    b->writeIndex = n;
														
 
															+}
														
--- a/src/Buffer.h
+++ b/src/Buffer.h
@@ -0,0 +1,38 @@
 
															+#ifndef BASIC_BUFFER_H
														
 
															+#define BASIC_BUFFER_H
														
 
															+
														
 
															+#include "Types.h"
														
 
															+
														
 
															+typedef struct {
														
 
															+    u8* data;
														
 
															+    size_t maxIndex;
														
 
															+    size_t readIndex;
														
 
															+    size_t writeIndex;
														
 
															+} Buffer;
														
 
															+
														
 
															+void bufferInit(Buffer* b, u8* data, size_t n);
														
 
															+void bufferReset(Buffer* b);
														
 
															+[[nodiscard]] bool bufferWrite(Buffer* b, const void* p, size_t n);
														
 
															+[[nodiscard]] bool bufferRead(Buffer* b, void* p, size_t n);
														
 
															+
														
 
															+#define BUFFER_READ_WRITE(Type, type)                        \
														
 
															+    [[nodiscard]] bool bufferWrite##Type(Buffer* b, type t); \
														
 
															+    [[nodiscard]] bool bufferRead##Type(Buffer* b, type* t)
														
 
															+
														
 
															+BUFFER_READ_WRITE(I8, i8);
														
 
															+BUFFER_READ_WRITE(I16, i16);
														
 
															+BUFFER_READ_WRITE(I32, i32);
														
 
															+BUFFER_READ_WRITE(I64, i64);
														
 
															+BUFFER_READ_WRITE(U8, u8);
														
 
															+BUFFER_READ_WRITE(U16, u16);
														
 
															+BUFFER_READ_WRITE(U32, u32);
														
 
															+BUFFER_READ_WRITE(U64, u64);
														
 
															+
														
 
															+bool bufferIsEmpty(const Buffer* b);
														
 
															+
														
 
															+size_t bufferGetReadIndex(const Buffer* b);
														
 
															+void bufferSetReadIndex(Buffer* b, size_t n);
														
 
															+size_t bufferGetWriteIndex(const Buffer* b);
														
 
															+void bufferSetWriteIndex(Buffer* b, size_t n);
														
 
															+
														
 
															+#endif
														
--- a/src/Compiler.c
+++ b/src/Compiler.c
@@ -23,10 +23,12 @@ typedef enum : u8 { LITERAL, INT64, DOUBLE, STRING, PLUS, NEWLINE, END } Token;
 
															     snprintf(error.text, sizeof(error.text), __VA_ARGS__); \
														
 
															     longjmp(jumpPosition, 1)
														
 
															-#define CODE(command)                                          \
														
 
															-    if(command) {                                              \
														
 
															-        THROW_ERROR("Code overflow on line %zu", lineCounter); \
														
 
															-    }
														
 
															+#define CODE(command)                                              \
														
 
															+    do {                                                           \
														
 
															+        if(command) {                                              \
														
 
															+            THROW_ERROR("Code overflow on line %zu", lineCounter); \
														
 
															+        }                                                          \
														
 
															+    } while(false)
														
 
															 static void cleanup() {
														
 
															     if(file != nullptr) {
														
--- a/src/Main.c
+++ b/src/Main.c
@@ -3,25 +3,50 @@
 
															 #include "Code.h"
														
 
															 #include "Compiler.h"
														
 
															+#include "Tokenizer.h"
														
 
															+
														
 
															+static u8 tokens[1000];
														
 
															 int main(int argCount, const char** args) {
														
 
															     if(argCount < 2) {
														
 
															         return 0;
														
 
															     }
														
 
															-    const Error* e = compileFile(args[1]);
														
 
															-    if(hasError(e)) {
														
 
															-        puts(e->text);
														
 
															+
														
 
															+    Tokenizer t;
														
 
															+    if(tokenizerInit(&t, args[1], tokens, sizeof(tokens))) {
														
 
															+        puts(tokenizerGetError(&t));
														
 
															         return 0;
														
 
															     }
														
 
															-    codeRun();
														
 
															-    // char line[256];
														
 
															-    // while(true) {
														
 
															-    //     fgets(line, sizeof(line), stdin);
														
 
															-    //     if(strcmp(line, "quit\n") == 0) {
														
 
															-    //         break;
														
 
															-    //     }
														
 
															-    //     puts(line);
														
 
															+
														
 
															+    while(true) {
														
 
															+        Token token = tokenizerNext(&t);
														
 
															+        if(tokenizerHasError(&t)) {
														
 
															+            puts(tokenizerGetError(&t));
														
 
															+            break;
														
 
															+        }
														
 
															+        char buffer[256];
														
 
															+        tokenizerPrintToken(&token, buffer, sizeof(buffer));
														
 
															+        puts(buffer);
														
 
															+        if(token.type == END) {
														
 
															+            break;
														
 
															+        }
														
 
															+    }
														
 
															+
														
 
															+    // const Error* e = compileFile(args[1]);
														
 
															+    // if(hasError(e)) {
														
 
															+    //     puts(e->text);
														
 
															+    //     return 0;
														
 
															     // }
														
 
															-    // puts("quit");
														
 
															+    // codeRun();
														
 
															+
														
 
															+    //  char line[256];
														
 
															+    //  while(true) {
														
 
															+    //      fgets(line, sizeof(line), stdin);
														
 
															+    //      if(strcmp(line, "quit\n") == 0) {
														
 
															+    //          break;
														
 
															+    //      }
														
 
															+    //      puts(line);
														
 
															+    //  }
														
 
															+    //  puts("quit");
														
 
															     return 0;
														
 
															 }
														
--- a/src/Tokenizer.c
+++ b/src/Tokenizer.c
@@ -0,0 +1,276 @@
 
															+#include "Tokenizer.h"
														
 
															+
														
 
															+#include <errno.h>
														
 
															+#include <stdarg.h>
														
 
															+#include <stdlib.h>
														
 
															+
														
 
															+check_format(2, 3) static void tokenizerError(
														
 
															+    Tokenizer* t, const char* format, ...) {
														
 
															+    va_list args;
														
 
															+    va_start(args, format);
														
 
															+    vsnprintf(t->error, sizeof(t->error), format, args);
														
 
															+    va_end(args);
														
 
															+}
														
 
															+
														
 
															+static void tokenizerTooMuchTokens(Tokenizer* t) {
														
 
															+    tokenizerError(t, "Line has too much tokens");
														
 
															+}
														
 
															+
														
 
															+static void tokenizerInvalidToken(Tokenizer* t, char c) {
														
 
															+    tokenizerError(t, "Unexpected token '%c'", c);
														
 
															+}
														
 
															+
														
 
															+static void tokenizerInvalidNumber(Tokenizer* t) {
														
 
															+    tokenizerError(t, "Invalid number");
														
 
															+}
														
 
															+
														
 
															+static void tokenizerAddToken(Tokenizer* t, TokenType type) {
														
 
															+    if(bufferWriteU8(&t->buffer, type)) {
														
 
															+        tokenizerTooMuchTokens(t);
														
 
															+    }
														
 
															+}
														
 
															+
														
 
															+static void tokenizerAddChar(Tokenizer* t, char c) {
														
 
															+    if(bufferWriteI8(&t->buffer, c)) {
														
 
															+        tokenizerTooMuchTokens(t);
														
 
															+    }
														
 
															+}
														
 
															+
														
 
															+static bool isLetter(char c) {
														
 
															+    return (c >= 'a' && c <= 'z') || (c >= 'A' && c <= 'Z');
														
 
															+}
														
 
															+
														
 
															+static bool isNumber(char c) {
														
 
															+    return c >= '0' && c <= '9';
														
 
															+}
														
 
															+
														
 
															+static bool isAlphaNumeric(char c) {
														
 
															+    return isLetter(c) || isNumber(c);
														
 
															+}
														
 
															+
														
 
															+static bool isTokenEnd(char c) {
														
 
															+    return c == ' ' || c == '\0' || c == '\n';
														
 
															+}
														
 
															+
														
 
															+static const char* tokenizerAddLiteral(Tokenizer* t, const char* s) {
														
 
															+    tokenizerAddToken(t, LITERAL);
														
 
															+    tokenizerAddChar(t, *s);
														
 
															+    while(true) {
														
 
															+        char c = *(++s);
														
 
															+        if(isAlphaNumeric(c)) {
														
 
															+            tokenizerAddChar(t, c);
														
 
															+        } else if(isTokenEnd(c)) {
														
 
															+            break;
														
 
															+        } else {
														
 
															+            tokenizerInvalidToken(t, c);
														
 
															+            break;
														
 
															+        }
														
 
															+    }
														
 
															+    tokenizerAddChar(t, '\0');
														
 
															+    return s;
														
 
															+}
														
 
															+
														
 
															+static const char* tokenizerAddNumber(Tokenizer* t, const char* s) {
														
 
															+    size_t nIndex = 0;
														
 
															+    char number[64] = {};
														
 
															+    number[nIndex++] = *s;
														
 
															+    while(true) {
														
 
															+        char c = *(++s);
														
 
															+        if(isTokenEnd(c)) {
														
 
															+            break;
														
 
															+        } else if(!isNumber(c)) {
														
 
															+            tokenizerInvalidToken(t, c);
														
 
															+        } else if(nIndex >= sizeof(number) - 1) {
														
 
															+            tokenizerInvalidNumber(t);
														
 
															+        }
														
 
															+        number[nIndex++] = c;
														
 
															+    }
														
 
															+    char* end = nullptr;
														
 
															+    errno = 0;
														
 
															+    i64 i = strtoll(number, &end, 10);
														
 
															+    if(errno != 0) {
														
 
															+        tokenizerInvalidNumber(t);
														
 
															+    } else if(*end == '\0') {
														
 
															+        tokenizerAddToken(t, INT64);
														
 
															+        if(bufferWriteI64(&t->buffer, i)) {
														
 
															+            tokenizerTooMuchTokens(t);
														
 
															+        }
														
 
															+        return s;
														
 
															+    }
														
 
															+    return s;
														
 
															+}
														
 
															+
														
 
															+static const char* tokenizerAddString(Tokenizer* t, const char* s) {
														
 
															+    tokenizerAddToken(t, STRING);
														
 
															+    while(true) {
														
 
															+        char c = *(++s);
														
 
															+        if(c == '\0') {
														
 
															+            tokenizerError(t, "Unclosed string");
														
 
															+            break;
														
 
															+        } else if(c == '"') {
														
 
															+            s++;
														
 
															+            break;
														
 
															+        }
														
 
															+        tokenizerAddChar(t, c);
														
 
															+    }
														
 
															+    tokenizerAddChar(t, '\0');
														
 
															+    return s;
														
 
															+}
														
 
															+
														
 
															+static void tokenizerParseLineString(Tokenizer* t, const char* s) {
														
 
															+    while(!tokenizerHasError(t)) {
														
 
															+        char c = *s;
														
 
															+        if(isLetter(c)) {
														
 
															+            s = tokenizerAddLiteral(t, s);
														
 
															+        } else if(isNumber(c)) {
														
 
															+            s = tokenizerAddNumber(t, s);
														
 
															+        } else if(c == '"') {
														
 
															+            s = tokenizerAddString(t, s);
														
 
															+        } else if(c == '\n') {
														
 
															+            tokenizerAddToken(t, NEWLINE);
														
 
															+            break;
														
 
															+        } else if(c == ' ') {
														
 
															+            s++;
														
 
															+        } else if(c == '+') {
														
 
															+            tokenizerAddToken(t, PLUS);
														
 
															+            s++;
														
 
															+        } else if(c == '\0') {
														
 
															+            break;
														
 
															+        } else {
														
 
															+            tokenizerInvalidToken(t, c);
														
 
															+        }
														
 
															+    }
														
 
															+}
														
 
															+
														
 
															+static void tokenizerParseLine(Tokenizer* t) {
														
 
															+    bufferReset(&t->buffer);
														
 
															+    t->line++;
														
 
															+    char line[256] = {};
														
 
															+    if(fgets(line, sizeof(line), t->file) == nullptr) {
														
 
															+        return;
														
 
															+    }
														
 
															+    char c = line[sizeof(line) - 2];
														
 
															+    if(c != '\n' && c != '\0') {
														
 
															+        tokenizerError(t, "Too long line");
														
 
															+        return;
														
 
															+    }
														
 
															+    tokenizerParseLineString(t, line);
														
 
															+}
														
 
															+
														
 
															+//[[noreturn]] static void unexpectedToken(Token t) {
														
 
															+//    switch(t) {
														
 
															+//        case LITERAL:
														
 
															+//            THROW_ERROR(
														
 
															+//                "Unexpected literal(%s) on line %zu", readString(),
														
 
															+//                lineCounter);
														
 
															+//            break;
														
 
															+//        case INT64:
														
 
															+//            THROW_ERROR(
														
 
															+//                "Unexpected int(%ld) on line %zu", readInt64(), lineCounter);
														
 
															+//            break;
														
 
															+//        case DOUBLE:
														
 
															+//            THROW_ERROR(
														
 
															+//                "Unexpected double(%lf) on line %zu", readDouble(),
														
 
															+//                lineCounter);
														
 
															+//            break;
														
 
															+//        case STRING:
														
 
															+//            THROW_ERROR(
														
 
															+//                "Unexpected string(%s) on line %zu", readString(),
														
 
															+//                lineCounter);
														
 
															+//            break;
														
 
															+//        case PLUS:
														
 
															+//            THROW_ERROR("Unexpected plus on line %zu", lineCounter);
														
 
															+//            break;
														
 
															+//        case NEWLINE:
														
 
															+//            THROW_ERROR("Unexpected newline on line %zu", lineCounter);
														
 
															+//            break;
														
 
															+//        case END: THROW_ERROR("Unexpected end on line %zu", lineCounter);
														
 
															+//        break;
														
 
															+//    }
														
 
															+//    THROW_ERROR("Unexpected unknown token on line %zu", lineCounter);
														
 
															+//}
														
 
															+
														
 
															+static const char* tokenizerReadString(Tokenizer* t) {
														
 
															+    const char* c = (char*)(t->buffer.data + t->buffer.readIndex);
														
 
															+    i8 i = 1;
														
 
															+    while(i != 0) {
														
 
															+        if(bufferReadI8(&t->buffer, &i)) {
														
 
															+            tokenizerError(t, "empty buffer on readInt64");
														
 
															+            return "";
														
 
															+        }
														
 
															+    }
														
 
															+    return c;
														
 
															+}
														
 
															+
														
 
															+static i64 tokenizerReadInt64(Tokenizer* t) {
														
 
															+    i64 i = 0;
														
 
															+    if(bufferReadI64(&t->buffer, &i)) {
														
 
															+        tokenizerError(t, "empty buffer on readInt64");
														
 
															+    }
														
 
															+    return i;
														
 
															+}
														
 
															+
														
 
															+Token tokenizerNext(Tokenizer* t) {
														
 
															+    Token token = {.type = END};
														
 
															+    if(bufferIsEmpty(&t->buffer)) {
														
 
															+        tokenizerParseLine(t);
														
 
															+    }
														
 
															+    if(tokenizerHasError(t) || bufferReadU8(&t->buffer, &token.type)) {
														
 
															+        return token;
														
 
															+    }
														
 
															+    switch(token.type) {
														
 
															+        case STRING:
														
 
															+        case LITERAL: token.stringValue = tokenizerReadString(t); break;
														
 
															+        case INT64: token.intValue = tokenizerReadInt64(t); break;
														
 
															+        default: break;
														
 
															+    }
														
 
															+    return token;
														
 
															+}
														
 
															+
														
 
															+Token tokenizerPeek(Tokenizer* t) {
														
 
															+    size_t index = bufferGetReadIndex(&t->buffer);
														
 
															+    Token token = tokenizerNext(t);
														
 
															+    bufferSetReadIndex(&t->buffer, index);
														
 
															+    return token;
														
 
															+}
														
 
															+
														
 
															+bool tokenizerInit(Tokenizer* t, const char* path, u8* tokens, size_t n) {
														
 
															+    bufferInit(&t->buffer, tokens, n);
														
 
															+    t->error[0] = '\0';
														
 
															+    t->line = 0;
														
 
															+    t->file = fopen(path, "r");
														
 
															+    if(t->file == nullptr) {
														
 
															+        tokenizerError(t, "Cannot read file '%s'", path);
														
 
															+        return true;
														
 
															+    }
														
 
															+    return false;
														
 
															+}
														
 
															+
														
 
															+void tokenizerDestroy(Tokenizer* t) {
														
 
															+    fclose(t->file);
														
 
															+    *t = (Tokenizer){};
														
 
															+}
														
 
															+
														
 
															+bool tokenizerHasError(const Tokenizer* t) {
														
 
															+    return t->error[0] != '\0';
														
 
															+}
														
 
															+
														
 
															+const char* tokenizerGetError(const Tokenizer* t) {
														
 
															+    return t->error;
														
 
															+}
														
 
															+
														
 
															+void tokenizerPrintToken(const Token* token, char* buffer, size_t n) {
														
 
															+    switch(token->type) {
														
 
															+        case LITERAL:
														
 
															+            snprintf(buffer, n, "Literal(%s)", token->stringValue);
														
 
															+            break;
														
 
															+        case INT64: snprintf(buffer, n, "Int64(%ld)", token->intValue); break;
														
 
															+        case STRING:
														
 
															+            snprintf(buffer, n, "String(%s)", token->stringValue);
														
 
															+            break;
														
 
															+        case PLUS: snprintf(buffer, n, "Plus"); break;
														
 
															+        case NEWLINE: snprintf(buffer, n, "Newline"); break;
														
 
															+        case END: snprintf(buffer, n, "End"); break;
														
 
															+        default: snprintf(buffer, n, "Unknown"); break;
														
 
															+    }
														
 
															+}
														
--- a/src/Tokenizer.h
+++ b/src/Tokenizer.h
@@ -0,0 +1,38 @@
 
															+#ifndef BASIC_TOKENIZER_H
														
 
															+#define BASIC_TOKENIZER_H
														
 
															+
														
 
															+#include <stdio.h>
														
 
															+
														
 
															+#include "Buffer.h"
														
 
															+
														
 
															+typedef enum : u8 { LITERAL, INT64, STRING, PLUS, NEWLINE, END } TokenType;
														
 
															+
														
 
															+typedef struct {
														
 
															+    TokenType type;
														
 
															+
														
 
															+    union {
														
 
															+        const char* stringValue;
														
 
															+        i64 intValue;
														
 
															+    };
														
 
															+} Token;
														
 
															+
														
 
															+typedef struct {
														
 
															+    char error[256];
														
 
															+    FILE* file;
														
 
															+    size_t line;
														
 
															+    Buffer buffer;
														
 
															+} Tokenizer;
														
 
															+
														
 
															+[[nodiscard]] bool tokenizerInit(
														
 
															+    Tokenizer* t, const char* path, u8* tokens, size_t n);
														
 
															+void tokenizerDestroy(Tokenizer* t);
														
 
															+
														
 
															+Token tokenizerNext(Tokenizer* t);
														
 
															+Token tokenizerPeek(Tokenizer* t);
														
 
															+
														
 
															+bool tokenizerHasError(const Tokenizer* t);
														
 
															+const char* tokenizerGetError(const Tokenizer* t);
														
 
															+
														
 
															+void tokenizerPrintToken(const Token* token, char* buffer, size_t n);
														
 
															+
														
 
															+#endif
														
--- a/src/Types.h
+++ b/src/Types.h
@@ -0,0 +1,23 @@
 
															+#ifndef BASIC_TYPES_H
														
 
															+#define BASIC_TYPES_H
														
 
															+
														
 
															+#include <stddef.h>
														
 
															+#include <stdint.h>
														
 
															+
														
 
															+typedef uint64_t u64;
														
 
															+typedef uint32_t u32;
														
 
															+typedef uint16_t u16;
														
 
															+typedef uint8_t u8;
														
 
															+typedef int64_t i64;
														
 
															+typedef int32_t i32;
														
 
															+typedef int16_t i16;
														
 
															+typedef int8_t i8;
														
 
															+
														
 
															+#if defined(__GNUC__)
														
 
															+#define check_format(format_index, arg_start_index)                \
														
 
															+    __attribute__((format(printf, format_index, arg_start_index)))
														
 
															+#else
														
 
															+#error "please add a 'check_format' option"
														
 
															+#endif
														
 
															+
														
 
															+#endif