Unduhan aParser - Unduhan kode Sumber aParser

aParser

Visual Dasar

1.0.0

Unduh

aParser

Proyek ini adalah kompiler yang mengambil program sumber yang ditulis dalam C# (input) kemudian menerjemahkannya ke dalam program target yang ditulis dalam Visual Basic (output) . Proses ini dilakukan dengan melalui tiga modul ( Tokenizer , Parser , dan Translator ). Setiap modul akan dijelaskan secara terpisah dalam laporan ini.

Tokenizer

Apa itu Tokenizer?

Tokenizer / Lexical Analyzer adalah program yang mengambil rangkaian karakter (input) dan mengeluarkan rangkaian token (output).

Definisi Token

Tokenizer memiliki daftar definisi untuk setiap token yang mungkin dihasilkan dengan mengelompokkan serangkaian karakter. Setiap definisi token terdiri dari:

Tipe : digunakan untuk membedakan token
Regular Expression (RegEx) : digunakan untuk menangkap (mencocokkan) nilai

Tabel berikut mewakili semua definisi yang digunakan dalam proyek, dengan contoh nilai yang cocok untuk masing-masing definisi.

Kata kunci

Jenis	Ekspresi Reguler	Nilai yang Cocok
Menggunakan	menggunakan	`using`
Kelas	kelas	`class`
Jika	jika	`if`
Kalau tidak	kalau tidak	`else`
Untuk	untuk	`for`
Melakukan	Mengerjakan	`do`
Ketika	ketika	`while`
Mengalihkan	mengalihkan	`switch`
Kasus	kasus	`case`
Merusak	merusak	`break`
Bawaan	bawaan	`default`
Kembali	kembali	`return`
Batal	batal	`null`
BENAR	BENAR	`true`
PALSU	PALSU	`false`
PALSU	(batal \| var) \| (bool \| char \| short \| int \| long \| float \| double \| desimal \| string \| String) ([] \| ?)?	`void` `bool` `char?` `int[]`

Nilai-nilai

Jenis	Ekspresi Reguler	Nilai yang Cocok
Nomor	d*.d+ \| d+	`77` `.25` `3.14`
Rangkaian	"[^"]*"	`"This is string"`
Pengidentifikasi	[a-zA-Z_]w*	`fact` `_private` `iD_1`
Komentar	(?<=//) .*? (?=(r \| n \| //))	// `inline comment`
Komentar Multiline	(?<=/) (?:(?!/)(?:.\|[rn]))* (?=*/)	/* `multi line` `comment` */

Operator

Jenis	Ekspresi Reguler	Nilai yang Cocok
Dan	&& \| &	`&&` `&`
Atau	\|\| \| \|	`\|\|` `\|`
Bukan	!	`!`
Setara	=	`=`
Ditambah Sama	+=	`+=`
MinusSama	-=	`-=`
GandaEquals	==	`==`
Tidak Sama	!=	`!=`
Kurang dari	<	`<`
Lebih Besar Dari	>	`>`
Kurang Dari Atau Sama	<=	`<=`
Lebih Besar Dari Atau Sama	>=	`>=`

Simbol

Jenis	Ekspresi Reguler	Nilai yang Cocok
OpenRoundBracket	(	`(`
TutupRoundBracket	)	`)`
OpenCurlyBracket	{	`{`
TutupCurlyBracket	}	`}`
OpenSquareBracket	[	`[`
TutupSquareBracket	]	`]`
Plus	+	`+`
dikurangi	-	`-`
DoublePlus	++	`++`
Minus Ganda	--	`--`
Persen	%	`%`
Asterisk	*	`*`
Garis miring terbalik	\
Tebasan Depan	/	`/`
Garis miring ganda ke depan	//	`//`
MajuSlashAsterisk	/*	`/*`
AsteriskMajuSlash	*/	`*/`
Dot	.	`.`
Koma	,	`,`
Usus besar	:	`:`
Titik koma	;	`;`

Pelaksanaan

Semua jenis token ini dikelompokkan sebagai enum dalam file TokenType.cs.

 public enum TokenType
{
    // Keywords
    Using ,               // using
    Class ,               // class
    If ,                  // if
    Else ,                // else
    For ,                 // for
    Do ,                  // do
    While ,               // while
    Switch ,              // switch
    Case ,                // case
    Break ,               // break
    Default ,             // default
    Return ,              // return
    Null ,                // null
    True ,                // true
    False ,               // false
    DataType ,            // void | bool | char? | int[]

    // Values
    Number ,              // 77 | .25 | 3.14
    String ,              // "I am 'Moaz'"
    Comment ,             // Any Character After (//) and Before (r | n | //)
    Identifier ,          // fact | _private | iD_1
    MultilineComment ,    // Any Character After (/*) and Before (*/)

    // Operators
    And ,                 // && | &
    Or ,                  // || | |
    Not ,                 // !
    Equal ,               // =
    PlusEqual ,           // +=
    MinusEqual ,          // -=
    DoubleEquals ,        // ==
    NotEqual ,            // !=
    LessThan ,            // <
    GreaterThan ,         // >
    LessThanOrEqual ,     // <=
    GreaterThanOrEqual ,  // >=

    // Symbols
    OpenRoundBracket ,    // (
    CloseRoundBracket ,   // )
    OpenCurlyBracket ,    // {
    CloseCurlyBracket ,   // }
    OpenSquareBracket ,   // [
    CloseSquareBracket ,  // ]
    Plus ,                // +
    Minus ,               // -
    DoublePluses ,        // ++
    DoubleMinuses ,       // --
    Percent ,             // %
    Asterisk ,            // *
    BackSlash ,           // 
    ForwardSlash ,        // /
    DoubleForwardSlashes , // //
    ForwardSlashAsterisk , // /*
    AsteriskForwardSlash , // */
    Dot ,                 // .
    Comma ,               // ,
    Colon ,               // :
    Semicolon            // ;
}

dan definisinya dibuat dan disimpan di List<TokenDefinition> dalam file Tokenizer.cs.

 private readonly List < TokenDefinition > _tokenDefinitions = new List < TokenDefinition >
{
    // Keywords
    new TokenDefinition ( TokenType . Using , @"using" ) ,
    new TokenDefinition ( TokenType . Class , @"class" ) ,
    new TokenDefinition ( TokenType . If , @"if" ) ,
    new TokenDefinition ( TokenType . Else , @"else" ) ,
    new TokenDefinition ( TokenType . For , @"for" ) ,
    new TokenDefinition ( TokenType . Do , @"do" , 1 ) ,
    new TokenDefinition ( TokenType . While , @"while" ) ,
    new TokenDefinition ( TokenType . Switch , @"switch" ) ,
    new TokenDefinition ( TokenType . Case , @"case" ) ,
    new TokenDefinition ( TokenType . Default , @"default" ) ,
    new TokenDefinition ( TokenType . Break , @"break" ) ,
    new TokenDefinition ( TokenType . Return , @"return" ) ,
    new TokenDefinition ( TokenType . Null , @"null" ) ,
    new TokenDefinition ( TokenType . True , @"true" ) ,
    new TokenDefinition ( TokenType . False , @"false" ) ,
    new TokenDefinition ( TokenType . DataType , @"(void|var)|(bool|char|short|int|long|float|double|decimal|String|string)([]|?)?" ) ,

    // Values
    new TokenDefinition ( TokenType . Number , @"d*.d+|d+" ) ,
    new TokenDefinition ( TokenType . String , @"""[^""]*""" ) ,
    new TokenDefinition ( TokenType . Identifier , @"[a-zA-Z_]w*" , 1 ) ,
    new TokenDefinition ( TokenType . Comment , @"(?<=//).*?(?=(r|n|//))" ) ,
    new TokenDefinition ( TokenType . MultilineComment , @"(?<=/*)(?:(?!*/)(?:.|[rn]))*(?=*/)" ) ,

    // Operators
    new TokenDefinition ( TokenType . And , @"&&|&" ) ,
    new TokenDefinition ( TokenType . Or , @"||||" ) ,
    new TokenDefinition ( TokenType . Not , @"!" , 1 ) ,
    new TokenDefinition ( TokenType . Equal , @"=" , 1 ) ,
    new TokenDefinition ( TokenType . PlusEqual , @"+=" ) ,
    new TokenDefinition ( TokenType . MinusEqual , @"-=" ) ,
    new TokenDefinition ( TokenType . DoubleEquals , @"==" ) ,
    new TokenDefinition ( TokenType . NotEqual , @"!=" ) ,
    new TokenDefinition ( TokenType . LessThan , @"<" , 1 ) ,
    new TokenDefinition ( TokenType . GreaterThan , @">" , 1 ) ,
    new TokenDefinition ( TokenType . LessThanOrEqual , @"<=" ) ,
    new TokenDefinition ( TokenType . GreaterThanOrEqual , @">=" ) ,

    // Symbols
    new TokenDefinition ( TokenType . OpenRoundBracket , @"(" ) ,
    new TokenDefinition ( TokenType . CloseRoundBracket , @")" ) ,
    new TokenDefinition ( TokenType . OpenCurlyBracket , @"{" ) ,
    new TokenDefinition ( TokenType . CloseCurlyBracket , @"}" ) ,
    new TokenDefinition ( TokenType . OpenSquareBracket , @"[" ) ,
    new TokenDefinition ( TokenType . CloseSquareBracket , @"]" ) ,
    new TokenDefinition ( TokenType . Plus , @"+" , 1 ) ,
    new TokenDefinition ( TokenType . Minus , @"-" , 1 ) ,
    new TokenDefinition ( TokenType . DoublePluses , @"++" ) ,
    new TokenDefinition ( TokenType . DoubleMinuses , @"--" ) ,
    new TokenDefinition ( TokenType . Percent , @"%" ) ,
    new TokenDefinition ( TokenType . Asterisk , @"*" , 1 ) ,
    new TokenDefinition ( TokenType . BackSlash , @"\" ) ,
    new TokenDefinition ( TokenType . ForwardSlash , @"/" , 1 ) ,
    new TokenDefinition ( TokenType . DoubleForwardSlashes , @"//" ) ,
    new TokenDefinition ( TokenType . ForwardSlashAsterisk , @"/*" ) ,
    new TokenDefinition ( TokenType . AsteriskForwardSlash , @"*/" ) ,
    new TokenDefinition ( TokenType . Dot , @"." ) ,
    new TokenDefinition ( TokenType . Comma , @"," ) ,
    new TokenDefinition ( TokenType . Colon , @":" ) ,
    new TokenDefinition ( TokenType . Semicolon , @";" ) ,
} ;
.. .

Memperbaiki Masalah

1. Saat Token Tumpang Tindih

Ketika tokenizer menghadapi beberapa urutan karakter seperti ++ menjadi bingung, apakah itu salah satu token bertipe DoublePluses ? Atau dua token berurutan bertipe Plus ? Masalah ini juga berlaku untuk token lain yang tumpang tindih seperti: { + , += } & { - , -- } & { - , -= } & { / , // }

Larutan:

Setiap token akan diberi properti Priority dengan nilai default 0 (Highest Priority) , dan ketika dua token tumpang tindih seperti + dan += kami menurunkan prioritas token dengan panjang yang lebih pendek + menjadi 1 .
Sekarang, tokenizer tidak akan bingung lagi antara + dan += , dan akan mengambil yang memiliki prioritas lebih tinggi += .

2. Token Di Dalam Token

Ketika tokenizer menghadapi beberapa rangkaian karakter seperti "String + String = String" maka akan menghasilkan tiga jenis token yaitu:

Tali : "String + String = String"
Ditambah : +
Sama : =

tapi kita hanya membutuhkan token dengan tipe String !!

Larutan:

Setiap token akan diberi properti Indeks Awal dan Indeks Akhir , sehingga token sebelumnya akan memiliki:

Jenis	Nilai	Mulai Indeks	Indeks Akhir
Rangkaian	`"String + String = String"`	0	25
Plus	`+`	8	9
Setara	`=`	17	18

dan kami mengabaikan token apa pun yang dimulai dalam rentang token lainnya.

Sekarang, tokenizer hanya akan menghasilkan satu token yang bertipe String dan mengabaikan token yang ada di dalamnya.

pengurai

Apa itu Parsernya?

Parser / Syntax Analyzer adalah program yang mengambil urutan token - yang dihasilkan dari Tokenizer - dan mengelompokkannya untuk membentuk struktur yang ditentukan oleh produksi tata bahasa bebas konteks (CFG) yang digunakan.

Peran Pengurai

Kenali Sintaks Bebas Konteks
Menghasilkan Pesan Kesalahan yang Berarti
Membangun Representasi Menengah (IR)

Tata Bahasa Bebas Konteks (CFG)

Ringkasan:

CAPITAL_CASE : Non-Terminal
small_case : Terminal
| : Alternatif (Atau)
ε : Kosong

  PROGRAM --> IMPORTS CLASSES

  IMPORTS          --> IMPORT_STATEMENT IMPORTS | ε
  IMPORT_STATEMENT --> using IDS;

  CLASSES          --> CLASS_STATEMENT CLASSES | ε
  CLASS_STATEMENT  --> class id { SUPER_STATEMENTS }

  SUPER_STATEMENTS --> SUPER_STATEMENT SUPER_STATEMENTS | ε
  SUPER_STATEMENT  --> COMMENT_STATEMENT | FUNCTION_STATEMENT | INLINE_STATEMENT ;

  COMMENT_STATEMENT  --> // comment | /* multiline_comment */
  FUNCTION_STATEMENT --> data_type id (DECLARES) { STATEMENTS }
  INLINE_STATEMENT     --> DECSIGN_STATEMENT | DECLARE_STATEMENT | INC_DEC_STATEMENT | ASSIGN_STATEMENT | CALL_STATEMENT
    DECSIGN_STATEMENT  --> data_type id = EXPRESSION
    DECLARE_STATEMENT  --> data_type id
    INC_DEC_STATEMENT  --> id INC_DEC_OPERATOR
    ASSIGN_STATEMENT   --> id ASSIGN_OPERATOR EXPRESSION
    CALL_STATEMENT     --> IDS(EXPRESSIONS)

  STATEMENTS --> STATEMENT STATEMENTS | ε
  STATEMENT  --> SUPER_STATEMENT | STRUCT_STATEMENT

  STRUCT_STATEMENT --> IF_STATEMENT | WHILE_STATEMENT | DO_WHILE_STATEMENT | FOR_STATEMENT | BLOCK_STATEMENT | RETURN_STATEMENT | SWITCH_STATEMENT
    IF_STATEMENT          --> if (CONDITION) STATEMENT ELSE_STATEMENT
    ELSE_STATEMENT        --> else STATEMENT  | ε
    WHILE_STATEMENT       --> while (CONDITION) STATEMENT
    DO_WHILE_STATEMENT    --> do STATEMENT while (CONDITION);
    FOR_STATEMENT         --> for (INLINE_STATEMENT; CONDITION; INLINE_STATEMENT) STATEMENT
    BLOCK_STATEMENT       --> { STATEMENTS }
    RETURN_STATEMENT      --> return RETURN_STATEMENT_REST;
    RETURN_STATEMENT_REST --> EXPRESSION | ε
    SWITCH_STATEMENT      --> switch (EXPRESSION) { CASES }
    CASES                 --> CASE CASES | ε
    CASE                  --> CASE_STATEMENT | DEFAULT_STATEMENT
    CASE_STATEMENT        --> case VALUE: STATEMENT break;
    DEFAULT_STATEMENT     --> default: STATEMENT break;

  CONDITION  --> EXPRESSION REL_OPERATOR EXPRESSION | true | false
  EXPRESSION --> VALUE | id | ( EXPRESSION )
  VALUE      --> string | number | true | false | null

  IDS              --> id MORE_IDS
  MORE_IDS         --> .IDS | ε

  DECLARES         --> DECLARE_STATEMENT MORE_DECLARES | ε
  MORE_DECLARES    --> , DECLARES | ε

  EXPRESSIONS      --> EXPRESSION MORE_EXPRESSIONS | ε
  MORE_EXPRESSIONS --> , EXPRESSIONS | ε

  INC_DEC_OPERATOR --> ++ | --
  ASSIGN_OPERATOR  --> = | += | -=
  REL_OPERATOR     --> == | != | > |  >= | < | <=

Diagram Sintaks BNF

Dalam ilmu komputer, bentuk Backus–Naur (BNF atau bentuk normal Backus) adalah notasi yang digunakan untuk mendeskripsikan sintaksis bahasa pemrograman atau bahasa formal lainnya. Ini dikembangkan oleh John Backus dan Peter Naur. BNF dapat digambarkan sebagai notasi metasyntax untuk tata bahasa bebas konteks.
-- Formulir Backus–Naur @ Wikipedia

PROGRAM

IMPORT_STATEMENT

direferensikan oleh:

PROGRAM

KELAS_PERNYATAAN

direferensikan oleh:

PROGRAM

PENYATAAN

direferensikan oleh:

BLOCK_STATEMENT
KASUS_PERNYATAAN
DEFAULT_STATEMENT
LAKUKAN_WHILE_STATEMENT
FOR_STATEMENT
FUNCTION_STATEMENT
IF_STATEMENT
WHILE_STATEMENT

SUPER_STATEMENT

direferensikan oleh:

KELAS_PERNYATAAN
PENYATAAN

KOMENTAR_PERNYATAAN

direferensikan oleh:

SUPER_STATEMENT

KOMENTAR

direferensikan oleh:

KOMENTAR_PERNYATAAN

MULTILINE_COMMENT

direferensikan oleh:

KOMENTAR_PERNYATAAN

FUNCTION_STATEMENT

direferensikan oleh:

SUPER_STATEMENT

INLINE_STATEMENT

direferensikan oleh:

FOR_STATEMENT
SUPER_STATEMENT

DECLARE_STATEMENT

direferensikan oleh:

FUNCTION_STATEMENT
INLINE_STATEMENT

ASSIGN_STATEMENT

direferensikan oleh:

INLINE_STATEMENT

DECSIGN_STATEMENT

direferensikan oleh:

INLINE_STATEMENT

INC_DEC_STATEMENT

direferensikan oleh:

INLINE_STATEMENT

PANGGILAN_PERNYATAAN

direferensikan oleh:

INLINE_STATEMENT

STRUCT_STATEMENT

direferensikan oleh:

PENYATAAN

BLOCK_STATEMENT

direferensikan oleh:

STRUCT_STATEMENT

IF_STATEMENT

direferensikan oleh:

STRUCT_STATEMENT

WHILE_STATEMENT

direferensikan oleh:

STRUCT_STATEMENT

LAKUKAN_WHILE_STATEMENT

direferensikan oleh:

STRUCT_STATEMENT

FOR_STATEMENT

direferensikan oleh:

STRUCT_STATEMENT

RETURN_STATEMENT

direferensikan oleh:

STRUCT_STATEMENT

SWITCH_STATEMENT

direferensikan oleh:

STRUCT_STATEMENT

KASUS_PERNYATAAN

direferensikan oleh:

SWITCH_STATEMENT

DEFAULT_STATEMENT

direferensikan oleh:

SWITCH_STATEMENT

KONDISI

direferensikan oleh:

LAKUKAN_WHILE_STATEMENT
FOR_STATEMENT
IF_STATEMENT
WHILE_STATEMENT

EKSPRESI

direferensikan oleh:

ASSIGN_STATEMENT
KONDISI
DECSIGN_STATEMENT
EKSPRESI
RETURN_STATEMENT
SWITCH_STATEMENT

PENGIDENTIFIKASI

direferensikan oleh:

ASSIGN_STATEMENT
PANGGILAN_PERNYATAAN
KELAS_PERNYATAAN
DECLARE_STATEMENT
DECSIGN_STATEMENT
EKSPRESI
FUNCTION_STATEMENT
IMPORT_STATEMENT
INC_DEC_STATEMENT

NILAI

direferensikan oleh:

KASUS_PERNYATAAN
EKSPRESI

NOMOR

direferensikan oleh:

NILAI

BOOLEAN

direferensikan oleh:

KONDISI
NILAI

RANGKAIAN

direferensikan oleh:

NILAI

INC_DEC_OPERATOR

direferensikan oleh:

INC_DEC_STATEMENT

ASSIGN_OPERATOR

direferensikan oleh:

ASSIGN_STATEMENT

REL_OPERATOR

direferensikan oleh:

KONDISI

DATA_TYPE

direferensikan oleh:

DECLARE_STATEMENT
DECSIGN_STATEMENT
FUNCTION_STATEMENT

Memperluas

Informasi Tambahan

Versi 1.0.0
Tipe Visual Dasar
Waktu Pembaruan 2024-12-14
ukuran 67.04KB
Berasal dari Github

Aplikasi Terkait

SIBA

2024-12-14
VisioPanelAddinVSTO

2024-12-15
vegetable traders check program

2024-12-15
Hazard

2024-12-14
TersebutReconnector

2024-12-14
screen orientation changer

2024-12-15

Direkomendasikan untuk Anda

chat.petals.dev

Kode sumber lainnya

1.0.0
GPT Prompt Templates

Kode sumber lainnya

1.0.0
GPTyped

Kode sumber lainnya

GPTyped 1.0.5
SIBA

Visual Dasar

SIBA
VisioPanelAddinVSTO

Visual Dasar

1.2.4
vegetable traders check program

Visual Dasar

1.0.0
waymo open dataset

Kode sumber lainnya

December 2023 Update
termwind

Kategori lainnya

v2.3.0
wp functions

Kategori lainnya

1.0.0

Informasi Terkait Semua