lark ดาวน์โหลด - lark ดาวน์โหลดซอร์สโค้ด

lark

หลาม

1.2.2 - Bugfix for 1.2.1 (Earley issues with ambiguity)

ดาวน์โหลด

Lark - ชุดเครื่องมือแยกวิเคราะห์สำหรับ Python

Lark เป็นชุดเครื่องมือแยกวิเคราะห์สำหรับ Python ที่สร้างขึ้นโดยเน้นไปที่หลักสรีรศาสตร์ ประสิทธิภาพ และความเป็นโมดูล

Lark สามารถแยกวิเคราะห์ภาษาที่ไม่มีบริบททั้งหมดได้ พูดง่ายๆ ก็คือ มันสามารถแยกวิเคราะห์ภาษาการเขียนโปรแกรมได้เกือบทุกภาษา และในภาษาธรรมชาติส่วนใหญ่ในระดับหนึ่งด้วย

มันมีไว้สำหรับใคร?

ผู้เริ่มต้น : Lark เป็นมิตรมากสำหรับการทดลอง มันสามารถแยกวิเคราะห์ไวยากรณ์ใดๆ ที่คุณพูดถึง ไม่ว่าจะซับซ้อนหรือคลุมเครือแค่ไหน และทำได้อย่างมีประสิทธิภาพ นอกจากนี้ยังสร้างแผนผังการแยกวิเคราะห์ที่มีคำอธิบายประกอบให้กับคุณ โดยใช้เพียงไวยากรณ์และอินพุต และให้เครื่องมือที่สะดวกและยืดหยุ่นแก่คุณในการประมวลผลแผนผังการแยกวิเคราะห์นั้น
ผู้เชี่ยวชาญ : Lark ใช้ทั้ง Earley(SPPF) และ LALR(1) และ lexers ต่างๆ มากมาย เพื่อให้คุณสามารถแลกพลังงานและความเร็วได้ ตามความต้องการของคุณ นอกจากนี้ยังมีคุณสมบัติและยูทิลิตี้ที่ซับซ้อนมากมาย

มันทำอะไรได้บ้าง?

แยกวิเคราะห์ไวยากรณ์ที่ไม่มีบริบททั้งหมด และจัดการกับความคลุมเครืออย่างงดงาม
สร้างแผนผังพาร์สที่มีคำอธิบายประกอบโดยอัตโนมัติ โดยไม่ต้องใช้โค้ดก่อสร้าง
มอบประสิทธิภาพชั้นหนึ่งในแง่ของความซับซ้อน Big-O และเวลารันไทม์ที่วัดได้ (พิจารณาว่านี่คือ Python ;)
รันบนล่าม Python ทุกตัว (เป็น pure-python)
สร้างตัวแยกวิเคราะห์แบบสแตนด์อโลน (สำหรับไวยากรณ์ LALR(1))

และคุณสมบัติอื่น ๆ อีกมากมาย อ่านล่วงหน้าและค้นหา!

สิ่งสำคัญที่สุดคือ Lark จะช่วยคุณประหยัดเวลาและป้องกันไม่ให้คุณปวดหัวในการแยกวิเคราะห์

ลิงค์ด่วน

เอกสาร @readthedocs
เอกสารสรุป (PDF)
ไอดีออนไลน์
บทช่วยสอนสำหรับการเขียนตัวแยกวิเคราะห์ JSON
โพสต์ในบล็อก: วิธีเขียน DSL ด้วย Lark
แชท Gitter

ติดตั้งลาร์ค

 $ pip install lark --upgrade

Lark ไม่มีการพึ่งพา

การเน้นไวยากรณ์

Lark จัดให้มีการเน้นไวยากรณ์สำหรับไฟล์ไวยากรณ์ (*.lark):

ข้อความประเสริฐ & TextMate
vscode
Intellij และ PyCharm
เป็นกลุ่ม
อะตอม

โคลนนิ่ง

สิ่งเหล่านี้คือการใช้งาน Lark ในภาษาอื่น พวกเขายอมรับไวยากรณ์ของ Lark และจัดเตรียมยูทิลิตี้ที่คล้ายกัน

Lerche (Julia) - ร่างโคลนอย่างไม่เป็นทางการเขียนด้วย Julia ทั้งหมด
Lark.js (Javascript) - พอร์ตของเครื่องกำเนิดพาร์เซอร์ LALR (1) แบบสแตนด์อโลนไปยัง Javascsript

สวัสดีชาวโลก

นี่คือโปรแกรมเล็กๆ สำหรับแยกวิเคราะห์ "Hello, World!" (หรือวลีอื่นที่คล้ายคลึงกัน):

 from lark import Lark

l = Lark ( '''start: WORD "," WORD "!"

            %import common.WORD   // imports from terminal library
            %ignore " "           // Disregard spaces in text
         ''' )

print ( l . parse ( "Hello, World!" ) )

และผลลัพธ์คือ:

 Tree ( start , [ Token ( WORD , 'Hello' ), Token ( WORD , 'World' )])

สังเกตเครื่องหมายวรรคตอนไม่ปรากฏในแผนภูมิผลลัพธ์ จะถูกกรองออกไปโดยอัตโนมัติโดย Lark

แมลงวันผลไม้เหมือนกล้วย

Lark เก่งในการจัดการกับความคลุมเครือ นี่คือผลลัพธ์ของการแยกวิเคราะห์วลี "แมลงวันผลไม้เหมือนกล้วย":

ผลไม้.png

อ่านโค้ดที่นี่ และดูตัวอย่างเพิ่มเติมได้ที่นี่

รายการคุณสมบัติหลัก

สร้าง parse-tree (AST) โดยอัตโนมัติตามโครงสร้างของไวยากรณ์
เออร์ลีย์ พาร์เซอร์
- สามารถแยกวิเคราะห์ไวยากรณ์ที่ไม่มีบริบททั้งหมดได้
- รองรับไวยากรณ์ที่ไม่ชัดเจนอย่างเต็มที่
ตัวแยกวิเคราะห์ LALR(1)
- รวดเร็วและเบา แข่งขันกับ PLY
- สามารถสร้าง parser แบบสแตนด์อโลนได้ (อ่านเพิ่มเติม)
ไวยากรณ์ EBNF
รองรับ Unicode อย่างสมบูรณ์
การติดตามบรรทัดและคอลัมน์อัตโนมัติ
ตัวแยกวิเคราะห์แบบโต้ตอบสำหรับกระบวนการแยกวิเคราะห์และการดีบักขั้นสูง
องค์ประกอบไวยากรณ์ - นำเข้าเทอร์มินัลและกฎจากไวยากรณ์อื่น
ไลบรารีมาตรฐานของเทอร์มินัล (สตริง ตัวเลข ชื่อ ฯลฯ)
นำเข้าไวยากรณ์จาก Nearley.js (อ่านเพิ่มเติม)
ชุดทดสอบที่กว้างขวาง
พิมพ์คำอธิบายประกอบ (รองรับ MyPy)
และอีกมากมาย!

ดูรายการคุณสมบัติทั้งหมดได้ที่นี่

เปรียบเทียบกับห้องสมุดอื่นๆ

การเปรียบเทียบประสิทธิภาพ

ความสนุกสนานนั้นเร็วและเบา (ต่ำกว่าดีกว่า)

การเปรียบเทียบรันไทม์

การเปรียบเทียบการใช้หน่วยความจำ

ดูบทช่วยสอน JSON เพื่อดูรายละเอียดเพิ่มเติมเกี่ยวกับวิธีการเปรียบเทียบ

หากต้องการการวัดประสิทธิภาพจากบุคคลที่สามอย่างละเอียด โปรดดูที่ Python Parsing Benchmarks repo

การเปรียบเทียบคุณสมบัติ

ห้องสมุด	อัลกอริทึม	ไวยากรณ์	สร้างต้นไม้?	รองรับความคลุมเครือ?	สามารถจัดการทุก CFG ได้หรือไม่?	การติดตามบรรทัด/คอลัมน์	สร้างแบบสแตนด์อโลน
สนุกสนาน	เออร์ลีย์/LALR(1)	อีบีเอ็นเอฟ	ใช่!	ใช่!	ใช่!	ใช่!	ใช่! (LALR เท่านั้น)
ชั้น	ลาอาร์(1)	บีเอ็นเอฟ	เลขที่	เลขที่	เลขที่	เลขที่	เลขที่
PyParsing	ตรึง	เครื่องผสมผสาน	เลขที่	เลขที่	เลขที่*	เลขที่	เลขที่
ผักชีฝรั่ง	ตรึง	อีบีเอ็นเอฟ	เลขที่	เลขที่	เลขที่*	เลขที่	เลขที่
ใจดี	ตรึง	อีบีเอ็นเอฟ	ใช่	เลขที่	เลขที่*	เลขที่	เลขที่
แอนทีอาร์	LL(*)	อีบีเอ็นเอฟ	ใช่	เลขที่	ใช่?	ใช่	เลขที่

(* PEG ไม่สามารถจัดการไวยากรณ์ที่ไม่ได้กำหนดไว้ได้ นอกจากนี้ตาม Wikipedia ยังไม่ได้รับคำตอบว่า PEG สามารถแยกวิเคราะห์ CFG ที่กำหนดทั้งหมดได้จริงหรือไม่ )

โครงการที่ใช้ Lark

บทกวี - ยูทิลิตี้สำหรับการจัดการการพึ่งพาและบรรจุภัณฑ์
Vyper - ภาษา Pythonic Smart Contract สำหรับ EVM
PyQuil - ไลบรารี Python สำหรับการเขียนโปรแกรมควอนตัมโดยใช้ Quil
Preql - ภาษาคิวรีเชิงสัมพันธ์ที่คอมไพล์เป็น SQL
สมมติฐาน - ห้องสมุดสำหรับการทดสอบตามคุณสมบัติ
mappyfile - ตัวแยกวิเคราะห์ MapFile สำหรับการทำงานกับการกำหนดค่า MapServer
tartiflette - เซิร์ฟเวอร์ GraphQL โดย Dailymotion
ไซแนปส์ - แพลตฟอร์มการวิเคราะห์ข่าวกรอง
Datacube-core - Open Data Cube วิเคราะห์ข้อมูลการสังเกตการณ์โลกในระดับทวีปตามเวลา
SPFlow - ไลบรารีสำหรับเครือข่ายผลิตภัณฑ์รวม
Torchani - ศักยภาพเครือข่ายประสาทที่แม่นยำบน PyTorch
Command-Block-Assembly - ภาษาแอสเซมบลีและคอมไพเลอร์ C สำหรับคำสั่ง Minecraft
EQL - ภาษาแบบสอบถามเหตุการณ์
Fabric-SDK-Py - SDK ผ้า Hyperledger พร้อม Python 3.x
จำเป็น - การตรวจสอบหลายฟิลด์โดยใช้ docstrings
miniwdl - ชุดเครื่องมือวิเคราะห์แบบคงที่สำหรับภาษาคำอธิบายเวิร์กโฟลว์
pytreeview - เครื่องมือสำรวจไวยากรณ์แบบต้นไม้น้ำหนักเบา
harmally - ภาษาสำหรับการวิเคราะห์ฮาร์มอนิกและทฤษฎีดนตรี
gersemi - ตัวจัดรูปแบบโค้ด CMake
MistQL - ภาษาคิวรีสำหรับโครงสร้างที่คล้ายกับ JSON
โครงร่าง - การสร้างแบบมีโครงสร้างด้วยโมเดลภาษาขนาดใหญ่