lark Download - lark Quellcode-Download

lark

Python

1.2.2 - Bugfix for 1.2.1 (Earley issues with ambiguity)

Herunterladen

Lark – ein Parsing-Toolkit für Python

Lark ist ein Parsing-Toolkit für Python, das mit Schwerpunkt auf Ergonomie, Leistung und Modularität entwickelt wurde.

Lark kann alle kontextfreien Sprachen analysieren. Einfach ausgedrückt bedeutet dies, dass es in der Lage ist, fast jede verfügbare Programmiersprache und bis zu einem gewissen Grad auch die meisten natürlichen Sprachen zu analysieren.

Für wen ist es?

Anfänger : Lerche ist sehr experimentierfreudig. Es kann jede Grammatik analysieren, egal wie kompliziert oder mehrdeutig sie ist, und zwar effizient. Außerdem erstellt es für Sie einen annotierten Parse-Baum, der nur die Grammatik und eine Eingabe verwendet, und stellt Ihnen praktische und flexible Tools zur Verarbeitung dieses Parse-Baums zur Verfügung.
Experten : Lark implementiert sowohl Earley (SPPF) als auch LALR (1) und mehrere verschiedene Lexer, sodass Sie je nach Ihren Anforderungen einen Kompromiss zwischen Leistung und Geschwindigkeit finden können. Es bietet außerdem eine Vielzahl anspruchsvoller Funktionen und Dienstprogramme.

Was kann es tun?

Analysieren Sie alle kontextfreien Grammatiken und gehen Sie elegant mit etwaigen Unklarheiten um
Erstellen Sie automatisch einen annotierten Parse-Baum, kein Konstruktionscode erforderlich.
Bieten Sie erstklassige Leistung sowohl hinsichtlich der Big-O-Komplexität als auch der gemessenen Laufzeit (wenn man bedenkt, dass es sich um Python handelt ;)
Läuft auf jedem Python-Interpreter (es ist reines Python)
Generieren Sie einen eigenständigen Parser (für LALR(1)-Grammatiken)

Und viele weitere Funktionen. Lesen Sie weiter und finden Sie es heraus!

Am wichtigsten ist, dass Sie mit Lark Zeit sparen und Kopfschmerzen beim Parsen vermeiden.

Schnelle Links

Dokumentation @readthedocs
Spickzettel (PDF)
Online-IDE
Tutorial zum Schreiben eines JSON-Parsers.
Blogbeitrag: Wie schreibe ich eine DSL mit Lark
Gitter-Chat

Installieren Sie Lark

 $ pip install lark --upgrade

Lark hat keine Abhängigkeiten.

Syntaxhervorhebung

Lark bietet Syntaxhervorhebung für seine Grammatikdateien (*.lark):

Erhabener Text und TextMate
vscode
Intellij & PyCharm
Vim
Atom

Klone

Dies sind Implementierungen von Lark in anderen Sprachen. Sie akzeptieren Lark-Grammatiken und bieten ähnliche Dienstprogramme.

Lerche (Julia) – ein inoffizieller Klon, vollständig in Julia geschrieben.
Lark.js (Javascript) – eine Portierung des eigenständigen LALR(1)-Parser-Generators auf Javascsript.

Hallo Welt

Hier ist ein kleines Programm zum Parsen von „Hello, World!“ (Oder ein anderer ähnlicher Satz):

 from lark import Lark

l = Lark ( '''start: WORD "," WORD "!"

            %import common.WORD   // imports from terminal library
            %ignore " "           // Disregard spaces in text
         ''' )

print ( l . parse ( "Hello, World!" ) )

Und die Ausgabe ist:

 Tree ( start , [ Token ( WORD , 'Hello' ), Token ( WORD , 'World' )])

Beachten Sie, dass im resultierenden Baum keine Satzzeichen angezeigt werden. Es wird automatisch von Lark herausgefiltert.

Fruchtfliegen mögen Bananen

Lark ist großartig im Umgang mit Mehrdeutigkeiten. Hier ist das Ergebnis der Analyse des Ausdrucks „Fruchtfliegen wie Bananen“:

Lesen Sie den Code hier und sehen Sie sich hier weitere Beispiele an.

Liste der Hauptfunktionen

Erstellt automatisch einen Analysebaum (AST), basierend auf der Struktur der Grammatik
Early -Parser
- Kann alle kontextfreien Grammatiken analysieren
- Volle Unterstützung für mehrdeutige Grammatiken
LALR(1) -Parser
- Schnell und leicht, konkurrenzfähig mit PLY
- Kann einen eigenständigen Parser generieren (weiterlesen)
EBNF- Grammatik
Unicode wird vollständig unterstützt
Automatische Zeilen- und Spaltenverfolgung
Interaktiver Parser für erweiterte Parsing-Abläufe und Debugging
Grammatikkomposition – Importieren Sie Terminals und Regeln aus anderen Grammatiken
Standardbibliothek von Terminals (Zeichenfolgen, Zahlen, Namen usw.)
Grammatiken aus Nearley.js importieren (weiterlesen)
Umfangreiche Testsuite
Typanmerkungen (MyPy-Unterstützung)
Und noch viel mehr!

Die vollständige Liste der Funktionen finden Sie hier

Vergleich mit anderen Bibliotheken

Leistungsvergleich

Lark ist schnell und leicht (niedriger ist besser)

Laufzeitvergleich

Vergleich der Speichernutzung

Weitere Informationen zur Durchführung des Vergleichs finden Sie im JSON-Tutorial.

Ausführliche Benchmarks von Drittanbietern finden Sie im Repo „Python Parsing Benchmarks“.

Funktionsvergleich

Bibliothek	Algorithmus	Grammatik	Baut Baum?	Unterstützt Mehrdeutigkeit?	Kommt mit jedem CFG zurecht?	Zeilen-/Spaltenverfolgung	Erzeugt Standalone
Lerche	Earley/LALR(1)	EBNF	Ja!	Ja!	Ja!	Ja!	Ja! (nur LALR)
PLY	LALR(1)	BNF	NEIN	NEIN	NEIN	NEIN	NEIN
PyParsing	PFLOCK	Kombinatoren	NEIN	NEIN	NEIN*	NEIN	NEIN
Petersilie	PFLOCK	EBNF	NEIN	NEIN	NEIN*	NEIN	NEIN
Sparsam	PFLOCK	EBNF	Ja	NEIN	NEIN*	NEIN	NEIN
ANTLR	LL(*)	EBNF	Ja	NEIN	Ja?	Ja	NEIN

(* PEGs können nicht mit nichtdeterministischen Grammatiken umgehen. Außerdem bleibt laut Wikipedia unbeantwortet, ob PEGs wirklich alle deterministischen CFGs analysieren können .)

Projekte mit Lark

Poetry – Ein Dienstprogramm für Abhängigkeitsmanagement und Paketierung
Vyper – Pythonic Smart Contract Language für die EVM
PyQuil – Python-Bibliothek für Quantenprogrammierung mit Quil
Preql – Eine interpretierte relationale Abfragesprache, die zu SQL kompiliert wird
Hypothese – Bibliothek für eigenschaftsbasiertes Testen
mappyfile – ein MapFile-Parser für die Arbeit mit der MapServer-Konfiguration
tartiflette – GraphQL-Server von Dailymotion
Synapse – eine Plattform zur Intelligenzanalyse
Datacube-core – Open Data Cube analysiert Erdbeobachtungsdaten auf kontinentaler Ebene im Zeitverlauf
SPFlow – Bibliothek für Summenproduktnetzwerke
Torchani – Genaues neuronales Netzwerkpotenzial auf PyTorch
Command-Block-Assembly – Eine Assemblersprache und ein C-Compiler für Minecraft-Befehle
EQL – Ereignisabfragesprache
Fabric-SDK-Py – Hyperledger Fabric SDK mit Python 3.x
Erforderlich – Mehrfeldvalidierung mithilfe von Dokumentzeichenfolgen
miniwdl – Ein statisches Analyse-Toolkit für die Workflow Description Language
pytreeview – ein leichter baumbasierter Grammatik-Explorer
Harmalyse – Eine Sprache für harmonische Analyse und Musiktheorie
gersemi – Ein CMake-Codeformatierer
MistQL – Eine Abfragesprache für JSON-ähnliche Strukturen
Outlines – Strukturierte Generierung mit großen Sprachmodellen