Hinweis: Projekt unter schwerer Entwicklung!
UCFS ist ein U- Nuversal- C- OnText- F- Ree - Olver: Ein Tool zur Lösung von Problemen im Zusammenhang mit kontextfreiem und regulärem Sprachschnitt. Beispiele für solche Probleme:
Usage: kotgll options_list
Options:
--input -> Input format (always required) { Value should be one of [string, graph] }
--grammar -> Grammar format (always required) { Value should be one of [cfg, rsm] }
--sppf [ON] -> Sppf mode { Value should be one of [on, off] }
--inputPath -> Path to input txt file (always required) { String }
--grammarPath -> Path to grammar txt file (always required) { String }
--outputPath -> Path to output txt file (always required) { String }
--help, -h -> Usage info
git clone https://github.com/FormalLanguageConstrainedPathQuerying/kotgll.git
oder
git clone [email protected]:FormalLanguageConstrainedPathQuerying/kotgll.git
oder
gh repo clone FormalLanguageConstrainedPathQuerying/kotgll
cd kotgll
gradle run --args="--help"
Sie sehen die Nachricht "Optionenliste".
gradle run --args="--input graph --grammar rsm --sppf off --inputPath src/test/resources/cli/TestGraphReadWriteCSV/dyck.csv --grammarPath src/test/resources/cli/TestRSMReadWriteTXT/dyck.txt --outputPath ./result.txt"
curl -L -O https://github.com/FormalLanguageConstrainedPathQuerying/kotgll/releases/download/v1.0.0/kotgll-1.0.0.jar
java -jar kotgll-1.0.0.jar --input graph --grammar rsm --sppf off --inputPath src/test/resources/cli/TestGraphReadWriteCSV/dyck.csv --grammarPath src/test/resources/cli/TestRSMReadWriteTXT/dyck.txt --outputPath ./result.txt
StartNonterminal("S")
Nonterminal("S") -> Terminal("subClassOf_r") Nonterminal("S") Terminal("subClassOf")
Nonterminal("S") -> Terminal("subClassOf_r") Terminal("subClassOf")
Nonterminal("S") -> Terminal("type_r") Nonterminal("S") Terminal("type")
Nonterminal("S") -> Terminal("type_r") Terminal("type")
StartState(id=0,nonterminal=Nonterminal("S"),isStart=true,isFinal=false)
State(id=0,nonterminal=Nonterminal("S"),isStart=true,isFinal=false)
State(id=1,nonterminal=Nonterminal("S"),isStart=false,isFinal=false)
State(id=4,nonterminal=Nonterminal("S"),isStart=false,isFinal=false)
State(id=3,nonterminal=Nonterminal("S"),isStart=false,isFinal=true)
State(id=2,nonterminal=Nonterminal("S"),isStart=false,isFinal=false)
State(id=6,nonterminal=Nonterminal("S"),isStart=false,isFinal=true)
State(id=5,nonterminal=Nonterminal("S"),isStart=false,isFinal=false)
TerminalEdge(tail=0,head=1,terminal=Terminal("subClassOf_r"))
TerminalEdge(tail=0,head=4,terminal=Terminal("type_r"))
TerminalEdge(tail=1,head=3,terminal=Terminal("subClassOf"))
NonterminalEdge(tail=1,head=2,nonterminal=Nonterminal("S"))
TerminalEdge(tail=4,head=6,terminal=Terminal("type"))
NonterminalEdge(tail=4,head=5,nonterminal=Nonterminal("S"))
TerminalEdge(tail=2,head=3,terminal=Terminal("subClassOf"))
TerminalEdge(tail=5,head=6,terminal=Terminal("type"))
Der GLL -Algorithmus wurde geändert, um die Grapheingabe zu unterstützen. Die vorgeschlagene Modifikation wurde in mehreren realen Grafiken für das Szenario bewertet, um alle Erreichbarkeitspaare zu finden.
Maschinenkonfiguration : PC mit Ubuntu 20.04, Intel Core i7-6700 3.40GHz CPU, DDR4 64 GB RAM.
Umweltkonfiguration :
Die Diagrammdaten werden aus dem Datensatz von cfpq_data ausgewählt.
Eine detaillierte Beschreibung der Diagramme ist belly aufgeführt.
Grafikname | | V | | | E | | #SubClassof | #Typ | #BroaderTransitive |
---|---|---|---|---|---|
Enzym | 48 815 | 86 543 | 8 163 | 14 989 | 8 156 |
Eclass | 239 111 | 360 248 | 90 962 | 72 517 | 0 |
Gehen Sie Hierarchie | 45 007 | 490 109 | 490 109 | 0 | 0 |
Gehen | 582 929 | 1 437 437 | 94 514 | 226 481 | 0 |
Geospezies | 450 609 | 2 201 532 | 0 | 89 065 | 20 867 |
Taxonomie | 5 728 398 | 14 922 125 | 2 112 637 | 2 508 635 | 0 |
Alle bei der Bewertung verwendeten Abfragen sind Varianten der Abfrage mit gleicher Generation. Die Umkehrung einer x
-Beziehung und die jeweilige Kante wird als x_r
bezeichnet.
Grammatiken, die für RDF -Diagramme verwendet werden:
G 1
S -> subClassOf_r S subClassOf | subClassOf_r subClassOf
| type_r S type | type_r type
Die Darstellung der kontextfreien Grammatik von G 1 im Repository finden Sie hier.
Die Darstellung der kontextfreien Grammatik von G 1 als rekursiver Automaten im Repository finden Sie hier.
Die Ergebnisse der Evaluierung aller Paare der Erreichbarkeitsabfragen in den Grafiken in Bezug auf die RDF -Analyse sind nachstehend aufgeführt.
In jeder Reihe wird die beste Zwischenzeit in Sekunden fett hervorgehoben.
Graph | CFG | RSM | Gll4Graph |
---|---|---|---|
Enzym | 0,107 | 0,044 | 0,22 |
Eclass | 0,94 | 0,43 | 1.5 |
Gehen Sie Hierarchie | 4.1 | 3.0 | 3.6 |
Gehen | 3.2 | 1.86 | 5.55 |
Geospezies | 0,97 | 0,34 | 2.89 |
Taxonomie | 31.2 | 14.8 | 45,4 |
Weitere Ergebnisse, aber in roher Form finden Sie in den Repository kotgll_benchmarks