注:激しい開発中のプロジェクト!
UCFSは、コンテキストと通常の言語の交差点に関連する問題を解決するためのツールです。そのような問題の例:
Usage: kotgll options_list
Options:
--input -> Input format (always required) { Value should be one of [string, graph] }
--grammar -> Grammar format (always required) { Value should be one of [cfg, rsm] }
--sppf [ON] -> Sppf mode { Value should be one of [on, off] }
--inputPath -> Path to input txt file (always required) { String }
--grammarPath -> Path to grammar txt file (always required) { String }
--outputPath -> Path to output txt file (always required) { String }
--help, -h -> Usage info
git clone https://github.com/FormalLanguageConstrainedPathQuerying/kotgll.git
または
git clone [email protected]:FormalLanguageConstrainedPathQuerying/kotgll.git
または
gh repo clone FormalLanguageConstrainedPathQuerying/kotgll
cd kotgll
gradle run --args="--help"
「オプションリスト」メッセージが表示されます。
gradle run --args="--input graph --grammar rsm --sppf off --inputPath src/test/resources/cli/TestGraphReadWriteCSV/dyck.csv --grammarPath src/test/resources/cli/TestRSMReadWriteTXT/dyck.txt --outputPath ./result.txt"
curl -L -O https://github.com/FormalLanguageConstrainedPathQuerying/kotgll/releases/download/v1.0.0/kotgll-1.0.0.jar
java -jar kotgll-1.0.0.jar --input graph --grammar rsm --sppf off --inputPath src/test/resources/cli/TestGraphReadWriteCSV/dyck.csv --grammarPath src/test/resources/cli/TestRSMReadWriteTXT/dyck.txt --outputPath ./result.txt
StartNonterminal("S")
Nonterminal("S") -> Terminal("subClassOf_r") Nonterminal("S") Terminal("subClassOf")
Nonterminal("S") -> Terminal("subClassOf_r") Terminal("subClassOf")
Nonterminal("S") -> Terminal("type_r") Nonterminal("S") Terminal("type")
Nonterminal("S") -> Terminal("type_r") Terminal("type")
StartState(id=0,nonterminal=Nonterminal("S"),isStart=true,isFinal=false)
State(id=0,nonterminal=Nonterminal("S"),isStart=true,isFinal=false)
State(id=1,nonterminal=Nonterminal("S"),isStart=false,isFinal=false)
State(id=4,nonterminal=Nonterminal("S"),isStart=false,isFinal=false)
State(id=3,nonterminal=Nonterminal("S"),isStart=false,isFinal=true)
State(id=2,nonterminal=Nonterminal("S"),isStart=false,isFinal=false)
State(id=6,nonterminal=Nonterminal("S"),isStart=false,isFinal=true)
State(id=5,nonterminal=Nonterminal("S"),isStart=false,isFinal=false)
TerminalEdge(tail=0,head=1,terminal=Terminal("subClassOf_r"))
TerminalEdge(tail=0,head=4,terminal=Terminal("type_r"))
TerminalEdge(tail=1,head=3,terminal=Terminal("subClassOf"))
NonterminalEdge(tail=1,head=2,nonterminal=Nonterminal("S"))
TerminalEdge(tail=4,head=6,terminal=Terminal("type"))
NonterminalEdge(tail=4,head=5,nonterminal=Nonterminal("S"))
TerminalEdge(tail=2,head=3,terminal=Terminal("subClassOf"))
TerminalEdge(tail=5,head=6,terminal=Terminal("type"))
GLLアルゴリズムは、グラフ入力をサポートするように変更されています。提案された変更は、すべての到達可能性のペアを見つけるシナリオのために、いくつかの実際のグラフで評価されています。
マシンの構成:Ubuntu 20.04のPC、Intel Core i7-6700 3.40GHz CPU、DDR4 64GB RAM。
環境構成:
グラフデータは、CFPQ_DATAデータセットから選択されます。
グラフの詳細な説明には、次のようにリストされています。
グラフ名 | | v | | | E | | #subclassof | #タイプ | #BroaderTransitive |
---|---|---|---|---|---|
酵素 | 48 815 | 86 543 | 8 163 | 14 989 | 8 156 |
eclass | 239 111 | 360 248 | 90 962 | 72 517 | 0 |
階層に行きます | 45 007 | 490 109 | 490 109 | 0 | 0 |
行く | 582 929 | 1 437 437 | 94 514 | 226 481 | 0 |
ジェスチーズ | 450 609 | 2 201 532 | 0 | 89 065 | 20 867 |
分類 | 5 728 398 | 14 922 125 | 2 112 637 | 2 508 635 | 0 |
評価で使用されるすべてのクエリは、同じ世代のクエリのバリエーションです。 x
関係とそれぞれのエッジの逆はx_r
として示されます。
RDFグラフに使用される文法:
G 1
S -> subClassOf_r S subClassOf | subClassOf_r subClassOf
| type_r S type | type_r type
リポジトリ内のG 1コンテキストフリーの文法の表現は、ここにあります。
リポジトリ内の再帰オートマトンとしてのG 1のコンテキストフリーの文法の表現は、ここにあります。
RDF分析に関連するグラフのすべてのペアリーチ可能性クエリ評価の結果を以下に示します。
各行で、秒単位で最高の平均時間が太字で強調されています。
グラフ | CFG | RSM | gll4graph |
---|---|---|---|
酵素 | 0.107 | 0.044 | 0.22 |
eclass | 0.94 | 0.43 | 1.5 |
階層に行きます | 4.1 | 3.0 | 3.6 |
行く | 3.2 | 1.86 | 5.55 |
ジェスチーズ | 0.97 | 0.34 | 2.89 |
分類 | 31.2 | 14.8 | 45.4 |
より多くの結果、しかし生の形式では、リポジトリkotgll_benchmarksにあります