詳細なドキュメントと手順については、meertensinstituut.github.io/mtas/ を参照してください。
いくつかのサンプル ドキュメントのインデックス作成とクエリを備えた Solr ベースのデモンストレーション シナリオを提供する Docker イメージが利用可能です。引っ張って走るには
docker pull textexploration/mtas
docker run -t -i -p 8080:80 --name mtas textexploration/mtas
またはビルドして実行する
docker build -t mtas https://raw.githubusercontent.com/textexploration/mtas/master/docker/Dockerfile
docker run -t -i -p 8080:80 --name mtas mtas
これにより、Docker ホストの IP 上のポート 8080 にある Web サイトに詳細情報が提供されます。
Mtas の主な使用例の1つである Nederlab プロジェクトは、現在、以下に指定されている検索と分析のために、メタデータと注釈付きテキストの両方の観点から 7,400 万を超えるアイテムへのアクセスを提供しています。
合計 | 平均 | 分 | マックス | |
---|---|---|---|---|
Solr インデックスのサイズ | 2,715G | 60.3G | 75k | 288G |
Solrドキュメント | 74,762,559 | 1,661,390 | 119 | 11,912,415 |
コレクションは、新しいコアの追加、コアの置換、および/または新しいコアと既存のコアのマージによって、定期的に追加および更新されます。現在、データは 44 の個別のコアに分割されています。これらの文書のうち 41,437,881 には、1 ワードから 350 万ワード以上までのさまざまなサイズの注釈付きテキストが含まれています。
合計 | 平均 | 分 | マックス | |
---|---|---|---|---|
言葉 | 18,494,454,357 | 446 | 1 | 3,537,883 |
注釈 | 95,921,919,849 | 2,314 | 4 | 23,589,831 |
1 件の状況 2018 年 6 月
著作権 2017-2018 Koninklijke Nederlandse Academie van Wetenschappen
Apache License バージョン 2.0 (「ライセンス」) に基づいてライセンスされています。ライセンスに準拠する場合を除き、このファイルを使用することはできません。ライセンスのコピーは次の場所で入手できます。
http://www.apache.org/licenses/LICENSE-2.0
適用される法律で義務付けられている場合または書面による同意がない限り、ライセンスに基づいて配布されるソフトウェアは、明示または黙示を問わず、いかなる種類の保証や条件もなく、「現状のまま」で配布されます。ライセンスに基づく許可と制限を規定する特定の言語については、ライセンスを参照してください。