Consulte meertensinstituut.github.io/mtas/ para obter mais documentação e instruções.
Está disponível uma imagem docker que fornece um cenário de demonstração baseado em Solr com indexação e consulta de alguns documentos de amostra. Para puxar e correr
docker pull textexploration/mtas
docker run -t -i -p 8080:80 --name mtas textexploration/mtas
Ou para construir e executar
docker build -t mtas https://raw.githubusercontent.com/textexploration/mtas/master/docker/Dockerfile
docker run -t -i -p 8080:80 --name mtas mtas
Isso fornecerá um site na porta 8080 no IP do seu host docker com mais informações.
Um dos principais casos de uso do Mtas, o projeto Nederlab, atualmente 1 fornece acesso, tanto em termos de metadados quanto de texto anotado, a mais de 74 milhões de itens para pesquisa e análise, conforme especificado abaixo.
Total | Significar | Mínimo | Máx. | |
---|---|---|---|---|
Tamanho do índice Solr | 2.715g | 60,3g | 75 mil | 288g |
Documentos Solr | 74.762.559 | 1.661.390 | 119 | 11.912.415 |
As coleções são adicionadas e atualizadas regularmente adicionando novos núcleos, substituindo núcleos e/ou mesclando novos núcleos com os existentes. Atualmente, os dados estão divididos em 44 núcleos separados. Para 41.437.881 desses documentos, está incluído texto anotado variando em tamanho de 1 a mais de 3,5 milhões de palavras:
Total | Significar | Mínimo | Máx. | |
---|---|---|---|---|
Palavras | 18.494.454.357 | 446 | 1 | 3.537.883 |
Anotações | 95.921.919.849 | 2.314 | 4 | 23.589.831 |
1 situação junho 2018
Copyright 2017-2018 Koninklijke Nederlandse Academie van Wetenschappen
Licenciado sob a Licença Apache, Versão 2.0 (a "Licença"); você não pode usar este arquivo exceto em conformidade com a Licença. Você pode obter uma cópia da Licença em
http://www.apache.org/licenses/LICENSE-2.0
A menos que exigido pela lei aplicável ou acordado por escrito, o software distribuído sob a Licença é distribuído "COMO ESTÁ", SEM GARANTIAS OU CONDIÇÕES DE QUALQUER TIPO, expressas ou implícitas. Consulte a Licença para saber o idioma específico que rege as permissões e limitações da Licença.