См. meertensinstituut.github.io/mtas/ для получения дополнительной документации и инструкций.
Доступен образ докера, предоставляющий демонстрационный сценарий на основе Solr с индексированием и запросом некоторых примеров документов. Тянуть и бежать
docker pull textexploration/mtas
docker run -t -i -p 8080:80 --name mtas textexploration/mtas
Или построить и запустить
docker build -t mtas https://raw.githubusercontent.com/textexploration/mtas/master/docker/Dockerfile
docker run -t -i -p 8080:80 --name mtas mtas
Это предоставит веб-сайт через порт 8080 на IP-адресе вашего хоста докера с дополнительной информацией.
Один из основных вариантов использования Mtas, проект Nederlab, в настоящее время 1 обеспечивает доступ как к метаданным, так и к аннотированному тексту, к более чем 74 миллионам элементов для поиска и анализа, как указано ниже.
Общий | Иметь в виду | Мин | Макс | |
---|---|---|---|---|
Размер индекса Solr | 2715 Г | 60,3 Г | 75 тыс. | 288 г |
Солр документы | 74 762 559 | 1 661 390 | 119 | 11 912 415 |
Коллекции регулярно добавляются и обновляются путем добавления новых ядер, замены ядер и/или объединения новых ядер с существующими. В настоящее время данные разделены по 44 отдельным ядрам. В 41 437 881 из этих документов включен аннотированный текст объемом от 1 до более 3,5 миллионов слов:
Общий | Иметь в виду | Мин | Макс | |
---|---|---|---|---|
Слова | 18 494 454 357 | 446 | 1 | 3 537 883 |
Аннотации | 95 921 919 849 | 2314 | 4 | 23 589 831 |
1 ситуация июнь 2018 г.
Copyright 2017-2018 Koninklijke Nederlandse Academie van Wetenschappen
Лицензируется по лицензии Apache версии 2.0 («Лицензия»); вы не можете использовать этот файл, кроме как в соответствии с Лицензией. Вы можете получить копию Лицензии по адресу:
http://www.apache.org/licenses/LICENSE-2.0
Если это не требуется действующим законодательством или не согласовано в письменной форме, программное обеспечение, распространяемое по Лицензии, распространяется на условиях «КАК ЕСТЬ», БЕЗ КАКИХ-ЛИБО ГАРАНТИЙ ИЛИ УСЛОВИЙ, явных или подразумеваемых. См. Лицензию для определения конкретного языка, регулирующего разрешения и ограничения в рамках Лицензии.