자세한 문서 및 지침은 meertensinstituut.github.io/mtas/를 참조하세요.
일부 샘플 문서의 인덱싱 및 쿼리와 함께 Solr 기반 데모 시나리오를 제공하는 도커 이미지를 사용할 수 있습니다. 당기고 달리려면
docker pull textexploration/mtas
docker run -t -i -p 8080:80 --name mtas textexploration/mtas
또는 빌드하고 실행하려면
docker build -t mtas https://raw.githubusercontent.com/textexploration/mtas/master/docker/Dockerfile
docker run -t -i -p 8080:80 --name mtas mtas
그러면 Docker 호스트 IP의 포트 8080에 더 많은 정보가 포함된 웹사이트가 제공됩니다.
Mtas의 주요 사용 사례 중 하나인 Nederlab 프로젝트는 현재 메타데이터 및 주석 이 달린 텍스트 측면에서 아래에 지정된 검색 및 분석을 위한 7,400만 개 이상의 항목에 대한 액세스를 제공합니다.
총 | 평균 | 최소 | 맥스 | |
---|---|---|---|---|
Solr 인덱스 크기 | 2,715지 | 60.3G | 75,000 | 288G |
솔러 문서 | 74,762,559 | 1,661,390 | 119 | 11,912,415 |
컬렉션은 새 코어를 추가하고, 코어를 교체하고, 새 코어를 기존 코어와 병합하여 정기적으로 추가 및 업데이트됩니다. 현재 데이터는 44개의 개별 코어로 나누어져 있습니다. 이 문서 중 41,437,881개에는 1백만 단어에서 350만 단어까지 다양한 크기의 주석이 달린 텍스트가 포함되어 있습니다.
총 | 평균 | 최소 | 맥스 | |
---|---|---|---|---|
단어 | 18,494,454,357 | 446 | 1 | 3,537,883 |
주석 | 95,921,919,849 | 2,314 | 4 | 23,589,831 |
2018년 6월 상황 1개
저작권 2017-2018 Koninklijke Nederlandse Academie van Wetenschappen
Apache 라이센스 버전 2.0("라이센스")에 따라 라이센스가 부여되었습니다. 라이센스를 준수하는 경우를 제외하고는 이 파일을 사용할 수 없습니다. 다음에서 라이센스 사본을 얻을 수 있습니다.
http://www.apache.org/licenses/LICENSE-2.0
해당 법률에서 요구하거나 서면으로 동의하지 않는 한, 라이선스에 따라 배포되는 소프트웨어는 명시적이든 묵시적이든 어떠한 종류의 보증이나 조건 없이 "있는 그대로" 배포됩니다. 라이선스에 따른 허가 및 제한 사항을 관리하는 특정 언어는 라이선스를 참조하세요.