doccano는 인간을 위한 오픈 소스 텍스트 주석 도구입니다. 텍스트 분류, 서열 라벨링 및 서열 간 작업을 위한 주석 기능을 제공합니다. 감정 분석, 명명된 엔터티 인식, 텍스트 요약 등을 위해 레이블이 지정된 데이터를 생성할 수 있습니다. 프로젝트를 만들고, 데이터를 업로드하고, 주석을 달기 시작하세요. 몇 시간 안에 데이터 세트를 구축할 수 있습니다.
주석 데모를 사용해 보세요.
https://doccano.github.io/doccano/에서 설명서를 읽어보세요.
Doccano를 실행하는 데는 세 가지 옵션이 있습니다.
Doccano를 설치하려면 다음을 실행하세요.
pip install doccano
기본적으로 SQLite 3이 기본 데이터베이스로 사용됩니다. PostgreSQL을 사용하려면 추가 종속성을 설치하십시오.
pip install ' doccano[postgresql] '
PostgreSQL 자격 증명에 따라 DATABASE_URL
환경 변수를 설정합니다.
DATABASE_URL= " postgres:// ${POSTGRES_USER} : ${POSTGRES_PASSWORD} @ ${POSTGRES_HOST} : ${POSTGRES_PORT} / ${POSTGRES_DB} ?sslmode=disable "
설치 후 다음 명령을 실행하십시오.
# Initialize database.
doccano init
# Create a super user.
doccano createuser --username admin --password pass
# Start a web server.
doccano webserver --port 8000
다른 터미널에서 다음 명령을 실행합니다.
# Start the task queue to handle file upload/download.
doccano task
http://127.0.0.1:8000/으로 이동합니다.
일회성 설정으로 다음과 같이 Docker 컨테이너를 만듭니다.
docker pull doccano/doccano
docker container create --name doccano
-e " ADMIN_USERNAME=admin "
-e " [email protected] "
-e " ADMIN_PASSWORD=password "
-v doccano-db:/data
-p 8000:8000 doccano/doccano
다음으로 컨테이너를 실행하여 Doccano를 시작합니다.
docker container start doccano
http://127.0.0.1:8000/으로 이동합니다.
컨테이너를 중지하려면 docker container stop doccano -t 5
실행하세요. 컨테이너에 생성된 모든 데이터는 다시 시작해도 유지됩니다.
최신 기능을 사용하려면 nightly
태그를 지정하세요.
docker pull doccano/doccano:nightly
Git을 설치하고 저장소를 복제해야 합니다.
git clone https://github.com/doccano/doccano.git
cd doccano
Windows 개발자를 위한 참고 사항: 줄 끝을 올바르게 처리하도록 git을 구성해야 합니다. 그렇지 않으면 이후 단계에서 서비스를 실행하는 동안 status code 127
오류가 발생할 수 있습니다. 아래의 git config 옵션을 사용하여 실행하면 git 디렉토리가 줄 끝을 올바르게 처리하는지 확인할 수 있습니다.
git clone https://github.com/doccano/doccano.git --config core.autocrlf=input
그런 다음, 다음 형식의 변수를 사용하여 .env
파일을 만듭니다(./docker/.env.example 참조).
# platform settings
ADMIN_USERNAME=admin
ADMIN_PASSWORD=password
[email protected]
# rabbit mq settings
RABBITMQ_DEFAULT_USER=doccano
RABBITMQ_DEFAULT_PASS=doccano
# database settings
POSTGRES_USER=doccano
POSTGRES_PASSWORD=doccano
POSTGRES_DB=doccano
다음 명령을 실행한 후 http://127.0.0.1/에 접속합니다.
docker-compose -f docker/docker-compose.prod.yml --env-file .env up
서비스 | 단추 |
---|---|
AWS 1 | |
헤로쿠 |
자세한 내용은 설명서를 참조하세요.
다른 소프트웨어와 마찬가지로 Doccano도 지속적으로 개발되고 있습니다. 기능에 대한 요청이 있는 경우 요청을 설명하는 문제를 제출하세요. 또한 특정 기능에 대한 작업을 보고 싶다면 해당 기능에 대한 작업을 통해 자유롭게 기여해 주세요. 표준 절차는 저장소를 포크하고, 기능을 추가하고, 버그를 수정한 다음, 변경 사항이 기본 저장소에 병합되어 다음 릴리스에 포함되도록 풀 요청을 제출하는 것입니다.
다음은 도움이 될 수 있는 몇 가지 팁입니다. Doccano 프로젝트에 기여하는 방법
@misc{doccano,
title={{doccano}: Text Annotation Tool for Human},
url={https://github.com/doccano/doccano},
note={Software available from https://github.com/doccano/doccano},
author={
Hiroki Nakayama and
Takahiro Kubo and
Junya Kamura and
Yasufumi Taniguchi and
Xu Liang},
year={2018},
}
도움과 피드백이 필요하면 언제든지 작성자에게 문의하세요.
(1) EC2 KeyPair는 자동으로 생성될 수 없으므로 한 리전에 기존 EC2 KeyPair가 있어야 합니다. 아니면 직접 만들어 보세요. (2) AWS에서 HTTPS를 통해 Doccano에 액세스하려면 다음 지침을 따르세요. ↩