Doccano es una herramienta de anotación de texto de código abierto para humanos. Proporciona funciones de anotación para clasificación de texto, etiquetado de secuencias y tareas de secuencia a secuencia. Puede crear datos etiquetados para análisis de opiniones, reconocimiento de entidades con nombre, resúmenes de texto, etc. Simplemente cree un proyecto, cargue datos y comience a anotar. Puede crear un conjunto de datos en horas.
Pruebe la demostración de anotaciones.
Lea la documentación en https://doccano.github.io/doccano/.
Hay tres opciones para ejecutar doccano:
Para instalar doccano, ejecute:
pip install doccano
De forma predeterminada, SQLite 3 se utiliza para la base de datos predeterminada. Si desea utilizar PostgreSQL, instale las dependencias adicionales:
pip install ' doccano[postgresql] '
y configure la variable de entorno DATABASE_URL
de acuerdo con sus credenciales de PostgreSQL:
DATABASE_URL= " postgres:// ${POSTGRES_USER} : ${POSTGRES_PASSWORD} @ ${POSTGRES_HOST} : ${POSTGRES_PORT} / ${POSTGRES_DB} ?sslmode=disable "
Después de la instalación, ejecute los siguientes comandos:
# Initialize database.
doccano init
# Create a super user.
doccano createuser --username admin --password pass
# Start a web server.
doccano webserver --port 8000
En otra terminal, ejecute el comando:
# Start the task queue to handle file upload/download.
doccano task
Vaya a http://127.0.0.1:8000/.
Como configuración única, cree un contenedor Docker de la siguiente manera:
docker pull doccano/doccano
docker container create --name doccano
-e " ADMIN_USERNAME=admin "
-e " [email protected] "
-e " ADMIN_PASSWORD=password "
-v doccano-db:/data
-p 8000:8000 doccano/doccano
A continuación, inicie doccano ejecutando el contenedor:
docker container start doccano
Vaya a http://127.0.0.1:8000/.
Para detener el contenedor, ejecute docker container stop doccano -t 5
. Todos los datos creados en el contenedor persistirán después de los reinicios.
Si desea utilizar las funciones más recientes, especifique la etiqueta nightly
:
docker pull doccano/doccano:nightly
Necesitas instalar Git y clonar el repositorio:
git clone https://github.com/doccano/doccano.git
cd doccano
Nota para desarrolladores de Windows: asegúrese de configurar git para manejar correctamente los finales de línea o puede encontrar errores status code 127
al ejecutar los servicios en pasos futuros. Ejecutar con las opciones de configuración de git a continuación garantizará que su directorio git maneje correctamente los finales de línea.
git clone https://github.com/doccano/doccano.git --config core.autocrlf=input
Luego, cree un archivo .env
con variables en el siguiente formato (consulte ./docker/.env.example):
# platform settings
ADMIN_USERNAME=admin
ADMIN_PASSWORD=password
[email protected]
# rabbit mq settings
RABBITMQ_DEFAULT_USER=doccano
RABBITMQ_DEFAULT_PASS=doccano
# database settings
POSTGRES_USER=doccano
POSTGRES_PASSWORD=doccano
POSTGRES_DB=doccano
Después de ejecutar el siguiente comando, acceda a http://127.0.0.1/.
docker-compose -f docker/docker-compose.prod.yml --env-file .env up
Servicio | Botón |
---|---|
AWS 1 | |
héroeku |
Consulte la documentación para obtener más detalles.
Como ocurre con cualquier software, doccano está en continuo desarrollo. Si tiene solicitudes de funciones, presente un problema que describa su solicitud. Además, si desea ver cómo se trabaja en una característica específica, no dude en contribuir trabajando para lograrla. El procedimiento estándar es bifurcar el repositorio, agregar una función, corregir un error y luego presentar una solicitud de extracción para que sus cambios se fusionen en el repositorio principal y se incluyan en la próxima versión.
A continuación se ofrecen algunos consejos que pueden resultar útiles. Cómo contribuir al Proyecto Doccano
@misc{doccano,
title={{doccano}: Text Annotation Tool for Human},
url={https://github.com/doccano/doccano},
note={Software available from https://github.com/doccano/doccano},
author={
Hiroki Nakayama and
Takahiro Kubo and
Junya Kamura and
Yasufumi Taniguchi and
Xu Liang},
year={2018},
}
Para obtener ayuda y comentarios, no dude en ponerse en contacto con el autor.
(1) EC2 KeyPair no se puede crear automáticamente, así que asegúrese de tener un EC2 KeyPair existente en una región. O crea uno tú mismo. (2) Si desea acceder a doccano a través de HTTPS en AWS, aquí tiene una instrucción. ↩