doccano adalah alat anotasi teks sumber terbuka untuk manusia. Ini menyediakan fitur anotasi untuk klasifikasi teks, pelabelan urutan, dan tugas urutan ke urutan. Anda dapat membuat data berlabel untuk analisis sentimen, pengenalan entitas bernama, ringkasan teks, dan sebagainya. Cukup buat proyek, unggah data, dan mulai membuat anotasi. Anda dapat membuat kumpulan data dalam hitungan jam.
Coba demo anotasi.
Baca dokumentasinya di https://doccano.github.io/doccano/.
Ada tiga opsi untuk menjalankan doccano:
Untuk menginstal doccano, jalankan:
pip install doccano
Secara default, SQLite 3 digunakan untuk database default. Jika Anda ingin menggunakan PostgreSQL, instal dependensi tambahan:
pip install ' doccano[postgresql] '
dan atur variabel lingkungan DATABASE_URL
sesuai dengan kredensial PostgreSQL Anda:
DATABASE_URL= " postgres:// ${POSTGRES_USER} : ${POSTGRES_PASSWORD} @ ${POSTGRES_HOST} : ${POSTGRES_PORT} / ${POSTGRES_DB} ?sslmode=disable "
Setelah instalasi, jalankan perintah berikut:
# Initialize database.
doccano init
# Create a super user.
doccano createuser --username admin --password pass
# Start a web server.
doccano webserver --port 8000
Di terminal lain, jalankan perintah:
# Start the task queue to handle file upload/download.
doccano task
Kunjungi http://127.0.0.1:8000/.
Sebagai pengaturan satu kali, buat container Docker sebagai berikut:
docker pull doccano/doccano
docker container create --name doccano
-e " ADMIN_USERNAME=admin "
-e " [email protected] "
-e " ADMIN_PASSWORD=password "
-v doccano-db:/data
-p 8000:8000 doccano/doccano
Selanjutnya, mulai doccano dengan menjalankan container:
docker container start doccano
Kunjungi http://127.0.0.1:8000/.
Untuk menghentikan container, jalankan docker container stop doccano -t 5
. Semua data yang dibuat dalam penampung akan tetap ada meskipun dimulai ulang.
Jika Anda ingin menggunakan fitur terbaru, tentukan tag nightly
:
docker pull doccano/doccano:nightly
Anda perlu menginstal Git dan mengkloning repositori:
git clone https://github.com/doccano/doccano.git
cd doccano
Catatan untuk pengembang Windows: Pastikan untuk mengonfigurasi git agar menangani akhir baris dengan benar atau Anda mungkin mengalami kesalahan status code 127
saat menjalankan layanan di langkah selanjutnya. Menjalankan opsi konfigurasi git di bawah ini akan memastikan direktori git Anda menangani akhir baris dengan benar.
git clone https://github.com/doccano/doccano.git --config core.autocrlf=input
Kemudian, buat file .env
dengan variabel dalam format berikut (lihat ./docker/.env.example):
# platform settings
ADMIN_USERNAME=admin
ADMIN_PASSWORD=password
[email protected]
# rabbit mq settings
RABBITMQ_DEFAULT_USER=doccano
RABBITMQ_DEFAULT_PASS=doccano
# database settings
POSTGRES_USER=doccano
POSTGRES_PASSWORD=doccano
POSTGRES_DB=doccano
Setelah menjalankan perintah berikut, akses http://127.0.0.1/.
docker-compose -f docker/docker-compose.prod.yml --env-file .env up
Melayani | Tombol |
---|---|
AWS 1 | |
Pahlawanku |
Lihat dokumentasi untuk detailnya.
Seperti halnya perangkat lunak apa pun, doccano terus dikembangkan. Jika Anda memiliki permintaan untuk fitur, harap ajukan masalah yang menjelaskan permintaan Anda. Selain itu, jika Anda ingin melihat upaya untuk mencapai fitur tertentu, jangan ragu untuk berkontribusi dengan mengupayakannya. Prosedur standarnya adalah melakukan fork pada repositori, menambahkan fitur, memperbaiki bug, lalu mengajukan permintaan tarik agar perubahan Anda digabungkan ke dalam repositori utama dan disertakan dalam rilis berikutnya.
Berikut beberapa tip yang mungkin berguna. Bagaimana Berkontribusi pada Proyek Doccano
@misc{doccano,
title={{doccano}: Text Annotation Tool for Human},
url={https://github.com/doccano/doccano},
note={Software available from https://github.com/doccano/doccano},
author={
Hiroki Nakayama and
Takahiro Kubo and
Junya Kamura and
Yasufumi Taniguchi and
Xu Liang},
year={2018},
}
Untuk bantuan dan masukan, jangan ragu untuk menghubungi penulis.
(1) EC2 KeyPair tidak dapat dibuat secara otomatis, jadi pastikan Anda memiliki EC2 KeyPair di satu wilayah. Atau buat sendiri. (2) Jika Anda ingin mengakses doccano melalui HTTPS di AWS, berikut instruksinya. ↩