doccano เป็นเครื่องมือใส่คำอธิบายประกอบแบบโอเพ่นซอร์สสำหรับมนุษย์ โดยมีคุณสมบัติคำอธิบายประกอบสำหรับการจัดประเภทข้อความ การติดป้ายลำดับ และงานตามลำดับต่อลำดับ คุณสามารถสร้างข้อมูลที่มีป้ายกำกับสำหรับการวิเคราะห์ความคิดเห็น การรับรู้เอนทิตีที่มีชื่อ การสรุปข้อความ และอื่นๆ เพียงสร้างโปรเจ็กต์ อัปโหลดข้อมูล และเริ่มใส่คำอธิบายประกอบ คุณสามารถสร้างชุดข้อมูลได้ภายในไม่กี่ชั่วโมง
ลองสาธิตคำอธิบายประกอบ
อ่านเอกสารประกอบได้ที่https://doccano.github.io/doccano/
มีสามตัวเลือกในการรัน docno:
หากต้องการติดตั้ง docno ให้รัน:
pip install doccano
ตามค่าเริ่มต้น SQLite 3 จะใช้สำหรับฐานข้อมูลเริ่มต้น หากคุณต้องการใช้ PostgreSQL ให้ติดตั้งการอ้างอิงเพิ่มเติม:
pip install ' doccano[postgresql] '
และตั้งค่าตัวแปรสภาพแวดล้อม DATABASE_URL
ตามข้อมูลรับรอง PostgreSQL ของคุณ:
DATABASE_URL= " postgres:// ${POSTGRES_USER} : ${POSTGRES_PASSWORD} @ ${POSTGRES_HOST} : ${POSTGRES_PORT} / ${POSTGRES_DB} ?sslmode=disable "
หลังการติดตั้ง ให้รันคำสั่งต่อไปนี้:
# Initialize database.
doccano init
# Create a super user.
doccano createuser --username admin --password pass
# Start a web server.
doccano webserver --port 8000
ในเทอร์มินัลอื่น ให้รันคำสั่ง:
# Start the task queue to handle file upload/download.
doccano task
ไปที่ http://127.0.0.1:8000/
เป็นการตั้งค่าครั้งเดียว ให้สร้างคอนเทนเนอร์ Docker ดังนี้:
docker pull doccano/doccano
docker container create --name doccano
-e " ADMIN_USERNAME=admin "
-e " [email protected] "
-e " ADMIN_PASSWORD=password "
-v doccano-db:/data
-p 8000:8000 doccano/doccano
จากนั้นให้เริ่ม doccano โดยเรียกใช้คอนเทนเนอร์:
docker container start doccano
ไปที่ http://127.0.0.1:8000/
หากต้องการหยุดคอนเทนเนอร์ ให้รัน docker container stop doccano -t 5
ข้อมูลทั้งหมดที่สร้างในคอนเทนเนอร์จะคงอยู่ตลอดการรีสตาร์ท
หากคุณต้องการใช้คุณสมบัติใหม่ล่าสุด ให้ระบุแท็ก nightly
:
docker pull doccano/doccano:nightly
คุณต้องติดตั้ง Git และโคลนพื้นที่เก็บข้อมูล:
git clone https://github.com/doccano/doccano.git
cd doccano
หมายเหตุสำหรับนักพัฒนา Windows: อย่าลืมกำหนดค่าคอมไพล์ให้จัดการการสิ้นสุดบรรทัดอย่างถูกต้อง ไม่เช่นนั้นคุณอาจพบข้อผิดพลาด status code 127
ขณะใช้บริการในขั้นตอนต่อ ๆ ไป การรันด้วยตัวเลือกการกำหนดค่า git ด้านล่างจะช่วยให้มั่นใจได้ว่าไดเร็กทอรี git ของคุณจัดการการสิ้นสุดบรรทัดได้อย่างถูกต้อง
git clone https://github.com/doccano/doccano.git --config core.autocrlf=input
จากนั้น สร้างไฟล์ .env
พร้อมตัวแปรในรูปแบบต่อไปนี้ (ดู ./docker/.env.example):
# platform settings
ADMIN_USERNAME=admin
ADMIN_PASSWORD=password
[email protected]
# rabbit mq settings
RABBITMQ_DEFAULT_USER=doccano
RABBITMQ_DEFAULT_PASS=doccano
# database settings
POSTGRES_USER=doccano
POSTGRES_PASSWORD=doccano
POSTGRES_DB=doccano
หลังจากรันคำสั่งต่อไปนี้แล้ว ให้เข้าไปที่ http://127.0.0.1/
docker-compose -f docker/docker-compose.prod.yml --env-file .env up
บริการ | ปุ่ม |
---|---|
เอเอสเอส 1 | |
เฮโรกุ |
ดูเอกสารประกอบสำหรับรายละเอียด
เช่นเดียวกับซอฟต์แวร์อื่นๆ docno อยู่ระหว่างการพัฒนาอย่างต่อเนื่อง หากคุณมีคำขอคุณสมบัติ โปรดยื่นประเด็นที่อธิบายคำขอของคุณ นอกจากนี้ หากคุณต้องการเห็นการปรับปรุงคุณลักษณะเฉพาะ อย่าลังเลที่จะมีส่วนร่วมโดยดำเนินการตามนั้น ขั้นตอนมาตรฐานคือการแยกพื้นที่เก็บข้อมูล เพิ่มคุณสมบัติ แก้ไขจุดบกพร่อง จากนั้นยื่นคำขอดึงว่าการเปลี่ยนแปลงของคุณจะถูกรวมเข้ากับพื้นที่เก็บข้อมูลหลักและรวมไว้ในรีลีสถัดไป
เคล็ดลับบางประการที่อาจเป็นประโยชน์มีดังนี้ วิธีมีส่วนร่วมในโครงการ Doccano
@misc{doccano,
title={{doccano}: Text Annotation Tool for Human},
url={https://github.com/doccano/doccano},
note={Software available from https://github.com/doccano/doccano},
author={
Hiroki Nakayama and
Takahiro Kubo and
Junya Kamura and
Yasufumi Taniguchi and
Xu Liang},
year={2018},
}
หากต้องการความช่วยเหลือและข้อเสนอแนะ โปรดติดต่อผู้เขียน
(1) EC2 KeyPair ไม่สามารถสร้างได้โดยอัตโนมัติ ดังนั้น ตรวจสอบให้แน่ใจว่าคุณมี EC2 KeyPair อยู่แล้วในภูมิภาคเดียว หรือสร้างมันขึ้นมาเอง (2) หากคุณต้องการเข้าถึง doccano ผ่าน HTTPS ใน AWS นี่คือคำแนะนำ