Doccano هي أداة تعليقات توضيحية نصية مفتوحة المصدر للبشر. ويوفر ميزات التعليقات التوضيحية لتصنيف النص، ووضع العلامات التسلسلية، والتسلسل إلى مهام التسلسل. يمكنك إنشاء بيانات ذات علامات لتحليل المشاعر والتعرف على الكيانات المسماة وتلخيص النص وما إلى ذلك. ما عليك سوى إنشاء مشروع وتحميل البيانات والبدء في إضافة التعليقات التوضيحية. يمكنك إنشاء مجموعة بيانات في ساعات.
جرب العرض التوضيحي للتعليق التوضيحي.
اقرأ الوثائق على https://doccano.github.io/doccano/.
هناك ثلاثة خيارات لتشغيل doccano:
لتثبيت doccano، قم بتشغيل:
pip install doccano
بشكل افتراضي، يتم استخدام SQLite 3 لقاعدة البيانات الافتراضية. إذا كنت تريد استخدام PostgreSQL، فقم بتثبيت التبعيات الإضافية:
pip install ' doccano[postgresql] '
وقم بتعيين متغير البيئة DATABASE_URL
وفقًا لبيانات اعتماد PostgreSQL الخاصة بك:
DATABASE_URL= " postgres:// ${POSTGRES_USER} : ${POSTGRES_PASSWORD} @ ${POSTGRES_HOST} : ${POSTGRES_PORT} / ${POSTGRES_DB} ?sslmode=disable "
بعد التثبيت قم بتشغيل الأوامر التالية:
# Initialize database.
doccano init
# Create a super user.
doccano createuser --username admin --password pass
# Start a web server.
doccano webserver --port 8000
في محطة أخرى، قم بتشغيل الأمر:
# Start the task queue to handle file upload/download.
doccano task
انتقل إلى http://127.0.0.1:8000/.
كإعداد لمرة واحدة، أنشئ حاوية Docker كما يلي:
docker pull doccano/doccano
docker container create --name doccano
-e " ADMIN_USERNAME=admin "
-e " [email protected] "
-e " ADMIN_PASSWORD=password "
-v doccano-db:/data
-p 8000:8000 doccano/doccano
بعد ذلك، ابدأ تشغيل doccano عن طريق تشغيل الحاوية:
docker container start doccano
انتقل إلى http://127.0.0.1:8000/.
لإيقاف الحاوية، قم بتشغيل docker container stop doccano -t 5
. ستستمر جميع البيانات التي تم إنشاؤها في الحاوية عبر عمليات إعادة التشغيل.
إذا كنت تريد استخدام أحدث الميزات، فحدد العلامة nightly
:
docker pull doccano/doccano:nightly
تحتاج إلى تثبيت Git واستنساخ المستودع:
git clone https://github.com/doccano/doccano.git
cd doccano
ملاحظة لمطوري Windows: تأكد من تكوين git للتعامل مع نهايات الأسطر بشكل صحيح وإلا فقد تواجه أخطاء status code 127
أثناء تشغيل الخدمات في الخطوات المستقبلية. سيؤدي تشغيل خيارات git config أدناه إلى ضمان معالجة دليل git لنهايات الأسطر بشكل صحيح.
git clone https://github.com/doccano/doccano.git --config core.autocrlf=input
بعد ذلك، قم بإنشاء ملف .env
يحتوي على متغيرات بالتنسيق التالي (راجع ./docker/.env.example):
# platform settings
ADMIN_USERNAME=admin
ADMIN_PASSWORD=password
[email protected]
# rabbit mq settings
RABBITMQ_DEFAULT_USER=doccano
RABBITMQ_DEFAULT_PASS=doccano
# database settings
POSTGRES_USER=doccano
POSTGRES_PASSWORD=doccano
POSTGRES_DB=doccano
بعد تشغيل الأمر التالي، قم بالوصول إلى http://127.0.0.1/.
docker-compose -f docker/docker-compose.prod.yml --env-file .env up
خدمة | زر |
---|---|
أوس 1 | |
هيروكو |
راجع الوثائق للحصول على التفاصيل.
كما هو الحال مع أي برنامج، فإن doccano قيد التطوير المستمر. إذا كانت لديك طلبات للحصول على ميزات، فيرجى تقديم مشكلة تصف طلبك. وأيضًا، إذا كنت تريد رؤية العمل نحو ميزة معينة، فلا تتردد في المساهمة من خلال العمل على تحقيقها. الإجراء القياسي هو تقسيم المستودع، وإضافة ميزة، وإصلاح الخلل، ثم تقديم طلب سحب لدمج تغييراتك في المستودع الرئيسي وإدراجها في الإصدار التالي.
وهنا بعض النصائح قد تكون مفيدة. كيفية المساهمة في مشروع Doccano
@misc{doccano,
title={{doccano}: Text Annotation Tool for Human},
url={https://github.com/doccano/doccano},
note={Software available from https://github.com/doccano/doccano},
author={
Hiroki Nakayama and
Takahiro Kubo and
Junya Kamura and
Yasufumi Taniguchi and
Xu Liang},
year={2018},
}
للحصول على المساعدة والتعليقات، لا تتردد في الاتصال بالمؤلف.
(1) لا يمكن إنشاء EC2 KeyPair تلقائيًا، لذا تأكد من أن لديك EC2 KeyPair موجودًا في منطقة واحدة. أو قم بإنشاء واحدة بنفسك. (2) إذا كنت تريد الوصول إلى doccano عبر HTTPS في AWS، فإليك التعليمات. ↩