مسرع حلول تعدين المعرفة
يحتوي هذا المستودع على جميع التعليمات البرمجية لنشر حل التنقيب المعرفي الشامل استنادًا إلى Azure Cognitive Search.
إنه مبني على أعلى معايير خدمات Azure مثل الوظائف وخدمات تطبيقات الويب والخدمات التعاونية والبحث المعرفي. فهو يوفر مسار نشر يسمح بإعداد سريع وسهل لخطوط أنابيب CI/CD لمشاريعك.
للحصول على وثائق مفصلة، يرجى الرجوع إلى قسم المستندات في الريبو الذي يحتوي على الحل wiki.
لإعداد الحل الخاص بك بنجاح، ستحتاج إلى الوصول إلى ما يلي و/أو توفيره:
يُفترض دور المالك أو المساهم في اشتراك Azure أو مجموعة الموارد المستهدفة.
يرجى الرجوع إلى الملف README لنشر مسرع الحلول هذا.
تفترض التوجيهات الواردة في جميع الأدلة أن لديك معرفة عملية أساسية بمدخل Azure ووظائف Azure والبحث المعرفي في Azure والوظائف والتخزين وخدمات Azure Cognitives.
لمزيد من التدريب والدعم، يرجى الاطلاع على:
يعد التنقيب عن المعرفة (KM) نظامًا ناشئًا في الذكاء الاصطناعي (AI) يستخدم مجموعة من الخدمات الذكية للتعلم بسرعة من كميات هائلة من المعلومات. فهو يسمح للمؤسسات بفهم المعلومات بعمق واستكشافها بسهولة، والكشف عن الرؤى المخفية، والعثور على العلاقات والأنماط على نطاق واسع.
تعدين المعرفة في أزور
يهدف مسرع حلول KM هذا إلى تزويدك بحل عملي وشامل لتعدين المعرفة يتكون من:
باستخدام هذا المسرع المستند إلى السحابة، ستحصل على حل شامل مع أدوات النشر والتوسيع والتشغيل والمراقبة.
وفي هذا الصدد، يوفر الحل
مسرع حلول تعدين المعرفة هذا مستوحى من مسرع آخر لحلول تعدين المعرفة.
استنادًا إلى خبرتنا الميدانية، قمنا ببناء ميزات/مهارات لمواجهة تحديات البيانات غير المنظمة الشائعة مع التركيز على سهولة الاستخدام وتجربة استكشاف البيانات.
وفيما يلي قائمة غير شاملة من النقاط الرئيسية:
فهرسة الصور المضمنة
تطبيع الصورة :
البيانات الوصفية
تحويل HTML
استخراج الجداول : المعلومات الجدولية شائعة في مجموعة البيانات غير المنظمة. سيقوم الحل باستخراج الجداول وفهرستها وعرضها في مخزن معرفي مخصص (اختياري).
الترجمة ": هناك ميزتان للترجمة في هذا الحل
تحليلات النص : قم باستخراج الكيانات (المسماة والمرتبطة) من أي مستند ونص الصورة المدعم بالتعرف الضوئي على الحروف.
التصدير إلى Excel : سؤال شائع عند استكشاف البيانات غير المنظمة.
واجهة مستخدم قابلة للتكوين : يستغرق إنشاء واجهة مستخدم وقتًا طويلاً، وأردنا توفير إمكانية تكوين رائعة لواجهة المستخدم حتى تتمكن من إحياء حلول إدارة المعرفة الجديدة في الوقت المناسب.
إن روح تسريع الحلول هذه تنتمي إلى سيناريو إدارة المعرفة لأبحاث المحتوى.
ومع ذلك، نظرًا لأن بنيته مفتوحة، فيمكنك استخدامه كأساس لسيناريوهات إدارة المعرفة الأكثر تخصصًا.
لا يستهدف مسرع الحلول هذا أي مجال على الرغم من أن قابليته للتوسعة ستمنحك الأدوات اللازمة لجعله خاصًا بالمجال.
بعض حالات الاستخدام الملهمة
قد تفكر في إنتاج مثل هذا المسرع لمؤسستك.
يستهدف مسرع الحلول هذا كل من يحتاج إليه
الغرض من تسريع الحلول هذا هو أيضًا تسهيل دمج وحدات علوم البيانات في حل استخراج المعرفة الخاص بك.
قام فريق مجموعة أدوات علوم البيانات ببناء مسرعات لأعباء عمل علوم البيانات لديك.
حل | وصف |
---|---|
التنوع | Verseagility عبارة عن مجموعة أدوات تعتمد على لغة Python لتعزيز مهمة معالجة اللغة الطبيعية (NLP) المخصصة لديك، مما يسمح لك بإحضار بياناتك الخاصة واستخدام أطر العمل المفضلة لديك وإدخال النماذج في الإنتاج. وهو مكون أساسي في مجموعة أدوات علوم البيانات من Microsoft. |
قاعدة MLOps | يحتوي هذا المستودع على بنية المستودع الأساسية لمشاريع التعلم الآلي المستندة إلى تقنيات Azure (Azure ML وAzure DevOps). يتم اختيار أسماء المجلدات والملفات بناءً على الخبرة الشخصية. يمكنك العثور على المبادئ والأفكار الكامنة وراء الهيكل، والتي نوصي باتباعها عند تخصيص مشروعك الخاص وعملية MLOps. ونتوقع أيضًا أن يكون المستخدمون على دراية بمفاهيم التعلم الآلي اللازوردي وكيفية استخدام التكنولوجيا. |
MLOps لـ DataBricks | يحتوي هذا المستودع على إطار عمل تطوير Databricks لتقديم أي مشاريع هندسة بيانات ومشاريع التعلم الآلي المستندة إلى تقنيات Azure. |
مسرع حل التصنيف | يحتوي هذا المستودع على بنية المستودع الأساسية لتقديم حلول التصنيف لمشاريع التعلم الآلي (ML) استنادًا إلى تقنيات Azure (Azure ML وAzure DevOps). |
مسرع حل الكشف عن الكائنات | يحتوي هذا المستودع على كافة التعليمات البرمجية لتدريب نماذج الكشف عن الكائنات TensorFlow ضمن Azure Machine Learning (AML) مع إعدادات للتدريب على حساب Azure ومراقبة التجربة ونشر نقطة النهاية كخدمة ويب. إنه مبني على MLOps Accelerator ويوفر التدريب الشامل وخطوط النشر مما يسمح بإعداد سريع وسهل لخطوط أنابيب CI/CD لمشاريعك. |
يمكنك الرجوع إلى وثائق مسرع الحلول كما يلي:
عنوان | وصف | رابط التوثيق |
---|---|---|
المتطلبات المسبقة | ما الذي تحتاجه لنشر الحل وتشغيله؟ | التمهيدي |
بنيان | كيف يتم تصميم الحل | التمهيدي |
النشر | كيفية نشر مسرع الحلول هذا | التمهيدي |
إعدادات | كل ما تحتاج لمعرفته حول تكوين مسرع الحلول | التمهيدي |
علم البيانات | التكامل مع علوم البيانات | التمهيدي |
النشر | هو البدء بنشر الحل | التمهيدي |
يراقب | كيفية مراقبة الحل | التمهيدي |
يبحث | كيفية تكوين البحث وإدارته | التمهيدي |
البحث والاستكشاف (واجهة المستخدم) | واجهة المستخدم للبحث والاستكشاف | التمهيدي |
هيكل مستودع هذا المسرع هو كما يلي
قم باستنساخ هذا المستودع أو تنزيله، ثم انتقل إلى مجلد النشر، باتباع الخطوات الموضحة في دليل النشر.
عند إكمال جميع الخطوات، سيكون لديك حل فعال لاستخراج المعرفة يجمع بين استيعاب مصادر البيانات ومهارات إثراء البيانات وتطبيق ويب مدعوم من Azure Cognitive Search.
هذا الحل مستوحى من العمل الأصلي لـ
المساهمين الأساسيين في مسرع الحلول هذا هم
فريق رعاية مجموعة أدوات علوم البيانات
للمحادثة الرائعة حول التنقيب عن المعرفة والبيانات غير المنظمة
يرحب هذا المشروع بالمساهمات والاقتراحات. تتطلب معظم المساهمات منك الموافقة على اتفاقية ترخيص المساهم (CLA) التي تعلن أن لديك الحق في منحنا حقوق استخدام مساهمتك، بل وتفعل ذلك بالفعل. للحصول على التفاصيل، تفضل بزيارة https://cla.opensource.microsoft.com.
عند إرسال طلب سحب، سيحدد روبوت CLA تلقائيًا ما إذا كنت بحاجة إلى تقديم CLA وتزيين العلاقات العامة بشكل مناسب (على سبيل المثال، التحقق من الحالة، التعليق). ما عليك سوى اتباع التعليمات التي يقدمها لك الروبوت. سوف تحتاج إلى القيام بذلك مرة واحدة فقط في جميع عمليات إعادة الشراء باستخدام CLA الخاص بنا.
اعتمد هذا المشروع قواعد السلوك الخاصة بشركة Microsoft مفتوحة المصدر. لمزيد من المعلومات، راجع الأسئلة الشائعة حول قواعد السلوك أو اتصل بـ [email protected] لطرح أي أسئلة أو تعليقات إضافية.
قد يحتوي هذا المشروع على علامات تجارية أو شعارات للمشاريع أو المنتجات أو الخدمات. يخضع الاستخدام المصرح به للعلامات التجارية أو الشعارات الخاصة بشركة Microsoft ويجب أن يتبع إرشادات العلامة التجارية والعلامات التجارية الخاصة بشركة Microsoft. يجب ألا يتسبب استخدام العلامات التجارية أو الشعارات الخاصة بشركة Microsoft في الإصدارات المعدلة من هذا المشروع في حدوث ارتباك أو الإشارة ضمنًا إلى رعاية Microsoft. ويخضع أي استخدام لعلامات تجارية أو شعارات تابعة لجهات خارجية لسياسات تلك الجهات الخارجية.