ตัวเร่งโซลูชันการขุดความรู้
พื้นที่เก็บข้อมูลนี้มีโค้ดทั้งหมดสำหรับการปรับใช้โซลูชันการขุดความรู้แบบ end-to-end โดยยึดตาม Azure Cognitive Search
สร้างขึ้นจากบริการมาตรฐานของ Azure เช่น ฟังก์ชัน บริการเว็บแอป บริการที่เชื่อมโยง และการค้นหาทางปัญญา โดยมีไปป์ไลน์การปรับใช้ที่ช่วยให้ตั้งค่าไปป์ไลน์ CI/CD สำหรับโปรเจ็กต์ของคุณได้อย่างรวดเร็วและง่ายดาย
สำหรับเอกสารประกอบโดยละเอียด โปรดดูส่วน เอกสาร ของ repo ที่มีวิกิโซลูชัน
เพื่อให้การตั้งค่าโซลูชันของคุณสำเร็จ คุณจะต้องมีสิทธิ์เข้าถึงและหรือจัดเตรียมสิ่งต่อไปนี้:
บทบาทของเจ้าของหรือผู้สนับสนุนจะถือว่าอยู่ในการสมัครใช้งาน Azure หรือกลุ่มทรัพยากรที่เป็นเป้าหมาย
โปรดดู README เพื่อปรับใช้ตัวเร่งโซลูชันนี้
คำแนะนำที่ให้ไว้ในคำแนะนำทั้งหมดถือว่าคุณมีความรู้พื้นฐานเกี่ยวกับพอร์ทัล Azure, ฟังก์ชัน Azure, Azure Cognitive Search, ฟังก์ชัน, พื้นที่เก็บข้อมูล และบริการ Azure Cognitives
สำหรับการฝึกอบรมและการสนับสนุนเพิ่มเติม โปรดดู:
การทำเหมืองความรู้ (KM) เป็นวินัยที่เกิดขึ้นใหม่ในปัญญาประดิษฐ์ (AI) ที่ใช้การผสมผสานบริการอัจฉริยะเพื่อเรียนรู้อย่างรวดเร็วจากข้อมูลจำนวนมหาศาล ช่วยให้องค์กรเข้าใจอย่างลึกซึ้งและสำรวจข้อมูลได้อย่างง่ายดาย เปิดเผยข้อมูลเชิงลึกที่ซ่อนอยู่ และค้นหาความสัมพันธ์และรูปแบบในวงกว้าง
การขุดความรู้ใน Azure
ตัวเร่งโซลูชัน KM นี้มุ่งหวังเพื่อให้คุณได้รับโซลูชันการขุดความรู้แบบ end-to-end ที่สามารถใช้งานได้ซึ่งประกอบด้วย:
ด้วยตัวเร่งความเร็วบนคลาวด์นี้ คุณจะได้รับโซลูชันแบบครบวงจรพร้อมเครื่องมือในการปรับใช้ ขยาย ดำเนินการ และตรวจสอบ
ในแง่นั้น ทางแก้ปัญหาก็จัดให้
ตัวเร่งโซลูชันการขุดความรู้นี้ได้รับแรงบันดาลใจจากตัวเร่งโซลูชันการขุดความรู้อีกตัวหนึ่ง
จากประสบการณ์ภาคสนามของเรา เราได้สร้างคุณสมบัติ/ทักษะเพื่อจัดการกับความท้าทายทั่วไปเกี่ยวกับข้อมูลที่ไม่มีโครงสร้างโดยเน้นที่การใช้งานและประสบการณ์การสำรวจข้อมูล
ด้านล่างนี้เป็นรายการไฮไลท์สำคัญโดยสังเขป:
การจัดทำดัชนีภาพที่ฝังอยู่
การทำให้ภาพเป็นมาตรฐาน :
ข้อมูลเมตา
การแปลง HTML
การแยกตาราง : ข้อมูลแบบตารางเป็นเรื่องธรรมดาในคลังข้อมูลที่ไม่มีโครงสร้าง โซลูชันจะแยก จัดทำดัชนี และตารางโครงการไปยังคลังความรู้เฉพาะ (ตัวเลือก)
การแปล ": มีคุณลักษณะการแปลสองประการในโซลูชันนี้
การวิเคราะห์ข้อความ : แยกเอนทิตี (ชื่อ, ลิงก์) จากเอกสารใดๆ และข้อความรูปภาพ OCR
ส่งออกเป็น Excel : คำถามยอดนิยมเมื่อสำรวจข้อมูลที่ไม่มีโครงสร้าง
UI ที่กำหนดค่าได้ : การสร้าง UI นั้นใช้เวลานาน เราต้องการนำความสามารถในการกำหนดค่า UI ที่ยอดเยี่ยมมาใช้ เพื่อให้คุณสามารถนำโซลูชัน KM ใหม่มาใช้จริงได้ในเวลาที่เหมาะสม
จิตวิญญาณของการเร่งความเร็วโซลูชันนี้อยู่ในสถานการณ์จำลอง KM การวิจัยเนื้อหา
อย่างไรก็ตาม เนื่องจากสถาปัตยกรรมเป็นแบบเปิด คุณจึงสามารถใช้เป็นรากฐานสำหรับสถานการณ์ KM ที่พิเศษยิ่งขึ้นได้
ตัวเร่งโซลูชันนี้ไม่ได้กำหนดเป้าหมายไปยังโดเมนใดๆ แม้ว่าความสามารถในการขยายของโดเมนจะให้เครื่องมือแก่คุณในการทำให้เป็นโดเมนเฉพาะก็ตาม
กรณีการใช้งานที่สร้างแรงบันดาลใจบางส่วน
คุณอาจนึกถึงตัวเร่งการผลิตดังกล่าวสำหรับองค์กรของคุณ
ตัวเร่งโซลูชันนี้มุ่งเป้าไปที่ใครก็ตามที่ต้องการ
วัตถุประสงค์ในการเร่งโซลูชันนี้ยังช่วยให้การรวมโมดูล Data Science เข้ากับโซลูชันการขุดความรู้ของคุณง่ายขึ้นอีกด้วย
ทีม Data Science Toolkit ได้สร้างตัวเร่งความเร็วสำหรับปริมาณงานด้านวิทยาศาสตร์ข้อมูลของคุณ
สารละลาย | คำอธิบาย |
---|---|
ความเก่งกาจ | Verseagility เป็นชุดเครื่องมือที่ใช้ Python เพื่อเพิ่มงานการประมวลผลภาษาธรรมชาติ (NLP) ที่คุณกำหนดเอง ซึ่งช่วยให้คุณสามารถนำข้อมูลของคุณเอง ใช้เฟรมเวิร์กที่คุณต้องการ และนำโมเดลมาสู่การใช้งานจริง เป็นองค์ประกอบสำคัญของ Microsoft Data Science Toolkit |
ฐาน MLOps | พื้นที่เก็บข้อมูลนี้มีโครงสร้างพื้นที่เก็บข้อมูลพื้นฐานสำหรับโปรเจ็กต์การเรียนรู้ของเครื่องที่ใช้เทคโนโลยี Azure (Azure ML และ Azure DevOps) ชื่อโฟลเดอร์และไฟล์จะถูกเลือกตามประสบการณ์ส่วนตัว คุณจะพบหลักการและแนวคิดเบื้องหลังโครงสร้าง ซึ่งเราแนะนำให้ปฏิบัติตามเมื่อปรับแต่งโครงการและกระบวนการ MLOps ของคุณเอง นอกจากนี้ เราคาดหวังให้ผู้ใช้คุ้นเคยกับแนวคิด Azure Machine Learning และวิธีการใช้เทคโนโลยี |
MLOps สำหรับ DataBricks | พื้นที่เก็บข้อมูลนี้ประกอบด้วยกรอบงานการพัฒนา Databricks สำหรับการส่งมอบโครงการวิศวกรรมข้อมูล และโครงการการเรียนรู้ของเครื่องที่ใช้เทคโนโลยี Azure |
ตัวเร่งโซลูชันการจำแนกประเภท | พื้นที่เก็บข้อมูลนี้มีโครงสร้างพื้นที่เก็บข้อมูลพื้นฐานสำหรับการนำเสนอโซลูชันการจำแนกประเภทสำหรับโครงการการเรียนรู้ของเครื่อง (ML) ที่ใช้เทคโนโลยี Azure (Azure ML และ Azure DevOps) |
ตัวเร่งโซลูชันการตรวจจับวัตถุ | พื้นที่เก็บข้อมูลนี้มีโค้ดทั้งหมดสำหรับการฝึกโมเดลการตรวจจับอ็อบเจ็กต์ TensorFlow ภายใน Azure Machine Learning (AML) พร้อมการตั้งค่าสำหรับการฝึกการประมวลผล Azure การตรวจสอบการทดลอง และการปรับใช้จุดสิ้นสุดเป็นบริการเว็บ สร้างขึ้นบน MLOps Accelerator และให้การฝึกอบรมแบบครบวงจรและการปรับใช้ไปป์ไลน์ ช่วยให้สามารถติดตั้งไปป์ไลน์ CI/CD สำหรับโปรเจ็กต์ของคุณได้อย่างรวดเร็วและง่ายดาย |
คุณอาจอ้างถึงเอกสารประกอบตัวเร่งความเร็วโซลูชันดังต่อไปนี้:
หัวข้อ | คำอธิบาย | ลิงค์เอกสาร |
---|---|---|
ข้อกำหนดเบื้องต้น | สิ่งที่คุณต้องการในการปรับใช้และดำเนินการโซลูชัน | อ่านฉัน |
สถาปัตยกรรม | วิธีการออกแบบโซลูชัน | อ่านฉัน |
การปรับใช้ | วิธีปรับใช้ตัวเร่งโซลูชันนี้ | อ่านฉัน |
การกำหนดค่า | สิ่งที่คุณต้องรู้ทั้งหมดเกี่ยวกับการกำหนดค่าตัวเร่งโซลูชัน | อ่านฉัน |
วิทยาศาสตร์ข้อมูล | บูรณาการกับวิทยาศาสตร์ข้อมูล | อ่านฉัน |
การปรับใช้ | โฮ เพื่อเริ่มต้นใช้งานด้วยการปรับใช้โซลูชัน | อ่านฉัน |
การตรวจสอบ | วิธีการติดตามผลการแก้ปัญหา | อ่านฉัน |
ค้นหา | วิธีกำหนดค่าและจัดการการค้นหา | อ่านฉัน |
ค้นหาและสำรวจ (UI) | ส่วนต่อประสานผู้ใช้เพื่อค้นหาและสำรวจ | อ่านฉัน |
โครงสร้างพื้นที่เก็บข้อมูลของคันเร่งนี้มีดังนี้
โคลนหรือดาวน์โหลดที่เก็บนี้ จากนั้นไปที่โฟลเดอร์ Deployment โดยทำตามขั้นตอนที่ระบุไว้ในคู่มือการปรับใช้
เมื่อคุณทำตามขั้นตอนทั้งหมด คุณจะมีโซลูชันการขุดความรู้แบบครบวงจรที่รวมการนำเข้าแหล่งข้อมูลเข้ากับทักษะการเพิ่มคุณค่าข้อมูล และแอปเว็บที่ขับเคลื่อนโดย Azure Cognitive Search
โซลูชั่นนี้ได้รับแรงบันดาลใจจากผลงานต้นฉบับของ
ผู้สนับสนุนหลักในการเร่งโซลูชันนี้คือ
ทีมสนับสนุนชุดเครื่องมือวิทยาศาสตร์ข้อมูล
สำหรับการสนทนาดีๆ เรื่อง Knowledge Mining และ Unstructured Data
โครงการนี้ยินดีรับการสนับสนุนและข้อเสนอแนะ การบริจาคส่วนใหญ่กำหนดให้คุณยอมรับข้อตกลงใบอนุญาตผู้ร่วมให้ข้อมูล (CLA) โดยประกาศว่าคุณมีสิทธิ์ที่จะให้สิทธิ์แก่เราในการใช้การบริจาคของคุณจริงๆ สำหรับรายละเอียด โปรดไปที่ https://cla.opensource.microsoft.com
เมื่อคุณส่งคำขอดึง บอท CLA จะกำหนดโดยอัตโนมัติว่าคุณจำเป็นต้องจัดเตรียม CLA และตกแต่ง PR อย่างเหมาะสมหรือไม่ (เช่น การตรวจสอบสถานะ ความคิดเห็น) เพียงทำตามคำแนะนำที่ได้รับจากบอท คุณจะต้องทำสิ่งนี้เพียงครั้งเดียวกับ repos ทั้งหมดโดยใช้ CLA ของเรา
โครงการนี้ได้นำหลักจรรยาบรรณของ Microsoft Open Source มาใช้ สำหรับข้อมูลเพิ่มเติม โปรดดูคำถามที่พบบ่อยเกี่ยวกับจรรยาบรรณหรือติดต่อ [email protected] หากมีคำถามหรือความคิดเห็นเพิ่มเติม
โครงการนี้อาจมีเครื่องหมายการค้าหรือโลโก้สำหรับโครงการ ผลิตภัณฑ์ หรือบริการ การใช้เครื่องหมายการค้าหรือโลโก้ของ Microsoft โดยได้รับอนุญาตนั้นอยู่ภายใต้และต้องปฏิบัติตามแนวทางเครื่องหมายการค้าและแบรนด์ของ Microsoft การใช้เครื่องหมายการค้าหรือโลโก้ของ Microsoft ในเวอร์ชันแก้ไขของโครงการนี้จะต้องไม่ทำให้เกิดความสับสนหรือบ่งบอกถึงการสนับสนุนของ Microsoft การใช้เครื่องหมายการค้าหรือโลโก้ของบุคคลที่สามจะต้องเป็นไปตามนโยบายของบุคคลที่สามเหล่านั้น