知識挖掘解決方案加速器
此儲存庫包含用於部署基於 Azure 認知搜尋的端到端知識挖掘解決方案的所有程式碼。
它建構在標準 Azure 服務之上,例如功能、Web 應用服務、認知服務和認知搜尋。它提供了一個部署管道,允許為您的專案快速輕鬆地設定 CI/CD 管道。
有關詳細文檔,請參閱包含解決方案 wiki 的儲存庫的文檔部分。
為了成功設定您的解決方案,您需要有權存取和/或配置以下內容:
在 Azure 訂閱或目標資源群組上假定擁有者或貢獻者角色。
請參閱自述文件來部署此解決方案加速器。
所有指南中提供的說明都假定你具備 Azure 入口網站、Azure Functions、Azure 認知搜尋、函數、儲存和 Azure 認知服務的基本工作知識。
如需其他培訓和支持,請參閱:
知識挖掘(KM)是人工智慧(AI)中的一門新興學科,它利用智慧服務的組合來快速從大量資訊中學習。它使組織能夠深入理解並輕鬆探索訊息,發現隱藏的見解,並大規模發現關係和模式。
Azure 中的知識挖掘
此知識管理解決方案加速器旨在為您提供可行的端到端知識挖掘解決方案,其中包括:
借助這個基於雲端的加速器,您將獲得具有部署、擴展、操作和監控工具的端到端解決方案。
在這方面,該解決方案提供了
該知識挖掘解決方案加速器的靈感來自另一個加速器知識挖掘解決方案加速器。
根據我們的現場經驗,我們建立了功能/技能來解決常見的非結構化資料挑戰,重點關注可用性和資料探索體驗。
以下是主要亮點的非詳盡列表:
嵌入圖像索引
圖像標準化:
元數據
HTML 轉換
表格擷取:表格資訊在非結構化資料語料庫中很常見。此解決方案將提取表、索引表並將其投影到專用知識儲存(可選)。
Translation ": 此解決方案有兩個翻譯功能
文字分析:從任何文件和 OCR 圖像文字中提取實體(命名、連結)。
匯出到 Excel :探索非結構化資料時常見的問題。
可設定的 UI :建立 UI 非常耗時,我們希望提供出色的 UI 可設定性,以便您可以及時實現新的 KM 解決方案。
此解決方案加速器精神屬於內容研究知識管理場景。
儘管如此,由於其架構是開放的,您可以將其用作更專業的知識管理場景的基礎。
此解決方案加速器不針對任何網域,儘管其可擴展性將為您提供使其特定於網域的工具。
一些鼓舞人心的用例
您可能會認為產品化是您組織的加速器。
該解決方案加速器針對有需要的人
此解決方案加速器的目的還在於簡化資料科學模組與知識挖掘解決方案的整合。
數據科學工具包團隊為您的數據科學工作負載建立了加速器。
解決方案 | 描述 |
---|---|
多才多藝 | Verseagility 是一個基於 Python 的工具包,可增強您的自訂自然語言處理 (NLP) 任務,使您能夠引入自己的資料、使用您喜歡的框架並將模型投入生產。它是 Microsoft 資料科學工具包的核心元件。 |
MLOps 基礎 | 此儲存庫包含基於 Azure 技術(Azure ML 和 Azure DevOps)的機器學習專案的基本儲存庫結構。資料夾名稱和檔案是根據個人經驗選擇的。您可以找到該結構背後的原則和想法,我們建議您在自訂自己的專案和 MLOps 流程時遵循這些原則和想法。此外,我們希望使用者熟悉 Azure 機器學習概念以及如何使用技術。 |
DataBricks 的 MLOps | 此儲存庫包含 Databricks 開發框架,用於交付任何資料工程專案以及基於 Azure 技術的機器學習專案。 |
分類解決方案加速器 | 此儲存庫包含基本儲存庫結構,用於為基於 Azure 技術(Azure ML 和 Azure DevOps)的機器學習 (ML) 專案提供分類解決方案。 |
物體偵測解決方案加速器 | 此儲存庫包含用於在 Azure 機器學習 (AML) 中訓練 TensorFlow 物件偵測模型的所有程式碼,以及用於在 Azure 運算、實驗監控和作為 Web 服務的端點部署上進行訓練的設定。它基於 MLOps 加速器構建,提供端到端培訓和部署管道,允許快速輕鬆地為您的專案設置 CI/CD 管道。 |
您可以參考解決方案加速器文件如下:
話題 | 描述 | 文件連結 |
---|---|---|
先決條件 | 部署和操作該解決方案需要什麼 | 自述文件 |
建築學 | 解決方案的架構如何 | 自述文件 |
部署 | 如何部署此解決方案加速器 | 自述文件 |
配置 | 您需要了解的有關解決方案加速器配置的所有信息 | 自述文件 |
數據科學 | 與數據科學集成 | 自述文件 |
部署 | Ho 開始部署解決方案 | 自述文件 |
監控 | 如何監控解決方案 | 自述文件 |
搜尋 | 如何配置和管理搜尋 | 自述文件 |
搜尋與探索(UI) | 用於搜尋和探索的使用者介面 | 自述文件 |
該加速器的儲存庫結構如下
複製或下載此儲存庫,然後導航至部署資料夾,請按照部署指南中概述的步驟進行操作。
完成所有步驟後,你將擁有一個有效的端到端知識挖掘解決方案,該解決方案將資料來源攝取與資料豐富技能以及由 Azure 認知搜尋提供支援的 Web 應用程式結合。
該解決方案的靈感來自於
該解決方案加速器的核心貢獻者是
數據科學工具包贊助團隊
關於知識探勘和非結構化資料的精彩對話
該項目歡迎貢獻和建議。大多數貢獻都要求您同意貢獻者授權協議 (CLA),聲明您有權並且實際上授予我們使用您的貢獻的權利。有關詳細信息,請訪問 https://cla.opensource.microsoft.com。
當您提交拉取請求時,CLA 機器人將自動確定您是否需要提供 CLA 並適當地裝飾 PR(例如,狀態檢查、評論)。只需按照機器人提供的說明進行操作即可。您只需使用我們的 CLA 在所有儲存庫中執行一次此操作。
該專案採用了微軟開源行為準則。有關詳細信息,請參閱行為準則常見問題解答或聯繫 [email protected] 提出任何其他問題或意見。
該項目可能包含項目、產品或服務的商標或標誌。 Microsoft 商標或標誌的授權使用須遵守且必須遵循 Microsoft 的商標和品牌指南。在此項目的修改版本中使用 Microsoft 商標或標誌不得混淆或暗示 Microsoft 贊助。對第三方商標或標誌的任何使用均須遵守這些第三方的政策。