Ускоритель решений для интеллектуального анализа знаний
Этот репозиторий содержит весь код для развертывания комплексного решения интеллектуального анализа знаний на основе Когнитивного поиска Azure.
Он построен на основе стандартов служб Azure, таких как функции, службы веб-приложений, службы Congitive и когнитивный поиск. Он предоставляет конвейер развертывания, позволяющий быстро и легко настроить конвейеры CI/CD для ваших проектов.
Подробную документацию можно найти в разделе документации репозитория, содержащего вики-решение.
Для успешной настройки решения вам необходимо иметь доступ и/или подготовить следующее:
В подписке Azure или целевой группе ресурсов предполагается роль владельца или участника.
Пожалуйста, обратитесь к README, чтобы развернуть этот ускоритель решений.
Инструкции, представленные во всех руководствах, предполагают, что у вас есть фундаментальные рабочие знания о портале Azure, функциях Azure, Когнитивном поиске Azure, функциях, хранилище и службах Azure Cognitive Services.
Для дополнительного обучения и поддержки см.:
Интеллектуальный анализ знаний (КМ) — это новая дисциплина в области искусственного интеллекта (ИИ), которая использует комбинацию интеллектуальных сервисов для быстрого обучения на огромных объемах информации. Это позволяет организациям глубоко понимать и легко исследовать информацию, раскрывать скрытые идеи и находить взаимосвязи и закономерности в масштабе.
Интеллектуальный анализ знаний в Azure
Этот акселератор решений KM призван предоставить вам работоспособное комплексное решение для интеллектуального анализа знаний, состоящее из:
Благодаря этому облачному ускорителю вы получите комплексное решение с инструментами для развертывания, расширения, эксплуатации и мониторинга.
В этом отношении решение обеспечивает
Этот ускоритель решений Knowledge Mining создан на основе другого ускорителя Knowledge Mining Solution Accelerator.
Основываясь на нашем практическом опыте, мы создали функции/навыки для решения распространенных проблем с неструктурированными данными, уделяя особое внимание удобству использования и опыту исследования данных.
Ниже приведен неисчерпывающий список основных моментов:
Индексация встроенных изображений
Нормализация изображения :
Метаданные
HTML-конвертация
Извлечение таблиц : табличная информация часто встречается в неструктурированных массивах данных. Решение будет извлекать, индексировать и проектировать таблицы в специальное хранилище знаний (необязательно).
Перевод »: в этом решении есть две функции перевода.
Текстовая аналитика : извлечение объектов (именованных, связанных) из любого документа и текста изображения, обработанного распознаванием текста.
Экспорт в Excel : популярный вопрос при изучении неструктурированных данных.
Настраиваемый пользовательский интерфейс : создание пользовательского интерфейса требует много времени, мы хотели обеспечить широкие возможности настройки пользовательского интерфейса, чтобы вы могли своевременно внедрять новые решения УЗ.
Этот дух ускорителя решений основан на сценарии УЗ по исследованию контента.
Тем не менее, поскольку его архитектура открыта, вы можете использовать его в качестве основы для более специализированных сценариев УЗ.
Этот ускоритель решений не ориентирован на какой-либо домен, хотя его расширяемость предоставит вам инструменты, позволяющие сделать его специфичным для домена.
Несколько вдохновляющих примеров использования
Вы можете подумать о внедрении такого ускорителя для вашей организации.
Этот акселератор решений предназначен для всех, кто нуждается в
Целью этого ускорителя решений также является упрощение интеграции модулей Data Science в ваше решение для интеллектуального анализа данных.
Команда Data Science Toolkit создала ускорители для ваших задач по анализу данных.
Решение | Описание |
---|---|
Универсальность | Verseagility — это набор инструментов на основе Python, позволяющий расширить вашу задачу обработки естественного языка (NLP), позволяя вам использовать собственные данные, использовать предпочитаемые вами платформы и запускать модели в производство. Это центральный компонент Microsoft Data Science Toolkit. |
База МЛОпс | Этот репозиторий содержит базовую структуру репозитория для проектов машинного обучения на основе технологий Azure (Azure ML и Azure DevOps). Названия папок и файлов выбраны исходя из личного опыта. Вы можете найти принципы и идеи, лежащие в основе структуры, которым мы рекомендуем следовать при настройке вашего собственного проекта и процесса MLOps. Кроме того, мы ожидаем, что пользователи будут знакомы с концепциями машинного обучения Azure и способами использования этой технологии. |
MLOps для DataBricks | Этот репозиторий содержит платформу разработки Databricks для реализации любых проектов по инженерии данных и проектов машинного обучения на основе технологий Azure. |
Ускоритель классификационных решений | Этот репозиторий содержит базовую структуру репозитория для предоставления решений классификации для проектов машинного обучения (ML) на основе технологий Azure (Azure ML и Azure DevOps). |
Ускоритель решений для обнаружения объектов | Этот репозиторий содержит весь код для обучения моделей обнаружения объектов TensorFlow в машинном обучении Azure (AML) с настройками для обучения вычислениям Azure, мониторинга экспериментов и развертывания конечных точек в качестве веб-службы. Он построен на базе ускорителя MLOps и обеспечивает сквозные конвейеры обучения и развертывания, позволяя быстро и легко настраивать конвейеры CI/CD для ваших проектов. |
Вы можете обратиться к документации по акселератору решений следующим образом:
Тема | Описание | Ссылка на документацию |
---|---|---|
Предварительные требования | Что вам нужно для развертывания и эксплуатации решения | ЧИТАЙТЕ |
Архитектура | Как спроектировано решение | ЧИТАЙТЕ |
Развертывание | Как развернуть этот ускоритель решений | ЧИТАЙТЕ |
Конфигурация | Все, что вам нужно знать о конфигурации акселератора решений | ЧИТАЙТЕ |
Наука о данных | Интеграция с наукой о данных | ЧИТАЙТЕ |
Развертывание | Как начать с развертывания решения | ЧИТАЙТЕ |
Мониторинг | Как контролировать решение | ЧИТАЙТЕ |
Поиск | Как настраивается и управляется поиск | ЧИТАЙТЕ |
Поиск и исследование (пользовательский интерфейс) | Пользовательский интерфейс для поиска и изучения | ЧИТАЙТЕ |
Структура репозитория этого ускорителя следующая:
Клонируйте или загрузите этот репозиторий, а затем перейдите в папку развертывания, следуя инструкциям в руководстве по развертыванию.
Выполнив все шаги, вы получите работающее комплексное решение для интеллектуального анализа знаний, которое сочетает прием источников данных с навыками обогащения данных, а также веб-приложение на базе Когнитивного поиска Azure.
Это решение вдохновлено оригинальной работой
Основными участниками этого акселератора решений являются
Команда спонсоров набора инструментов для анализа данных
За отличный разговор о интеллектуальном анализе и неструктурированных данных
Этот проект приветствует вклад и предложения. Большинство вкладов требует от вас согласия с Лицензионным соглашением для авторов (CLA), в котором говорится, что вы имеете право и действительно предоставляете нам права на использование вашего вклада. Подробную информацию можно найти на странице https://cla.opensource.microsoft.com.
Когда вы отправляете запрос на включение, бот CLA автоматически определяет, нужно ли вам предоставить CLA, и соответствующим образом оформляет PR (например, проверку статуса, комментарий). Просто следуйте инструкциям бота. Вам нужно будет сделать это только один раз во всех репозиториях, используя наш CLA.
В этом проекте принят Кодекс поведения Microsoft с открытым исходным кодом. Для получения дополнительной информации см. часто задаваемые вопросы по Кодексу поведения или свяжитесь с нами по адресу [email protected], если у вас возникнут дополнительные вопросы или комментарии.
Этот проект может содержать товарные знаки или логотипы проектов, продуктов или услуг. Разрешенное использование товарных знаков и логотипов Microsoft регулируется и должно соответствовать Руководству Microsoft по товарным знакам и брендам. Использование товарных знаков или логотипов Microsoft в измененных версиях этого проекта не должно вызывать путаницу или подразумевать спонсорство Microsoft. Любое использование товарных знаков или логотипов третьих лиц регулируется политикой этих третьих сторон.