Estrutura rápida para construir pipelines Enterprise RAG (Retriever Augmented Generation) em escala - desenvolvido por watsonx
Bem-vindo ao repositório SuperKnowa GitHub! A estrutura SuperKnowa acelera seus aplicativos Enterprise Generative AI para obter soluções prontas para produção rapidamente em seus dados privados. Aqui, você encontrará uma coleção diversificada de componentes conectáveis projetados para lidar com vários casos de uso de IA generativa usando Large Language Models (LLMs). Pense nesses componentes como blocos de construção, como peças de Lego, que você pode montar para enfrentar uma ampla gama de desafios no domínio da geração de texto baseada em IA. Eles são testados em batalha em uma base de conhecimento privada de 1 milhão a 200 milhões e dimensionados para bilhões de tokens de recuperação.
O pipeline geral da estrutura SuperKnowa RAG e os principais blocos de construção:
Componentes configuráveis para o pipeline SuperKnowa RAG usando um único arquivo:
SuperKnowa é uma estrutura poderosa desenvolvida usando watsonx (assista ao vídeo em watsonx.ai aqui) que aproveita os recursos de Large Language Models (LLMs) para oferecer uma variedade de casos de uso avançados de IA generativa. Este repositório apresenta os vários casos de uso cobertos pelo SuperKnowa.
Saiba mais sobre o SuperKnowa em nossa postagem esclarecedora no blog:
Cover Blog - SuperKnowa: Construindo soluções RAG empresariais em escala https://medium.com/towards-generative-ai/superknowa-simplest-framework-yet-to-swiftly-build-enterprise-rag-solutions-at-scale-ca90b49be28a
Experimente a estrutura SuperKnowa com um aplicativo ativo construído na base de conhecimento privada de 1 milhão de documentos diversos:
https://superknowa.tsglwatson.buildlab.cloud/
(Caso você não tenha IBM ID, obtenha-o aqui - https://www.ibm.com/account/reg/us-en/signup?formid=urx-19776)
Você pode começar atualizando o arquivo config.yaml
e executando o script LLMQnA.py para configurar rapidamente seu pipeline RAG:
retriever:
indexName: superknowa
query: What is IBM Cloud?
....
reranker:
query: What is IBM Data and Analytics Reference Architecture?
...
LLMQnA:
question: What is IBM Data and Analytics Reference Architecture?
...
Para explorar os recursos e capacidades do SuperKnowa, consulte a série de blogs, exemplos de código e recursos fornecidos neste repositório.
Para obter instruções detalhadas e exemplos, navegue até o diretório de cada componente. Liberte o potencial dos grandes modelos de linguagem em seus projetos usando os componentes Generative AI Lego da SuperKnowa!
Vamos desbloquear o potencial da IA generativa com SuperKnowa e moldar o futuro do processamento de conhecimento baseado em IA!
Documentos de indexação
Pesquisa Elástica
Sol
Descoberta do Watson
Recuperador Neural
Pesquisa Elástica
Sol
Reclassificação
Aprendizagem contextual usando LLM
Avaliações LLM
Avaliação do modelo LLM
Integração MLFLOW
Afinação
Instruir banco de dados
Ajuste fino do Falcon 7B usando QLORA
Ajuste fino do LLAMA2 7B usando QLORA
Modelo RLHF
Implantar e inferir
Back-end
Implantação
Ferramenta de alinhamento de IA
Casos de uso de LLM empresarial
Meça o alinhamento dos modelos de IA nas métricas de utilidade, nocividade e precisão, capturando informações humanas.
Crie seus vários experimentos online e offline para avaliações e compare os resultados do alinhamento de IA usando um painel interativo.
O Eval_Package é uma ferramenta desenvolvida para avaliar o desempenho do LLM (Language Model) em um conjunto de dados contendo perguntas, contexto e respostas ideais. Ele permite que você execute avaliações em vários conjuntos de dados e avalie quão bem o modelo gera a resposta em dezenas de métricas estatísticas como BLUE, ROUGE, etc.
O MLflow_Package é um kit de ferramentas abrangente projetado para integrar os resultados do Eval_Package e rastrear e gerenciar experimentos com eficiência. Ele também permite criar um placar para comparações de avaliações e visualizar métricas por meio de um painel.
Abaixo está uma lista de casos de uso de IA generativa criados usando a estrutura SuperKnowa.
Participe de conversas em linguagem natural com o sistema conversacional de perguntas e respostas (Q&A) do SuperKnowa. Faça perguntas com base na base de conhecimento da empresa privada e receba respostas detalhadas e contextualizadas.
Aproveite o recurso "Pergunte aos seus documentos" do SuperKnowa para desbloquear o potencial de seus PDFs e documentos de texto. O SuperKnowa pode ajudá-lo a extrair informações relevantes, responder perguntas específicas e auxiliar na recuperação de informações.
Gere resumos coerentes e informativos sem esforço com o recurso de resumo do SuperKnowa em grandes corpus de texto usando FlanT5 e UL2. Extraia os principais pontos e detalhes essenciais de artigos, relatórios e outros textos, permitindo uma compreensão eficiente do conteúdo.
O recurso de resumo abstrativo do SuperKnowa vai além da simples extração usando FlanUL2 e LLAMA2. Ele pode analisar documentos PDF extensos e gerar resumos abstrativos concisos, capturando a essência do conteúdo. Além disso, o SuperKnowa identifica pontos-chave, facilitando a compreensão e a comunicação de informações complexas.
Experimente o poder do recurso Text-to-SQL do SuperKnowa, que transforma consultas de linguagem natural em consultas SQL estruturadas. Interaja com bancos de dados usando linguagem simples, eliminando a necessidade de conhecimento em SQL.
Criado e arquitetado por
Construtores
Esta estrutura é desenvolvida pelo Build Lab, IBM Ecosystem. Observe que este conteúdo é disponibilizado para promover a adoção da tecnologia de IA incorporável e servir aos parceiros do ecossistema. O conteúdo pode incluir sistemas e métodos com patente pendente no USPTO e protegidos pelas leis de patentes dos EUA. SuperKnowa não é um produto, mas uma estrutura construída no topo do IBM watsonx junto com outros produtos como modelos LLAMA da Meta e ML Flow da Databricks. O uso do SuperKnowa exige implicitamente a concordância com os Termos e condições desses produtos. Essa estrutura é disponibilizada no estado em que se encontra para acelerar o desenvolvimento de aplicativos Enterprise GenAI. Em caso de dúvidas, entre em contato com [email protected].
Direitos autorais @ 2023 IBM Corporation.