Geração Aumentada de Recuperação de Próxima Geração (RAG)
Introdução
Este é um centro colaborativo dedicado ao avanço da próxima geração da tecnologia Retrieval Augmented Generation (RAG). Este repositório está focado na exploração dinâmica do cenário em evolução do RAG, com o objetivo de descobrir, desenvolver e compartilhar os avanços de ponta que moldam o futuro da recuperação e geração de informações orientadas por IA.
Metas
Este repositório embarca em uma exploração dinâmica do cenário em evolução do RAG, com o objetivo de descobrir, desenvolver e compartilhar os avanços de ponta que moldam o futuro da recuperação e geração de informações orientadas por IA.
Metas
Os principais objetivos deste repositório são:
- Inovar e Explorar : Para ampliar os limites das tecnologias RAG atuais, explorando novos conceitos, metodologias e arquiteturas.
- Pesquisa Colaborativa : Para promover uma comunidade de pesquisadores, desenvolvedores e entusiastas trabalhando juntos para avançar no campo do RAG.
- Compartilhamento de conhecimento : Para servir como um recurso abrangente para desenvolvimentos de última geração, avanços conceituais e discussões esclarecedoras sobre RAG e suas aplicações.
- Impacto no mundo real : Para traduzir avanços teóricos em soluções práticas que abordem desafios do mundo real na recuperação de informações e geração de texto.
Tópicos de interesse
Este repositório concentra-se em uma ampla gama de tópicos dentro do domínio RAG e áreas relacionadas, incluindo, mas não se limitando a:
- Roteamento Semântico
- Integração de Conhecimento
- Processamento avançado de consultas
- Classificação
- Estratégias para classificação de texto eficaz e eficiente usando grandes modelos de linguagem
- Treinando um reclassificador LLM usando otimização de preferência direta
- Perdido no meio: como os modelos de linguagem usam contextos longos
- Classificação instantânea
- Recuperador de contexto longo
- Segurança:
- (todo: adicionar thread de exploração)ComPromptMized: liberando worms de clique zero que visam aplicativos com tecnologia GenAI
Estrutura do Repositório
- notebooks/ : notebooks Jupyter contendo pesquisas, experimentos e demonstrações. Cada caderno é independente com instruções e explicações.
- docs/ : Documentação adicional sobre conceitos, técnicas e descobertas.
- data/ : conjuntos de dados de amostra usados para experimentação (tarefa: adicionar conjuntos de dados).
- scripts/ : scripts utilitários e trechos de código (tarefa: adicionar scripts).
Em andamento
Pendências
Roteiro