qevals
1.0.0
Evals é uma estrutura de geração e avaliação de dados sintéticos para aplicações LLMs e RAG.
Possui 2 módulos principais:
Um diagrama de arquitetura de alto nível de avaliações é o seguinte:
Diagrama de arquitetura
Para começar com avaliações, siga estas etapas:
pip install -r requirements.txt
no diretório do projeto.config/config.toml.template
e nomeie-a config/config.toml
.config.toml
:MISC
DATAGEN
DATA_DIR
controla a localização do corpus de dados para gerar dados sintéticos, é relativo ao diretório datagen/data/
. Em outras palavras, adicione seus diretórios de dados e especifique seus nomes na variável.GEN_PROVIDER
permite escolher entre azure
ou vertex
.DATAEVAL
EVAL_TESTS
oferece uma lista de testes de avaliação suportados pelo framework. As opções possíveis são AnswerRelevancy
, Hallucination
, Faithfulness
, Bias
, Toxicity
, Correctness
, Coherence
, PromptInjection
, PromptBreaking
, PromptLeakage
.EVAL_RPVODER
permite escolher entre azure
ou vertex
.Para executar o módulo de geração de dados sintéticos:
Modifique/adapte o cliente de amostra fornecido ( datagen/client.py
)
Execute python -m datagen.client
Os dados gerados sinteticamente serão armazenados no diretório datagen/qa_out/
como um arquivo CSV com o formato:
```csv
question,context,ground_truth
```
Para executar o módulo de avaliação:
eval/client.py
)question
, context
, ground_truth
).ground_truth
pode ou não ser usado dependendo da configuração use_answers_from_dataset
. Quando definido como False
ignorará essa coluna de dados e gerará novas saídas usando o modelo generativo configurado.mlflow ui --port 5000
python -m eval.client