self refine Download - self refine download do código-fonte

self refine

Outro código-fonte

1.0.0

Baixar

Auto-refinamento: refinamento iterativo com auto-feedback

Com o Self-Refine, os LLMs podem gerar feedback sobre seu trabalho, usá-lo para melhorar o resultado e repetir esse processo.

Site | Papel

Índice

Atualizações
Configurar
Primeiros passos com geração de acrônimos
Geração de resposta de diálogo
Melhoria na legibilidade do código
Comum
GSM-8k
Yelp
TORTA
Configuração geral
Citação

Atualizações

Novembro de 2023 : Adicionados exemplos visuais de autorrefinamento e colaborações. Use GPT4-V para escrever código tikz para diagramas e melhorá-los iterativamente.

Exemplo do Teorema de Stokes
Exemplo de auto-refinamento visual 1

Exemplo de Unicórnio
Exemplo de auto-refinamento visual 2

Configurar

Usamos prompt-lib para consultar LLMs. Você pode instalar prompt-lib executando os seguintes comandos:

git clone https://github.com/reasoning-machines/prompt-lib
pip install prompt-lib/

Dependendo das configurações padrão, você pode usar o seguinte para definir um PYTHONPATH:

 export PYTHONPATH= " .:../:.:src:../:../../:.:prompt-lib "

Primeiros passos com geração de acrônimos

python -u src/acronym/run.py " Using language models of code for few-shot commonsense "

Como amostramos com temperatura de 0,7, você obterá resultados diferentes cada vez que executar o comando acima.

 0 INIT > Using language models of code for few - shot commonsense

0 GEN > CLoCK
0 SCORES > * Ease of pronunciation : CLoCK is pronounced " clah-k " . This is easy acronym to pronounce . 4 / 5 
* Ease of spelling : CLoCK is easy to spell . 5 / 5 
* Relation to title : CLoCK stands for " Code Language Models of Commonsense Knowledge " which is related to the title . 5 / 5 
* Positive connotation : CLoCK is a positive acronym . It implies accuracy and efficiency . 5 / 5 
* Well - known : CLoCK is not a well - known acronym . 2 / 5

* Total score : 21 / 25

1 GEN > CMNSC
1 SCORES > * Ease of pronunciation : CMNSC is pronounced " see-min-es-see " . This is a difficult acronym to pronounce . 1 / 5 
* Ease of spelling : CMNSC is difficult to spell . 1 / 5 
* Relation to title : CMNSC stands for " Commonsense " which is related to the title . 4 / 5 
* Positive connotation : CMNSC is a neutral acronym . 3 / 5 
* Well - known : CMNSC is not a well - known acronym . 1 / 5

* Total score : 10 / 25

2 GEN > COMMIT
2 SCORES > * Ease of pronunciation : COMMIT is pronounced " com-mit " . This is an easy acronym to pronounce . 4 / 5
* Ease of spelling : COMMIT is easy to spell . 5 / 5
* Relation to title : COMMIT stands for " Commonsense Model of Code for Intuitive Training " which is related to the title . 5 / 5 
* Positive connotation : COMMIT is a positive acronym . It implies commitment and dedication . 5 / 5
* Well - known : COMMIT is not a well - known acronym . 2 / 5

* Total score : 21 / 25

Geração de resposta de diálogo

PYTHONPATH= " . " python -u src/responsegen/run.py --output < OUTPUT FILE > --size < DATA SIZE >

Use tamanho 0 para execução em todas as instâncias de teste

Melhoria na legibilidade do código

Nota: Descompacte 'data/tasks/codeclean/code_readability/codenet-python-train.jsonl.zip' antes de executar os seguintes comandos!

Correndo:

PYTHONPATH= " . " python -u src/readability/readability.py --output < OUTPUT FILE >

Avaliação:

PYTHONPATH= " . " python -u src/readability/{count_comment | count_function | count_meaningful_var}.py --file < INPUT FILE >

Comum

Usamos uma versão difícil do commongen. Os dados estão localizados em data/prompt/commongen . Você pode baixar os dados executando os seguintes comandos:

python -u src/commongen/run.py cmd stair bubble team dryer puppy aliens cat

GSM-8k

Para executar a tarefa GSM-8k:

python -u src/gsm/run.py

As saídas serão salvas em data/tasks/gsm/gsm_outputs.jsonl
Para avaliar os resultados:

python src/gsm/gsm_selfref_eval.py --path  data/tasks/gsm/gsm_outputs.jsonl

O script de avaliação também gerará um relatório ( data/tasks/gsm/gsm_outputs.jsonl.reports.txt ) mostrando exemplos de gerações erradas, feedback e gerações de feedback refinado.

Yelp

Para executar a tarefa do Yelp:

python -u src/sentiment_transfer_sr/run.py data/tasks/yelp/yelp-extreme.jso
nl 4 none

As saídas serão salvas em data/tasks/yelp/

TORTA

Para executar a tarefa PIE:

python -u src/pie/run.py --slow_programs_file data/tasks/pie/codenet-python-test-1k.jsonl --max_attempts 4 --outfile data/tasks/pie/output --feedback_type rich

Para obter detalhes da avaliação, consulte docs/pie_eval.md.

Configuração geral

Cada tarefa possui três tipos diferentes de prompts:

Init : usado para inicializar a tarefa. É assim que a saída inicial é gerada.
Feedback : usado para obter feedback do modelo sobre os resultados intermediários.
Iterate : usado para obter a próxima iteração do modelo, com base no feedback.

Cada tarefa possui um run.py que inicializa os prompts e executa a tarefa.
Por exemplo, os prompts para commongen são os seguintes:

Prompt de inicialização:

python src/commongen/task_init.py

Solicitação de feedback:

 python src/commongen/feedback.py

Iterar prompt:

python src/commongen/task_iterate.py

Você também pode ver essas instruções em nosso site.

Citação

@misc{madaan2023selfrefine,
      title = {Self - Refine: Iterative Refinement with Self - Feedback}, 
      author = {Aman Madaan and Niket Tandon and Prakhar Gupta and Skyler Hallinan and Luyu Gao and Sarah Wiegreffe and Uri Alon and Nouha Dziri and Shrimai Prabhumoye and Yiming Yang and Sean Welleck and Bodhisattwa Prasad Majumder and Shashank Gupta and Amir Yazdanbakhsh and Peter Clark},
      year = { 2023 },
      eprint = { 2303 . 17651 },
      archivePrefix = {arXiv},
      primaryClass = { cs . CL }
}

 fluxograma LR
    Gerador -->|Inicializa| Não refinado
    Crítico_1 -> Crítica_fb
    ... --> Crítica_fb
    Crítica_k -> Crítica_fb
    Critique_fb --> Não refinado{Saída para refinar}
    Não refinado -> Refinador
    Refinador --> |R: y_t, x, fb| Refined_Output{Saída Refinada}
    Refined_Output --> |Critérios de parada não atendidos| Não refinado

Expandir

Informações adicionais

Versão 1.0.0
Tipo Outro código-fonte
Data da Última Atualização 2024-12-22
tamanho 57.59MB
Vindo de Github

Aplicativos Relacionados

GitHub sgrebnov/cordova plugin background download

2024-11-05
wolfs 2024 f llmo ie f lmyz lla dow load ree 7 0p 4 0p a d 10 0p

2024-11-01
Self Cuidados Goals Tracker app

2024-03-18
Versão móvel do Keychain Maker (jogo de chaveiro de autodefesa)

2023-10-24
Autossuficiência

2023-05-19
Isolamento voluntário

2022-08-09

Recomendado para você

chat.petals.dev

Outro código-fonte

1.0.0
GPT Prompt Templates

Outro código-fonte

1.0.0
GPTyped

Outro código-fonte

GPTyped 1.0.5
waymo open dataset

Outro código-fonte

December 2023 Update
SmartTube

Outro código-fonte

24.71 Stable
Sunamu

Outro código-fonte

Release 2.2.0
waymo open dataset

Outro código-fonte

December 2023 Update
wp functions

Outras categorias

1.0.0
termwind

Outras categorias

v2.3.0

Informações Relacionadas Todos