Download GenDataAttribution - Download do código-fonte GenDataAttribution

GenDataAttribution

Código-Fonte de IA

1.0.0

Baixar

Avaliando atribuição de dados para modelos de texto para imagem

Projeto | Papel

Sheng-Yu Wang ¹ , Alexei A. Efros ² , Jun-Yan Zhu ¹ , Richard Zhang ³ .
Universidade Carnegie Mellon ¹ , UC Berkeley ² , Adobe Research ²
Em ICCV, 2023.

short_vid_v2.mp4

Resumo

Embora grandes modelos de texto para imagem sejam capazes de sintetizar imagens "novas", essas imagens são necessariamente um reflexo dos dados de treinamento. O problema da atribuição de dados em tais modelos – quais das imagens no conjunto de treinamento são as mais responsáveis pela aparência de uma determinada imagem gerada – é difícil, mas importante. Como passo inicial em direção a esse problema, avaliamos a atribuição por meio de métodos de “customização”, que ajustam um modelo existente em grande escala a um determinado objeto ou estilo exemplar. Nosso principal insight é que isso nos permite criar com eficiência imagens sintéticas que são influenciadas computacionalmente pelo exemplar por construção. Com nosso novo conjunto de dados de imagens influenciadas por exemplares, somos capazes de avaliar vários algoritmos de atribuição de dados e diferentes espaços de recursos possíveis. Além disso, treinando em nosso conjunto de dados, podemos ajustar modelos padrão, como DINO, CLIP e ViT, para o problema de atribuição. Embora o procedimento seja ajustado para conjuntos de exemplares pequenos, mostramos generalização para conjuntos maiores. Finalmente, levando em consideração a incerteza inerente ao problema, podemos atribuir pontuações de atribuição suave sobre um conjunto de imagens de treinamento.

Configurar

Configurar ambiente conda

conda env create -f environment.yaml
conda activate gen-attr

Baixe pesos e dados do modelo

 # Download precomputed features of 1M LAION images
bash feats/download_laion_feats.sh

# Download jpeg-ed 1M LAION images for visualization
bash dataset/download_dataset.sh laion_jpeg

# Download pretrained models
bash weights/download_weights.sh

Início rápido (demonstração interativa)

Estimamos a influência dos dados de treinamento pela similaridade dos recursos aprendidos. Esta demonstração recebe uma imagem gerada por difusão estável como consulta e produz pontuações de influência do subconjunto de 1 milhão de imagens LAION. Para iniciar a demonstração, execute:

streamlit run streamlit_demo.py

Conjunto de dados

Liberamos nosso conjunto de testes para avaliação. Para baixar o conjunto de dados:

 # Download the exemplar real images
bash dataset/download_dataset.sh exemplar

# Download the testset portion of images synthesized from Custom Diffusion
bash dataset/download_dataset.sh testset

# (Optional, can download precomputed features instead!)
# Download the uncompressed 1M LAION subset in pngs
bash dataset/download_dataset.sh laion

O conjunto de dados está estruturado da seguinte forma:

 dataset
├── exemplar
│   ├── artchive
│   ├── bamfg
│   └── imagenet
├── synth
│   ├── artchive
│   ├── bamfg
│   └── imagenet
├── laion_subset
└── json
    ├──test_artchive.json
    ├──test_bamfg.json
    ├──...

Todas as imagens exemplares são armazenadas em dataset/exemplar , todas as imagens sintetizadas são armazenadas em dataset/synth e 1 milhão de imagens laion em pngs são armazenadas em dataset/laion_subset . Os arquivos JSON em dataset/json especificam as divisões train/val/test, incluindo diferentes casos de teste, e servem como rótulos de verdade. Cada entrada dentro de um arquivo JSON é um modelo exclusivo e ajustado. Uma entrada também registra as imagens exemplares usadas para ajuste fino e as imagens sintetizadas geradas pelo modelo. Temos quatro casos de teste: test_artchive.json , test_bamfg.json , test_observed_imagenet.json e test_unobserved_imagenet.json .

(Lançaremos o conjunto de treinamento e validação em um futuro próximo!)

Avaliação

Após o download do conjunto de testes, dos recursos LAION pré-computados e dos pesos pré-treinados, podemos pré-calcular os recursos do conjunto de testes executando extract_feat.py e, em seguida, avaliar o desempenho executando eval.py . Abaixo estão os scripts bash que executam a avaliação em lotes:

 # precompute all features from the testset
bash scripts/preprocess_feats.sh

# run evaluation in batches
bash scripts/run_eval.sh

As métricas são armazenadas em arquivos .pkl nos results . Atualmente, o script executa cada comando sequencialmente. Sinta-se à vontade para modificá-lo para executar os comandos em paralelo. O comando a seguir analisará os arquivos .pkl em tabelas armazenadas como arquivos .csv :

python results_to_csv.py

Atualização de 18/12/2023 Para baixar modelos treinados apenas em modelos centrados em objeto ou centrados em estilo, execute bash weights/download_style_object_ablation.sh

Citação

 @inproceedings{wang2023evaluating,
  title={Evaluating Data Attribution for Text-to-Image Models},
  author={Wang, Sheng-Yu and Efros, Alexei A. and Zhu, Jun-Yan and Zhang, Richard},
  booktitle={ICCV},
  year={2023}
}

Reconhecimento

Agradecemos a Aaron Hertzmann pela leitura de um rascunho anterior e pelo feedback esclarecedor. Agradecemos aos colegas da Adobe Research, incluindo Eli Shechtman, Oliver Wang, Nick Kolkin, Taesung Park, John Collomosse e Sylvain Paris, juntamente com Alex Li e Yonglong Tian pela discussão útil. Agradecemos Nupur Kumari pela orientação com o treinamento de difusão personalizada, Ruihan Gao pela revisão do rascunho, Alex Li pelas dicas para extrair recursos de difusão estável e Dan Ruta pela ajuda com o conjunto de dados BAM-FG. Agradecemos a Bryan Russell pelas caminhadas e brainstorming sobre a pandemia. Este trabalho começou quando SYW era estagiário da Adobe e foi apoiado em parte por uma doação da Adobe e pelo prêmio de pesquisa do corpo docente do JP Morgan Chase.

Expandir

Informações adicionais

Versão 1.0.0
Tipo Código-Fonte de IA
Data da Última Atualização 2024-12-17
tamanho 2.67MB
Vindo de Github

Aplicativos Relacionados

node telegram bot api

2024-12-14
typebot.io

2024-12-14
python wechaty getting started

2024-12-14
TranscriberBot

2024-12-14
genal chat

2024-12-14
Facemoji

2024-12-14

Recomendado para você

chat.petals.dev

Outro código-fonte

1.0.0
GPT Prompt Templates

Outro código-fonte

1.0.0
GPTyped

Outro código-fonte

GPTyped 1.0.5
node telegram bot api

Código-Fonte de IA

v0.50.0
typebot.io

Código-Fonte de IA

v3.1.2
python wechaty getting started

Código-Fonte de IA

1.0.0
waymo open dataset

Outro código-fonte

December 2023 Update
wp functions

Outras categorias

1.0.0
termwind

Outras categorias

v2.3.0

Informações Relacionadas Todos