image caption pytorch Download - image caption pytorch Download do código-fonte

image caption pytorch

Código-Fonte de IA

1.0.0

Baixar

Legendagem de imagens neurais com PyTorch

Implemente modelos de legendagem de imagens neurais com PyTorch baseados na arquitetura codificador-decodificador.

O conjunto de dados é Flikr8k, que é pequeno o suficiente para o orçamento de computação e para obter resultados rapidamente. Dentro do conjunto de dados, existem 8.091 imagens, com 5 legendas para cada imagem. Portanto, é propenso a superajuste se o modelo for muito complexo. A fonte oficial está quebrada, outros links para o conjunto de dados podem estar aqui e aqui

A arquitetura do modelo é descrita abaixo. A rede do codificador para a imagem é Resnet-101 (pode ser carregada do torchvision). O decodificador é basicamente um modelo de linguagem baseado em LSTM, com o vetor de contexto (recurso de imagem codificada) como o estado inicial oculto/célula do LSTM [1]. O modelo atento também é implementado [2].

O modelo é treinado por SGD com impulso. A taxa de aprendizagem começa em 0,01 e é dividida por 10 quando estagnada em um platô. O momento de 0,9 e a redução de peso de 0,001 são usados.

O modelo [1] pode obter descrições relativamente razoáveis, com pontuação no teste BLEU-1 35,7.

Exemplos

Imagens	Legendas
	Dois cachorros brincam na grama.
	Uma pessoa está andando de caiaque no barco.
	Um menino está mergulhando em uma piscina.
	Duas pessoas sentam-se em uma doca perto da água.
	Um jogador de futebol de uniforme vermelho corre com uma bola de futebol na frente de uma multidão.
	Um snowboarder está pulando de uma colina.
	Um cachorro marrom está brincando com uma bola na areia.
	Um menino de camisa azul está correndo por um campo gramado.
	Um grupo de pessoas vestidas com trajes coloridos.

Dependências

PyTorch 0.4.1

Referência

[1] Mostre e conte: um gerador de legenda de imagem neural (https://arxiv.org/abs/1411.4555)
[2] Mostre, assista e conte: geração de legendas de imagens neurais com atenção visual (https://arxiv.org/abs/1502.03044)

Expandir

Informações adicionais

Versão 1.0.0
Tipo Código-Fonte de IA
Data da Última Atualização 2024-12-30
tamanho 50MB
Vindo de Github

Aplicativos Relacionados

pytorch image models

2024-11-03
galeria de imagens moa

2011-09-14
Host de imagem CF

2011-04-26
Host de imagem CF

2011-04-26
Redimensionador de imagem VSO

2009-06-04
Plug-in de superimagem

2009-04-18

Recomendado para você

chat.petals.dev

Outro código-fonte

1.0.0
GPT Prompt Templates

Outro código-fonte

1.0.0
GPTyped

Outro código-fonte

GPTyped 1.0.5
node telegram bot api

Código-Fonte de IA

v0.50.0
typebot.io

Código-Fonte de IA

v3.1.2
python wechaty getting started

Código-Fonte de IA

1.0.0
waymo open dataset

Outro código-fonte

December 2023 Update
termwind

Outras categorias

v2.3.0
wp functions

Outras categorias

1.0.0

Informações Relacionadas Todos