Descarga UniIR - Descarga del código fuente UniIR

UniIR

Código Fuente de IA

1.0.0

Descargar

UniIR

Página de inicio | ? Conjunto de datos (punto de referencia M-BEIR) | ? Puntos de control (modelos UniIR ) | arXiv | GitHub

Este repositorio contiene el código base para el documento ECCV-2024 " UniIR : capacitación y evaluación comparativa de recuperadores de información multimodales universales".

?Noticias

[2024-04-13] : Destacamos otra investigación valiosa y concurrente sobre el entrenamiento de recuperadores multimodales multitarea que siguen instrucciones con interacción tardía: PreFLMR: Scaling Up Fine-Grained Late-Interaction Multi-modal Retrievers, que fue realizado por investigadores de la Universidad de Cambridge. También introdujeron el punto de referencia M2KR que se puede utilizar para entrenar y evaluar recuperadores de información universales multimodales. Podemos combinar los puntos de referencia M2KR y M-BEIR para facilitar el avance de este campo.
[2024-03-18]: ¿Liberar los puntos de control UniIR (CLIP_SF) grande y UniIR (BLIP_FF) grande ? Puntos de control
[2023-12-21]: Nuestro ? M-BEIR Benchmark ya está disponible para su uso.

Introducción

Proponemos el marco UniIR (Recuperación de información multimodal universal) para aprender a un único recuperador a realizar (posiblemente) cualquier tarea de recuperación. A diferencia de los sistemas de IR tradicionales, UniIR necesita seguir las instrucciones para realizar una consulta heterogénea y recuperarla de un grupo de candidatos heterogéneo con millones de candidatos en diversas modalidades.

Contenido

M-BEIR
Capacitación
Evaluación
Zoológico modelo
Citas y contacto

M-BEIR

Para entrenar y evaluar modelos universales de recuperación multimodal, creamos un punto de referencia de recuperación a gran escala llamado M-BEIR (Multimodal BEnchmark for Instructed Retrieval).

Descarga de M-BEIR

Proporcionamos el conjunto de datos M-BEIR en el formato ? Conjunto de datos . Siga las instrucciones proporcionadas en la página de HF para descargar el conjunto de datos y prepararlos para la capacitación y la evaluación. Debes configurar GiT LFS y clonar directamente el repositorio:

 git clone https://huggingface.co/datasets/TIGER-Lab/M-BEIR

Modelos UniIR

Proporcionamos la base de código para entrenar y evaluar los modelos UniIR CLIP-ScoreFusion, CLIP-FeatureFusion, BLIP-ScoreFusion y BLIP-FeatureFusion.

Ambiente

Prepare la base de código del proyecto UniIR y el entorno Conda utilizando los siguientes comandos:

UniIR cd src/models/ conda env create -f UniIR _env.yml">

git clone https://github.com/TIGER-AI-Lab/UniIR
cd UniIR

cd src/models/
conda env create -f UniIR _env.yml

Capacitación

Para entrenar los modelos UniIR desde puntos de control CLIP y BLIP previamente entrenados, siga las instrucciones a continuación. Los scripts descargarán automáticamente los puntos de control CLIP y BLIP previamente entrenados.

1. Descargue el punto de referencia M-BEIR

Descargue el punto de referencia M-BEIR siguiendo las instrucciones en la sección M-BEIR .

2. Guiones

Para entrenar UniIR CLIP_SF Large con la configuración predeterminada:

 cd src/models/ UniIR _clip/clip_scorefusion/configs_scripts/large/train/inbatch/

Modifique inbatch.yaml para ajustar los hiperparámetros y run_inbatch.sh para su propio entorno y rutas.

Nota:

Modifique UniIR _DIR en run_inbatch.sh al directorio donde desea almacenar los puntos de control.
Modifique MBEIR_DATA_DIR en run_inbatch.sh al directorio donde almacena el punto de referencia M-BEIR.
Modifique SRC_DIR en run_inbatch.sh al directorio donde almacena el código base del proyecto UniIR (este repositorio).
De forma predeterminada, los modelos UniIR se entrenan en M-BEIR con negativos en lotes y no se utilizan los negativos duros proporcionados por los conjuntos de datos originales.
Usamos wandb para registrar el proceso de capacitación. Asegúrese de que esté configurado un entorno .env con WANDB_API_KEY , WANDB_PROJECT y WANDB_ENTITY .

Luego puede ejecutar el siguiente comando para entrenar el modelo UniIR CLIP_SF Large.

bash run_inbatch.sh

Para entrenar UniIR BLIP_FF Large con la configuración predeterminada:

 cd src/models/ UniIR _blip/blip_featurefusion/configs_scripts/large/train/inbatch/

Modifique inbatch.yaml para ajustar los hiperparámetros y run_inbatch.sh para su propio entorno y rutas.

bash run_inbatch.sh

De manera similar, puede entrenar los modelos UniIR CLIP_FF y BLIP_SF modificando los scripts correspondientes.

Evaluación

Proporcionamos el proceso de evaluación para los modelos UniIR en el punto de referencia M-BEIR.

1. Medio ambiente

Cree un entorno para la biblioteca FAISS:

 # From the root directory of the project
cd src/common/
conda env create -f faiss_env.yml

2. Descargue el punto de referencia M-BEIR

Descargue el punto de referencia M-BEIR siguiendo las instrucciones en la sección M-BEIR .

3. Descargue los puntos de control UniIR

Puede entrenar los modelos UniIR desde cero o descargar los puntos de control UniIR previamente entrenados siguiendo las instrucciones en la sección Model Zoo .

4. Guiones

Para evaluar UniIR CLIP_SF Large con la configuración predeterminada:

 cd src/models/ UniIR _clip/clip_scorefusion/configs_scripts/large/eval/inbatch/

Modifique embed.yaml , index.yaml , retrieval.yaml y run_eval_pipeline_inbatch.sh para su propio entorno, rutas y configuración de evaluación.

Nota:

Si descarga nuestro modelo UniIR previamente entrenado, modifique UniIR _DIR en run_eval_pipeline_inbatch.sh al directorio donde desea almacenar archivos grandes, incluidos los puntos de control, incrustaciones, índices y resultados de recuperación. Luego puede colocar el archivo clip_sf_large.pth en la siguiente ruta:
```
 $ UniIR _DIR /checkpoint/CLIP_SF/Large/Instruct/InBatch/clip_sf_large.pth
```
Esta es la ruta predeterminada especificada por model.ckpt_config en el archivo embed.yaml .
Modifique MBEIR_DATA_DIR en run_eval_pipeline_inbatch.sh al directorio donde almacena el punto de referencia M-BEIR.
Modifique SRC_DIR en run_eval_pipeline_inbatch.sh al directorio donde almacena el código base del proyecto UniIR (este repositorio).

La configuración predeterminada evaluará el modelo UniIR CLIP_SF Large en los puntos de referencia M-BEIR (grupo de candidatos heterogéneos de 5,6 millones) y M-BEIR_local (grupo de candidatos homogéneos). UNION en los archivos yaml se refiere al M-BEIR (grupo de candidatos heterogéneos de 5,6 millones). Puede seguir los comentarios en los archivos yaml y modificar las configuraciones para evaluar el modelo únicamente en el punto de referencia M-BEIR_local.

bash run_eval_pipeline_inbatch.sh

embed , index , logger y retrieval_results se guardarán en el directorio $ UniIR _DIR .

Para evaluar UniIR BLIP_FF Large con la configuración predeterminada:

 cd src/models/unii_blip/blip_featurefusion/configs_scripts/large/eval/inbatch/

De manera similar, si descarga nuestro modelo UniIR previamente entrenado, puede colocar el archivo blip_ff_large.pth en la siguiente ruta:

 $ UniIR _DIR /checkpoint/BLIP_FF/Large/Instruct/InBatch/blip_ff_large.pth

La configuración predeterminada evaluará el modelo UniIR BLIP_FF Large en los puntos de referencia M-BEIR y M-BEIR_local.

bash run_eval_pipeline_inbatch.sh

Evaluación UniRAG

La evaluación UniRAG es muy similar a la evaluación predeterminada con las siguientes diferencias:

Almacena archivos jsonl que contienen consultas y sus candidatos recuperados en retrieval_results . Esto resulta útil cuando los resultados recuperados se utilizarán en aplicaciones posteriores como RAG.
Cuando retrieve_image_text_pairs en retrieval.yaml se establece en True , se buscará un candidato de complemento para cada candidato con modalidad de solo text o image . Con esta configuración, el candidato y su complemento siempre tendrán modalidad image, text . Los candidatos complementarios se obtienen utilizando los candidatos originales como consultas (por ejemplo, _texto de consulta -> _imagen candidata -> _texto candidato complementario ).
Para ejecutar evaluaciones en modo UniRAG, siga las instrucciones proporcionadas anteriormente reemplazando InBatch e inbatch con UniRAG y unirag , respectivamente.

Puede entrenar y evaluar los modelos UniIR CLIP_FF y BLIP_SF modificando los scripts correspondientes.

Zoológico modelo

Proporcionamos los puntos de control del modelo UniIR en el ? Puntos de control . Puede utilizar directamente los puntos de control para tareas de recuperación o ajustar los modelos para sus propias tareas de recuperación.

Puntos de control disponibles

Nombre del modelo	Versión	Tamaño del modelo	Enlace modelo
UniIR (CLIP-SF)	Grande	5,13GB	Enlace de descarga
UniIR (BLIP-FF)	Grande	7,49GB	Enlace de descarga

Puedes descargarlos por

 git clone https://huggingface.co/TIGER-Lab/UniIR

Citación y contacto

Cong Wei: [email protected]
Yang Chen: [email protected]
Alan Ritter: [email protected]
Wenhu Chen: [email protected]

BibTeX:

UniIR, title={ UniIR : Training and benchmarking universal multimodal information retrievers}, author={Wei, Cong and Chen, Yang and Chen, Haonan and Hu, Hexiang and Zhang, Ge and Fu, Jie and Ritter, Alan and Chen, Wenhu}, journal={arXiv preprint arXiv:2311.17136}, year={2023} }">

 @article { wei2023 UniIR ,
  title = { UniIR : Training and benchmarking universal multimodal information retrievers } ,
  author = { Wei, Cong and Chen, Yang and Chen, Haonan and Hu, Hexiang and Zhang, Ge and Fu, Jie and Ritter, Alan and Chen, Wenhu } ,
  journal = { arXiv preprint arXiv:2311.17136 } ,
  year = { 2023 }
}

Expandir

Información adicional

Versión 1.0.0
Tipo Código Fuente de IA
Fecha de actualización 2024-12-30
tamaño 50MB
Proviene de Github

Aplicaciones relacionadas

node telegram bot api

2024-12-14
typebot.io

2024-12-14
python wechaty getting started

2024-12-14
TranscriberBot

2024-12-14
genal chat

2024-12-14
Facemoji

2024-12-14

Recomendado para ti

chat.petals.dev

Otro código fuente

1.0.0
GPT Prompt Templates

Otro código fuente

1.0.0
GPTyped

Otro código fuente

GPTyped 1.0.5
node telegram bot api

Código Fuente de IA

v0.50.0
typebot.io

Código Fuente de IA

v3.1.2
python wechaty getting started

Código Fuente de IA

1.0.0
waymo open dataset

Otro código fuente

December 2023 Update
termwind

Otras categorias

v2.3.0
wp functions

Otras categorias

1.0.0

Información relacionada Todo