sail bli Descargar - Descargar el código fuente sail bli

sail bli

Código Fuente de IA

1.0.0

Descargar

Vela-bli

Este repositorio es la implementación oficial de Pytorch del siguiente documento:

Yaoyiran Li, Anna Korhonen e Ivan Vulić. 2024. S ELF- Una ganancia de contexto I utgmented I para la traducción de palabras no supervisada . En Actas de la 62ª Reunión Anual de la Asociación de Lingüística Computacional (ACL 2024). [Papel]

Sail tiene como objetivo mejorar la traducción de palabras no supervisada / inducción de léxico bilingüe (BLI) (1) inferir un diccionario de traducción de palabras de alta confianza con indicación de disparo cero, (2) luego refinando opcionalmente el diccionario de alta confianza iterativamente con pocas disparos en el lugar de las pocas disparos en el que Los ejemplos en contexto provienen del diccionario de alta confianza en la iteración anterior, y (3) finalmente realizando evaluación en el conjunto de pruebas BLI con pocos disparos que también derivan muestras en contexto del último diccionario de alta confianza. Todo el proceso no aprovecha los pares de traducción de palabras de verdad en tierra para el entrenamiento/aprendizaje de pocos disparos y mejora los puntajes BLI por típicamente 10 ~ 15 puntos de precisión@1 en nuestros puntos de referencia BLI en comparación con la solicitud de disparo cero.

Dependencias

Pytorch> = 1.10.1
Transformers> = 4.28.1
OpenAI> = 1.28.1 (opcional)

Datos

Siguiendo nuestro trabajo anterior ContrastiveBli, Blicer y Pront4Bli, nuestros datos se obtienen del XLIN (8 idiomas, 56 direcciones BLI en total) y Panlex-Bli (15 idiomas de recursos más bajos, 210 direcciones BLI en total).

Obtenga datos de XLIN:

sh get_xling_data.sh

Para Panlex-Bli, consulte ./get_panlex_data, donde proporcionamos el código para derivar las incrustaciones de palabras monolingües.

Ejecutar el código

Prepare el vocabulario BLI:

python run_extract_vocabularies.py

Ejecute BLI Evaluation con Sail (Definir hiper-parametros, directorios y pares de idiomas para evaluar manualmente en run_bli.py):

python run_bli.py

(Opcional) Ejecute la línea de base de solicitación cero-shot introducida en Pront4Bli con modelos LLAMA:

python run_zero_shot.py

(Opcional) Ejecute la línea de base de solicitación de disparo cero introducido en Pront4Bli con modelos ChatGPT:

python run_zero_shot_chatgpt.py

LLMS utilizados en nuestro trabajo

Experimentos principales (vela):

Nuestros principales experimentos incluyen cuatro modelos de llama previos a la aparición sin ajuste de instrucciones.

LLM	(Cara abrazada) ID del modelo
Llama-7b	"Huggyllama/Llama-7b"
Llama-13b	"Huggyllama/Llama-13b"
Llama2-7b	"Meta-llama/Llama-2-7B-HF"
Llama2-13b	"Meta-llama/Llama-2-13b-HF"

ACTUALIZACIÓN: LLAMA3-8B meta-llama/Meta-Llama-3-8B también es compatible con nuestro repositorio de código ahora.

Experimentos adicionales de ChatGPT (solo solicitante de disparo cero, correspondiente a la sección 4.2 de nuestro documento):

Dado que es probable que el ajuste de instrucciones de los modelos ChatGPT cubra datos paralelos a gran escala para la traducción automática, no son adecuados para BLI no supervisado (además, el RLHF también puede incluir señales de supervisión de traducción a nivel de palabra/oración de anotadores/usuarios ). Reportamos los resultados de ChatGPT derivados con un disparo cero solo como referencia.

LLM	(API de OpenAI) ID del modelo
GPT-3.5	"GPT-3.5-TURBO-0125"
GPT-4	"GPT-4-TURBO-2024-04-09"

Diccionarios de alta confianza auto-acogedora

También liberamos los diccionarios autoadeños derivados con Llama2-13b como se discutió en la Sección 4.2 de nuestro artículo en ./augmenteddicts-llama2-13b. Estos diccionarios de alta confianza se infieren con N _IT = 1, N _F = 5000, y con la traducción posterior.

Citación

Por favor cita nuestro artículo si encuentra útil Sail-Bli .

 @inproceedings { li-etal-2024-self-augmented ,
    title     = { Self-Augmented In-Context Learning for Unsupervised Word Translation } ,
    author    = { Li, Yaoyiran and Korhonen, Anna and Vuli{'c}, Ivan } ,
    booktitle = { Proceedings of the 62nd Annual Meeting of the Association for Computational Linguistics } ,    
    year      = { 2024 }
}

Expandir

Información adicional

Versión 1.0.0
Tipo Código Fuente de IA
Fecha de actualización 2025-02-14
tamaño 335.42KB
Proviene de Github

Aplicaciones relacionadas

GitHub sgrebnov/cordova plugin background download

2024-11-05
Wa ch navra maza navsacha 2 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-03
Wa ch the greatest of all time 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-02
wolfs 2024 f llmo ie f lmyz lla dow load ree 7 0p 4 0p a d 10 0p

2024-11-01
Navegación y sacrificio

2022-08-30
Sail!Sistema de gestión de sitios web empresariales Versión en chino simplificado

2010-12-06

Recomendado para ti

chat.petals.dev

Otro código fuente

1.0.0
GPT Prompt Templates

Otro código fuente

1.0.0
GPTyped

Otro código fuente

GPTyped 1.0.5
node telegram bot api

Código Fuente de IA

v0.50.0
typebot.io

Código Fuente de IA

v3.1.2
python wechaty getting started

Código Fuente de IA

1.0.0
waymo open dataset

Otro código fuente

December 2023 Update
wp functions

Otras categorias

1.0.0
termwind

Otras categorias

v2.3.0

Información relacionada Todo