Descarga de Reversal of Thought - Descarga del código fuente Reversal of Thought

Reversal of Thought

Código Fuente de IA

1.0.0

Descargar

Reversión del pensamiento: Mejora de modelos de idiomas grandes con calentamiento de razonamiento inverso guiado por preferencias

La ROT mejora la precisión y la eficiencia del razonamiento al tiempo que minimiza los costos computacionales, aprovechando el razonamiento inverso guiado por preferencias y un administrador de preferencias cognitivas para explorar de manera óptima el razonamiento de LLM con preferencias cognitivas.

Arquitectura modelo

Demostración para razonamiento inverso guiado por preferencias

???? reversal_demo.py

 from utils . llm_utils import *
from utils . prompt import *
pipeline = Pipeline ( model_id = model_id , base_url = base_url , api_key = api_key , prob = True )
demos = "Input:... Output:..." #Suggest 2-shot Demos
llm_taste = rot_pipeline ( pipeline , reversal_of_thought , demos = demos , warmup = 5 )

¿Para qué podría usarse reversal_demo.py?

Mejorar las indicaciones preferidas por LLM para las soluciones de tareas
Refina las indicaciones para alinearse con las estrategias preferidas por LLM, optimizando la eficiencia de resolución de tareas.
Potencial para crear diversos conjuntos de datos de control de calidad
Genera variados pares de preguntas y respuestas para mejorar la diversidad del conjunto de datos.

Citación

Si encuentra útil nuestro trabajo para su investigación, por favor cita nuestro artículo de la siguiente manera:

 @article { yuan2024reversal ,
  title = { Reversal of Thought: Enhancing Large Language Models with Preference-Guided Reverse Reasoning Warm-up } ,
  author = { Yuan, Jiahao and Du, Dehui and Zhang, Hao and Di, Zixiang and Naseem, Usman } ,
  journal = { arXiv preprint arXiv:2410.12323 } ,
  year = { 2024 }
}

Expandir

Información adicional

Versión 1.0.0
Tipo Código Fuente de IA
Fecha de actualización 2025-02-11
tamaño 4.94MB
Proviene de Github

Aplicaciones relacionadas

Devolver

2024-09-12
Aplicación REVERTO

2024-04-22
Fiebre agrícola

2023-11-01
Azul inverso

2023-08-08
Fiebre de la pelota

2023-04-14
Fiebre de rebanada

2023-03-15

Recomendado para ti

chat.petals.dev

Otro código fuente

1.0.0
GPT Prompt Templates

Otro código fuente

1.0.0
GPTyped

Otro código fuente

GPTyped 1.0.5
node telegram bot api

Código Fuente de IA

v0.50.0
typebot.io

Código Fuente de IA

v3.1.2
python wechaty getting started

Código Fuente de IA

1.0.0
waymo open dataset

Otro código fuente

December 2023 Update
termwind

Otras categorias

v2.3.0
wp functions

Otras categorias

1.0.0

Información relacionada Todo