Descarga de Solo Performance Prompting - Descarga del código fuente Solo Performance Prompting

Solo Performance Prompting

Otro código fuente

Descargar

Repositorio oficial del documento Solo Performance Promptting (SPP)

Ilustración de indicaciones para una actuación en solitario

Noticias

5/8/2024 : Actualización del código de inferencia GPT-3.5 y LLama2 y los resultados de la Figura 6, que muestra la naturaleza emergente de la sinergia cognitiva.
3/15/2024 : ¡Este artículo ha sido aceptado como artículo principal de la conferencia en NAACL2024!

Configuración

Instalar dependencias
```
 pip install -r requirements.txt
```
Configure las configuraciones de la API OpenAI en config_template.sh y ejecute source config_template.sh para configurar las variables env (tenga en cuenta que estamos usando la API de Azure en nuestros experimentos)

Inicio rápido

Proporcionamos scripts en ejecución para cada una de las tres tareas; consulte los comentarios en los scripts ".sh" para obtener más información:

Escritura creativa de trivia: bash scripts/trivia_creative_writing.sh
Nombres en clave colaborativos: bash scripts/codenames_collaborative.sh
Rompecabezas de cuadrícula lógica: bash scripts/logic_grid_puzzle.sh

Indicaciones

Todos los mensajes se pueden encontrar en la carpeta prompts/ .

Conjuntos de datos

Todos los conjuntos de datos se pueden encontrar en la carpeta data/ .

Resultados del experimento en papel

Los resultados experimentales en el documento para cada tarea se pueden encontrar en la carpeta logs/ . gpt4_w_sys_mes y gpt4_wo_sys_mes contienen resultados correspondientes a la Tabla 2 de nuestro artículo. También incluimos los resultados de gpt-3.5 y llama2-13b correspondientes a los resultados de la Figura 6, donde los hiperparámetros, como si agregar o no un mensaje del sistema, siguen las opciones de mejor rendimiento en los experimentos de gpt4.

Formatos de archivos de registro

"test_output_infos" : contiene métricas de evaluación para cada instancia, por ejemplo, # respuestas correctas mencionadas.
`"prompt"``: mensaje de entrada completo para la llamada API. (para la tarea de nombres en clave, hay dos llamadas API para cada instancia)
"*raw_responses" : respuestas sin procesar de cada llamada a la API.
"*parsing_flag" : si la respuesta sin formato se analizó correctamente. (para la tarea de nombres en clave, este campo está separado en "parsing_success_flag_spymaster" y "parsing_success_flag_guesser")
"unwrapped_output" : salida analizada que se utilizará para calcular las métricas de evaluación. (para la tarea de nombres en clave, este campo está separado en "spymaster_output" y "guesser_output"; hay un campo adicional llamado "hint_word" que se analiza a partir de la salida de spymaster y se inserta en la entrada de Guesser; la métrica de evaluación se calcula en función de " adivinador_salida")
"task data" : datos para la instancia de la tarea actual, por ejemplo, preguntas, respuestas, palabras objetivo, etc.
"usage" : registro de la cantidad de tokens y el costo gastado hasta el momento.
otros campos de configuración que se explican por sí mismos: "modelo", "método", "temperatura", etc.

Citas

Cite el artículo y destaque este repositorio si encuentra este trabajo interesante/útil.

 @article{wang2023unleashing,
  title={Unleashing Cognitive Synergy in Large Language Models: A Task-Solving Agent through Multi-Persona Self-Collaboration},
  author={Wang, Zhenhailong and Mao, Shaoguang and Wu, Wenshan and Ge, Tao and Wei, Furu and Ji, Heng},
  journal={arXiv preprint arXiv:2307.05300},
  year={2023}
}

Expresiones de gratitud

Esta base de código hacía referencia a la estructura del repositorio oficial de Tree-of-thinking. Agradecemos a los autores por sus esfuerzos de código abierto.

Expandir

Información adicional

Versión
Tipo Otro código fuente
Fecha de actualización 2024-11-16
tamaño 50MB
Proviene de Github

Aplicaciones relacionadas

Software de vida canina en solitario

2024-07-31
Juego móvil ARISE de nivelación en solitario

2024-03-25
Caballero solitario

2023-03-23
B3LOG Solo v1.0.0 para MySQL

2022-05-29
Blog de código abierto B3LOG Solo v0.6.7

2022-05-23
B3LOG Solo v1.0.0 para GAE

2022-05-21

Recomendado para ti

chat.petals.dev

Otro código fuente

1.0.0
GPT Prompt Templates

Otro código fuente

1.0.0
GPTyped

Otro código fuente

GPTyped 1.0.5
waymo open dataset

Otro código fuente

December 2023 Update
SmartTube

Otro código fuente

24.71 Stable
Sunamu

Otro código fuente

Release 2.2.0
waymo open dataset

Otro código fuente

December 2023 Update
wp functions

Otras categorias

1.0.0
termwind

Otras categorias

v2.3.0

Información relacionada Todo