Descargar kani - Descargar el código fuente de kani

kani

Otro código fuente

v1.2.3

Descargar

kani

Paquete de prueba

Kani (カニ)

Kani (カニ) es un marco ligero y altamente hackable para modelos de idiomas basados en chat con uso/llamadas de funciones de herramientas.

En comparación con otros marcos de LM, Kani es menos obstinado y ofrece una personalización más de grano fino sobre las partes del flujo de control que importa, lo que lo convierte en la opción perfecta para los investigadores, aficionados y desarrolladores de PNL, tanto.

Kani viene con soporte para los siguientes modelos fuera de la caja, con un marco agnóstico modelo para agregar soporte para muchos más:

Modelos alojados

Operai Models (GPT-3.5-TURBO, GPT-4, GPT-4-TURBO, GPT-4O)
Modelos antrópicos (Claude, Claude Instant)

Modelos de código abierto

Kani admite cada modelo de chat disponible en la cara de abrazo a través de transformers o llama.cpp !

En particular, tenemos implementaciones de referencia para los siguientes modelos base y sus ajustes finos:

Llama 3 (todos los tamaños)
Mistral-7B, MixTral-8x7b y Mixtral-8x22b
Comando R y Comando R+
Gemma (todos los tamaños)
Llama 2 (todos los tamaños)
Vicuna V1.3

¡Vea el zoológico del modelo para ver cómo usar cada uno de estos modelos en su aplicación!

¿Interesado en contribuir? Echa un vistazo a nuestra guía.

¡Lea los documentos en Readthedocs!

¡Lea nuestro artículo sobre Arxiv!

Características

Ligero y de alto nivel : Kani implementa la placa común común para interactuar con los modelos de lenguaje sin obligarlo a usar marcos de inmediato de opinión o herramientas complejas específicas de la biblioteca.
Modelo Agnóstico : Kani proporciona una interfaz simple para implementar: contabilidad de tokens y generación de finalización. Kani permite a los desarrolladores cambiar qué modelo de idioma se ejecuta en el backend sin refactores de código principales.
Gestión automática de la memoria de chat : permita que las sesiones de chat fluyan sin preocuparse por administrar la cantidad de tokens en la historia: Kani se encarga de ello.
FUNCIÓN Llamando con comentarios de modelo y reintento : brinde a los modelos acceso a funciones en una sola línea de código. Kani proporciona elegantemente comentarios sobre parámetros y errores alucinados y permite que el modelo vuelva a intentar las llamadas.
Usted controla las indicaciones : no hay hacks de inmediato ocultos. Nunca decidiremos por usted cómo formatear sus propios datos, a diferencia de otras bibliotecas de modelos de idiomas populares.
Rápido para iterar e intuitivo para aprender , con Kani, solo escribe Python, manejamos el resto.
Diseño asincrónico desde el principio : Kani puede escalar para ejecutar múltiples sesiones de chat en paralelo fácilmente, sin tener que administrar múltiples procesos o programas.

Instalación

Kani requiere Python 3.10 o superior. Para instalar dependencias específicas del modelo, Kani utiliza varios extras (soportes después del nombre de la biblioteca en pip install ). Para determinar qué extra (s) instalar, consulte la tabla de modelos o use los [all] extra para instalar todo.

 # for OpenAI models
$ pip install " kani[openai] "
# for Hugging Face models
$ pip install " kani[huggingface] " torch
# or install everything:
$ pip install " kani[all] "

Para los cambios más actualizados y los nuevos modelos, también puede instalar la versión de desarrollo de la rama main de Git:

$ pip install " kani[all] @ git+https://github.com/zhudotexe/kani.git@main "

Inicio rápido

Kani requiere Python 3.10 o superior.

Primero, instale la biblioteca. En este arranque rápido, usaremos el motor Operai, aunque Kani es agnóstico modelo.

$ pip install " kani[openai] "

Luego, usemos Kani para crear un chatbot simple usando chatgpt como backend.

 # import the library
import asyncio
from kani import Kani , chat_in_terminal
from kani . engines . openai import OpenAIEngine

# Replace this with your OpenAI API key: https://platform.openai.com/account/api-keys
api_key = "sk-..."

# kani uses an Engine to interact with the language model. You can specify other model 
# parameters here, like temperature=0.7.
engine = OpenAIEngine ( api_key , model = "gpt-4o-mini" )

# The kani manages the chat state, prompting, and function calling. Here, we only give 
# it the engine to call ChatGPT, but you can specify other parameters like 
# system_prompt="You are..." here.
ai = Kani ( engine )

# kani comes with a utility to interact with a kani through your terminal...
chat_in_terminal ( ai )


# or you can use kani programmatically in an async function!
async def main ():
    resp = await ai . chat_round ( "What is the airspeed velocity of an unladen swallow?" )
    print ( resp . text )


asyncio . run ( main ())

Kani se toma el tiempo de configurar un modelo de chat de trabajo corto, al tiempo que ofrece al programador una profunda personalización sobre cada llamada de solicitud, función de función e incluso el modelo de lenguaje subyacente.

Funciones llamadas

La llamada de función le da a los modelos de lenguaje la capacidad de elegir cuándo llamar a una función que proporciona en función de su documentación.

Con Kani, puede escribir funciones en Python y exponerlas al modelo con solo una línea de código: el decorador @ai_function .

 # import the library
import asyncio
from typing import Annotated
from kani import AIParam , Kani , ai_function , chat_in_terminal , ChatRole
from kani . engines . openai import OpenAIEngine

# set up the engine as above
api_key = "sk-..."
engine = OpenAIEngine ( api_key , model = "gpt-4o-mini" )


# subclass Kani to add AI functions
class MyKani ( Kani ):
    # Adding the annotation to a method exposes it to the AI
    @ ai_function ()
    def get_weather (
        self ,
        # and you can provide extra documentation about specific parameters
        location : Annotated [ str , AIParam ( desc = "The city and state, e.g. San Francisco, CA" )],
    ):
        """Get the current weather in a given location."""
        # In this example, we mock the return, but you could call a real weather API
        return f"Weather in { location } : Sunny, 72 degrees fahrenheit."


ai = MyKani ( engine )

# the terminal utility allows you to test function calls...
chat_in_terminal ( ai )


# and you can track multiple rounds programmatically.
async def main ():
    async for msg in ai . full_round ( "What's the weather in Tokyo?" ):
        print ( msg . role , msg . text )


asyncio . run ( main ())

Kani garantiza que las llamadas de funciones son válidas para el momento en que llegan a sus métodos al tiempo que le permiten concentrarse en escribir código. Para obtener más información, consulte la función llamando a los documentos.

Transmisión

Kani admite las respuestas de transmisión del modelo de lenguaje subyacente token-by-token, incluso en presencia de llamadas de funciones. La transmisión está diseñada para ser un superconjunto de los métodos chat_round y full_round , lo que le permite refactorizar gradualmente su código sin dejarlo en un estado roto.

 async def stream_chat ():
    stream = ai . chat_round_stream ( "What does kani mean?" )
    async for token in stream :
        print ( token , end = "" )
    print ()
    msg = await stream . message ()  # or `await stream`


async def stream_with_function_calling ():
    async for stream in ai . full_round_stream ( "What's the weather in Tokyo?" ):
        async for token in stream :
            print ( token , end = "" )
        print ()
        msg = await stream . message ()

¿Por qué Kani?

Los marcos existentes para modelos de idiomas como Langchain y Simpleaichat son de peso pesado y/o pesado: editan las indicaciones de los desarrolladores bajo el capó, son difíciles de aprender y son difíciles de personalizar sin agregar una gran cantidad de hinchazón de alto mantenimiento a su base de código.

kani

Construimos Kani como una alternativa más flexible, simple y robusta. Una buena analogía entre los marcos sería decir que Kani es Langchain como frasco (o fastapi) es para Django.

Kani es apropiado para todos, desde investigadores académicos hasta profesionales de la industria y aficionados a usar sin preocuparse por los trucos subterráneos.

Documento

Para obtener más información sobre cómo personalizar a Kani con sus propios envoltorios rápidos, llamar a funciones y más, ¡lea los documentos!

O eche un vistazo a los ejemplos prácticos en este repositorio.

Manifestación

¿Quieres ver a Kani en acción? Usando cuantificación de 4 bits para encoger el modelo, ejecutamos Llama V2 como parte de nuestro conjunto de pruebas directamente en las acciones de GitHub:

https://github.com/zhudotexe/kani/acciones/workflows/pytest.yml?query=Branch%3amain+is%3Asuccess

¡Simplemente haga clic en la última compilación para ver la salida de Llama!

Quien somos

Logotipo de la Universidad de Pensilvania

El equipo de desarrollo principal está hecho de tres estudiantes de doctorado en el Departamento de Informática y Ciencias de la Información de la Universidad de Pensilvania. Todos somos miembros del laboratorio del profesor Chris Callison-Burch, trabajando para avanzar en el futuro de la PNL.

Andrew Zhu comenzó en el otoño de 2022. Sus intereses de investigación incluyen el procesamiento del lenguaje natural, los lenguajes de programación, los sistemas distribuidos y más. También es ingeniero de software de pila, competente en todo tipo de backend, DevOps, base de datos e ingeniería frontend. Andrew se esfuerza por hacer un código idiomático, limpio, de rendimiento y de bajo mantenimiento, filosofías que a menudo son raras en la academia. Su investigación es apoyada por la Beca de Investigación de Graduados de NSF.
Liam Dugan comenzó en el otoño de 2021. Su investigación se centra principalmente en modelos de idiomas grandes y cómo los humanos interactúan con ellos. En particular, está interesado en la detección humana de texto generado y si podemos aplicar esas ideas a los sistemas de detección automáticos. También está interesado en la aplicación práctica de grandes modelos de idiomas a la educación.
Alyssa Hwang comenzó en el otoño de 2020 y es aconsejada por Chris Callison-Burch y Andrew Head. Su investigación se centra en asistentes de IA que comunican efectivamente información compleja, como asistentes de voz que guían a los usuarios a través de instrucciones o audiolibros que permiten a los usuarios navegar sin problemas a través del texto hablado. Más allá de la investigación, Alyssa preside la Asociación de Doctorado de Penn CIS, fundó el Programa de Tutoría de PhD de CIS y fue apoyado por el Programa de Becas de Investigación de Graduados de NSF.

Usamos Kani activamente en nuestra investigación y tenemos el objetivo de mantenerlo actualizado con las prácticas modernas de PNL.

Citación

Si usa Kani, cíquanos como:

 @inproceedings{zhu-etal-2023-kani,
    title = "Kani: A Lightweight and Highly Hackable Framework for Building Language Model Applications",
    author = "Zhu, Andrew  and
      Dugan, Liam  and
      Hwang, Alyssa  and
      Callison-Burch, Chris",
    editor = "Tan, Liling  and
      Milajevs, Dmitrijs  and
      Chauhan, Geeticka  and
      Gwinnup, Jeremy  and
      Rippeth, Elijah",
    booktitle = "Proceedings of the 3rd Workshop for Natural Language Processing Open Source Software (NLP-OSS 2023)",
    month = dec,
    year = "2023",
    address = "Singapore",
    publisher = "Association for Computational Linguistics",
    url = "https://aclanthology.org/2023.nlposs-1.8",
    doi = "10.18653/v1/2023.nlposs-1.8",
    pages = "65--77",
}

Expresiones de gratitud

Nos gustaría agradecer a los miembros del laboratorio de Chris Callison-Burch por sus pruebas y comentarios detallados sobre el contenido de nuestro documento y el repositorio de Kani. Además, nos gustaría agradecer a Henry Zhu (sin relación con el primer autor) por su apoyo temprano y entusiasta del proyecto.

Esta investigación se basa en el trabajo apoyado en parte por el Laboratorio de Investigación de la Fuerza Aérea (Contrato FA8750-23-C-0507), el Programa IARPA Hiatus (Contrato 2022-22072200005) y el NSF (premio 1928631). Aprobado para la liberación pública, distribución ilimitada. Las opiniones y conclusiones contenidas en este documento son las de los autores y no deben interpretarse como necesariamente que representen las políticas oficiales, ya sea expresadas o implícitas, de IARPA, NSF o el gobierno de los Estados Unidos.

Expandir

Información adicional

Versión v1.2.3
Tipo Otro código fuente
Fecha de actualización 2025-03-03
tamaño 12.76MB
Proviene de Github

Aplicaciones relacionadas

waymo open dataset

2024-11-18
Sunamu

2024-12-14
chat.petals.dev

2024-11-30
SmartTube

2024-12-14
MySchedule.py

2024-12-15
viptools for eslam

2024-12-15

Recomendado para ti

chat.petals.dev

Otro código fuente

1.0.0
GPT Prompt Templates

Otro código fuente

1.0.0
GPTyped

Otro código fuente

GPTyped 1.0.5
waymo open dataset

Otro código fuente

December 2023 Update
Sunamu

Otro código fuente

Release 2.2.0
chat.petals.dev

Otro código fuente

1.0.0
waymo open dataset

Otro código fuente

December 2023 Update
termwind

Otras categorias

v2.3.0
wp functions

Otras categorias

1.0.0

Información relacionada Todo