Unduh kani - Unduh Kode Sumber kani

kani

Kode sumber lainnya

v1.2.3

Unduh

Kani

Paket Uji

Kani (カニ)

Kani (カニ) adalah kerangka kerja yang ringan dan sangat dapat diretas untuk model bahasa berbasis obrolan dengan panggilan penggunaan alat/fungsi.

Dibandingkan dengan kerangka kerja LM lainnya, Kani kurang memiliki pendapat dan menawarkan lebih banyak kemampuan kustomisasi berbutir halus atas bagian-bagian dari aliran kontrol yang penting, menjadikannya pilihan yang sempurna bagi para peneliti NLP, hobi, dan pengembang.

Kani hadir dengan dukungan untuk model-model berikut di luar kotak, dengan kerangka kerja model-agnostik untuk menambah dukungan lebih banyak:

Model yang di -host

Model OpenAI (GPT-3.5-Turbo, GPT-4, GPT-4-Turbo, GPT-4O)
Model Antropik (Claude, Claude Instan)

Model Sumber Terbuka

Kani mendukung setiap model obrolan yang tersedia di Face memeluk melalui transformers atau llama.cpp !

Secara khusus, kami memiliki implementasi referensi untuk model dasar berikut, dan fine-tunes mereka:

Llama 3 (semua ukuran)
Mistral-7b, Mixtral-8x7b, dan Mixtral-8x22b
Perintah R dan Perintah R+
Gemma (semua ukuran)
Llama 2 (semua ukuran)
Vicuna v1.3

Lihat Model Zoo untuk melihat cara menggunakan masing -masing model ini di aplikasi Anda!

Tertarik berkontribusi? Lihat panduan kami.

Baca dokumen di readthedocs!

Baca makalah kami di Arxiv!

Fitur

KANI yang ringan dan tingkat tinggi mengimplementasikan boilerplate umum untuk berinteraksi dengan model bahasa tanpa memaksa Anda untuk menggunakan kerangka kerja cepat yang opinial atau alat khusus perpustakaan yang kompleks.
Model Agnostik - Kani menyediakan antarmuka sederhana untuk diterapkan: penghitungan token dan pembuatan penyelesaian. Kani memungkinkan pengembang beralih model bahasa mana yang berjalan di backend tanpa refactor kode utama.
Manajemen Memori Obrolan Otomatis - Izinkan sesi obrolan mengalir tanpa khawatir mengelola jumlah token dalam sejarah - Kani mengurusnya.
Panggilan fungsi dengan umpan balik model dan coba lagi - berikan model akses ke fungsi hanya dalam satu baris kode. Kani secara elegan memberikan umpan balik tentang parameter dan kesalahan yang halusinasi dan memungkinkan model untuk mencoba lagi panggilan.
Anda mengontrol petunjuknya - tidak ada peretasan prompt tersembunyi. Kami tidak akan pernah memutuskan untuk memformat data Anda sendiri, tidak seperti perpustakaan model bahasa populer lainnya.
Cepat ke iterate dan intuitif untuk dipelajari - dengan Kani, Anda hanya menulis ular python - kami menangani sisanya.
Desain asinkron dari awal - Kani dapat skala untuk menjalankan beberapa sesi obrolan secara paralel dengan mudah, tanpa harus mengelola beberapa proses atau program.

Instalasi

Kani membutuhkan Python 3.10 atau lebih. Untuk menginstal ketergantungan model-spesifik, Kani menggunakan berbagai tambahan (braket setelah nama perpustakaan di pip install ). Untuk menentukan ekstra mana yang akan diinstal, lihat tabel model, atau gunakan ekstra [all] untuk menginstal semuanya.

 # for OpenAI models
$ pip install " kani[openai] "
# for Hugging Face models
$ pip install " kani[huggingface] " torch
# or install everything:
$ pip install " kani[all] "

Untuk perubahan terbaru dan model baru, Anda juga dapat menginstal versi pengembangan dari cabang main Git:

$ pip install " kani[all] @ git+https://github.com/zhudotexe/kani.git@main "

QuickStart

Kani membutuhkan Python 3.10 atau lebih.

Pertama, instal perpustakaan. Di quickstart ini, kami akan menggunakan mesin OpenAI, meskipun Kani adalah model-agnostik.

$ pip install " kani[openai] "

Kemudian, mari kita gunakan Kani untuk membuat chatbot sederhana menggunakan chatgpt sebagai backend.

 # import the library
import asyncio
from kani import Kani , chat_in_terminal
from kani . engines . openai import OpenAIEngine

# Replace this with your OpenAI API key: https://platform.openai.com/account/api-keys
api_key = "sk-..."

# kani uses an Engine to interact with the language model. You can specify other model 
# parameters here, like temperature=0.7.
engine = OpenAIEngine ( api_key , model = "gpt-4o-mini" )

# The kani manages the chat state, prompting, and function calling. Here, we only give 
# it the engine to call ChatGPT, but you can specify other parameters like 
# system_prompt="You are..." here.
ai = Kani ( engine )

# kani comes with a utility to interact with a kani through your terminal...
chat_in_terminal ( ai )


# or you can use kani programmatically in an async function!
async def main ():
    resp = await ai . chat_round ( "What is the airspeed velocity of an unladen swallow?" )
    print ( resp . text )


asyncio . run ( main ())

Kani menyediakan waktu untuk mengatur model obrolan yang berfungsi pendek, sambil menawarkan promosi yang mendalam pada setiap prompt, panggilan fungsi, dan bahkan model bahasa yang mendasarinya.

Panggilan fungsi

Panggilan fungsi memberikan model bahasa kemampuan untuk memilih kapan harus memanggil fungsi yang Anda berikan berdasarkan dokumentasinya.

Dengan Kani, Anda dapat menulis fungsi di Python dan mengeksposnya ke model hanya dengan satu baris kode: dekorator @ai_function .

 # import the library
import asyncio
from typing import Annotated
from kani import AIParam , Kani , ai_function , chat_in_terminal , ChatRole
from kani . engines . openai import OpenAIEngine

# set up the engine as above
api_key = "sk-..."
engine = OpenAIEngine ( api_key , model = "gpt-4o-mini" )


# subclass Kani to add AI functions
class MyKani ( Kani ):
    # Adding the annotation to a method exposes it to the AI
    @ ai_function ()
    def get_weather (
        self ,
        # and you can provide extra documentation about specific parameters
        location : Annotated [ str , AIParam ( desc = "The city and state, e.g. San Francisco, CA" )],
    ):
        """Get the current weather in a given location."""
        # In this example, we mock the return, but you could call a real weather API
        return f"Weather in { location } : Sunny, 72 degrees fahrenheit."


ai = MyKani ( engine )

# the terminal utility allows you to test function calls...
chat_in_terminal ( ai )


# and you can track multiple rounds programmatically.
async def main ():
    async for msg in ai . full_round ( "What's the weather in Tokyo?" ):
        print ( msg . role , msg . text )


asyncio . run ( main ())

Kani menjamin bahwa panggilan fungsi valid pada saat mereka mencapai metode Anda sambil memungkinkan Anda untuk fokus pada kode penulisan. Untuk informasi lebih lanjut, periksa fungsi dokumen yang menelepon.

Mengalir

Kani mendukung respons streaming dari model bahasa yang mendasari token-by-token, bahkan dengan adanya panggilan fungsi. Streaming dirancang untuk menjadi superset drop-in dari metode chat_round dan full_round , memungkinkan Anda untuk secara bertahap refactor kode Anda tanpa pernah meninggalkannya dalam keadaan rusak.

 async def stream_chat ():
    stream = ai . chat_round_stream ( "What does kani mean?" )
    async for token in stream :
        print ( token , end = "" )
    print ()
    msg = await stream . message ()  # or `await stream`


async def stream_with_function_calling ():
    async for stream in ai . full_round_stream ( "What's the weather in Tokyo?" ):
        async for token in stream :
            print ( token , end = "" )
        print ()
        msg = await stream . message ()

Mengapa Kani?

Kerangka kerja yang ada untuk model bahasa seperti Langchain dan SimpleAichat memiliki pendapat dan/atau kelas berat - mereka mengedit petunjuk pengembang di bawah kap, menantang untuk dipelajari, dan sulit untuk disesuaikan tanpa menambahkan banyak pemeliharaan tinggi yang mementingkan basis kode Anda.

Kani

Kami membangun Kani sebagai alternatif yang lebih fleksibel, sederhana, dan kuat. Analogi yang baik antara kerangka kerja adalah dengan mengatakan bahwa Kani adalah dengan langchain sebagai labu (atau Fastapi) adalah untuk Django.

Kani cocok untuk semua orang dari peneliti akademik hingga profesional industri hingga penggemar untuk digunakan tanpa khawatir tentang peretasan di bawah-rumah.

Dokumen

Untuk mempelajari lebih lanjut tentang cara menyesuaikan Kani dengan pembungkus prompt Anda sendiri, panggilan fungsi, dan banyak lagi, baca dokumen!

Atau lihat contoh langsung dalam repo ini.

Demo

Ingin melihat Kani beraksi? Menggunakan kuantisasi 4-bit untuk mengecilkan model, kami menjalankan llama v2 sebagai bagian dari suite test kami tepat pada tindakan github:

https://github.com/zhudotexe/kani/actions/workflows/pytest.yml?Query=Branch%3Amain+is%3asuccess

Cukup klik build terbaru untuk melihat output Llama!

Siapa kita

Logo Universitas Pennsylvania

Tim pengembangan inti terbuat dari tiga mahasiswa PhD di Departemen Komputer dan Ilmu Informasi di University of Pennsylvania. Kita semua anggota laboratorium Prof. Chris Callison-Burch, berupaya memajukan masa depan NLP.

Andrew Zhu mulai pada musim gugur 2022. Minat penelitiannya meliputi pemrosesan bahasa alami, bahasa pemrograman, sistem terdistribusi, dan banyak lagi. Dia juga seorang insinyur perangkat lunak tumpukan penuh, mahir dalam segala macam backend, devops, basis data, dan rekayasa frontend. Andrew berusaha untuk membuat kode idiomatik, bersih, performan, dan pemeliharaan rendah-filosofi yang sering jarang di dunia akademis. Penelitiannya didukung oleh NSF Graduate Research Fellowship.
Liam Dugan mulai pada musim gugur 2021. Penelitiannya berfokus terutama pada model bahasa besar dan bagaimana manusia berinteraksi dengan mereka. Secara khusus, ia tertarik pada deteksi manusia pada teks yang dihasilkan dan apakah kita dapat menerapkan wawasan itu pada sistem deteksi otomatis. Dia juga tertarik pada aplikasi praktis model bahasa besar untuk pendidikan.
Alyssa Hwang dimulai pada musim gugur 2020 dan disarankan oleh Chris Callison-Burch dan Andrew Head. Penelitiannya berfokus pada asisten AI yang secara efektif mengkomunikasikan informasi yang kompleks, seperti asisten suara yang memandu pengguna melalui instruksi atau buku audio yang memungkinkan pengguna untuk bernavigasi dengan mulus melalui teks lisan. Di luar penelitian, Alyssa mengetuai Asosiasi Doktor Penn Cis, mendirikan Program Bimbingan CIS PhD, dan didukung oleh Program Fellowship Penelitian Pascasarjana NSF.

Kami menggunakan Kani secara aktif dalam penelitian kami, dan bertujuan untuk memperbarui dengan praktik NLP modern.

Kutipan

Jika Anda menggunakan Kani, silakan mengutip kami sebagai:

 @inproceedings{zhu-etal-2023-kani,
    title = "Kani: A Lightweight and Highly Hackable Framework for Building Language Model Applications",
    author = "Zhu, Andrew  and
      Dugan, Liam  and
      Hwang, Alyssa  and
      Callison-Burch, Chris",
    editor = "Tan, Liling  and
      Milajevs, Dmitrijs  and
      Chauhan, Geeticka  and
      Gwinnup, Jeremy  and
      Rippeth, Elijah",
    booktitle = "Proceedings of the 3rd Workshop for Natural Language Processing Open Source Software (NLP-OSS 2023)",
    month = dec,
    year = "2023",
    address = "Singapore",
    publisher = "Association for Computational Linguistics",
    url = "https://aclanthology.org/2023.nlposs-1.8",
    doi = "10.18653/v1/2023.nlposs-1.8",
    pages = "65--77",
}

Ucapan Terima Kasih

Kami ingin mengucapkan terima kasih kepada anggota lab Chris Callison-Burch atas pengujian mereka dan umpan balik terperinci tentang isi makalah kami dan repositori Kani. Selain itu, kami ingin mengucapkan terima kasih kepada Henry Zhu (tidak ada hubungannya dengan penulis pertama) atas dukungan awal dan antusiasnya dari proyek tersebut.

Penelitian ini didasarkan pada pekerjaan yang didukung sebagian oleh Laboratorium Penelitian Angkatan Udara (Kontrak FA8750-23-C-0507), Program Hiatus IARPA (Kontrak 2022-22072200005), dan NSF (penghargaan 1928631). Disetujui untuk rilis publik, Distribution Unlimited. Pandangan dan kesimpulan yang terkandung di sini adalah pandangan penulis dan tidak boleh ditafsirkan sebagai harus mewakili kebijakan resmi, baik diungkapkan maupun tersirat, dari IARPA, NSF, atau pemerintah AS.

Memperluas

Informasi Tambahan

Versi v1.2.3
Tipe Kode sumber lainnya
Waktu Pembaruan 2025-03-03
ukuran 12.76MB
Berasal dari Github

Aplikasi Terkait

waymo open dataset

2024-11-18
Sunamu

2024-12-14
chat.petals.dev

2024-11-30
SmartTube

2024-12-14
MySchedule.py

2024-12-15
viptools for eslam

2024-12-15

Direkomendasikan untuk Anda

chat.petals.dev

Kode sumber lainnya

1.0.0
GPT Prompt Templates

Kode sumber lainnya

1.0.0
GPTyped

Kode sumber lainnya

GPTyped 1.0.5
waymo open dataset

Kode sumber lainnya

December 2023 Update
Sunamu

Kode sumber lainnya

Release 2.2.0
chat.petals.dev

Kode sumber lainnya

1.0.0
waymo open dataset

Kode sumber lainnya

December 2023 Update
termwind

Kategori lainnya

v2.3.0
wp functions

Kategori lainnya

1.0.0

Informasi Terkait Semua