kaniダウンロードkaniソースコードのダウンロード

kani

その他のソースコード

v1.2.3

ダウンロード

テストパッケージ

カニ（カニ）

Kani（カニ）は、ツールの使用/関数呼び出しを備えたチャットベースの言語モデル向けの軽量で高度にハッキング可能なフレームワークです。

他のLMフレームワークと比較して、Kaniは意見を述べておらず、重要なコントロールフローの部分に対してより微調整されたカスタマイズ可能性を提供し、NLPの研究者、愛好家、開発者にとっても最適です。

Kaniには、次のモデルのサポートが箱から出され、さらに多くのサポートを追加するためのモデルに依存しないフレームワークが付属しています。

ホストモデル

OpenAIモデル（GPT-3.5-Turbo、GPT-4、GPT-4-TURBO、GPT-4O）
人類モデル（クロード、クロードインスタント）

オープンソースモデル

Kaniは、 transformersまたはllama.cppを介して顔を抱き締めることで利用できるすべてのチャットモデルをサポートしています！

特に、次のベースモデルの参照実装とそれらの微調整があります。

llama3（すべてのサイズ）
Mistral-7B、Mixtral-8x7b、およびMixtral-8x22b
コマンドrおよびコマンドr+
ジェマ（すべてサイズ）
llama2（すべてのサイズ）
Vicuna v1.3

モデル動物園をチェックして、アプリケーションでこれらの各モデルを使用する方法を確認してください！

貢献に興味がありますか？ガイドをご覧ください。

readthedocsのドキュメントを読んでください！

Arxivに関する論文を読んでください！

特徴

軽量で高レベル-Kaniは、意見のある迅速なフレームワークや複雑なライブラリ固有のツーリングを使用することなく、言語モデルとのインターフェースに共通のボイラープレートを実装します。
Model Agnostic -Kaniは、実装するシンプルなインターフェイスを提供します：トークンカウントと完了生成。 Kaniは、開発者が主要なコードリファクタルなしでバックエンドで実行される言語モデルを切り替えることができます。
自動チャットメモリ管理- 歴史のトークンの数を管理することを心配することなく、チャットセッションが流れるようにします - カニはそれを処理します。
モデルフィードバックと再試行を使用した関数呼び出し- 1行のコードのみで機能へのモデルアクセスを提供します。 Kaniは、幻覚パラメーターとエラーに関するフィードバックをエレガントに提供し、モデルが呼び出しを再試行できるようにします。
プロンプトを制御します- 隠されたプロンプトハッキングはありません。他の人気のある言語モデルライブラリとは異なり、独自のデータをフォーマットする方法を決定することはありません。
速く反復し、直感的に学習します- Kaniを使用すると、Pythonのみを書きます - 残りを処理します。
非同期設計最初から- カニは、複数のプロセスやプログラムを管理することなく、簡単に並行して複数のチャットセッションを実行するようにスケーリングできます。

インストール

KaniにはPython 3.10以上が必要です。モデル固有の依存関係をインストールするために、Kaniはさまざまなエクストラ（ pip installのライブラリ名の後のブラケット）を使用します。インストールする余分な（s）を決定するには、モデルテーブルを参照するか、すべてをインストールするために[all]追加を使用します。

 # for OpenAI models
$ pip install " kani[openai] "
# for Hugging Face models
$ pip install " kani[huggingface] " torch
# or install everything:
$ pip install " kani[all] "

最新の変更と新しいモデルについては、Gitのmainブランチから開発バージョンをインストールすることもできます。

$ pip install " kani[all] @ git+https://github.com/zhudotexe/kani.git@main "

クイックスタート

KaniにはPython 3.10以上が必要です。

まず、ライブラリをインストールします。このQuickStartでは、Kaniはモデルに依存していますが、Openaiエンジンを使用します。

$ pip install " kani[openai] "

次に、Kaniを使用して、ChatGPTをバックエンドとして使用してシンプルなチャットボットを作成しましょう。

 # import the library
import asyncio
from kani import Kani , chat_in_terminal
from kani . engines . openai import OpenAIEngine

# Replace this with your OpenAI API key: https://platform.openai.com/account/api-keys
api_key = "sk-..."

# kani uses an Engine to interact with the language model. You can specify other model 
# parameters here, like temperature=0.7.
engine = OpenAIEngine ( api_key , model = "gpt-4o-mini" )

# The kani manages the chat state, prompting, and function calling. Here, we only give 
# it the engine to call ChatGPT, but you can specify other parameters like 
# system_prompt="You are..." here.
ai = Kani ( engine )

# kani comes with a utility to interact with a kani through your terminal...
chat_in_terminal ( ai )


# or you can use kani programmatically in an async function!
async def main ():
    resp = await ai . chat_round ( "What is the airspeed velocity of an unladen swallow?" )
    print ( resp . text )


asyncio . run ( main ())

Kaniは、作業チャットモデルを短く設定する時間を作成し、プログラマーにすべてのプロンプト、機能コール、さらには基礎となる言語モデルで深いカスタマイズ可能性を提供します。

関数呼び出し

関数呼び出しにより、言語モデルは、ドキュメントに基づいて提供する関数を呼び出すときを選択する機能を提供します。

Kaniを使用すると、Pythonで関数を書き込み、1つのコードのみでモデルに公開できます： @ai_function Decrator。

 # import the library
import asyncio
from typing import Annotated
from kani import AIParam , Kani , ai_function , chat_in_terminal , ChatRole
from kani . engines . openai import OpenAIEngine

# set up the engine as above
api_key = "sk-..."
engine = OpenAIEngine ( api_key , model = "gpt-4o-mini" )


# subclass Kani to add AI functions
class MyKani ( Kani ):
    # Adding the annotation to a method exposes it to the AI
    @ ai_function ()
    def get_weather (
        self ,
        # and you can provide extra documentation about specific parameters
        location : Annotated [ str , AIParam ( desc = "The city and state, e.g. San Francisco, CA" )],
    ):
        """Get the current weather in a given location."""
        # In this example, we mock the return, but you could call a real weather API
        return f"Weather in { location } : Sunny, 72 degrees fahrenheit."


ai = MyKani ( engine )

# the terminal utility allows you to test function calls...
chat_in_terminal ( ai )


# and you can track multiple rounds programmatically.
async def main ():
    async for msg in ai . full_round ( "What's the weather in Tokyo?" ):
        print ( msg . role , msg . text )


asyncio . run ( main ())

Kaniは、コードの作成に集中できるようにしながら、メソッドに到達するまでに関数呼び出しが有効であることを保証します。詳細については、docsを呼び出す関数をご覧ください。

ストリーミング

Kaniは、関数呼び出しが存在する場合でも、基礎となる言語モデルトークンごとのストリーミング応答をサポートしています。ストリーミングは、 chat_roundおよびfull_roundメソッドのドロップインスーパーセットになるように設計されており、コードを壊れた状態にしておくことなく徐々にリファクタリングできます。

 async def stream_chat ():
    stream = ai . chat_round_stream ( "What does kani mean?" )
    async for token in stream :
        print ( token , end = "" )
    print ()
    msg = await stream . message ()  # or `await stream`


async def stream_with_function_calling ():
    async for stream in ai . full_round_stream ( "What's the weather in Tokyo?" ):
        async for token in stream :
            print ( token , end = "" )
        print ()
        msg = await stream . message ()

なぜカニ？

LangchainやSimpleaichatなどの言語モデルの既存のフレームワークは、意見を述べたり、ヘビー級です。彼らは、ボンネットの下で開発者のプロンプトを編集し、学習するのが難しく、コードベースに多くのメンテナンスの膨張を追加せずにカスタマイズすることが困難です。

私たちは、より柔軟でシンプルで堅牢な代替品としてKaniを構築しました。フレームワーク間の良い類似性は、フラスコ（またはFastapi）がDjangoにあるので、KaniがLangchainであると言うことです。

Kaniは、学術研究者から業界の専門家、愛好家まで、フード下のハッキングを心配することなく使用するために使用するために、すべての人に適しています。

ドキュメント

独自の迅速なラッパー、機能呼び出しなどでKaniをカスタマイズする方法の詳細については、ドキュメントをお読みください！

または、このリポジトリの実践的な例をご覧ください。

デモ

カニが動作しているのを見たいですか？ 4ビットの量子化を使用してモデルを縮小すると、GitHubアクションでテストスイートの一部としてLlama V2を実行します。

https://github.com/zhudotexe/kani/actions/workflows/pytest.yml?query=branch%3amain+is%3asuccess

最新のビルドをクリックして、Llamaの出力を確認してください！

私たちは誰ですか

ペンシルベニア大学ロゴ

コア開発チームは、ペンシルベニア大学のコンピューター情報科学部の3人の博士課程学生で作られています。私たちは皆、Chris Callison-Burch教授の研究室のメンバーであり、NLPの未来を前進させることに取り組んでいます。

Andrew Zhuは2022年秋に開始されました。彼の研究対象には、自然言語処理、プログラミング言語、分散システムなどが含まれます。彼はまた、あらゆる種類のバックエンド、DevOps、データベース、およびFrontend Engineeringに熟練したフルスタックソフトウェアエンジニアでもあります。アンドリューは、慣用性、清潔、パフォーマンス、メンテナンスの低いコードを作るよう努めています。彼の研究は、NSF大学院研究フェローシップによってサポートされています。
リアム・デュガンは2021年秋に始まりました。彼の研究は、主に大規模な言語モデルと人間との相互作用に焦点を当てています。特に、彼は生成されたテキストの人間の検出と、それらの洞察を自動検出システムに適用できるかどうかに興味があります。彼はまた、教育への大規模な言語モデルの実際の応用にも興味があります。
Alyssa Hwangは2020年秋に始まり、Chris Callison-BurchとAndrew Headからアドバイスを受けています。彼女の研究は、ユーザーが指示やオーディオブックを介してユーザーをガイドする音声アシスタントなど、複雑な情報を効果的に伝達するAIアシスタントに焦点を当てており、ユーザーが話し言葉をシームレスにナビゲートできるようにします。 Alyssaは研究を超えて、Penn CIS博士協会の議長を務め、CIS PhDメンターシッププログラムを設立し、NSF大学院研究フェローシッププログラムによってサポートされました。

私たちは私たちの研究で積極的にKaniを使用しており、最新のNLPプラクティスを最新の状態に保つことを目指しています。

引用

Kaniを使用している場合は、次のように引用してください。

 @inproceedings{zhu-etal-2023-kani,
    title = "Kani: A Lightweight and Highly Hackable Framework for Building Language Model Applications",
    author = "Zhu, Andrew  and
      Dugan, Liam  and
      Hwang, Alyssa  and
      Callison-Burch, Chris",
    editor = "Tan, Liling  and
      Milajevs, Dmitrijs  and
      Chauhan, Geeticka  and
      Gwinnup, Jeremy  and
      Rippeth, Elijah",
    booktitle = "Proceedings of the 3rd Workshop for Natural Language Processing Open Source Software (NLP-OSS 2023)",
    month = dec,
    year = "2023",
    address = "Singapore",
    publisher = "Association for Computational Linguistics",
    url = "https://aclanthology.org/2023.nlposs-1.8",
    doi = "10.18653/v1/2023.nlposs-1.8",
    pages = "65--77",
}

謝辞

Chris Callison-Burchのラボのメンバーに、テストと、私たちの論文とKaniリポジトリの両方の内容に関する詳細なフィードバックに感謝します。さらに、プロジェクトの初期かつ熱狂的なサポートについて、ヘンリーズー（最初の著者とは関係ありません）に感謝したいと思います。

この研究は、空軍研究所（契約FA8750-23-C-0507）、IARPA HIATUSプログラム（契約2022-220722200005）、およびNSF（賞1928631）によって部分的にサポートされている作業に基づいています。パブリックリリース、Distribution Unlimitedが承認されました。本明細書に含まれる見解と結論は著者の見解であり、IARPA、NSF、または米国政府の表明または黙示のいずれかの公式政策を必ずしも表現するものとして解釈されるべきではない。

拡大する

追加情報