StableCode の大規模モデルは、人工知能アルゴリズムとアプリケーションの開発と実装に特に使用されるツールであり、複数の深層学習フレームワーク上で実行でき、画像分類、ターゲット検出、セマンティック セグメンテーションなどのタスクに適しています。
Stability AI は、Stable Diffusion テキスト生成画像モデルで最もよく知られていますが、同社が現在、コード生成にも手を広げているため、関心のある分野はそれだけではありません。本日、Stability AI は、新しいオープン ラージ言語モデル (LLM) StableCode をリリースしました。これは、ユーザーがプログラミング言語コードを生成できるように設計されており、トランスフォーマー ニューラル ネットワークに基づいています。
StableCode は、一般的な使用のための基本モデル、命令モデル、および最大 16,000 のトークンをサポートできる長いコンテキスト ウィンドウ モデルの 3 つの異なるレベルを提供します。
StableCode モデルは、オープンソース BigCode プロジェクトの初期プログラミング言語データ セットの恩恵を受けており、Stability AI による追加のフィルタリングと微調整も受けて、最初は Python、Go、Java などのプログラミング言語での開発をサポートします。 、JavaScript、C、マークダウン、C++。
LLM のトレーニングはデータに依存しており、StableCode のデータは BigCode プロジェクトから取得されます。 HuggingFace と ServiceNow も 5 月に BigCode に基づいたオープン StarCoder LLM を開始しました。 Stability AI の主任研究員である Nathan Cooper 氏は、StableCode のトレーニングには BigCode データの大規模なフィルタリングとクリーニングが含まれると述べました。
StableCode の長いコンテキスト ウィンドウには 16,000 トークンのコンテキスト ウィンドウがあり、Stability AI はこれが他のどのモデルよりも大きいと主張しています。これは、ユーザーが StableCode にメディアを表示できることを意味します。新しいコードの理解と生成に役立つ複数のファイルを含む -size のコード ベース。
StableCode はまだ初期段階にあり、現在の公式目標は、開発者がこのモデルをどのように受け入れ、使用するかを確認することです。