Downcodes の編集者は次のように報告しました。Baichuan Intelligence は天津大学と協力して、Sibyl System と呼ばれるエージェント フレームワークを開発しました。このフレームワークは、Meta、Huggingface、AutoGPT が共同で立ち上げた GAIA Leader Board の評価で 1 位を獲得しました。 GAIA の評価は、複雑なタスクにおけるエージェントの実行能力とソリューション設計の評価に焦点を当てており、現実世界のアプリケーション シナリオに近い質問をテストし、AI モデルに非常に高い課題を提示します。この成果は、複雑なタスク処理の分野における中国の AI 技術における大きな進歩を示しています。
Baichuan Intelligence は天津大学と協力して Sibyl System インテリジェント エージェント フレームワークを立ち上げ、GAIA リーダーボードで 1 位を獲得しました。 GAIA は、2023 年 11 月に Meta、Huggingface、AutoGPT によって提案された新しい評価スキームです。主に、複雑なタスクを実行する際のエージェントの能力とソリューションを評価します。この評価計画は、既存のモデルの機能の欠陥を明らかにし、モデルとエージェントの開発に改善の方向性を提供します。
GAIA のテスト問題は現実世界に近く、AI には推論、マルチモーダル理解 (テキスト、画像、オーディオ/ビデオ)、Web ブラウジング、およびツールの使用能力が求められます。これらの質問は人間にとって理解するのは難しくありませんが、モデルにとっては非常に困難です。たとえば、GPT-4 のテスト成功率はわずか 15% でしたが、人体実験者は 92% を達成できました。これらの問題を完了するには、多くの場合、複数の手順とツールを必要とする長い論理リンクと時間が必要になります。
Sibyl System フレームワークの設計機能には次のものが含まれます。
人間のようなブラウザ インターフェイスの置き換え検索強化の生成。
ステートレスな質問と回答機能を使用して、システム アーキテクチャを簡素化することで、対話を質問と回答に置き換えます。
専用ツールへの依存を減らすために、Web ブラウザと Python 環境という 2 つの一般的なツールのみを使用します。
System1からSystem2では、マルチエージェントによる議論を通じて自己批判と修正を行い、グローバルワークスペースの情報を活用して回答の精度を高める「陪審」の仕組みが導入されています。
Sibyl System は、大規模な言語モデルに基づいたシンプルかつ強力なエージェント フレームワークで、少数のツールを使用して複雑な推論の問題を解決できます。グローバル ワークスペースとマルチエージェント メカニズム、およびブラウザベースのユニバーサル情報取得チャネルを導入することでシステムの複雑さを軽減しながら、問題解決の複雑さを拡大し、「速い思考」から「遅い思考」へのモデルの変換を実現します。 。また、Sibyl System は拡張性が高く、デバッグが容易なので、他のモデルのエージェント モジュールを簡単に置き換えて、モデルの機能を向上させることができます。
技術レポート: https://arxiv.org/pdf/2407.10718
シビュラ システム フレームワークの成功は、人工知能の分野におけるバイチュアン インテリジェンスと天津大学の強力な強みを証明するだけでなく、将来のインテリジェント エージェント フレームワークの設計と開発に貴重な経験と参考資料を提供します。近い将来、シビュラシステムのフレームワークに基づいた革新的なアプリケーションがさらに登場し、人工知能技術の発展がより深いレベルで促進されると私は信じています。