私たちのアプローチが Agent as Graph と異なる点は、Agent システムがグラフで表されるプロセスではなく、そのプロセスから分離されたグラフ データ (グラフ プログラム) 構造を読み書きおよび実行できるインタプリタであるという事実です。エージェントがグラフ プログラム (他のデータと同様) を実行、読み取り、変更することで学習できるようにすることで、本質的に HybridAGI は Cypher 言語を中心とした自己プログラミング システムとなることを目的としています。これは、神経記号プログラミング、プログラム合成、記号 AI を中心とした、すぐに実稼働可能な研究プロジェクトです。
Turing Complete DSL : HybridAGI の Turing Complete ドメイン固有言語 (DSL) は、4 つの異なるタイプのノード (制御、アクション、決定、プログラム) のみを使用して無限の数のアルゴリズムを記述するように特別に設計されています。インタプリタ エージェントは、従来のプログラミング言語と同様に、サブプログラムをループして呼び出すことができます。
グラフ プログラムの検索と動的呼び出し: 私たちのエージェント システムは静的な有限状態マシンではなく、グラフベースの DSL をノードごとに解釈するインタープリターであるため、プログラムをメモリ内で検索し、ユーザーのクエリを解決するために最適なプログラムを動的に呼び出すことができます。
最適化可能なパイプラインとエージェント: HybridAGI と DSPy を使用すると、データ処理パイプラインとエージェント システムを独自のニーズに合わせて最適化できます。各 HybridAGI モジュールは DSPy モジュールでもあるため、DSPy オプティマイザーをシームレスに使用できます。
ソフトウェアとしてのエージェントの動作: HybridAGI を使用すると、エージェントの動作を Cypher ソフトウェアとして出荷でき、スタートアップ企業や企業が Cypher に実装されたビジネス ロジックに基づいて独自の IP を作成できるようになります。
メモリ中心のシステム: HybridAGI は、プログラムの実行と構造化された知識の保存の両方にナレッジ グラフを多用するメモリ中心のシステムです。これにより、重要なドメインに対して Knowledge Graph RAG アプリケーションが有効になります。
セキュアで安全: 暗号インジェクションを防止するだけでなく、保護されたプログラムの概念を導入することによってエージェント システムが独自の主要なプロンプト メカニズムを変更することを防止するために特別な注意が払われています。
予測可能/決定的な動作と無限数のツール: エージェントに使用するツールの順序を選択させないため、無限数のツールを使用できます。グラフ プログラムに従うことで、エージェント システムの予測可能かつ決定的な方法論が保証されます。対応するツールを無制限に使用することで、すべてのメモリ システムを 1 つの固有のエージェントに結合できます。
HybridAGI は、グラフベースのプロンプト プログラミングアプローチを使用して動作を定義できる、最初のプログラム可能な LLM ベースのエージェントです。エージェントを高度なチャットボットとみなす他のフレームワークとは異なり、コンピューター科学、認知科学、シンボリック AI に根ざした方法論を採用しています。
私たちにとって、エージェント システムは、自然言語を処理し、実行するようにプログラムされたタスクを実行できる、目標指向型の認知ソフトウェアです。従来のソフトウェアと同様に、開発者がアプリケーションの動作を指定しますが、システムはそのようにプログラムされていない限り、真に自律的ではありません。システムのプログラミングは、エージェントがタスクを実行するのに役立つだけでなく、開発者の意図を形式化することも可能にします。
HybridAGI は、データ サイエンティスト、プロンプト エンジニア、研究者、AI の実験が好きな AI 愛好家向けに設計されています。これは、AI の自律性ではなく人間の創造性に焦点を当てた「Build Yourself」製品です。
HybridAGI を簡単にインストールするには、次のコマンドで pip を使用することをお勧めします。
pip install hybridagi
システムをさらに詳しく調べたい場合、またはプロジェクトに貢献したい場合は、次のコマンドを使用してソースから HybridAGI をインストールできます。
git clone https://github.com/SynaLinks/HybridAGI
cd HybridAGI
pip install .
ここには React Agent はありません。私たちが提供する唯一のエージェント システムは、メモリ内にあるグラフ プログラムをノードごとに実行するという厳密な方法論に従うカスタムグラフ インタープリタ エージェントです。計画をシンボリック コンポーネントにオフロードすることでエージェントの動作をエンドツーエンドで制御するため、システムの動作を簡単に修正/強化でき、微調整の必要性がなくなり、システムがオンザフライで学習できるようになります。
HybridAGI は、信頼性の高いロボット システムの作成における長年の経験に基づいて構築されています。当社は、ロボティクス、シンボリック AI、LLM、認知科学の知識をプログラマー、データ サイエンティスト、AI エンジニア向けの製品に統合しました。エージェント システムの長期メモリでは、グラフ プログラムだけでなく、構造化知識と非構造化知識を保存するためにグラフが多用されています。
当社は、Cypher Graph データベースを中心に LLM アプリケーションを構築するためのすべてを提供します。また、統合のいずれかを使用してアプリケーションを拡張する前に、ラピッド プロトタイピング用のローカル データベースも提供します。
HybridAGI を使用すると、データ抽出パイプライン、RAG アプリケーション、または高度なエージェント システムを構築でき、それぞれが DSPy オプティマイザーを使用して最適化される可能性があります。また、プロトタイピングを容易にする既製のモジュールとメトリクスも提供しています。
各モジュールとデータ型は厳密に型指定されており、データ検証レイヤーとして Pydantic を使用します。 Keras や HuggingFace のようにモジュールを順番に積み重ねることで、すぐにパイプラインを構築できます。
メモリ システムに読み書きしたり、エージェントの状態を変更したりするためのネイティブ ツールの次のリストが提供されています。
ツール名 | 使用法 |
---|---|
Predict | コンテキストに推論情報を入力するために使用されます |
ChainOfThought | コンテキストに推論情報を入力するために使用されます |
Speak | ユーザーにメッセージを送信し、最終的な回答を与えるために使用されます |
AskUser | ユーザーに質問するために使用されます (ユーザーのペルソナをシミュレートできます) |
UpdateObjective | エージェントの長期目標を更新する |
AddDocument | 新しいドキュメントをメモリに保存する |
AddFact | 新しい事実を記憶に保存する |
AddGraphProgram | 新しいプログラムをメモリに保存します (既存の場合は上書きします) |
DocumentSearch | ドキュメントメモリ内の情報を検索するために使用されます |
PastActionSearch | 過去のアクションをトレース メモリに検索するために使用されます。 |
EntitySearch | ファクトメモリ内のエンティティを検索するために使用されます |
FactSearch | ファクトメモリ内でファクトを検索するために使用されます |
GraphProgramSearch | グラフプログラムをプログラムメモリ内で検索するために使用されます。 |
ReadGraphProgram | メモリからグラフ プログラムを名前で読み取るために使用されます。 |
CallGraphProgram | グラフ プログラムを名前でメモリから動的に呼び出すために使用されます。 |
FunctionTool
と、最近の関数呼び出しのような Python 関数を使用して、さらにツールを追加できます。
さらなるデータベース統合のための貢献を受け付けています。詳細については、お気軽に discord チャンネルに参加してください。
私たちは、制御性と効率性に欠けるエージェントベースのシステムの現在の軌道に不満を抱いています。現在のアプローチには、人間の制御なしで独立して動作する React/MKRL エージェントの構築が含まれており、データ分散内にとどまる傾向があるため、無意味な無限ループにつながることがよくあります。マルチエージェント システムはこの問題に対処しようとしますが、エージェントのおしゃべりにより、より無意味で法外なコストが発生することがよくあります。さらに、今日のエージェントは、動作を強化または修正するために微調整が必要になることが多く、これは時間がかかり複雑なプロセスになる可能性があります。
HybridAGI を使用すると、動作グラフ (グラフ プログラム) を変更するだけで済みます。私たちは、コンテキスト内学習で望ましい結果が得られなかった場合、微調整は最後の手段であるべきだと考えています。認知科学をコンピューター サイエンスの概念に根付かせることで、プログラマーが一連の行動と意思決定を制御して夢のエージェント システムを構築できるようにします。私たちの目標は、人間と機械の両方が解釈できる仲介言語を使用して現実世界の問題を解決できるエージェント システムを構築することです。今後数年間、人間が最新情報を常に把握できるようにしたい場合は、その目的のためにエージェント システムを設計する必要があります。
LangGraph は、昨年の HybridAGI の場合でもあった LangChain の上に構築されています。ただし、制御性と説明性に欠ける ReACT エージェントを奨励するという LangChain チームの方向性を考慮して、パイプラインの最適化に重点を置くことでより優れた価値を提供する DSPy に切り替えました。最近、LangChain の不十分な意思決定を補うために LangGraph が登場しましたが、私たちはすでに自分たちの仕事の価値を証明していました。さらに、LangGraph は、多くのエージェント フレームワークと同様に、静的な有限状態マシンを記述します。私たちの AGI システムのビジョンは、チューリングが完全であることが必要であるということであり、これは多くのエージェント フレームワークに当てはまりますが、AGI の旅を真に始めるには、オンザフライで自身をプログラミングする機能 (実際の継続的な学習を意味します) も必要です。他のフレームワークが欠けている。
Llama-Index は最近、LangGraph と同様のイベント駆動型エージェント システムをリリースしました。これは静的ステート マシンであり、同じコメントが彼らの作業にも当てはまります。
HybridAGI は、DSPy チームの優れた成果に基づいて構築されており、LLM エージェントのコンテキストで複雑な DSPy プログラムの作成を簡素化するための抽象化を目的としています。 DSPy はより汎用的で、エージェント システムを必要としない単純なタスクにも使用されます。 DSPy とは異なり、私たちのプログラムは静的ではなく動的であり、メモリに保存されているプログラムを動的に呼び出すことでユーザーのクエリに適応できます。さらに、私たちはグラフを使用した説明可能な神経記号的 AGI システムに焦点を当てています。グラフ プログラムは、DSPy を使用して最初から実装するよりも簡単に構築できます。 DSPy が LLM アプリケーションの PyTorch である場合、HybridAGI は神経記号 LLM エージェントの Keras または HuggingFace と考えてください。
OpenAI o1 と HybridAGI は多くの共通の目標を共有していますが、異なるパラダイムを念頭に置いて構築されています。 OpenAI o1 と同様、HybridAGI はマルチステップ推論を使用し、目標指向のエージェント システムです。ただし、OpenAI o1 とは異なり、エージェント システムにアクション スペースを自由に探索させるのではなく、エージェント システムの CoT トレースをガイドします。これは、エージェントが Q 学習グラフではなく定義されたグラフ内をナビゲートする A* に近いパラダイムです。これにより、専門家が特定のユースケースを解決するように推論をプログラムできるため、より効率的な推論が可能になります。より小さな LLM を使用できるため、環境への影響が軽減され、ROI が向上します。当社のテクノロジーの欠点は、その機能を最大限に活用するには、プログラミングや AI システムだけでなく、自分の分野に関する専門知識が必要であることです。そのため、システムを実装するための AI の技術スキルが不足している人や企業に、監査、コンサルティング、開発サービスを提供します。
私たちはシリコンバレーに拠点を置いたり、大企業の一員ではありません。私たちは南フランスの小さな献身的なチームです。私たちは、ユーザーが制御を維持できる AI 製品を提供することに重点を置いています。私たちはエージェントベースの製品の現在の軌道に不満を持っています。私たちは、人間とロボットのインタラクションと、期待どおりに動作するインタラクティブ システムの構築の専門家です。私たちは認知科学とシンボリック AI からインスピレーションを得ていますが、より幅広い読者のためにコンピューター サイエンスに基づいたコンセプトを維持することを目指しています。
私たちの使命は、AI の安全性とパフォーマンスだけにとどまりません。それは、私たちが住みたい世界を形作ることなのです。たとえプログラミングが 5 年か 10 年で時代遅れになり、何らかの魔法のプロンプトに取って代わられたとしても、従来のプロンプトでは雇用を維持するには不十分であると私たちは信じています。あまりにも単純すぎて、意図を正確に伝えることができません。
対照的に、推論の各ステップをプログラミングするには、プロンプト エンジニアリングとプログラミングに関する専門知識が必要です。驚くべきことに、AI を制御することで AI が実際にどのように動作するかについて洞察を得ることができるため、プログラマーにとっては楽しいものであり、それほど難しいことではありません。自然言語とアルゴリズムを組み合わせることで、無限の可能性が広がります。それなしの世界を想像することはできません。
当社は、コンピュータビジョンから、健康、生物学、金融、航空宇宙などの重要な領域のナレッジグラフ/オントロジーシステムによる高度な推論まで、さまざまな領域で神経記号AIソリューションを実装したい企業に監査、コンサルティング、開発サービスを提供しています。 、その他にもたくさんあります。
HybridAGI は、当社の能力を紹介するだけでなく、将来の安全な AGI システムのビジョンをもたらす研究プロジェクトです。私たちは、ベンチャーキャピタルを喜ばせて誇大宣伝を煽るために大げさな主張をするのではなく、現実世界のユースケースを追求する自力で立ち上げたスタートアップです。
LLM の機能に対する当社のビジョンは他よりも緩やかであるため、スケーリングのみに依存して地球を燃やすことなく、AI のさまざまな分野 (進化学習、シンボリック学習、深層学習) を組み合わせて未来に飛躍することを積極的に検討しています。明らかな環境への影響に加えて、小規模/中規模モデルに依存することで、理解が深まり、数兆規模のデータセンターがなくても有用な研究を行う能力が得られます。
HybridAGI は、その将来に備えると同時に、最新および従来の AI システムに対する当社の理解を示すための方法です。 HybridAGI は、AGI システムの開発に何十億ドルも必要なく、情熱的な人々からなる少数のチームが違いを生むことができることを証明しています。
私たちはさまざまな理由から HybridAGI を GNU GPL に基づいてリリースしました。その 1 つ目は、私たちの仕事と貢献者の仕事を保護したいということです。 2 番目の理由は、私たちは大手 AI テクノロジー企業に依存することなく、人々が生きられる未来を築きたいということです。市場を破壊したり、自分たちの財産を私物化する方法なしに人々を失業させたりすることで人々を奴隷にするのではなく、人々に力を与えたいと考えています。知識。 HybridAGI は、コミュニティによるコミュニティのためのコミュニティ プロジェクトです。最後に、HybridAGI は、世界中の才能があり志を同じくする人々とつながり、望ましい未来を中心としたコミュニティを作成する方法です。
HybridAGI は単なるツールボックスであると主張する人もいるかもしれません。ただし、LangChain や Llama-Index とは異なり、HybridAGI は、DSL/アーキテクチャでトレーニングされた特別な目的の LLM と相乗効果を発揮するようにゼロから設計されています。私たちはコミュニティのおかげでソフトウェアを強化できました。また、独自のプログラミング言語を作成したのは私たちなので、それをプログラムするのに最適な人材でもあります。私たちは、競争上の優位性を維持するために、プロジェクトの最後の 1 年間にデータを蓄積し、多くの拡張技術を学習し、データセットをクリーンアップしてきました。構築中の LLM は、そうすることが当社にとって有益であると判断した時点でリリースする可能性があります。
当社のソフトウェアは、当社とコミュニティの貢献を保護するために、GNU GPL ライセンスに基づいてリリースされています。アプリケーションのロジック (グラフ プログラム) が分離されているため、HybridAGI を使用するのに IP の問題はありません。さらに、運用環境で使用する場合は、GPL ライセンスがソフトウェアの他の部分を汚染しないように、エージェントにリクエストする FastAPI サーバーを作成し、アプリ (Web サイトなど) のバックエンドとフロントエンドを分離する必要があります。必要に応じて、クライアントにデュアルライセンスも提供します。
開発者、研究者、AI 愛好家のコミュニティの一員になりませんか。プロジェクトに貢献し、フィードバックを共有し、HybridAGI の将来の形成に貢献してください。皆様のご参加を歓迎いたします。