我们的方法与图代理的不同之处在于,我们的代理系统不是由图表示的进程,而是一个可以读/写和执行与该进程分离的图数据(图程序)结构的解释器。使 Agent 通过执行、读取和修改图形程序(像任何其他数据一样)来学习成为可能,本质上 HybridAGI 旨在成为一个以 Cypher 语言为中心的自编程系统。这是一个以神经符号编程、程序合成和符号人工智能为中心的可投入生产的研究项目。
图灵完备 DSL :HybridAGI 的图灵完备领域特定语言 (DSL) 专门设计用于仅使用 4 种不同类型的节点(控制、操作、决策、程序)来描述无限数量的算法。解释器Agent可以循环和调用子程序,类似于传统的编程语言。
图程序搜索和动态调用:因为我们的代理系统不是静态有限状态机,而是一个逐节点解释基于图的 DSL 的解释器,因此它可以将程序搜索到内存中并动态调用最佳程序来解决用户查询。
可优化的管道和代理:借助 HybridAGI 和 DSPy,您可以根据自己的需求优化数据处理管道和代理系统。由于每个 HybridAGI 模块也是一个 DSPy 模块,因此您可以与它们无缝地使用 DSPy 优化器。
作为软件的代理行为:借助 HybridAGI,您可以将代理的行为作为 Cypher 软件提供,使初创企业和公司能够根据在 Cypher 中实现的业务逻辑创建自己的 IP。
以内存为中心的系统:HybridAGI 是一种以内存为中心的系统,大量使用知识图,既用于执行程序又用于存储结构化知识。这使得知识图谱 RAG 应用程序能够应用于关键领域。
安全可靠:特别注意防止密码注入,同时也通过引入受保护程序的概念来防止代理系统修改其自身的主要提示机制。
可预测/确定性行为和无限数量的工具:因为我们不让代理选择要使用的工具顺序,所以我们可以使用无限数量的工具。通过遵循图形程序,我们确保我们的代理系统采用可预测和确定的方法。我们可以不受限制地使用相应的工具将每个内存系统组合成一个独特的Agent。
HybridAGI 是第一个基于 LLM 的可编程代理,使您能够使用基于图形的提示编程方法定义其行为。与其他将代理视为高级聊天机器人的框架不同,我们采用了植根于计算机科学、认知科学和符号人工智能的方法。
对我们来说,代理系统是一种目标导向的认知软件,可以处理自然语言并执行其编程执行的任务。就像传统软件一样,开发人员指定应用程序的行为,并且系统并不是真正自治的,除非它已被编程为如此。对系统进行编程不仅可以帮助代理执行其任务,还可以使开发人员的意图形式化。
HybridAGI 专为数据科学家、提示工程师、研究人员和喜欢尝试 AI 的 AI 爱好者而设计。它是一款“Build Yourself”产品,专注于人类创造力而不是人工智能自主性。
为了轻松安装 HybridAGI,我们建议您使用 pip 和以下命令:
pip install hybridagi
如果您想更深入地探索我们的系统,或者为该项目做出贡献,您可以使用以下命令从源安装 HybridAGI:
git clone https://github.com/SynaLinks/HybridAGI
cd HybridAGI
pip install .
这里没有 React 代理,我们提供的唯一代理系统是我们的自定义图形解释器代理,它遵循严格的方法,逐个节点执行内存中的图形程序。因为我们通过将规划卸载到符号组件来端到端地控制代理的行为,所以我们可以轻松地纠正/增强系统的行为,消除了微调的需要,同时也允许系统动态学习。
HybridAGI 建立在多年制造可靠机器人系统的经验之上。我们将机器人、符号人工智能、法学硕士和认知科学方面的知识结合到为程序员、数据科学家和人工智能工程师提供的产品中。我们的Agent系统的长期记忆大量使用图来存储结构化和非结构化知识及其图程序。
我们为您提供构建 LLM 申请的一切,重点是 Cypher Graph 数据库。我们还提供一个本地数据库,用于在通过我们的集成之一扩展您的应用程序之前进行快速原型设计。
借助 HybridAGI,您可以构建数据提取管道、RAG 应用程序或高级代理系统,每个系统都可以使用 DSPy 优化器进行优化。我们还提供预制模块和指标,以方便原型设计。
每个模块和数据类型都是严格类型化的,并使用 Pydantic作为数据验证层。您可以通过按顺序堆叠模块来立即构建管道,就像 Keras 或 HuggingFace 中一样。
我们提供以下本机工具列表,用于读/写内存系统或修改代理的状态:
工具名称 | 用法 |
---|---|
Predict | 用于用推理信息填充上下文 |
ChainOfThought | 用于用推理信息填充上下文 |
Speak | 用于向用户发送消息并给出最终答案 |
AskUser | 用于向用户提问(可以模拟用户角色) |
UpdateObjective | 更新代理的长期目标 |
AddDocument | 将新文档保存到内存中 |
AddFact | 将新事实保存到内存中 |
AddGraphProgram | 将新程序保存到内存中(如果存在则覆盖) |
DocumentSearch | 用于在文档内存中搜索信息 |
PastActionSearch | 用于在跟踪内存中搜索过去的操作 |
EntitySearch | 用于在事实内存中搜索实体 |
FactSearch | 用于在事实内存中搜索事实 |
GraphProgramSearch | 用于在程序存储器中搜索图形程序 |
ReadGraphProgram | 用于按名称从内存中读取图形程序 |
CallGraphProgram | 用于按名称从内存中动态调用图形程序 |
您可以使用FunctionTool
和 python 函数(例如现在的函数调用)来添加更多工具。
我们接受对更多数据库集成的贡献。请随时加入 Discord 频道以获取更多信息!
我们对缺乏控制和效率的基于代理的系统的当前发展轨迹感到不满意。今天的方法涉及构建在没有人类控制的情况下独立运行的 React/MKRL 代理,由于它们倾向于停留在数据分布范围内,因此通常会导致无意义的无限循环。多代理系统试图解决这个问题,但由于代理的闲聊,它们常常会导致更多的无意义和令人望而却步的成本。此外,当今的代理通常需要微调来增强或纠正其行为,这可能是一个耗时且复杂的过程。
使用 HybridAGI,您唯一需要做的就是修改行为图(图程序)。我们认为,当上下文学习未能产生预期结果时,微调应该是最后的手段。通过将认知科学植根于计算机科学概念,我们使程序员能够通过控制行动和决策的顺序来构建他们梦想的代理系统。我们的目标是建立一个代理系统,可以通过使用人类和机器都可以解释的中间语言来解决现实世界的问题。如果我们希望在未来几年让人类参与进来,我们需要为此目的设计代理系统。
LangGraph建立在LangChain之上,去年的HybridAGI也是如此。然而,考虑到浪链团队鼓励缺乏控制和可解释性的 ReACT 智能体的方向,我们转向了 DSPy,它通过专注于管道优化来提供更好的价值。最近,LangGraph的出现是为了弥补LangChain决策失误,但我们已经证明了我们工作的价值。此外,LangGraph 与许多代理框架一样,描述了静态有限状态机。我们对 AGI 系统的愿景是图灵完备,这是许多代理框架的情况,但要真正开始 AGI 之旅,还需要具备动态编程能力(意味着真正的持续学习),这就是其他框架所缺乏的。
Llama-Index 最近发布了一个事件驱动的代理系统,与 LangGraph 类似,它是一个静态状态机,同样的言论也适用于他们的工作。
HybridAGI 建立在 DSPy 团队的出色工作之上,旨在作为一种抽象来简化在 LLM 代理环境中复杂 DSPy 程序的创建。 DSPy 更通用,也用于不需要代理系统的简单任务。与 DSPy 不同,我们的程序不是静态的,而是动态的,可以通过动态调用存储在内存中的程序来适应用户查询。此外,我们的工作重点是使用图来解释可解释的神经符号 AGI 系统。构建图形程序比使用 DSPy 从头开始实现它们更容易。如果 DSPy 是 LLM 应用程序的 PyTorch,那么可以将 HybridAGI 视为神经符号 LLM 代理的 Keras 或 HuggingFace。
OpenAI o1 和 HybridAGI 有许多共同的目标,但它们是根据不同的范式构建的。与 OpenAI o1 一样,HybridAGI 使用多步推理,是一个面向目标的代理系统。然而,与 OpenAI o1 不同的是,我们引导代理系统的 CoT 跟踪,而不是让它自由探索其动作空间,这是一种更类似于 A* 的范例,其中代理在定义的图中导航,而不是 Q 学习图。这会带来更有效的推理,因为专家可以对其进行编程来解决特定的用例。我们可以使用较小的法学硕士,减少对环境的影响并提高投资回报率。我们技术的缺点是,您需要您所在领域以及编程和人工智能系统方面的专业知识,才能最好地利用其功能。因此,我们为缺乏人工智能技术技能来实施其系统的个人和公司提供审计、咨询和开发服务。
我们的总部不位于硅谷,也不隶属于大公司;我们是一支来自法国南部的小型、敬业的团队。我们的重点是提供用户可以保持控制的人工智能产品。我们对基于代理的产品目前的发展轨迹不满意。我们是人机交互和构建按预期运行的交互系统方面的专家。虽然我们从认知科学和符号人工智能中汲取灵感,但我们的目标是让我们的概念立足于计算机科学,为更广泛的受众服务。
我们的使命不仅限于人工智能安全和性能;这是关于塑造我们想要生活的世界。即使编程在 5 或 10 年内就会过时,并被某种神奇的提示所取代,我们相信传统的提示不足以保住工作。它们过于简单化,无法准确传达意图。
相比之下,对每个推理步骤进行编程需要即时工程和编程方面的专业知识。令人惊讶的是,对于程序员来说,这很有趣,而且并不困难,因为它可以让你通过控制 AI 来深入了解 AI 的真正运作方式。自然语言与算法的结合开辟了无限的可能性。我们无法想象没有它的世界。
我们为想要在各个领域实施神经符号人工智能解决方案的企业提供审计、咨询和开发服务,从计算机视觉到健康、生物学、金融、航空航天等关键领域的知识图/本体系统的高级推理,等等。
HybridAGI 是一个研究项目,旨在展示我们的能力,同时也带来我们对未来安全 AGI 系统的愿景。我们是一家自力更生的初创企业,寻求现实世界的用例,而不是为了取悦风投和助长炒作而做出自命不凡的声明。
因为我们对法学硕士能力的愿景比其他人更温和,所以我们正在积极寻求将人工智能的不同领域(进化、符号和深度学习)结合起来,以实现向未来的飞跃,而不会仅仅依靠扩展来烧毁地球。除了明显的环境影响之外,通过依靠中小型模型,我们可以更好地理解并有能力在没有价值万亿美元的数据中心的情况下进行有用的研究。
HybridAGI 是我们为未来做好准备的方式,同时展示了我们对现代和传统人工智能系统的理解。 HybridAGI 证明您不需要数十亿美元就可以在 AGI 系统上工作,并且由充满热情的人组成的小团队可以发挥作用。
我们出于多种原因在 GNU GPL 下发布了 HybridAGI,首先是我们想要保护我们的工作和贡献者的工作。第二个原因是,我们希望为人们创造一个生活的未来,而不是依赖大型人工智能科技公司,我们希望赋予人们权力,而不是通过破坏市场并让人们失业而无法获得其所有权来奴役他们。知识。 HybridAGI 是一个社区项目,由社区制定,为社区服务。最后,HybridAGI 是一种与世界各地有才华和志趣相投的人联系并围绕理想未来创建社区的方式。
有些人可能会说 HybridAGI 只是一个工具箱。然而,与 LangChain 或 Llama-Index 不同,HybridAGI 是从头开始设计的,可以与在我们的 DSL/架构上训练的特殊用途的 LLM 协同工作。感谢社区,我们增强了我们的软件,因为我们是创建自己的编程语言的人,所以我们也是编程语言的最佳人选。在项目的最后一年,我们积累了数据,学习了许多增强技术并清理了我们的数据集,以保持我们的竞争优势。当我们认为这样做对我们有利时,我们可能会在某个时间发布我们正在建立的法学硕士。
我们的软件是根据 GNU GPL 许可证发布的,以保护我们自己和社区的贡献。您的应用程序的逻辑被分离(图形程序),您使用 HybridAGI 不存在 IP 问题。此外,在生产中使用时,您肯定希望创建一个 FastAPI 服务器来请求代理并将应用程序的后端和前端(如网站)分开,这样 GPL 许可证就不会污染软件的其他部分。如果需要,我们还为客户提供双重许可。
成为我们的开发者、研究人员和人工智能爱好者社区的一员。为该项目做出贡献,分享您的反馈,并帮助塑造 HybridAGI 的未来。我们欢迎并重视您的参与!