人工智能和 ChatGPT
我于 2023 年 4 月 28 日提交的 ADUG 研讨会演讲的源代码和文档。此后我添加并增强了代码,以进一步展示人工智能的功能。
该项目的目标是让delphi用户能够在他们的应用程序中使用AI技术。人工智能有许多不同类型和数千种不同的模型。该项目致力于为不同类型的人工智能模型创建通用接口,并使它们易于访问。
人工智能 (AI) 是一个跨学科领域,它将计算机科学、数学和认知心理学相结合,创建能够执行复杂任务的智能系统。它的快速发展催生了一系列广泛的应用,展示了人工智能的多功能性。
语言翻译就是这样的应用程序之一,人工智能驱动的工具可以在语言之间进行有效的翻译,从而简化为全球受众翻译软件程序等任务。人工智能在类人对话方面也表现出色,其交互式应用程序可以自然地理解和响应人类语言。语音识别和实时语音到文本允许转换和无缝的基于语音的交互,使人工智能驱动的应用程序更易于访问和用户友好。
在创意和艺术领域,人工智能可以根据文本描述生成图像,展示其理解和生成视觉内容的能力。人工智能的计算机视觉功能使其能够准确识别照片和文档中的人脸和其他物体,展示了其在视觉识别任务以及安全和自动化等多种应用中的潜力。
人工智能分析和处理数据以及生成综合报告的能力凸显了其在各个领域的价值。此外,人工智能工具可以将音频文件转录为书面文本,使转录任务更加高效和准确。
下面的示例程序试图向当今的 Delphi 程序员展示可用的功能。我致力于创建通用 API,以便不同的提供程序可以换入或换出:
- 实验
- 遵循当前领先的AI模型
- 可以根据价格轻松更改
- 避免供应商锁定
- 或出于任何其他原因。
ChatGPT 提示
一些 GPT 提示示例
原始 2023 ADUG 研讨会的演示幻灯片
示例程序
- ChatGPTA动作
- 简单的服务器应用程序,可以添加到 ChatGPT GPT 操作中,以允许您的计算机编写 delphi 代码。有关使用 ChatGPTAction 创建的一些示例程序,请参阅 AI 生成的 Delphi。
- 嵌入演示
- 讲话
- 程序演示调用各种文本到语音 API 和不同的可用语音 (FMX)
- 翻译
- 使用各种云 API 在语言之间进行翻译。
- 使用 Delphi 内置的多语言资源支持简化 Delphi 程序的翻译。
- Delphi聊天GPT
- 将问题写入 ChatGPT 并让它说出答案。
- 人脸检测
- 检测照片中的脸部。
- 天气
- 从气象局查询本迪戈的天气预报,生成一两段并读出
- 转录音频
- 上传音频文件并通过云语音转文本 api 将其翻译。
- 语音识别
- 直接从麦克风将语音实时转换为文本,将其输入 OpenAI 的 GPT,然后将响应读回给您。
- 图像生成
- 使用您使用 OpenAI 的 DALLE-2 和 DALLE-3 API 提供的文本生成图像。
- 处理发票
- 从 pdf 发票中提取重要的详细信息和格式作为机器可读的 JSON 字符串
- 测试API
项目支持LLM功能
特征 | GPT-4o | Azure OpenAI 服务 | 格罗克 | xAI 的 Grok | 人类的克劳德 | 谷歌的双子座 |
---|
视力支持 | 是的 | 是的 | 是的 | 是的 | 是的 | 不* |
函数调用 | 是的 | 是的 | 是的 | 是的 | 不* | 不* |
*当前不支持/实现的功能
有问题/需要帮助吗?
创建一个问题,我会回复它。
使用/可用的提供商
- Google - 文本转语音、法学硕士、翻译
- Microsoft Azure - 文本到语音、GPT、翻译
- 亚马逊 - 文本转语音、翻译
- Anthropic claude-3-opus、claude-3-sonnet 和 claude-3-haiku,支持当前可用的最大上下文窗口之一(200k 令牌)
- X.AI grok-beta 法学硕士
- 复制访问多种型号
- Huggingface 访问多种型号
- ElevenLabs 文本转语音和语音克隆
- OpenAI 文本转语音、Whisper 语音识别、DALLE-2、DALLE-3 图像生成、GPT4 LLM
- AssemblyAI语音识别
- DeepGram 语音识别
- Rev.AI语音识别
- Conqui-ai 从 docker 容器本地运行各种文本到语音模型
- CodeProject-Ai 本地人脸检测。
让项目发挥作用
- 每个云 API 都需要在各自的开发人员控制台中进行设置。
- 运行 TestAPIs 项目并选择 Settings->API Keys... 菜单项。添加您要使用的提供商的 api。
- 如果您不使用特定的提供商,则不需要密钥。
有关代码以及如何设置的问题
- 如果您对代码有任何疑问,请随时提出问题。我知道这个项目有很多内容需要设置,所以我想改进文档,让每个人都能轻松使用这个项目的所有部分。
未来潜在的研究/学习领域
- 使用嵌入搜索大型数据集
- 使用Python4Delphi能够从Delphi调用各种Python AI库。
人工智能相关链接
TensorFlow.Delphi
语音识别.cpp
骆驼.cpp
美洲驼
必应图像创建器
必应
ChatGPT 的 RDOpenAI Delphi 实现 - 基于事件的组件
ChatGPT OpenAI ChatGPT
DelphiOpenAI 用于 OpenAI 的 Delphi 库
ChatGPTPluginForLazarus Lazarus IDE 的 OpenAI (ChatGPT) 插件。
ChatGPT 一个用 Delphi 编写的 Firemonkey ChatGPT 界面。
AI-Playground-DesktopClient Firemonkey 语言模型游乐场,用于访问 StableLM、ChatGPT 等语言模型。
AI-Code-Translator 使用 GPT 在编程语言之间进行翻译
TOpenALPR 开源车牌识别
PgVector PgVector 允许在 SQL 数据库中存储和查询向量/嵌入
CommonVoice 用于语音识别的公共录音数据集
抱脸
打开助手
构建项目所需的外部库
- ICS 9.0 或来自 Delphi 内置的 GetIt 包管理器。 - 用于语音识别
- landgraf-dev/aws-sdk-delphi AWS 开发工具包
- DelphiMVCChat框架GPTAction
用于创建示例项目的工具
- https://github.com/PKGeorgiev/Delphi-JsonToDelphiClass
- 提琴手
- Delphi 中的 XML 数据绑定器