人工智慧和 ChatGPT
我於 2023 年 4 月 28 日提交的 ADUG 研討會演講的源代碼和文件。
該專案的目標是讓delphi用戶能夠在他們的應用程式中使用AI技術。人工智慧有許多不同類型和數千種不同的模型。該專案致力於為不同類型的人工智慧模型創建通用接口,並使它們易於存取。
人工智慧 (AI) 是一個跨學科領域,它將電腦科學、數學和認知心理學相結合,創建能夠執行複雜任務的智慧系統。它的快速發展催生了一系列廣泛的應用,並展示了人工智慧的多功能性。
語言翻譯就是這樣的應用程式之一,人工智慧驅動的工具可以在語言之間有效率地進行翻譯,從而簡化為全球受眾翻譯軟體程式等任務。人工智慧在類人對話方面也表現出色,其互動式應用程式可以自然地理解和回應人類語言。語音識別和即時語音到文字允許轉換和無縫的基於語音的交互,使人工智慧驅動的應用程式更易於存取和用戶友好。
在創意和藝術領域,人工智慧可以根據文字描述產生圖像,展示其理解和生成視覺內容的能力。人工智慧的電腦視覺功能使其能夠準確識別照片和文件中的人臉和其他物體,展示了其在視覺識別任務以及安全和自動化等多種應用中的潛力。
人工智慧分析和處理數據以及產生綜合報告的能力凸顯了其在各個領域的價值。此外,人工智慧工具可以將音訊檔案轉錄為書面文本,使轉錄任務更加高效和準確。
下面的範例程式試圖向當今的 Delphi 程式設計師展示可用的功能。我致力於創建通用 API,以便不同的提供者可以換入或換出:
- 實驗
- 遵循目前領先的AI模型
- 可以根據價格輕鬆更改
- 避免供應商鎖定
- 或任何其他原因。
ChatGPT 提示
一些 GPT 提示範例
原始 2023 ADUG 研討會的簡報幻燈片
範例程式
- ChatGPTA動作
- 簡單的伺服器應用程序,可以添加到 ChatGPT GPT 操作中,以允許您的電腦編寫 delphi 程式碼。有關使用 ChatGPTAction 建立的一些範例程序,請參閱 AI 產生的 Delphi。
- 嵌入演示
- 演講
- 程式演示調用各種文字轉語音 API 和不同的可用語音 (FMX)
- 翻譯
- 使用各種雲端 API 在語言之間進行翻譯。
- 使用 Delphi 內建的多語言資源支援簡化 Delphi 程式的翻譯。
- Delphi聊天GPT
- 將問題寫入 ChatGPT 並讓它說出答案。
- 人臉偵測
- 偵測照片中的臉部。
- 天氣
- 從氣象局查詢本迪戈的天氣預報,產生一兩段並讀出
- 轉錄音訊
- 上傳音訊檔案並透過雲端語音轉文字 api 將其翻譯。
- 語音辨識
- 直接從麥克風將語音即時轉換為文本,將其輸入 OpenAI 的 GPT,然後將響應讀回給您。
- 影像生成
- 使用您使用 OpenAI 的 DALLE-2 和 DALLE-3 API 提供的文字產生圖像。
- 處理發票
- 從 pdf 發票中提取重要的詳細資訊並以機器可讀的 JSON 字串格式
- 測試API
專案支援LLM功能
特徵 | GPT-4o | Azure OpenAI 服務 | 格羅克 | xAI 的 Grok | 人類的克勞德 | Google的雙子座 |
---|
視力支援 | 是的 | 是的 | 是的 | 是的 | 是的 | 不* |
函數呼叫 | 是的 | 是的 | 是的 | 是的 | 不* | 不* |
*目前不支援/實現的功能
有問題/需要幫忙嗎?
建立一個問題,我會回覆它。
使用/可用的提供者
- Google - 文字轉語音、法學碩士、翻譯
- Microsoft Azure - 文字轉語音、GPT、翻譯
- 亞馬遜 - 文字轉語音、翻譯
- Anthropic claude-3-opus、claude-3-sonnet 和 claude-3-haiku,支援目前可用的最大上下文視窗之一(200k 令牌)
- X.AI grok-beta 法學碩士
- 複製存取多種型號
- Huggingface 存取多種型號
- ElevenLabs 文字轉語音與語音克隆
- OpenAI 文字轉語音、Whisper 語音辨識、DALLE-2、DALLE-3 影像生成、GPT4 LLM
- AssemblyAI語音識別
- DeepGram 語音識別
- Rev.AI語音識別
- Conqui-ai 從 docker 容器本地運行各種文字轉語音模型
- CodeProject-Ai 本地人臉偵測。
讓專案發揮作用
- 每個雲端 API 都需要在各自的開發人員控制台中進行設定。
- 執行 TestAPIs 專案並選擇 Settings->API Keys... 選單項目。新增您要使用的提供者的 api。
- 如果您不使用特定的提供者,則不需要金鑰。
有關程式碼以及如何設定的問題
- 如果您對程式碼有任何疑問,請隨時提出問題。我知道這個項目有很多內容需要設置,所以我想改進文檔,讓每個人都能輕鬆使用這個項目的所有部分。
未來潛在的研究/學習領域
- 使用嵌入搜尋大型資料集
- 使用Python4Delphi能夠從Delphi呼叫各種Python AI函式庫。
人工智慧相關連結
TensorFlow.Delphi
語音辨識.cpp
駱駝.cpp
美洲駝
必應影像建立器
必應
ChatGPT 的 RDOpenAI Delphi 實作 - 基於事件的元件
ChatGPT OpenAI ChatGPT
DelphiOpenAI 用於 OpenAI 的 Delphi 函式庫
ChatGPTPluginForLazarus Lazarus IDE 的 OpenAI (ChatGPT) 插件。
ChatGPT 一個用 Delphi 寫的 Firemonkey ChatGPT 介面。
AI-Playground-DesktopClient Firemonkey 語言模型遊樂場,用於存取 StableLM、ChatGPT 等語言模型。
AI-Code-Translator 使用 GPT 在程式語言之間進行翻譯
TOpenALPR 開源車牌識別
PgVector PgVector 允許在 SQL 資料庫中儲存和查詢向量/嵌入
CommonVoice 用於語音辨識的公共錄音資料集
抱臉
打開助手
建置專案所需的外部庫
- ICS 9.0 或來自 Delphi 內建的 GetIt 套件管理器。 - 用於語音識別
- landgraf-dev/aws-sdk-delphi AWS 開發工具包
- DelphiMVCChat框架GPTAction
用於建立範例專案的工具
- https://github.com/PKGeorgiev/Delphi-JsonToDelphiClass
- 提琴手
- Delphi 中的 XML 資料綁定器