Symposium2023下載 - Symposium2023原始碼下載

Symposium2023

其他源碼

1.0.0

下載

人工智慧和 ChatGPT

我於 2023 年 4 月 28 日提交的 ADUG 研討會演講的源代碼和文件。

該專案的目標是讓delphi用戶能夠在他們的應用程式中使用AI技術。人工智慧有許多不同類型和數千種不同的模型。該專案致力於為不同類型的人工智慧模型創建通用接口，並使它們易於存取。

人工智慧 (AI) 是一個跨學科領域，它將電腦科學、數學和認知心理學相結合，創建能夠執行複雜任務的智慧系統。它的快速發展催生了一系列廣泛的應用，並展示了人工智慧的多功能性。

語言翻譯就是這樣的應用程式之一，人工智慧驅動的工具可以在語言之間有效率地進行翻譯，從而簡化為全球受眾翻譯軟體程式等任務。人工智慧在類人對話方面也表現出色，其互動式應用程式可以自然地理解和回應人類語言。語音識別和即時語音到文字允許轉換和無縫的基於語音的交互，使人工智慧驅動的應用程式更易於存取和用戶友好。

在創意和藝術領域，人工智慧可以根據文字描述產生圖像，展示其理解和生成視覺內容的能力。人工智慧的電腦視覺功能使其能夠準確識別照片和文件中的人臉和其他物體，展示了其在視覺識別任務以及安全和自動化等多種應用中的潛力。

人工智慧分析和處理數據以及產生綜合報告的能力凸顯了其在各個領域的價值。此外，人工智慧工具可以將音訊檔案轉錄為書面文本，使轉錄任務更加高效和準確。

下面的範例程式試圖向當今的 Delphi 程式設計師展示可用的功能。我致力於創建通用 API，以便不同的提供者可以換入或換出：

實驗
遵循目前領先的AI模型
可以根據價格輕鬆更改
避免供應商鎖定
或任何其他原因。

ChatGPT 提示

一些 GPT 提示範例

原始 2023 ADUG 研討會的簡報幻燈片

人工智慧和 ChatGPT

範例程式

ChatGPTA動作
- 簡單的伺服器應用程序，可以添加到 ChatGPT GPT 操作中，以允許您的電腦編寫 delphi 程式碼。有關使用 ChatGPTAction 建立的一些範例程序，請參閱 AI 產生的 Delphi。
嵌入演示
- 展示嵌入如何工作的簡單演示
演講
- 程式演示調用各種文字轉語音 API 和不同的可用語音 (FMX)
翻譯
- 使用各種雲端 API 在語言之間進行翻譯。
- 使用 Delphi 內建的多語言資源支援簡化 Delphi 程式的翻譯。
Delphi聊天GPT
- 將問題寫入 ChatGPT 並讓它說出答案。
人臉偵測
- 偵測照片中的臉部。
天氣
- 從氣象局查詢本迪戈的天氣預報，產生一兩段並讀出
轉錄音訊
- 上傳音訊檔案並透過雲端語音轉文字 api 將其翻譯。
語音辨識
- 直接從麥克風將語音即時轉換為文本，將其輸入 OpenAI 的 GPT，然後將響應讀回給您。
影像生成
- 使用您使用 OpenAI 的 DALLE-2 和 DALLE-3 API 提供的文字產生圖像。
處理發票
- 從 pdf 發票中提取重要的詳細資訊並以機器可讀的 JSON 字串格式
測試API
- 用於測試不同 API 和 API 功能的項目

專案支援LLM功能

特徵	GPT-4o	Azure OpenAI 服務	格羅克	xAI 的 Grok	人類的克勞德	Google的雙子座
視力支援	是的	是的	是的	是的	是的	不*
函數呼叫	是的	是的	是的	是的	不*	不*

*目前不支援/實現的功能

有問題/需要幫忙嗎？

建立一個問題，我會回覆它。

使用/可用的提供者

Google - 文字轉語音、法學碩士、翻譯
Microsoft Azure - 文字轉語音、GPT、翻譯
亞馬遜 - 文字轉語音、翻譯
Anthropic claude-3-opus、claude-3-sonnet 和 claude-3-haiku，支援目前可用的最大上下文視窗之一（200k 令牌）
X.AI grok-beta 法學碩士
複製存取多種型號
Huggingface 存取多種型號
ElevenLabs 文字轉語音與語音克隆
OpenAI 文字轉語音、Whisper 語音辨識、DALLE-2、DALLE-3 影像生成、GPT4 LLM
AssemblyAI語音識別
DeepGram 語音識別
Rev.AI語音識別
Conqui-ai 從 docker 容器本地運行各種文字轉語音模型
CodeProject-Ai 本地人臉偵測。