Intelligence artificielle et ChatGPT
Code source et documentation de mon symposium ADUG présenté le 28 avril 2023. Depuis, j'ai ajouté et amélioré le code pour démontrer davantage les capacités de l'IA.
L'objectif de ce projet est de permettre aux utilisateurs de Delphi de pouvoir utiliser la technologie de l'IA dans leurs applications. Il existe de nombreux types d’IA et des milliers de modèles différents. Ce projet travaille à créer des interfaces généralisées vers les différents types de modèles d'IA et à les rendre facilement accessibles.
L'intelligence artificielle (IA) est un domaine interdisciplinaire qui combine l'informatique, les mathématiques et la psychologie cognitive pour créer des systèmes intelligents capables d'effectuer des tâches complexes. Ses progrès rapides ont conduit à un large éventail d’applications démontrant la polyvalence de l’IA.
La traduction linguistique est l'une de ces applications, dans laquelle les outils basés sur l'IA traduisent efficacement entre les langues, simplifiant ainsi les tâches telles que la traduction de logiciels pour un public mondial. L’IA excelle également dans les conversations de type humain, avec des applications interactives qui comprennent et répondent naturellement au langage humain. La reconnaissance vocale et la conversion parole-texte en temps réel permettent une conversion et des interactions vocales transparentes, rendant les applications basées sur l'IA plus accessibles et conviviales.
Dans les domaines créatifs et artistiques, l’IA peut générer des images basées sur des descriptions textuelles, démontrant ainsi sa capacité à comprendre et à produire du contenu visuel. Les capacités de vision par ordinateur de l'IA lui permettent de reconnaître avec précision les visages et autres objets dans les photographies et les documents, illustrant ainsi son potentiel dans les tâches de reconnaissance visuelle et diverses applications telles que la sécurité et l'automatisation.
La capacité de l'IA à analyser et traiter des données et à générer des rapports complets met en évidence sa valeur dans divers domaines. De plus, les outils basés sur l'IA peuvent transcrire des fichiers audio en texte écrit, rendant les tâches de transcription plus efficaces et plus précises.
Les exemples de programmes ci-dessous tentent de démontrer les capacités disponibles aujourd'hui pour les programmeurs Delphi. J'ai travaillé sur la création d'API génériques afin que différents fournisseurs puissent être échangés vers :
- expérience
- suivez le modèle d'IA leader actuel
- faciliter le changement en fonction du prix
- éviter le verrouillage du fournisseur
- ou pour toute autre raison.
Invites ChatGPT
Quelques exemples d'invites GPT
Diapositives de présentation du symposium ADUG original 2023
Exemples de programmes
- ChatGPTAction
- Application serveur simple qui peut être ajoutée à une action ChatGPT GPT pour permettre à votre ordinateur d'écrire du code Delphi. Voir AI Generated Delphi pour quelques exemples de programmes créés avec ChatGPTAction.
- IntégrationsDémo
- Démo simple montrant comment fonctionnent les intégrations
- Parler
- Programme démontrant l'appel de diverses API Text to Speech et les différentes voix disponibles (FMX)
- Traduire
- traduit entre les langues à l'aide des différentes API cloud.
- Simplifiez la traduction des programmes Delphi en utilisant la prise en charge intégrée des ressources multilingues de Delphi.
- DelphiChatGPT
- écrivez des questions à ChatGPT et demandez-lui de prononcer la réponse.
- Détection de visage
- Détectez les visages sur une photo.
- Météo
- Recherchez les prévisions météorologiques pour Bendigo auprès du bureau de météorologie, générez un paragraphe ou deux et lisez-le à haute voix.
- TranscrireAudio
- Téléchargez un fichier audio et faites-le traduire via une API cloud de parole en texte.
- Reconnaissance vocale
- convertissez la parole en texte en temps réel directement depuis votre microphone, transmettez-la au GPT d'OpenAI et faites-vous relire la réponse.
- Génération d'images
- générez une image à l'aide du texte que vous fournissez à l'aide des API DALLE-2 et DALLE-3 d'OpenAI.
- Traiter la facture
- à partir d'une facture PDF, extrayez les détails importants et formatez-les sous forme de chaîne JSON lisible par machine
- API de test
- Un projet pour tester les différentes API et les fonctionnalités des API
Le projet prend en charge les fonctionnalités LLM
Fonctionnalité | GPT-4o | Service Azure OpenAI | Groq | Grok de xAI | Claude d'Anthropique | Les Gémeaux de Google |
---|
Aide visuelle | Oui | Oui | Oui | Oui | Oui | Non* |
Appel de fonction | Oui | Oui | Oui | Oui | Non* | Non* |
*Fonctionnalité non prise en charge/implémentée actuellement
Questions / Besoin d'aide ?
Créez un problème et j'y répondrai.
Fournisseurs utilisés/disponibles
- Google - Synthèse vocale, LLM, Traduction
- Microsoft Azure - Synthèse vocale, GPT, Traduction
- Amazon - Synthèse vocale, traduction
- Anthropic claude-3-opus, claude-3-sonnet et claude-3-haiku, prenant en charge l'une des plus grandes fenêtres contextuelles actuellement disponibles (200 000 jetons)
- LLM X.AI grok-bêta
- Répliquez l’accès à une large gamme de modèles
- Huggingface accède à une large gamme de modèles
- Synthèse vocale et clonage vocal d'ElevenLabs
- Synthèse vocale OpenAI, reconnaissance vocale chuchotée, génération d'images DALLE-2, DALLE-3, GPT4 LLM
- Reconnaissance vocale AssemblyAI
- Reconnaissance vocale DeepGram
- Reconnaissance vocale Rev.AI
- Conqui-ai Exécuter une variété de modèles de synthèse vocale localement à partir d'un conteneur Docker
- Détection de visage locale CodeProject-Ai.
Faire fonctionner les projets
- Chacune des API cloud doit avoir été configurée dans leurs consoles de développement respectives.
- Exécutez le projet TestAPIs et sélectionnez l'élément de menu Paramètres->Clés API.... Ajoutez l'API pour les fournisseurs que vous souhaitez utiliser.
- Si vous n'utilisez pas un fournisseur particulier, vous n'avez pas besoin de clé.
Questions sur le code et comment configurer les choses
- N'hésitez pas à soulever des problèmes concernant toute question que vous avez sur le code. Je sais qu'il y a beaucoup de choses dans ce projet et beaucoup à configurer, j'aimerais donc améliorer la documentation pour permettre à tout le monde d'utiliser facilement toutes les parties de ce projet.
Futurs domaines potentiels de recherche/d’étude
- Utiliser les intégrations pour rechercher de grands ensembles de données
- Utiliser Python4Delphi pour pouvoir appeler diverses bibliothèques Python AI depuis Delphi.
Liens connexes Intelligence Artificielle
TensorFlow.Delphi
Whisper.cpp Reconnaissance vocale
lama.cpp
lama-pas
Créateur d'images Bing
Bing
Implémentation RDOpenAI Delphi de ChatGPT - un composant basé sur des événements
ChatGPT OpenAI ChatGPT
DelphiOpenAI une bibliothèque Delphi pour OpenAI
ChatGPTPluginForLazarus Un plug-in OpenAI (ChatGPT) pour l'IDE Lazarus.
ChatGPT une interface Firemonkey ChatGPT écrite en Delphi.
AI-Playground-DesktopClient Un terrain de jeu de modèle Firemonkey Language pour accéder à des modèles de langage tels que StableLM, ChatGPT, etc.
AI-Code-Translator Utilisez GPT pour traduire entre les langages de programmation
Reconnaissance de plaque d'immatriculation Open Source TOpenALPR
PgVector PgVector permet de stocker et d'interroger des vecteurs/incorporations dans une base de données SQL
CommonVoice Ensemble de données public d'enregistrements pour la reconnaissance vocale
Visage câlin
Assistant ouvert
Bibliothèques externes nécessaires pour créer des projets
- ICS 9.0 ou depuis le gestionnaire de packages GetIt intégré à Delphi. - Pour la reconnaissance vocale
- landgraf-dev/aws-sdk-delphi Kit SDK AWS
- DelphiMVCFramework pour ChatGPTAction
Outils utilisés pour créer des exemples de projets
- https://github.com/PKGeorgiev/Delphi-JsonToDelphiClass
- Violoneux
- Classeur de données XML dans Delphi