인공지능과 ChatGPT
2023년 4월 28일에 발표된 ADUG 심포지엄 강연의 소스 코드 및 문서입니다. 이후 AI 기능을 더욱 시연하기 위해 코드를 추가하고 향상했습니다.
이 프로젝트의 목표는 델파이 사용자가 애플리케이션에서 AI 기술을 사용할 수 있도록 하는 것입니다. AI에는 다양한 유형이 있고 수천 가지의 다양한 모델이 있습니다. 이 프로젝트는 다양한 유형의 AI 모델에 대한 일반화된 인터페이스를 만들고 쉽게 액세스할 수 있도록 하는 작업을 진행하고 있습니다.
인공지능(AI)은 컴퓨터 과학, 수학, 인지 심리학을 결합하여 복잡한 작업을 수행할 수 있는 지능형 시스템을 만드는 학제간 분야입니다. AI의 급속한 발전으로 인해 AI의 다양성을 입증하는 다양한 애플리케이션이 탄생했습니다.
언어 번역은 AI 기반 도구가 언어 간을 효율적으로 번역하여 전 세계 사용자를 위한 소프트웨어 프로그램 번역과 같은 작업을 단순화하는 애플리케이션 중 하나입니다. AI는 또한 인간의 언어를 자연스럽게 이해하고 응답하는 대화형 애플리케이션을 통해 인간과 같은 대화에도 탁월합니다. 음성 인식 및 실시간 음성-텍스트 변환을 통해 음성 기반의 원활한 상호 작용과 변환이 가능해 AI 기반 애플리케이션에 더욱 쉽게 접근하고 사용자 친화적으로 만들 수 있습니다.
창의적이고 예술적인 영역에서 AI는 텍스트 설명을 기반으로 이미지를 생성하여 시각적 콘텐츠를 이해하고 생산하는 능력을 보여줄 수 있습니다. AI의 컴퓨터 비전 기능을 사용하면 사진과 문서에서 얼굴과 기타 개체를 정확하게 인식할 수 있어 시각적 인식 작업과 보안 및 자동화와 같은 다양한 애플리케이션에서 잠재력을 보여줍니다.
데이터를 분석 및 처리하고 포괄적인 보고서를 생성하는 AI의 능력은 다양한 영역에서 그 가치를 강조합니다. 또한 AI 기반 도구를 사용하면 오디오 파일을 서면 텍스트로 변환할 수 있어 변환 작업이 더욱 효율적이고 정확해집니다.
아래 예제 프로그램은 오늘날 Delphi 프로그래머가 사용할 수 있는 기능을 보여주기 위한 시도입니다. 저는 다른 공급자를 다음과 같이 교체하거나 교체할 수 있도록 일반 API를 만드는 작업을 했습니다.
- 실험
- 현재의 선도적인 AI 모델을 따르다
- 가격에 따라 쉽게 변경할 수 있도록 하세요.
- 벤더 종속 방지
- 또는 다른 이유로.
ChatGPT 프롬프트
GPT 프롬프트의 일부 예
2023 ADUG 심포지엄 원본 프레젠테이션 슬라이드
예제 프로그램
- ChatGPT액션
- 컴퓨터에서 델파이 코드를 작성할 수 있도록 ChatGPT GPT 작업에 추가할 수 있는 간단한 서버 앱입니다. ChatGPTAction으로 생성된 몇 가지 예제 프로그램은 AI 생성 델파이를 참조하세요.
- 임베딩데모
- 말하다
- 다양한 Text to Speech API 호출과 사용 가능한 다양한 음성을 보여주는 프로그램(FMX)
- 번역하다
- 다양한 클라우드 API를 사용하여 언어 간 번역이 가능합니다.
- Delphi에 내장된 다국어 리소스 지원을 사용하면 Delphi 프로그램 번역이 단순화됩니다.
- 델파이챗GPT
- ChatGPT에 질문을 작성하고 답변을 말하도록 하세요.
- 얼굴 감지
- 사진에서 얼굴을 감지합니다.
- 날씨
- 기상청에서 벤디고에 대한 일기예보를 쿼리하여 한두 문단을 생성하고 읽어보세요.
- 오디오 전사
- 오디오 파일을 업로드하고 클라우드 음성을 통해 텍스트 API로 번역하세요.
- 음성인식
- 마이크에서 바로 실시간으로 음성을 텍스트로 변환하고 이를 OpenAI의 GPT에 공급하여 응답을 다시 읽어줍니다.
- 이미지 생성
- OpenAI의 DALLE-2 및 DALLE-3 API를 사용하여 제공한 텍스트를 사용하여 이미지를 생성합니다.
- 프로세스송장
- PDF 송장에서 중요한 세부 정보와 형식을 기계가 읽을 수 있는 JSON 문자열로 추출합니다.
- TestAPI
- 다양한 API와 API의 기능을 테스트하는 프로젝트
프로젝트는 LLM 기능을 지원합니다
특징 | GPT-4o | Azure OpenAI 서비스 | 그로크 | xAI의 그록(Grok) | 인류학의 클로드 | 구글의 쌍둥이 자리 |
---|
비전 지원 | 예 | 예 | 예 | 예 | 예 | 아니요* |
함수 호출 | 예 | 예 | 예 | 예 | 아니요* | 아니요* |
*현재 지원/구현되지 않는 기능
질문이 있거나 도움이 필요하신가요?
문제를 만들어 답변해 드리겠습니다.
사용된/사용 가능한 공급자
- Google - 텍스트 음성 변환, LLM, 번역
- Microsoft Azure - 텍스트 음성 변환, GPT, 번역
- Amazon - 텍스트 음성 변환, 번역
- Anthropic claude-3-opus, claude-3-sonnet 및 claude-3-haiku는 현재 사용 가능한 가장 큰 컨텍스트 창 중 하나를 지원합니다(200,000개 토큰).
- X.AI grok-beta LLM
- 다양한 모델에 대한 액세스 복제
- Huggingface는 다양한 모델에 액세스합니다.
- ElevenLabs 텍스트 음성 변환 및 음성 복제
- OpenAI 텍스트 음성 변환, 속삭임 음성 인식, DALLE-2, DALLE-3 이미지 생성, GPT4 LLM
- AssemblyAI 음성인식
- DeepGram 음성 인식
- Rev.AI 음성인식
- Conqui-ai Docker 컨테이너에서 로컬로 다양한 텍스트-음성 모델 실행
- CodeProject-Ai 로컬 얼굴 감지.
프로젝트 작동시키기
- 각 클라우드 API 요구 사항은 해당 개발자 콘솔에 설정되어 있어야 합니다.
- TestAPIs 프로젝트를 실행하고 설정->API 키... 메뉴 항목을 선택합니다. 사용하려는 공급자에 대한 API를 추가합니다.
- 특정 공급자를 사용하지 않는 경우 해당 공급자에 대한 키가 필요하지 않습니다.
코드 및 설정 방법에 대한 질문
- 코드에 대해 궁금한 점이 있으면 언제든지 문제를 제기해 주세요. 나는 이 프로젝트에 많은 것이 있고 설정해야 할 것이 많다는 것을 알고 있으므로 모든 사람이 이 프로젝트의 모든 부분을 쉽게 사용할 수 있도록 문서를 개선하고 싶습니다.
잠재적인 미래 연구/연구 분야
- 임베딩을 사용하여 대규모 데이터 세트 검색
- Python4Delphi를 사용하여 Delphi에서 다양한 Python AI 라이브러리를 호출할 수 있습니다.
인공지능 관련링크
TensorFlow.Delphi
속삭임.cpp 음성 인식
라마.cpp
라마파스
Bing 이미지 생성기
빙
ChatGPT의 RDOpenAI Delphi 구현 - 이벤트 기반 구성 요소
채팅GPT OpenAI 채팅GPT
DelphiOpenAI OpenAI용 델파이 라이브러리
ChatGPTPluginForLazarus Lazarus IDE용 OpenAI(ChatGPT) 플러그인입니다.
ChatGPT는 Delphi로 작성된 Firemonkey ChatGPT 인터페이스입니다.
AI-Playground-DesktopClient StableLM, ChatGPT 등과 같은 언어 모델에 액세스할 수 있는 Firemonkey 언어 모델 플레이그라운드입니다.
AI 코드 번역기 GPT를 사용하여 프로그래밍 언어 간 번역
TOpenALPR 오픈 소스 번호판 인식
PgVector PgVector를 사용하면 SQL 데이터베이스에 벡터/임베딩을 저장하고 쿼리할 수 있습니다.
CommonVoice 음성 인식용 녹음 공개 데이터세트
포옹하는 얼굴
오픈 어시스턴트
프로젝트를 빌드하는 데 필요한 외부 라이브러리
- ICS 9.0 또는 Delphi에 내장된 GetIt 패키지 관리자에서. - 음성인식용
- landgraf-dev/aws-sdk-delphi AWS SDK
- ChatGPTAction용 DelphiMVCFramework
예제 프로젝트를 만드는 데 사용되는 도구
- https://github.com/PKGeorgiev/Delphi-JsonToDelphiClass
- 바이올리니스트
- Delphi의 XML 데이터 바인더