ปัญญาประดิษฐ์และ ChatGPT
ซอร์สโค้ดและเอกสารสำหรับการพูดคุย ADUG Symposium Talk ของฉันที่นำเสนอในวันที่ 28 เมษายน 2023 ฉันได้เพิ่มและปรับปรุงโค้ดเพื่อแสดงความสามารถของ AI เพิ่มเติมตั้งแต่นั้นมา
เป้าหมายของโครงการนี้คือเพื่อให้ผู้ใช้ Delphi สามารถใช้เทคโนโลยี AI ในแอปพลิเคชันของตนได้ มี AI หลายประเภทและโมเดลที่แตกต่างกันหลายพันแบบ โปรเจ็กต์นี้กำลังทำงานเพื่อสร้างอินเทอร์เฟซทั่วไปสำหรับโมเดล AI ประเภทต่างๆ และทำให้เข้าถึงได้ง่าย
ปัญญาประดิษฐ์ (AI) เป็นสาขาสหวิทยาการที่ผสมผสานวิทยาการคอมพิวเตอร์ คณิตศาสตร์ และจิตวิทยาการรู้คิดเข้าด้วยกัน เพื่อสร้างระบบอัจฉริยะที่สามารถปฏิบัติงานที่ซับซ้อนได้ ความก้าวหน้าอย่างรวดเร็วทำให้เกิดแอปพลิเคชันที่หลากหลายซึ่งแสดงให้เห็นถึงความเก่งกาจของ AI
การแปลภาษาเป็นแอปพลิเคชั่นหนึ่งที่เครื่องมือที่ขับเคลื่อนด้วย AI แปลภาษาระหว่างภาษาต่างๆ ได้อย่างมีประสิทธิภาพ ทำให้งานต่างๆ เช่น การแปลโปรแกรมซอฟต์แวร์ง่ายขึ้นสำหรับผู้ชมทั่วโลก AI ยังเก่งในการสนทนาเหมือนมนุษย์ ด้วยแอปพลิเคชันแบบโต้ตอบที่เข้าใจและตอบสนองต่อภาษามนุษย์อย่างเป็นธรรมชาติ การจดจำเสียงและคำพูดเป็นข้อความแบบเรียลไทม์ช่วยให้เกิดการแปลงและการโต้ตอบด้วยเสียงที่ราบรื่น ทำให้แอปพลิเคชันที่ขับเคลื่อนด้วย AI เข้าถึงได้และใช้งานง่ายยิ่งขึ้น
ในขอบเขตความคิดสร้างสรรค์และศิลปะ AI สามารถสร้างรูปภาพตามคำอธิบายที่เป็นข้อความ ซึ่งแสดงให้เห็นถึงความสามารถในการทำความเข้าใจและสร้างเนื้อหาที่เป็นภาพ ความสามารถด้านคอมพิวเตอร์วิทัศน์ของ AI ช่วยให้สามารถจดจำใบหน้าและวัตถุอื่นๆ ในรูปถ่ายและเอกสารได้อย่างแม่นยำ ซึ่งแสดงให้เห็นถึงศักยภาพในงานการจดจำภาพและการใช้งานที่หลากหลาย เช่น การรักษาความปลอดภัยและระบบอัตโนมัติ
ความสามารถของ AI ในการวิเคราะห์และประมวลผลข้อมูล และสร้างรายงานที่ครอบคลุมได้เน้นย้ำถึงคุณค่าในขอบเขตต่างๆ นอกจากนี้ เครื่องมือที่ขับเคลื่อนด้วย AI ยังสามารถถอดเสียงไฟล์เสียงเป็นข้อความเขียนได้ ทำให้งานถอดเสียงมีประสิทธิภาพและแม่นยำยิ่งขึ้น
โปรแกรมตัวอย่างด้านล่างเป็นความพยายามในการสาธิตความสามารถที่มีให้สำหรับโปรแกรมเมอร์ Delphi ในปัจจุบัน ฉันได้ทำงานเกี่ยวกับการสร้าง API ทั่วไปเพื่อให้ผู้ให้บริการที่แตกต่างกันสามารถสลับเข้าหรือออกจาก:
- การทดลอง
- ติดตามโมเดล AI ชั้นนำในปัจจุบัน
- ทำให้ง่ายต่อการเปลี่ยนแปลงตามราคา
- หลีกเลี่ยงการล็อคอินของผู้ขาย
- หรือด้วยเหตุผลอื่นใด
ข้อความแจ้ง ChatGPT
ตัวอย่างพรอมต์ GPT
สไลด์การนำเสนอจากการประชุม ADUG Symposium ประจำปี 2023
ตัวอย่างโปรแกรม
- ChatGPTAแอ็กชั่น
- แอปเซิร์ฟเวอร์แบบธรรมดาที่สามารถเพิ่มลงในการดำเนินการ ChatGPT GPT เพื่อให้คอมพิวเตอร์ของคุณสามารถเขียนโค้ดเดลฟีได้ ดู Delphi ที่สร้างโดย AI สำหรับตัวอย่างโปรแกรมที่สร้างด้วย ChatGPTAction
- การฝังDemo
- การสาธิตง่ายๆ ที่แสดงวิธีการทำงานของการฝัง
- พูดคุย
- โปรแกรมสาธิตการเรียก Text to Speech API ต่างๆ และเสียงต่างๆ ที่มี (FMX)
- แปล
- แปลระหว่างภาษาต่างๆ โดยใช้ Cloud API ต่างๆ
- ลดความซับซ้อนในการแปลโปรแกรม Delphi เมื่อใช้การสนับสนุนทรัพยากรหลายภาษาในตัวของ Delphi
- DelphiChatGPT
- เขียนคำถามไปที่ ChatGPT และให้มันพูดคำตอบ
- การตรวจจับใบหน้า
- ตรวจจับใบหน้าในภาพถ่าย
- สภาพอากาศ
- สอบถามพยากรณ์อากาศสำหรับเบนดิโกจากสำนักอุตุนิยมวิทยา สร้างหนึ่งหรือสองย่อหน้าแล้วอ่านออกมา
- ถอดเสียง
- อัปโหลดไฟล์เสียงและแปลผ่าน Cloud Speech เป็น Text API
- การรู้จำเสียง
- แปลงคำพูดเป็นข้อความแบบเรียลไทม์จากไมโครโฟนของคุณ ป้อนลงใน GPT ของ OpenAI และให้ระบบอ่านคำตอบกลับมาให้คุณ
- การสร้างภาพ
- สร้างภาพโดยใช้ข้อความที่คุณระบุโดยใช้ API DALLE-2 และ DALLE-3 ของ OpenAI
- กระบวนการใบแจ้งหนี้
- จากใบแจ้งหนี้ PDF แยกรายละเอียดและรูปแบบที่สำคัญออกมาเป็นสตริง JSON ที่เครื่องอ่านได้
- TestAPI
- โปรเจ็กต์เพื่อทดสอบ API ต่างๆ และฟังก์ชันการทำงานของ API
โครงการรองรับคุณสมบัติ LLM
คุณสมบัติ | GPT-4o | บริการ Azure OpenAI | กร็อก | Grok จาก xAI | Claude ของมานุษยวิทยา | ราศีเมถุนของ Google |
---|
การสนับสนุนด้านการมองเห็น | ใช่ | ใช่ | ใช่ | ใช่ | ใช่ | เลขที่* |
การเรียกใช้ฟังก์ชัน | ใช่ | ใช่ | ใช่ | ใช่ | เลขที่* | เลขที่* |
*ฟีเจอร์ยังไม่รองรับ/ใช้งานในขณะนี้
คำถาม / ต้องการความช่วยเหลือ?
สร้างปัญหาแล้วฉันจะตอบกลับ
ผู้ให้บริการที่ใช้/มีอยู่
- Google - การอ่านออกเสียงข้อความ, LLM, การแปล
- Microsoft Azure - การแปลงข้อความเป็นคำพูด, GPT, แปล
- Amazon - ข้อความเป็นคำพูด แปล
- Anthropic claude-3-opus, claude-3-sonnet และ claude-3-haiku รองรับหนึ่งในหน้าต่างบริบทที่ใหญ่ที่สุดที่มีอยู่ในปัจจุบัน (โทเค็น 200,000 รายการ)
- X.AI grok-เบต้า LLM
- จำลองการเข้าถึงโมเดลที่หลากหลาย
- Huggingface เข้าถึงได้หลากหลายรุ่น
- ElevenLabs การโคลนข้อความเป็นคำพูดและเสียง
- การอ่านออกเสียงข้อความ OpenAI, การจดจำเสียงกระซิบ, DLALLE-2, การสร้างภาพ DALLE-3, GPT4 LLM
- การรู้จำเสียง AssemblyAI
- การรู้จำเสียง DeepGram
- Rev.AI การจดจำเสียง
- Conqui-ai เรียกใช้โมเดลข้อความเป็นคำพูดที่หลากหลายภายในเครื่องจากคอนเทนเนอร์นักเทียบท่า
- CodeProject-Ai การตรวจจับใบหน้าในพื้นที่
การดำเนินโครงการต่างๆ
- ความต้องการ Cloud API แต่ละรายการต้องได้รับการตั้งค่าในคอนโซลนักพัฒนาซอฟต์แวร์ที่เกี่ยวข้อง
- รันโปรเจ็กต์ TestAPIs และเลือกรายการเมนูการตั้งค่า -> คีย์ API... เพิ่ม API สำหรับผู้ให้บริการที่คุณต้องการใช้
- หากคุณไม่ได้ใช้ผู้ให้บริการรายใดรายหนึ่ง คุณไม่จำเป็นต้องมีรหัส
คำถามเกี่ยวกับโค้ดและวิธีตั้งค่า
- โปรดอย่าลังเลที่จะแจ้งปัญหาเกี่ยวกับคำถามที่คุณมีเกี่ยวกับโค้ด ฉันรู้ว่าโปรเจ็กต์นี้มีหลายสิ่งหลายอย่างและต้องตั้งค่าอีกมาก ดังนั้นฉันจึงต้องการปรับปรุงเอกสารประกอบเพื่อให้ทุกคนใช้ทุกส่วนของโปรเจ็กต์นี้ได้ง่าย
ขอบเขตการวิจัย/การศึกษาที่มีศักยภาพในอนาคต
- การใช้ Embeddings เพื่อค้นหาชุดข้อมูลขนาดใหญ่
- การใช้ Python4Delphi เพื่อให้สามารถเรียกใช้ไลบรารี Python AI ต่างๆ จาก Delphi
ลิงค์ที่เกี่ยวข้องกับปัญญาประดิษฐ์
TensorFlow.เดลฟี
การรู้จำเสียงกระซิบ.cpp
llama.cpp
ลามะ-พัส
โปรแกรมสร้างภาพ Bing
ปิง
การใช้งาน RDOpenAI Delphi ของ ChatGPT - ส่วนประกอบตามเหตุการณ์
ChatGPT OpenAI ChatGPT
DelphiOpenAI ห้องสมุด Delphi สำหรับ OpenAI
ChatGPTPluginForLazarus ปลั๊กอิน OpenAI (ChatGPT) สำหรับ Lazarus IDE
ChatGPT อินเทอร์เฟซ Firemonkey ChatGPT ที่เขียนด้วย Delphi
AI-Playground-DesktopClient สนามเด็กเล่นโมเดลภาษา Firemonkey เพื่อเข้าถึงโมเดลภาษา เช่น StableLM, ChatGPT และอื่นๆ
AI-Code-Translator ใช้ GPT เพื่อแปลระหว่างภาษาการเขียนโปรแกรม
การจดจำป้ายทะเบียนโอเพ่นซอร์ส TOPenALPR
PgVector PgVector อนุญาตให้จัดเก็บและสืบค้นเวกเตอร์/การฝังในฐานข้อมูล SQL
ชุดข้อมูล CommonVoice Public ของการบันทึกสำหรับการจดจำเสียง
กอดหน้า
เปิดผู้ช่วย
ห้องสมุดภายนอกที่จำเป็นในการสร้างโครงการ
- ICS 9.0 หรือจากตัวจัดการแพ็คเกจ GetIt ที่สร้างใน Delphi - สำหรับการจดจำเสียง
- landgraf-dev/aws-sdk-delphi AWS SDK
- DelphiMVCFramework สำหรับ ChatGPTAaction
เครื่องมือที่ใช้สร้างโครงการตัวอย่าง
- https://github.com/PKGeorgiev/Delphi-JsonToDelphiClass
- พู้ทำเล่น
- เครื่องผูกข้อมูล XML ใน Delphi