ดาต้าจีนี่
DataGenie เป็นเว็บแอปพลิเคชั่นที่ทรงพลังซึ่งออกแบบมาเพื่อทำให้กระบวนการหลักสองกระบวนการเป็นไปโดยอัตโนมัติ:
- การสร้างรายงาน : สร้างรายงาน PDF โดยอัตโนมัติจากไฟล์ CSV พร้อมโครงสร้างที่กำหนดไว้ล่วงหน้า สรุปข้อความ ตาราง และแผนภูมิ
- แชทบอทแบบโต้ตอบ : ค้นหาและโต้ตอบกับข้อมูลส่วนบุคคล เช่น PDF โดยใช้คุณสมบัติ AI ขั้นสูง เช่น การเก็บรักษาหน่วยความจำ และการค้นหาที่ปรับให้เหมาะสม
สารบัญ
- คุณสมบัติ
- ข้อกำหนดเบื้องต้น
- การติดตั้ง
- การกำหนดค่า
- การใช้งาน
- เครื่องมือสร้างรายงาน
- แชทบอท
- การปรับแต่ง
คุณสมบัติ
เครื่องมือสร้างรายงาน
- การสร้างรายงานอัตโนมัติ : สร้างรายงานที่ครอบคลุมตามโครงสร้างที่กำหนดไว้ล่วงหน้า
- การสรุปข้อความ : สรุปหัวข้อสำคัญภายในข้อมูลของคุณโดยอัตโนมัติ
- การแสดงภาพ : รวมตารางและแผนภูมิเข้ากับรายงานของคุณได้อย่างราบรื่น
- ผลลัพธ์ที่แก้ไขได้ : ดาวน์โหลดและแก้ไขรายงานในรูปแบบ Word ก่อนสรุปผล
แชทบอท
- การโต้ตอบข้อมูล : อัปโหลดรายงานและโต้ตอบกับรายงานแบบเรียลไทม์
- การเก็บรักษาหน่วยความจำ : รักษาสถานะการโต้ตอบสามสถานะล่าสุดเพื่อความต่อเนื่อง
- การค้นหาขั้นสูง : ใช้ประโยชน์จากเครื่องมือเพิ่มประสิทธิภาพการสืบค้น RAG เพื่อความสามารถในการค้นหาที่ได้รับการปรับปรุง
- ส่วนต่อประสานที่ใช้งานง่าย : มีส่วนร่วมกับข้อมูลผ่าน UI ที่คล่องตัวและใช้งานง่าย
ข้อกำหนดเบื้องต้น
- Python 3.9 (หรือสูงกว่า)
- สภาพแวดล้อมเสมือนจริง (เป็นทางเลือก แต่แนะนำ)
- ข้อมูลประจำตัว Azure OpenAI
การติดตั้ง
หากต้องการเริ่มต้นใช้งาน DataGenie ให้ทำตามขั้นตอนด้านล่าง:
โคลนพื้นที่เก็บข้อมูล :
git clone < repository-url >
สร้างและเปิดใช้งานสภาพแวดล้อมเสมือน Python :
python -m venv venv
source venv/bin/activate # On Windows use `venvScriptsactivate`
ติดตั้งการพึ่งพา :
pip install -r requirements.txt
การกำหนดค่า
การตั้งค่า Azure OpenAI
คุณต้องอัปเดตไฟล์ .env
ภายใต้ไดเร็กทอรี genai_utilits
ด้วยข้อมูลรับรอง Azure OpenAI ของคุณ คุณสามารถรับข้อมูลประจำตัวเหล่านี้ได้จากที่นี่
ตัวอย่างการกำหนดค่าสำหรับ .env
:
OPENAI_API_KEY = <your_azure_openai_api_key>
OPENAI_API_TYPE = <your_azure_openai_type e.g azure>
OPENAI_API_VERSION = <your_azure_openai_version>
OPENAI_ENDPOINT = <your_azure_openai_endpoint>
การใช้งาน
หลังจากเสร็จสิ้นการกำหนดค่า ให้เริ่มแอปพลิเคชัน Streamlit:
แอป Streamlit จะสามารถเข้าถึงได้บนเว็บเบราว์เซอร์ของคุณ ซึ่งคุณสามารถอัปโหลดไฟล์สำหรับการสร้างรายงานและแชทบอทได้
เครื่องมือสร้างรายงาน
อัพโหลดไฟล์ CSV :
- อัปโหลดไฟล์ CSV ข้อมูลการส่งออกและนำเข้าของคุณ ไฟล์ตัวอย่าง (
dec_com_export.csv
) มีอยู่ในโฟลเดอร์ . .assets
สร้างรายงาน :
- เครื่องมือจะสร้างไฟล์ PDF และ Word ที่จัดเก็บไว้ในโฟลเดอร์
generated_report
โครงสร้างที่กำหนดไว้ล่วงหน้าของรายงาน :
- แนวโน้มการส่งออกโดยรวม
- สินค้าส่งออก 5 อันดับแรก
- อัตราการเติบโตของการส่งออก
- การวิเคราะห์ตามภาคส่วน
- การเปรียบเทียบสินค้าโภคภัณฑ์
นี่คือวิดีโอสาธิตการใช้งาน DataGenie Report Generator:
DataGenie_ReportGenerator.mp4
แชทบอท
อัพโหลดรายงาน :
- อัปโหลดรายงาน PDF (เช่น
Introduction To New Gen Technology.pdf
ที่อยู่ในโฟลเดอร์ .assets
)
สนทนากับข้อมูล :
- กระบวนการนี้เกี่ยวข้องกับการดึงข้อมูลจาก PDF เริ่มต้น VectorStore เตรียมข้อมูลสำหรับการฝัง และเริ่มแชท สถานะหน่วยความจำสามสถานะล่าสุดจะถูกเก็บไว้เพื่อความต่อเนื่อง
นี่คือวิดีโอสาธิตการทำงานของ DataGenie ChatBot:
freecompress-DataGenie-ChatBot.mp4
การปรับแต่ง
แก้ไขอวาตาร์แชท:
- หากต้องการเปลี่ยนรูปประจำตัวในแชทบอต ให้เพิ่มรูปภาพใหม่ลงในไดเร็กทอรี .
.assets
การปรับแต่ง UI:
- ตัวเลือกการปรับแต่ง UI มีอยู่ในไฟล์
config.toml
ที่อยู่ในไดเร็กทอรี .streamlit
แก้ไขรูปลักษณ์และการตั้งค่าของแอป Streamlit ตามต้องการ