เอคโคบรีฟ
EchoBrief เป็นแอปพลิเคชันสรุปเสียงที่ขับเคลื่อนด้วย AI ซึ่งช่วยให้กระบวนการดึงข้อมูลสำคัญจากไฟล์เสียงง่ายขึ้น ไม่ว่าจะเป็นพอดแคสต์ การบรรยาย หรือการบันทึกการประชุม EchoBrief ใช้ Generative AI ของ Google เพื่อให้สรุปที่แม่นยำและกระชับ
คุณสมบัติ
- การสรุปด้วยเสียง : อัปโหลดไฟล์ WAV หรือ MP3 ของคุณและรับการสรุปที่กระชับโดยใช้ Generative AI ของ Google
- การแสดงรูปคลื่น : แสดงภาพรูปคลื่นของไฟล์เสียงที่อัปโหลดเพื่อความเข้าใจที่ดีขึ้น
- ข้อมูลไฟล์ : ดูรายละเอียดไฟล์เสียง เช่น ขนาดไฟล์และระยะเวลา
- ดาวน์โหลดข้อมูลสรุป : ดาวน์โหลดข้อมูลสรุปที่สร้างขึ้นในรูปแบบข้อความได้อย่างง่ายดาย
- โหมดมืด : สลับระหว่างธีมสว่างและธีมมืดเพื่อประสบการณ์ที่เป็นส่วนตัว
- ประวัติล่าสุด : ดูรายการไฟล์เสียงสรุปล่าสุด
เทคโนโลยีที่ใช้
- หลาม
- Streamlit : กรอบงานเว็บสำหรับการสร้าง UI แบบโต้ตอบ
- Google Generative AI : โมเดล AI สำหรับการสรุปเนื้อหา
- Librosa : ห้องสมุดสำหรับการวิเคราะห์เสียงและการแสดงภาพ
- Matplotlib : การแสดงรูปคลื่นเสียง
- dotenv : จัดการตัวแปรสภาพแวดล้อม
เริ่มต้นใช้งาน
ข้อกำหนดเบื้องต้น
ในการดำเนินโครงการนี้ คุณจะต้องมี:
- ไพธอน 3.7+
- รหัส Google API : คุณต้องมีรหัส Google API สำหรับ Generative AI
- pip : ตัวจัดการแพ็คเกจ Python
การติดตั้ง
โคลนพื้นที่เก็บข้อมูล :
git clone https://github.com/yourusername/EchoBrief.git
นำทางไปยังไดเร็กทอรีโครงการ :
ติดตั้งการพึ่งพาที่จำเป็น :
pip install -r requirements.txt
ตั้งค่าคีย์ Google API ของคุณ :
- สร้างไฟล์
.env
ในรูทของโปรเจ็กต์ - เพิ่มคีย์ Google API ของคุณในไฟล์
.env
: GOOGLE_API_KEY=your_api_key
เรียกใช้แอป
หากต้องการเริ่มแอป Streamlit ให้รันคำสั่งต่อไปนี้: