Skribify เป็นเครื่องมือถอดเสียงและสรุปอันทรงพลังที่ใช้ประโยชน์จาก GPT-3.5 หรือ GPT4 และ WhisperAI ของ OpenAI เพื่อสร้างบทสรุปที่กระชับจากเนื้อหาวิดีโอหรือเสียง ด้วยการรองรับไฟล์ในเครื่อง Skribify ทำให้การแยกข้อมูลเชิงลึกอันมีค่าจากไฟล์สื่อของคุณเป็นเรื่องง่าย
คุณสมบัติ
การติดตั้ง
การใช้งาน
อินเทอร์เฟซบรรทัดคำสั่ง
ตัวอย่าง: get_transcript.py
มีส่วนร่วม
ใบอนุญาต
ถอดเสียงและสรุปเนื้อหาวิดีโอหรือเสียง
รองรับไฟล์ในเครื่อง
พร้อมท์การสรุปที่ปรับแต่งได้
การบันทึกโดยละเอียดสำหรับการดีบักและติดตามความคืบหน้า
โคลนที่เก็บนี้:
โคลนคอมไพล์ https://github.com/jfalnes/Skribify.git
ติดตั้งการพึ่งพาที่จำเป็น:
pip ติดตั้ง -r ข้อกำหนด.txt
2b. ติดตั้งเป็นแพ็คเกจ:
pip ติดตั้ง git+https://github.com/jfalnes/Skribify.git
ตั้งค่าคีย์ OpenAI API ของคุณ:
หากไม่มีรหัส จะมีตัวเลือกให้ใช้ GPT-3.5 แทน (ไม่แนะนำ)
Skribify ใช้ GPT4 หากคุณไม่มีคีย์ GPT4 API คุณสามารถขอเข้าถึงรุ่นเบต้าได้ที่นี่
รับคีย์ OpenAI API จาก OpenAI
สร้างไฟล์ .env ในไดเร็กทอรี Skribify/ และเพิ่มคีย์ API ของคุณดังนี้:
TOKEN=your_openai_api_key
ตั้งค่าคีย์ Google API ของคุณ:
ปฏิบัติตามข้อความแจ้งเพื่อเปิด https://www.google.com/device ในเว็บเบราว์เซอร์ของคุณ
ป้อนรหัสที่ได้รับจากสคริปต์ (เช่น "DBTH-BTYV") บนหน้าเว็บและตรวจสอบความถูกต้องของบัญชีของคุณ
กลับไปที่เทอร์มินัลแล้วกด Enter เพื่อดำเนินการสคริปต์ต่อ
ติดตั้ง FFMPEG:
Skribify ต้องใช้ FFMPEG เพื่อให้การแยกเสียงทำงานได้ ตรวจสอบให้แน่ใจว่าติดตั้ง FFMPEG บนเครื่องของคุณแล้ว
คุณสามารถดาวน์โหลด FFMPEG ได้จากเว็บไซต์อย่างเป็นทางการที่นี่ และทำตามคำแนะนำเพื่อติดตั้งตามระบบปฏิบัติการของคุณ
ยืนยันว่าติดตั้ง FFMPEG สำเร็จแล้วโดยการรันคำสั่ง ffmpeg
ในเทอร์มินัล/cmd ของคุณ หากติดตั้งอย่างถูกต้อง คุณจะเห็นการตอบกลับพร้อมข้อมูลเวอร์ชันและรายการการกำหนดค่า
วิดีโอขนาดใหญ่อาจไม่ทำงานกับ GPT 3.5 และคุณอาจต้องเข้าถึง GPT-4 เพื่อการถอดเสียงเป็นคำขนาดใหญ่ หากคุณใช้ไฟล์ที่มีขนาดเกิน 25MB ไฟล์เหล่านั้นจะถูกแบ่งออกเป็นส่วนๆ และประมวลผลตามลำดับ ซึ่งหมายความว่าแม้ว่าจะสามารถทำงานกับไฟล์ขนาดใหญ่ได้ แต่ขอแนะนำอย่างยิ่งให้รักษาขนาดไฟล์เดียวให้ไม่เกิน 25MB เนื่องจาก Whisper API ซึ่งรับผิดชอบการถอดเสียงใน Skribify สามารถประมวลผลไฟล์เอกพจน์ที่มีขนาดเล็กกว่าได้อย่างมีประสิทธิภาพมากขึ้น โดยไม่มีภาวะแทรกซ้อนที่อาจเกิดขึ้นจากการประมวลผลแบบก้อน
Skribify สามารถใช้จากบรรทัดคำสั่งโดยระบุอาร์กิวเมนต์ที่จำเป็น:
--file
, -f
: เส้นทางของไฟล์วิดีโอหรือเสียงในเครื่องที่จะถอดเสียงและสรุป
--prompt
, -p
: พรอมต์แบบกำหนดเองสำหรับการสรุปหรือพาธไปยังไฟล์ที่มีพรอมต์ (ค่าเริ่มต้น: "สรุปข้อความต่อไปนี้: ")
--transcribe
, -t
: ถอดเสียงเฉพาะไฟล์วิดีโอหรือเสียง และไม่ทำการเปลี่ยนแปลง
--model
, -
: ระบุรุ่น GPT-4 เริ่มต้น
--version
, -v
: ตรวจสอบเวอร์ชัน Skribify
--help
, -h
: แสดงข้อความช่วยเหลือและออก
หลาม Skribify.py --file path/to/your/video_or_audio_file
คุณสามารถใช้อาร์กิวเมนต์ --prompt
เพื่อจัดเตรียมพร้อมต์แบบกำหนดเองสำหรับการสรุป ไม่ว่าจะเป็นสตริงโดยตรง หรือโดยการระบุพาธไปยังไฟล์ที่มีพร้อมต์
คุณยังสามารถใช้ Skribify ในสคริปต์ Python ของคุณได้ดังนี้:
จาก Skribify นำเข้า Skribifydef handle_transcription(transcription):# ลอจิกเพื่อจัดการ transcriptionfile = "<local-file'prompt = "สรุปข้อความต่อไปนี้: "ด้วย Skribify(callback=handle_transcription, prompt=prompt, ) เป็น skribify:skribify.loop run_until_complete(skribify.run())
py .Skribify.py --f '<local-file> --prompt 'สรุปข้อความต่อไปนี้: ' -m 'gpt-3.5-turbo'
หมายเหตุ : ควรใส่ filename
ด้วยเครื่องหมายคำพูดเดี่ยว ( ''
) เสมอ
The text discusses elephants and highlights their impressively long fronts as a cool feature.
เรายินดีต้อนรับการมีส่วนร่วม! โปรดส่งคำขอดึงคุณสมบัติใหม่ การแก้ไขข้อบกพร่อง หรือการปรับปรุงได้ตามสบาย
Skribify ได้รับการเผยแพร่ภายใต้ GNU General Public License v3.0 ดูใบอนุญาตสำหรับข้อมูลเพิ่มเติม