สารบัญ
ภาพรวม
คุณสมบัติ
โครงสร้างพื้นที่เก็บข้อมูล
โมดูล
เริ่มต้นใช้งาน
การติดตั้ง
กำลังรัน Report.ai
เริ่มต้นอย่างรวดเร็ว
แผนการทำงาน
มีส่วนร่วม
ใบอนุญาต
รับทราบ
ที่ Report.ai ภารกิจของเราชัดเจน: เพื่อให้คุณได้รับประสบการณ์การรายงานที่ขับเคลื่อนด้วย AI ที่แข็งแกร่ง เราได้ก้าวข้ามขีดจำกัดของการแบ่งส่วนตามความยาวของข้อความแบบเดิมๆ โดยเลือกใช้แนวทางที่ชาญฉลาดยิ่งขึ้น นั่นคือการแบ่งส่วนความหมาย วิธีการที่เป็นนวัตกรรมใหม่นี้รับประกันความแม่นยำที่ไม่มีใครเทียบได้ในการระบุทั้งธีมที่ครอบคลุมและรายละเอียดที่เหมาะสมยิ่งภายในเนื้อหาของคุณ ยิ่งไปกว่านั้น เรายังพยายามเป็นพิเศษด้วยการนำเสนอการถอดเสียงและเสียงในแต่ละส่วน โดยให้จุดอ้างอิงที่เชื่อถือได้สำหรับการทำความเข้าใจเนื้อหาของคุณอย่างครอบคลุม
แทนที่จะอาศัยความยาวของข้อความ Report.ai จะแบ่งกลุ่มรายงานของคุณตามความหมาย ซึ่งส่งผลให้มีการแบ่งย่อยเนื้อหาได้แม่นยำยิ่งขึ้น ทำให้คุณเข้าใจเนื้อหาได้ดีขึ้น
รายงานของเราเป็นมากกว่าแค่การแสดงข้อความเท่านั้น ท่อนความหมายแต่ละส่วนจะถูกนำเสนอควบคู่ไปกับบทถอดเสียงแบบโต้ตอบ ช่วยให้คุณสามารถนำทางและอ้างอิงส่วนเสียงต้นฉบับได้อย่างราบรื่น
เรามอบพลังแห่งการปรับแต่งมาไว้ในมือของคุณ ปรับแต่งการวิเคราะห์ของคุณอย่างง่ายดายโดยใช้เทมเพลตที่ปรับแต่งได้ของเรา ช่วยให้คุณสามารถดึงข้อมูลเชิงลึกที่สำคัญต่อคุณ
ไม่ว่าคุณจะทำงานกับลิงก์ YouTube ไฟล์เสียงในรูปแบบ WAV หรือการถอดเสียงข้อความในรูปแบบ TXT เราก็พร้อมรองรับคุณ Report.ai จัดการอินพุตมัลติมีเดียที่หลากหลายได้อย่างราบรื่น ทำให้ประสบการณ์ของคุณครอบคลุมและสะดวกสบาย
สำหรับผู้ที่ต้องการสร้างฐานข้อมูลระดับมืออาชีพ พื้นที่เก็บข้อมูลของเรามีการบูรณาการอย่างราบรื่นกับ Pinecone และ Chroma เครื่องมือขั้นสูงเหล่านี้มีความสามารถในการจัดการข้อมูลและการเรียกค้นข้อมูลที่เหนือกว่า ซึ่งจะช่วยเพิ่มมูลค่าให้กับการรายงานของคุณ
└── อ่านฉัน/ ├── .env ├── VAD.py ├──divide.py ├── ตัวอย่าง/ │ ├── WATCH_LIVE_Nvidia_Q2_Earnings_Call_NVDA │ └── แบตช์.txt ├── main.py ├── ข้อกำหนด.txt ├── s2t_whisper.py ├── storage_vector.py ├── summary.py ├── เทมเพลต/ │ ├── ทั่วไป.txt │ └── individuel.txt └── utils.py
ไฟล์ | สรุป |
---|---|
ข้อกำหนด.txt | จัดทำรายการการขึ้นต่อกันที่สำคัญซึ่งจำเป็นต่อการทำงานที่เหมาะสมของโค้ด |
.env | ไฟล์ .env ทำหน้าที่เป็นพื้นที่เก็บข้อมูลสำหรับการตั้งค่าการกำหนดค่าที่เกี่ยวข้องกับ API ต่างๆ ซึ่งรวมถึง OpenAI, Azure OpenAI และ Pinecone ภายในไฟล์นี้ คุณจะพบข้อมูลที่จำเป็น เช่น คีย์ API ชื่อรุ่น และการกำหนดค่าพื้นที่เก็บข้อมูล |
utils.py | ภายในไฟล์ utils.py คุณจะค้นพบฟังก์ชันยูทิลิตี้ต่างๆ มากมาย ฟังก์ชันเหล่านี้มีความหลากหลายและครอบคลุมงานที่จำเป็นต่างๆ รวมถึง: fuzzy_match: สำหรับการดำเนินการจับคู่สตริงแบบคลุมเครือ validate_filetype: การตรวจสอบความถูกต้องของประเภทไฟล์ ตรวจพบภาษา: การตรวจจับภาษาของไฟล์ข้อความ get_items: แยกรายการออกจากไฟล์เทมเพลต add_hyperlink: การเพิ่มไฮเปอร์ลิงก์ภายในเอกสาร Word divide_audio: การแบ่งไฟล์เสียงออกเป็นส่วนๆ get_file_list: การดึงรายการเส้นทางไฟล์ |
สรุป.py | สคริปต์ summarize.py มีไว้เพื่อสร้างสรุปตามเทมเพลตที่พบใน template/general.txt และ template/individual.txt ข้อมูลสรุปเหล่านี้สามารถแปลได้ หากจำเป็น จากนั้นแปลงเป็นรูปแบบเอกสาร Microsoft Word (.docx) ตลอดกระบวนการนี้ เอกสารจะเต็มไปด้วยไฮเปอร์ลิงก์และรายละเอียดบริบทเพิ่มเติม |
s2t_whisper.py | s2t_whisper.py มีฟังก์ชันในการดาวน์โหลดวิดีโอ YouTube, แยกเสียง, ลบความเงียบ, แปลงคำพูดเป็นข้อความด้วยการประทับเวลา และเพิ่มเครื่องหมายวรรคตอนสำหรับเนื้อหาภาษาจีน การถอดเสียงที่ได้จะถูกบันทึกทั้งในรูปแบบ JSON และ TXT |
VAD.py | VAD.py ใช้เพื่อแยกเสียงมนุษย์ออกจากไฟล์เสียง โดยแบ่งเสียงออกเป็นท่อนๆ ละ 10 นาที ส่งออกแต่ละท่อนเป็นไฟล์แยกกัน และแยกเสียงมนุษย์โดยใช้ไลบรารี Spleter จากนั้นเสียงร้องที่แยกออกมาจะรวมเป็นไฟล์เสียงไฟล์เดียว |
divide.py | divide.py คือการแบ่งบทความออกเป็นหัวข้อย่อยตามการถอดเสียง คลาสมีเมธอดส่วนตัวหลายวิธี: _string_cleaner ทำความสะอาดสตริงอินพุต, _get_timestamp_list แยกการประทับเวลาจากไฟล์ JSON, _add_timestamp เพิ่มการประทับเวลาให้กับหัวข้อย่อย, _add_transcript เพิ่มการถอดเสียงลงในหัวข้อย่อย และ _divide_by_subtopics ใช้โมเดลภาษาเพื่อแบ่งบทความออกเป็นชิ้นๆ |
main.py | main.py เป็นสคริปต์อเนกประสงค์ที่ออกแบบมาสำหรับการวิเคราะห์ไฟล์และการสร้างสรุป ให้ความยืดหยุ่นอย่างกว้างขวางโดยการยอมรับอาร์กิวเมนต์บรรทัดคำสั่งต่างๆ รวมถึง: File Path : เพื่อระบุไฟล์สำหรับการวิเคราะห์ Chunk Size : ช่วยให้คุณสามารถกำหนดขนาดของส่วนของข้อความได้ Temperature of Language Model : เพื่อปรับแต่งพฤติกรรมของโมเดลภาษาอย่างละเอียด Batch Mode : ช่วยให้คุณสามารถระบุว่าสคริปต์ควรทำงานในโหมดแบทช์หรือไม่ Report Generation : ให้ตัวเลือกในการสร้างรายงาน Vector Database Selection : ช่วยให้คุณสามารถเลือกระหว่างฐานข้อมูลเวกเตอร์ Pinecone และ Chroma ASR (Automatic Speech Recognition) Model : สำหรับเลือกรุ่น ASR ที่เหมาะสมที่จะใช้ |
storage_vector.py | สคริปต์ storage_vector.py มีฟังก์ชันสำคัญ 2 ฟังก์ชัน: pinecone_storage และ chroma_storage ซึ่งทั้งสองฟังก์ชันได้รับการออกแบบมาเพื่ออำนวยความสะดวกในการจัดเก็บผลลัพธ์ในฐานข้อมูลเวกเตอร์ |
ไฟล์ | สรุป |
---|---|
individuel.txt | เนื้อหาของ individuel.txt แสดงรายการที่ได้รับการวิเคราะห์ภายในแต่ละหัวข้อย่อย |
ทั่วไป.txt | เนื้อหาของ general.txt จัดเตรียมรายการที่ได้รับการวิเคราะห์ภายในการถอดเสียงทั้งหมด |
ไฟล์ | สรุป |
---|---|
ชุด.txt | ไฟล์ batch.txt ใช้เพื่ออำนวยความสะดวกในการประมวลผลไฟล์หลายไฟล์ ซึ่งทำได้โดยการแสดงรายการพาธของไฟล์โดยคั่นด้วยเครื่องหมายจุลภาค เพื่อระบุว่าไฟล์ใดบ้างที่ต้องประมวลผลตามลำดับ |
WATCH_LIVE_Nvidia_Q2_Earnings_Call_NVDA.txt | WATCH_LIVE_Nvidia_Q2_Earnings_Call_NVDA.txt มีบันทึกผลการดำเนินงานทางการเงินของไตรมาส 2 ปี 2023 ของ NVIDIA และเว็บแคสต์ถามตอบ |
ธงสั้น | ธงยาว | คำอธิบาย | พิมพ์ | สถานะ |
---|---|---|---|---|
- โอ้ | --output_dir | การตั้งค่าไดเร็กทอรีเอาต์พุตสำหรับรายงาน ค่าเริ่มต้นคือ ./docx | เชือก | ตัวเลือก |
- ค | --ก้อน | การตั้งค่าขนาดก้อนสำหรับการวิเคราะห์ แนะนำ (GPT-3.5: 10,000 ใน en, 2000 ใน zh, GPT-4: 18000 ใน en, 3600 ใน zh) ค่าเริ่มต้นคือ 2000 | สตริง | ตัวเลือก |
- ที | --อุณหภูมิ | ปรับอุณหภูมิของ LLM ภายในช่วง 0 ถึง 2 อุณหภูมิที่สูงขึ้นหมายถึงความคิดสร้างสรรค์ที่มากขึ้น ค่าเริ่มต้นคือ 0.1 | ลอย | ตัวเลือก |
- อี | --สารสกัด | แยกเสียงมนุษย์ออกจากเสียงหรือไม่ (ไม่รองรับ Mac ที่มี Apple Silicon) ค่าเริ่มต้นคือเท็จ | บูลีน | ตัวเลือก |
-ข | --แบทช์ | ใช้ 'True' หากไฟล์ข้อความอินพุตมีหลายเส้นทางของไฟล์ ค่าเริ่มต้นคือ False | บูลีน | ตัวเลือก |
- โวลต์ | --vectorDB | เลือกฐานข้อมูลเวกเตอร์ (ไพน์โคอีนหรือโครมา) ค่าเริ่มต้นคือไม่มี | เชือก | ตัวเลือก |
- ม | --แบบอย่าง | เลือกรุ่นกระซิบ ('เล็ก', 'ฐาน', 'เล็ก', 'กลาง', 'ขนาดใหญ่-v2') ค่าเริ่มต้นคือปานกลาง | เชือก | ตัวเลือก |
การพึ่งพาอาศัยกัน
โปรดตรวจสอบให้แน่ใจว่าคุณได้ติดตั้งการขึ้นต่อกันต่อไปนี้บนระบบของคุณ:
- Aanaconda or Miniconda
- python >=3.7, <=3.9 (Apple silicon python >= 3.8, <=3.9)
- pytorch
โคลนที่เก็บ Report.ai:
โคลนคอมไพล์ https://github.com/Shou-Hsu/Report.ai.git
เปลี่ยนเป็นไดเร็กทอรีโครงการ:
ซีดี Report.ai
ติดตั้งคอนดา:
ติดตั้ง minicode ผ่าน https://docs.conda.io/projects/miniconda/en/latest/miniconda-install.html
สร้างสภาพแวดล้อมเสมือนจริง:
conda create -n Report.ai python=3.9
เปิดใช้งานสภาพแวดล้อมเสมือน:
conda เปิดใช้งาน Report.ai
ติดตั้งไพทอร์ช:
ติดตั้ง pytorch ผ่านhttps://pytorch.org/get-started/locally/
ติดตั้ง ffmpeg และ libsndfile:
conda ติดตั้ง -c conda-forge ffmpeg libsndfile.conda
ติดตั้งการพึ่งพา:
pip ติดตั้ง -r ข้อกำหนด.txt
(Mac เท่านั้น) อัปเดตการอ้างอิง:
pip ติดตั้ง -U numba
หลาม main.py <file_path> -c 10,000
การตั้งค่าข้อมูลรับรอง Openai หรือ Azure openai ภายในไฟล์ .env นอกจากนี้ การตั้งค่าข้อมูลรับรองของ Pinecone หรือ Chroma หากต้องการจัดเก็บข้อมูลใน VectorDB
# chioce หนึ่งในผู้ให้บริการโมเดล gpt Azure หรือ OpenAI# Azure openAI credentialAZURE_OPENAI_API_KEY= AZURE_OPENAI_API_BASE= AZURE_OPENAI_API_VERSION= AZURE_OPENAI_API_TYPE= AZURE_DEPLOYMENT_NAME= EMBEDDING_DEPLOYMENT_NAME= #เฉพาะในกรณีที่คุณใช้ Azure OpenAI# # ข้อมูลรับรอง OpenAIOPENAI_API_KEY= MODEL_NAME=# # ข้อมูลรับรอง pinecone (ตัวเลือก) PINECONE_API_KEY= PINECONE_ENV=# ChromaDB (ตัวเลือก)PERSIST_DIR= คอลเลกชัน_NAME=
แก้ไข tempelete/general.txt และ tempelete/individuel.txt (รายการวิเคราะห์ซึ่งคั่นด้วย ",")
#ตัวอย่างเช่น หากคุณต้องการวิเคราะห์ "การเรียกหารายได้" คุณสามารถกำหนด "หัวข้อ สรุป คำอธิบายของ CFO เกี่ยวกับสถานการณ์ทางการเงินระยะสั้น คำอธิบายของ CEO เกี่ยวกับแนวโน้มของบริษัท ประเด็นข้อกังวลของตลาด" ใน tempelete/ ทั่วไป.txt พร้อมกัน ให้ตั้งค่า "บทคัดย่อ ข้อมูลเชิงลึกด้านการลงทุน คำสำคัญ" ใน tempelete/individuel.txt#ในกรณีที่คุณต้องการสร้างสรุปโดยย่อของ "การประชุมตามปกติ" คุณสามารถตั้งค่า "หัวข้อ สรุป งานคุณลักษณะ" ใน tempelete/ ทั่วไป.txt พร้อมกัน ตั้งค่า "บทคัดย่อ รายการการกระทำ คำหลัก" ใน tempelete/individuel.txt
เรียกใช้ Report.ai ในบรรทัดแนะนำ
หลาม main.py ตัวอย่าง/WATCH_LIVE_Nvidia_Q2_Earnings_Call_NVDA.txt -c 10,000
Publish project as a Python library via PyPI for easy installation.
Make project available as a Docker image on Docker Hub.
การอภิปราย
เข้าร่วมการสนทนาที่นี่
ฉบับใหม่
รายงานข้อบกพร่องหรือขอคุณสมบัติที่นี่
แนวทางการมีส่วนร่วม
เอ็มไอที.
แลงเชน, OpenAI, ไพน์โคน, โครมา, สปลีเตอร์
กลับ