NoteTakerGPT는 특히 회의용으로 맞춤화된 오디오 녹음을 기록하고 요약하도록 설계된 스크립트입니다. NoteTakerGPT의 핵심 아이디어는 OpenAI의 GPT-4 모델의 놀라운 기능을 활용하여 번거로운 메모 작성 작업을 자동화된 프로세스로 전환하는 것입니다.
이 스크립트는 회의에 자주 참석하고 주요 세부 정보를 캡처하기 위한 안정적인 도구가 필요한 전문가에게 완벽한 동반자입니다. 시간을 절약하고 생산성을 높이며 중요한 정보가 손실되거나 간과되는 일이 없도록 보장합니다. 스크립트의 출력은 회의에 대한 명확한 요약을 제공하는 체계적이고 포괄적인 주요 항목 메모 세트입니다.
NoteTakerGPT는 여러 Python 라이브러리와 OpenAI API의 강력한 기능을 결합하여 오디오 녹음, 전사, 텍스트 청크 및 요약을 처리합니다. 이 모든 작업을 실시간으로 수행하므로 회의가 끝난 후 바로 메모가 준비됩니다. 또한 NoteTakerGPT는 데이터의 개인정보 보호와 보안을 유지하는 방식으로 전체 프로세스를 처리합니다. 메모 작성 프로세스를 단순화하는 강력하고 다양한 도구입니다.
이 지침은 개발 및 테스트 목적으로 로컬 컴퓨터에서 프로젝트를 시작하고 실행하는 방법을 안내합니다.
프로젝트에는 올바르게 작동하기 위해 설치해야 하는 몇 가지 종속성이 있습니다. 종속성은 다음과 같습니다.
pip를 사용하여 다음 종속성을 설치할 수 있습니다.
pip install requests openai pandas numpy tiktoken pyaudio wave keyboard
git clone https://github.com/yourusername/NoteTakerGPT.git
cd NoteTakerGPT
pip install -r requirements.txt
python NoteTakerGPT.py
NoteTakerGPT를 사용하려면 다음 단계를 따르세요.
python NoteTakerGPT.py
스크립트가 자동으로 오디오 녹음 및 복사를 시작합니다. 기록 및 요약 프로세스는 KeyboardInterrupt 이벤트가 발생할 때까지 계속됩니다(일반적으로 Ctrl+C를 누름).
전사 및 요약 프로세스가 끝나면 스크립트는 녹음된 오디오에서 파생된 포괄적인 글머리 기호 메모 세트를 출력합니다.
NoteTakerGPT의 핵심은 여러 단계를 포함하는 복잡한 프로세스입니다. 각 단계는 원시 오디오 데이터를 체계적이고 포괄적인 노트 세트로 변환하도록 설계되었습니다. 각 단계를 좀 더 자세히 살펴보면 다음과 같습니다.
오디오 녹음 : 첫 번째 단계에서는 오디오 녹음이 포함됩니다. 이는 크로스 플랫폼 오디오 I/O 라이브러리인 PortAudio에 대한 Python 바인딩을 제공하는 PyAudio 라이브러리를 사용하여 수행됩니다. 스크립트는 후속 단계에서 관리 효율성과 효율성을 보장하기 위해 30초 간격으로 오디오를 녹음합니다. 각 간격이 끝나면 오디오 데이터가 .wav 파일로 저장됩니다.
전사 : 오디오 데이터가 저장되면 스크립트는 전사 프로세스를 시작합니다. 이는 OpenAI API를 통해 OpenAI의 Whisper ASR(자동 음성 인식) 시스템에 오디오 데이터를 전송함으로써 수행됩니다. 오디오 데이터를 텍스트로 변환한 다음 스크립트로 반환합니다. 녹음 프로세스가 차단되지 않고 원활하게 계속되도록 전사 프로세스는 별도의 프로세스에서 실행됩니다.
청킹 및 분석 : 전사 데이터가 수신되면 분석을 위해 관리 가능한 청크로 분할됩니다. 이는 OpenAI API가 각 요청에 대해 갖는 토큰 제한을 고려합니다. 스크립트는 기록을 청크로 분할하고 요약을 위해 각각을 OpenAI의 GPT-4 모델로 보냅니다. 각 청크와 함께 모델에 텍스트를 읽고 내용을 요약하는 자세한 주요 항목 메모를 생성하도록 지시하는 프롬프트가 있습니다.
노트 통합 : 모든 청크를 분석하고 요약한 후 스크립트는 마지막 단계인 노트 통합으로 들어갑니다. 여기에서는 요약된 모든 요점이 수집되어 하나의 포괄적인 메모 세트로 형식화됩니다. 이 작업은 다른 # NoteTakerGPT에 의해 수행됩니다.
NoteTakerGPT를 사용하려면 다음 단계를 따르세요.
python NoteTakerGPT.py
스크립트가 자동으로 오디오 녹음 및 복사를 시작합니다. 기록 및 요약 프로세스는 KeyboardInterrupt 이벤트가 발생할 때까지 계속됩니다(일반적으로 Ctrl+C를 누름).
전사 및 요약 프로세스가 끝나면 스크립트는 녹음된 오디오에서 파생된 포괄적인 글머리 기호 메모 세트를 출력합니다.
기여는 언제나 환영합니다! 이 프로젝트에 기여하려면 저장소를 포크하고 끌어오기 요청을 제출하세요.
이 프로젝트는 MIT 라이선스 조건에 따라 라이선스가 부여됩니다. 전체 텍스트는 LICENSE 파일을 참조하세요. 이를 통해 원본 저작권 표시 및 면책 조항을 포함하는 한 자신의 프로젝트에서 코드를 사용, 수정 및 배포할 수 있습니다.