이 Unity 프로젝트는 음성 안내를 통해 AI가 생성한 환경을 생성, 수정 및 탐색하기 위한 클라이언트입니다.
여기에는 데스크톱용 장면과 가상 현실용 장면 등 두 가지 주요 장면이 포함되어 있어 둘 다 새로운 세계를 탐험할 수 있습니다. 이 프로젝트의 아이디어는 애플리케이션에서 모든 AI 기능에 액세스할 수 있게 하여 생성 프로세스의 중단을 줄이는 것입니다.
이 프로젝트는 인지 과학 연구소(EPLF의 일부)와 협력하여 Fondation Campus Biotech Geneva(GitHub)에서 개발되었습니다.
표준 Unity 기능을 사용하므로 설치가 간단합니다. 자세한 가이드는 다음과 같습니다.
OpenXR과 호환되는 대부분의 VR 헤드셋은 기본적으로 작동합니다. 이 프로젝트는 HP Reverb G2(Windows 혼합 현실 헤드셋)를 사용하여 개발되었습니다.
중요한
이것은 클라이언트일 뿐이므로 실제로 AI 기능을 사용하려면 실행 중인 서버가 필요합니다! 서버를 실행하기 위한 저장소는 VR-Environment-GenAI-Server에서 찾을 수 있습니다.
이 Unity 프로젝트에는 텍스트 프롬프트에서 AI가 생성한 장면이 포함되어 있습니다. 장면은 입력된 텍스트를 기반으로 동적으로 생성되며 독특하고 창의적인 환경을 생성할 수 있습니다.
장면을 생성하려면:
원활한 경험을 위해 몇 가지 구성 매개변수를 설정해야 할 수도 있습니다. 대부분의 구성 매개변수는 Assets/Configurations/api.json
아래에 있습니다.
동일한 컴퓨터에서 로컬 VR 및 AI 프로젝트를 실행하는 경우("디버그" 구성), 다음을 설정해야 합니다.
pythonFallbackApiFile
: Python api.json
파일의 파일 경로입니다. 이 파일은 Python 프로젝트의 루트 폴더에 있어야 합니다.원격 서버에 연결하려는 경우 설정해야 할 중요한 기능은 다음과 같습니다.
serverDefaultIp
: AI 서버에 연결하기 위한 IP입니다(IPv4 선호).serverDefaultPort
: 서버 기본 포트 번호입니다.참고: 서버와 대체 API 파일이 모두 올바르게 지정되면 서버가 무시되고 연결은 로컬이 됩니다. 이 동작을 방지하려면 대체 API 파일 경로를 잘못된 경로로 바꿀 수 있습니다.
일부 옵션은 레거시로 간주되며 동일한 파일 스토리지에서 통신에 사용됩니다. Python이 파일을 저장할 위치를 지정할 수 있으며 임시 위치가 더 좋습니다.
audioPath
: 음성-텍스트 기능을 사용할 때 저장할 임시 오디오 파일의 경로입니다.baseImage
: 수정될 텍스처의 경로입니다.maskPath
: 인페인팅 기능 중에 사용되는 임시 마스크 텍스처의 경로입니다. 이 프로젝트의 주요 기능은 다음과 같습니다.
다음 장면은 모두 Assets/Scenes
폴더에 있습니다.
다른 장면은 목적을 테스트하기 위한 것입니다.
우리는 온라인 문서를 제공하며 docs/
폴더에서도 액세스할 수 있습니다.
문서는 DocFX로 생성되며 DocFX로 다시 생성할 수 있습니다.
cp README.md Documentation/index.md
# Option 1: Offline, static documentation
docfx Documentation/docfx.json -t statictoc,custom_template
# Option 2: on a web server
docfx Documentation/docfx.json
두 명령 모두 docs/
아래에 문서를 생성합니다.
이 프로젝트에서는 사용자 정의 스카이박스를 가져올 수 있습니다.
플레이어가 Enter 키를 누르면 스카이박스가 자동으로 장면으로 가져옵니다.
장면 실행:
작은 보너스 기능으로 이 프로젝트에는 명상을 위한 작은 호흡 실험이 포함되어 있습니다.
호흡 실험을 시작하려면:
이 프로젝트의 활성 공개 저장소는 https://github.com/HugoFara/speech-to-world-unity-client에서 찾을 수 있습니다.
공식 공용 AI 서버: https://github.com/fcbg-hnp-vr/VR-Environment-GenAI-Server.