Este proyecto de Unity es un cliente para generar, modificar y explorar entornos generados por IA a partir de indicaciones de voz.
Cuenta con dos escenas principales, una para escritorio y otra para realidad virtual, que te permiten explorar nuevos mundos. La idea de este proyecto es permitirte acceder a todas las funciones de IA desde una aplicación, reduciendo las interrupciones en el proceso de creación.
El proyecto se desarrolló en la Fondation Campus Biotech Geneva (GitHub), en colaboración con el Laboratorio de Ciencias Cognitivas (parte de EPLF).
La instalación es sencilla, ya que utilizamos funciones estándar de Unity. Aquí está la guía detallada.
La mayoría de los cascos de realidad virtual compatibles con OpenXR deberían funcionar de inmediato. El proyecto se desarrolló con HP Reverb G2 (un auricular de realidad mixta de Windows).
Importante
Este es solo el cliente, ¡necesita un servidor en ejecución para usar las funciones de IA! El repositorio para ejecutar el servidor se puede encontrar en: VR-Environment-GenAI-Server.
Este proyecto de Unity presenta una escena generada por una IA a partir de un mensaje de texto. La escena se crea dinámicamente en función del texto ingresado y permite generar entornos únicos y creativos.
Para generar una escena:
Es posible que deba establecer algunos parámetros de configuración para una experiencia fluida. La mayoría de los parámetros de configuración se encuentran en Assets/Configurations/api.json
.
En caso de que esté ejecutando el proyecto localmente VR y AI en la misma computadora (la configuración de "depuración"), debe configurar lo siguiente.
pythonFallbackApiFile
: ruta del archivo al archivo Python api.json
, este archivo debe estar en la carpeta raíz del proyecto Python.Si desea conectarse a un servidor remoto, las funciones importantes que debe configurar son:
serverDefaultIp
: la IP para llegar al servidor AI (preferiblemente IPv4).serverDefaultPort
: número de puerto predeterminado del servidor.Nota: si tanto el servidor como el archivo API alternativo se especifican correctamente, el servidor se ignorará y la conexión será local. Puede reemplazar la ruta del archivo API alternativa por cualquier ruta incorrecta para evitar este comportamiento.
Algunas opciones se consideran heredadas y se utilizan para la comunicación en el mismo almacenamiento de archivos. Puede especificar dónde debe guardar Python los archivos; las ubicaciones temporales son mejores.
audioPath
: la ruta al archivo de audio temporal que se guardará cuando se utiliza la función de voz a texto.baseImage
: la ruta a la textura que será modificada .maskPath
: la ruta a la textura de máscara temporal que se utiliza durante la función de pintura. Las principales características de este proyecto son:
Todas las escenas siguientes están en la carpeta Assets/Scenes
.
Las otras escenas son para fines de prueba:
Proporcionamos una documentación en línea, también puede acceder a ella en la carpeta docs/
.
La documentación se genera con DocFX, puedes regenerarla con DocFX.
cp README.md Documentation/index.md
# Option 1: Offline, static documentation
docfx Documentation/docfx.json -t statictoc,custom_template
# Option 2: on a web server
docfx Documentation/docfx.json
Ambos comandos generarán una documentación en docs/
.
Este proyecto permite la importación de palcos personalizados.
El palco se importa automáticamente a la escena cuando el jugador presiona Enter.
Lanzar la escena:
Como pequeña característica adicional, este proyecto incluye un pequeño experimento de respiración para la meditación.
Para comenzar el experimento de respiración:
Puede encontrar el repositorio público activo para este proyecto en: https://github.com/HugoFara/speech-to-world-unity-client
Para el servidor público oficial de IA: https://github.com/fcbg-hnp-vr/VR-Environment-GenAI-Server.