Para una versión similar para su reloj inteligente de Android, consulte mi otro repositorio de interlinga de asistentes GPT. Este proyecto aprovecha la API de asistentes de OpenAI.
(Hecho para un motor de finalización antiguo y adaptado para ChatGPT. No es tan bueno como las cosas modernas. Sigue buscando).
Este es un bot que le permite tener una conversación hablada atractiva y emotiva con ChatGPT o GPT-4 usando su micrófono. Si prefiere escribir en lugar de hablar, también puede conversar con el bot a través del terminal.
La herramienta utiliza un preajuste de chat GPT modificado, maneja el seguimiento de la conversación y utiliza la API de ChatGPT de forma predeterminada. Puede decirle algo a GPT y recordará lo que dijo para la sesión y también puede hacer que Bot desarrolle un recuerdo de usted con el tiempo si lo desea. A pesar de las limitaciones basadas en el recuento de tokens Max de GPT, GPT-VCC aún debería poder conversar con usted durante todo el tiempo que desee sin perder la conciencia sobre lo que ha hablado. Para usar esta herramienta, necesitará una tecla API OperaI válida.
El BOT requiere que la moderación de OpenAI y las API GPT funcionen correctamente sin demasiada latencia. Puede encontrar el estado aquí: https://status.openai.com/
Las versiones deben ser estables, en lo que respecta a las pruebas anteriores, pero no tendrán todas las características más recientes. Si desea tener todas las características como se enumeran aquí, clone el repositorio y ejecute 'git tirar' de vez en cuando. Esto le dará las características más recientes y las correcciones de errores a medida que vengan, pero podría ser inestable.
(Nota: Wisetech es el nombre de mi instancia de Bot eligió para sí misma)
En primer lugar, necesitará una tecla API de OpenAI. Puede crear una cuenta para obtener una clave API aquí: https://openai.com/api/.
Una vez que inicie sesión, presione en el círculo al lado del texto "personal" en la esquina superior derecha. Luego presione "Ver teclas API".
Presione "Crear nueva tecla secreta", luego guarde esa tecla. Esa es la clave que necesitará para ejecutar GPT-VCC. Pételo en el archivo TXT de teclas incluido de la siguiente manera:
OpenAI_Key={paste here without brackets}
Vaya a la pestaña "Billing" hacia la izquierda de la pantalla. Inicie un plan de pago cuando se quede sin crédito gratuito para seguir usando GPT-VCC.
Descargar Python en https://www.python.org/
Descargue este repositorio a través de las versiones, git clonando el repositorio o presionando el botón de código hacia la parte superior derecha y presionando "Descargar zip".
Extraiga contenido, luego mueva a la carpeta con los archivos.
Si tiene instalado el terminal de Windows, haga clic derecho en la parte vacía de la carpeta y seleccione 'Abrir en Terminal'. De lo contrario, use Win + R e Enter PowerShell. Una vez que esté en una ventana de terminal y en el directorio adecuado, use "Pip Install -r requirs.txt -upgrade". Si esto se hace con éxito, debería estar listo para comenzar tan pronto como obtenga una clave API de OpenAI.
Siga los pasos enumerados en el uso de GPT-VCC
Instalar pip3
sudo apt install python3-pip
Descargue este repositorio a través de las versiones, git clonando el repositorio o presionando el botón de código hacia la parte superior derecha y presionando "Descargar zip".
Extraiga archivos, mude al directorio, abra requisitos.txt y elimine pyaudio == 0.2.13 del archivo. Haga que parezca que nunca estuvo allí, preservando el formato original.
Descargue Pyaudio con Apt de la siguiente manera:
sudo apt install python3-pyaudio
Descargue espeak con apt de la siguiente manera (necesaria para la comunicación de la interfaz):
sudo apt install espeak
Descargue otros requisitos con PIP de la siguiente manera:
pip3 install -r requirements.txt --upgrade
Siga los pasos enumerados en el uso de GPT-VCC
Para usar este chatbot, ingrese el siguiente comando una vez que haya navegado a la carpeta del bot (reemplazando <key> con su tecla API):
python main.py <key>
Por conveniencia, también puede ingresar la clave en el archivo Keys.txt. Cuando ejecuta el script, el bot leerá automáticamente este archivo y cargará la clave.
Aparecerá una GUI Pygame; Sus colores representan el estado del bot. El color rojo indica que el bot no está escuchando. Para hacer que el bot te escuche, presiona espacio. El color se convertirá en amarillo cuando se cargue, luego en verde cuando escuche. Hable libremente cuando el color sea verde, su discurso se registrará, se convertirá en texto, luego se alimenta a GPT si cumple con las políticas de OpenAI. Cuando GPT está listo para responder, la pantalla se volverá azul.
Si desea usar el terminal, ejecute gptcli.py en su lugar usando la misma sintaxis (tener keyfile también funciona):
python gptcli.py <key>
Si desea usar ElevenLabs TTS, debe ingresar su clave de API personal de ElevenLabs siguiendo su clave API OpenAI de la siguiente manera o completar la clave en el archivo de clave:
python main.py <OpenAI key> <ElevenLabs TTS key>
Si no desea usar el TTS elegante, este bot usará automáticamente los TTS de Google.
La moderación utiliza tanto la herramienta de moderación de OpenAI como NLTK. Combinados, esperan evitar el uso de GPT que está fuera de la política de uso de Operai. Sin embargo, este no es un método infaliable, así que tenga cuidado con lo que le da a GPT.
Tenga en cuenta que las interrupciones o los problemas de latencia con la API de moderación le impedirán usar este chatbot. Si debe hablar con el bot mientras Openai tiene problemas, edite el archivo chatbot.py para excluir la condición "no self.flagged_by_openai (texto)". Sin embargo, no recomiendo esto.
Ahora puede usar voces alternativas si lo desea usar un argumento aprobado al comenzar el programa. En el futuro, se planea una forma más desarrollada de hacerlo. Por ahora, necesitará saber la identificación de la voz que desea usar (puede encontrar una lista de las ID de voz base aquí). Una vez que sepa esa identificación, úsela de la siguiente manera con el ejemplo de ID "21M00TCM4TLVDQ8IKWAM" para Rachel:
python main.py --voice_id 21m00Tcm4TlvDq8ikWAM
Para usar voces clonadas, haga lo siguiente:
Vaya al laboratorio de voz en https://beta.elevenlabs.io/voice-lab y cree una voz personalizada.
Una vez que tenga una voz clonada, vaya aquí https://api.elevenlabs.io/docs#/voices/get_voices_v1_voices_get.
Presione "Pruébelo", ingrese su tecla API en el cuadro, luego presione "Ejecutar".
Debajo del botón Ejecutar, verá un cuadro etiquetado como "cuerpo de respuesta". Desplácese hacia abajo en esta caja hasta que encuentre la voz que nombró. Obtenga el "Voice_ID" que está directamente sobre él y úselo como en el ejemplo anterior.
Barra espacial : esto comienza y detiene una grabación. Lo que digas se transcribirá y se enviará a GPT (si pasa filtros) una vez que presione el espacio por segunda vez.
Escape : esto sale sin memorizar.
P : Esto deja y tiene Bot, recuerde detalles sobre usted y sus conversaciones (los datos se guardan en el archivo de texto llamado Memories.txt)
P : Este es un comando depreciado para cancelar un mensaje. Ahora solo diga: "Cancele un mensaje" mientras se registra para cancelar.
Diga 'Establezca tokens en #' : cuando el bot reconoce esta frase, intentará establecer el max_tokens de la respuesta al valor que especificó.
Diga 'Habla como un robot' : esto establecerá todas las respuestas de GPT para ser habladas con un programa Robotic TTS que funciona fuera de línea. En el modo CLI, ingrese '! Robospeak ()' para alternar este modo.
Diga 'Deja de hablar como un robot' : esto revertirá los TT de Bot a lo que haya tenido antes (ya sea Google o ElevenLabs TTS). En el modo CLI, ingrese '! Robospeak ()' para alternar este modo.
Diga 'Muestre la conversación' : esto generará toda su conversación en la ventana del terminal.
Diga 'Muestre recuerdos' : esto proporcionará una salida de todas las recuerdos guardadas en el almacenamiento a largo plazo.
Diga 'Restaurar la memoria' : esto intentará reparar la memoria de trabajo del bot consolidando un cierto número de recuerdos del almacenamiento a largo plazo.
Diga 'Establezca el preajuste en' : esto establecerá el preajuste (una cadena de texto dada a AI al inicio de cada conversación) para el bot. Por ejemplo, el preajuste 'hablar como un pirata' hace que la AI hable como un pirata. Puede encontrar presets de ejemplo aquí: https://github.com/adri6336/gpt-voice-conversation-chatbot/wiki/example-press.
Diga 'Restablecer el preajuste' : esto eliminará el preajuste que realizó.
Diga 'Establezca el nombre en' : esto establecerá el nombre del bot en lo que sea que especifique, siempre que esté de acuerdo con las políticas de uso de OpenAI. Después de configurar el nombre, el bot se referirá a sí mismo con el nombre que establece.
Diga 'Por favor, alterne GPT4' : esto alternará entre los modelos ChATGPT y GPT-4. Al iniciar, su interruptor se conservará. En modo CLI, ingrese '! Gpt4 ()' para alternar el modelo.
Diga 'Establezca la creatividad en' : esto establecerá la aleatoriedad predeterminada del bot en un valor que especifique entre 1 y 15 (solía ser 9). En modo CLI, use '! Creatividad ( #)' donde el signo # es un valor entre 0.01 y 1.5.
Diga 'por favor, enumere los comandos' : esto tendrá la lista BOT de los comandos disponibles para usted.
Diga 'Por favor, alterne a OlevenLabs' : esto alternará y desactive el uso del bot de ElevenLabs. En modo CLI, use! 11ai () para alternarlo.
Diga 'Cancele el mensaje' : esto cancelará el mensaje, evitando que se envíe a GPT.
Tener una conversación personalizada con ChatGPT o GPT-4
Escuche a GPT hablar con usted con la herramienta TTS de Google (pronunciará los acentos con precisión si puede), en el TTS realista de ElevenLab (si tiene una clave API válida), o como un robot (digamos "Hable como un robot" para activar)
Habla con GPT Outloud usando la tecnología de reconocimiento de voz de Google
Bot recordará cosas sobre ti si cierra con la tecla 'Q'
Vea las respuestas de GPT como texto en la ventana Terminal. La mayoría de los caracteres UTF-32 (como el texto chino y árabe) también se imprimirán
Guarde automáticamente las conversaciones en un archivo en su disco para ayudarlo a realizar un seguimiento de lo que ha hablado
Guarde un preajuste personalizado para tener una experiencia más adecuada para usted y sus necesidades
Personalizar el nombre del bot
Personalizar la creatividad del bot
Chatear con GPT a través de la terminal (Windows y Linux)
Converse con BOT recreativamente
Use BOT para practicar un idioma mediante un ajuste preestablecido para hablar con usted en ese idioma como un maestro y escuchar las respuestas con la pronunciación adecuada utilizando los TTS de Google. Si lo prefiere, también puede quedarse con la voz multilingüe de Elevenlabs
Haga que BOT lo ayude a practicar la programación haciendo sus preguntas y dando comentarios sobre su código
Haga preguntas de BOT sobre varias cosas que aparecen
Pídale a Bot que lo ayude a escribir cartas de presentación y descripciones
Elevenlabs Demostración de voz
Demostración de voz en español de Google TTS