Aqui você (esperançosamente) encontrará tudo o que precisa saber para começar a usar o SEPIA.
Visão geral do ecossistema SEPIA (nota: algumas partes ainda estão nas ramificações de desenvolvimento).
Para atribuições de ícones de imagens, verifique a página inicial
Confira o Wiki para descrições detalhadas: SEPIA Framework Wiki
Visite Twitter ou Mastodon para obter as últimas notícias: SEPIA Twitter Feed | Alimentação de mastodonte SEPIA
Visite o blog para resumos e guias: SEPIA Blog
SEPIA é um acrônimo para: assistente auto-hospedado, extensível, pessoal e inteligente . É uma estrutura modular de código aberto equipada com todas as ferramentas necessárias para construir seu próprio assistente de voz digital completo, incluindo reconhecimento de fala (STT), detecção de palavra de ativação, conversão de texto em fala (TTS), natural - compreensão de linguagem, gerenciamento de diálogo, SDK(s), um aplicativo cliente multiplataforma e muito mais.
A estrutura consiste em vários microsserviços altamente personalizáveis que funcionam perfeitamente juntos para formar o SEPIA Open Assistant. Ele segue o princípio cliente-servidor usando um servidor Java leve e Elasticsearch DB como "cérebro" e um cliente baseado em Javascript que funciona como alto-falante inteligente, display inteligente, aplicativo de assistente móvel ou qualquer dispositivo inteligente que você criar? Todos os componentes funcionam em Linux, Windows e Mac e foram otimizados para funcionar perfeitamente em um Raspberry Pi ? ?.
Atualmente, o SEPIA pronto para uso possui serviços inteligentes para: notícias, música (rádio), cronômetros, alarmes, lembretes, listas de tarefas e compras, casa inteligente (por exemplo, usando ferramentas de código aberto como openHAB), navegação, lugares, clima, Wikipedia, pesquisa na web, resultados de futebol (Bundesliga), um pouco de conversa fiada e muito mais . Para concretizar suas próprias ideias, você pode usar ferramentas como o SEPIA SDK e o editor de código integrado ao SEPIA Control HUB para construir serviços ou escrever widgets HTML personalizados ????!
O SEPIA Framework consiste em 2 partes principais: o SEPIA Client e o Assist-Server.
Cliente SEPIA: A interface do usuário que lida com interações de voz, texto ou toque e gerencia o "diálogo" com o servidor SEPIA. As respostas do servidor podem ser apresentadas como texto (chat), elementos gráficos (cartões, botões) e/ou som, incluindo síntese de fala (text-to-speech) e música (media-player) . O cliente geralmente cuida do reconhecimento de fala (no dispositivo ou via servidor SEPIA STT) para transformar voz em texto e pode até ouvir wake-words como Hey SEPIA (graças ao Porcupine do Picovoice). Existem clientes para navegador, Android, iOS e uma versão DIY que funciona até "sem cabeça", por exemplo, em um Raspberry Pi.
Assist-Server: O "cérebro" do SEPIA que recebe solicitações do cliente por meio da API HTTP REST e cuida do entendimento da linguagem natural (intenção e NER), fluxo de conversação, integração de serviços inteligentes (como uma tarefa lista ou serviço de notícias), contas de usuário, conversão de texto em fala (TTS) e muito mais. O Assist-Server pode ser executado em seu próprio hardware, por exemplo, em SBCs como Raspberry Pi 3 ou paralelo ao cliente em sistemas mais potentes (RPi4, PC desktop etc.).
Como o reconhecimento de fala é um tópico muito delicado por vários motivos (privacidade, precisão, desempenho, controle etc.), o SEPIA Framework inclui outro componente importante: o servidor Speech-To-Text (STT).
Servidor SEPIA STT: um servidor de código aberto para reconhecimento de fala em tempo real que roda na maioria dos sistemas (x86, ARM), incluindo Raspberry Pi e suporta modelos ASR dinâmicos e personalizados (graças a ótimas ferramentas como Kaldi, Vosk ou Zamia Speech) .
Outros componentes notáveis do SEPIA Framework são o Control HUB para gerenciar servidores, clientes "sem cabeça", Smart Home e muito mais, o servidor WebSocket para bate-papos multicanais e transferência de dados duplex, o Teach-Server para armazenar comandos personalizados e um Java SDK para criar serviços personalizados poderosos.
Atualmente SEPIA trabalha em alemão e inglês com suporte básico para criação de comandos customizados em outros idiomas comuns. Alguns serviços, como notícias e resultados de futebol, são otimizados para alemão, o que significa que você receberá uma resposta em inglês, mas ainda poderá ver uma mistura de agências de notícias em inglês e alemão ou resultados de futebol da Bundesliga. Os serviços inteligentes estão constantemente melhorando e você mesmo pode editar facilmente a lista de pontos de venda.
Para usar o SEPIA, seu assistente de voz pessoal, digital e de código aberto, você precisa de duas coisas:
Para se conectar a um servidor personalizado basta abrir o aplicativo, alterar o “nome do host” na tela de login e reiniciar o aplicativo. Um nome de host típico pode ser o IP do servidor, "raspberrypi.local", "my-server.example.org/sepia" ou simplesmente manter "localhost" (para servidores de teste na mesma máquina).
Etapas básicas para instalar o servidor:
Instruções e um script de instalação (quase) automático para Raspberry Pi podem ser encontrados -AQUI-
Instruções para a instalação da pilha de servidores SEPIA em Linux, Windows ou Mac podem ser encontradas -AQUI-
Se você tiver alguma dúvida, precisar de ajuda ou quiser relatar um bug, clique aqui ou inicie uma discussão aqui.
Alguns serviços integrados no SEPIA requerem uma chave API para funcionar corretamente (por exemplo, navegação/geocodificação reversa). Descubra como obtê-los (de graça) aqui.
Se você administra seu próprio servidor e decide abri-lo ao público ou a seus amigos, certifique-se de que ele esteja devidamente protegido e informe os usuários sobre sua política de privacidade de dados, já que você está operando um banco de dados com informações pessoais potencialmente confidenciais.