Download PersonalAIserver - Download do código-fonte PersonalAIserver

PersonalAIserver

Código-Fonte de IA

1.0.0

Baixar

Servidor pessoal de IA

Monte um servidor GenAI em seu próprio hardware disponível. Este projeto fornece uma interface web para interagir com modelos LLaMA e Stable Diffusion (entre outros) para geração de texto, imagem, vídeo e 3D.

Muitas pessoas têm uma boa GPU em mãos e estão dispostas a usá-la em vez de pagar por assinaturas de OpenAI, Anthropic, etc. Aqui, você pode hospedar seus próprios modelos de IA, embora com muitas limitações em comparação com esses excelentes serviços. Depois, você pode acessá-lo de qualquer lugar com um navegador da web, como seu telefone ou outro computador.

Tela de login Página de modelos Geração de texto Geração de imagem

Características

Geração de texto usando LLaMA 3.2-1B-Instruct
Geração de imagem usando meio Stable Diffusion 3.5
Autenticação de usuário e segurança baseada em token JWT
Frontend baseado em React com componentes de UI modernos
Back-end FastAPI com suporte CORS

Configurar

O front-end para isso está hospedado nas páginas do GitHub, enquanto o back-end está hospedado na máquina do servidor disponível.

Após a configuração, o frontend estará disponível em https://[username].github.io/PersonalAIserver . Siga as instruções abaixo para configurar o back-end.

Front-end (páginas do GitHub hospedadas)

Para o frontend, apenas uma ação do GitHub precisa ser configurada para construir a página do projeto. Em seu repositório bifurcado, navegue até Settings -> Pages -> Source e defina-o como "Ações do GitHub". A compilação será executada automaticamente quando você enviar para o repositório, graças ao arquivo .github/workflows/main.yml .

Front-end (hospedado local)

Caso queira rodar o frontend localmente, siga as instruções abaixo. Requer Node.js, instalável a partir do gerenciador de versão do nó (nvm).

Configure o ambiente do aplicativo. No diretório frontend, execute os seguintes comandos:

 nvm install 20
npm install -D @shadcn/ui 
npx shadcn@latest init # Select default style, any color, and dont use css variables. 
npx shadcn@latest add alert button card input textarea # Accept defaults
npm install lucide-react
npm install -D @tailwindcss/typography
npm install clsx tailwind-merge
npm install
npm install sharp

Executando o front-end local

 npm run dev

Isso deve servir ao frontend em http://localhost:3000 , que você pode acessar com um navegador da web.

Back-end

Isso usa conda para gerenciamento de pacotes, mas fique à vontade para usar qualquer outro gerenciador de pacotes.

Em seu terminal no diretório backend, execute os seguintes comandos:

Criar ambiente conda

 conda create -n personalai python=3.11
conda activate personalai

Instalar dependências

 pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu124
pip install -r requirements.txt

Abraçando a configuração do rosto

Crie uma conta e faça login no Hugging Face.
Concorde com os termos de uso do modelo: difusão estável-3,5-médio, Llama-3.2-1B-Instruir.
Crie um token de acesso pessoal somente leitura: configurações/tokens.

Configuração de arquivos locais

Crie um arquivo users.json no diretório backend com o seguinte formato:

 {
    "username1": {
        "username": "username1",
        "password": "password1",
        "disabled": false
    },
    "username2": {
        "username": "username2",
        "password": "password2",
        "disabled": false
    }
    ...
}

Crie um arquivo .secret no diretório backend com uma string aleatória de sua escolha. Isso é usado para criptografar o token JWT. Eu recomendo gerar um com:

 import secrets
secret_key = secrets.token_hex(32)
print(secret_key)

e depois copiando a saída.

Segredos do GitHub (se estiver construindo para acesso público com GitHub Pages)

Navegue até Settings -> Secrets and variables -> Actions em seu repositório bifurcado
Adicione um segredo de repositório com o nome NEXT_PUBLIC_API_URL e o valor sendo a URL do servidor backend (mais detalhes abaixo). Exemplo: https://api.example.com .

Ajustar as origens do CORS

Em backend/backend.py , ajuste o CORSMiddleware próximo à linha 40 para incluir os URLs do seu frontend.

Executando o back-end

Faça login no Hugging Face com huggingface-cli login e use seu token de acesso pessoal criado acima como senha.
Execute o back-end com python backend/backend.py --public ou remova --public se desejar executar o servidor apenas no localhost. Localhost requer que você execute o frontend localmente também.

Hospedando o back-end

Existem muitas opções para hospedar o back-end em uma URL pública, mas recomendo usar o Cloudflare Tunnel. O Cloudflare Tunnel roteia o tráfego da Internet para o seu servidor sem expor uma porta ou seu IP local. Ele também suporta HTTPS, criptografia SSL e proteção DDoS, entre outros recursos de segurança que você mesmo precisaria configurar e manter.

Outras opções incluem:

Ngrok
Endereço IP local + encaminhamento de porta

Para o Cloudflare Tunnel, você precisará de um nome de domínio e uma conta Cloudflare.

Instale o cloudflared na máquina back-end: https://developers.cloudflare.com/cloudflare-one/connections/connect-apps/install-and-setup/installation/
Execute cloudflared tunnel login . Esta etapa abre uma janela do navegador para fazer login com sua conta Cloudflare.
Execute cloudflared tunnel create genai-api . Esta etapa gera um ID de túnel. Anote isso nas próximas etapas.
Crie um arquivo de configuração ~/.cloudflared/config.yml:

 tunnel: <your-tunnel-id>
credentials-file: /home/user/.cloudflared/<tunnel-id>.json

ingress:
  - hostname: <your-api-url>
    service: http://localhost:8000
  - service: http_status:404

O <your-api-url> deve ser o nome de domínio que você registrou nos servidores de nomes da Cloudflare e pode ser um subdomínio. Por exemplo, se você possui example.com , poderá usar genai.example.com ou api.example.com . 5. Crie o registro DNS cloudflared tunnel route dns <tunnel-id> <your-api-url> . Isso cria o túnel para a Cloudflare rotear o tráfego da Internet para o seu servidor sem expor uma porta ou seu IP local.

Mudando de modelo

Em backend/backend.py , você pode alterar os modelos usados. Encontre o modelo no Hugging Face que você gostaria de usar para geração de texto/imagem e ajuste as configurações do modelo ModelManager (linha ~127). Por padrão, usa o modelo LLaMA 3.2-1B-Instruct para geração de texto e o modelo de meio Stable Diffusion 3.5 para geração de imagens. Abaixo estão os requisitos de VRAM para cada modelo testado.

Tipo de modelo	Nome do modelo	Uso de VRAM (GB)	Notas
Texto	metal-lhama/Lhama-3.2-1B-Instruir	~8	Modelo base para geração de texto
Imagem	estabilidadeai/difusão estável-3,5-médio	~13	Funciona bem em RTX 4090
Imagem	estabilidadeai/difusão estável-3,5-grande	~20-30	Excede 4.090 VRAM para prompts longos

Nota: O uso de VRAM pode variar dependendo da resolução da imagem, comprimento dos prompts de texto e outros parâmetros. Os valores mostrados são aproximados para configurações padrão. Modelos de transformadores quantizados são suportados para reduzir ainda mais o uso de VRAM, mas não são usados por padrão (consulte backend/backend.py linhas 178-192). O grande modelo de difusão estável mal cabe na VRAM do meu 4090 com quantização. As velocidades do chatbot são extremamente rápidas no meu 4090, com a geração de imagens levando até 30 segundos para 100 etapas para imagens de 1024x1024.

O prompt do sistema para o modelo de idioma pode ser encontrado em backend/system_prompt.txt . No momento, é uma versão do modelo Claude 3.5 Sonnet da Anthropic, lançado em 22 de outubro de 2024. https://docs.anthropic.com/en/release-notes/system-prompts#claude-3-5-sonnet

Notas e isenções de responsabilidade

Não sou um desenvolvedor web ou especialista em segurança, portanto provavelmente há muitos problemas de segurança e usabilidade neste projeto. Use por sua conta e risco. Todo o frontend e sistema de login foram gerados com Claude.
Este projeto não é afiliado à Meta ou Stability AI, nem a nenhuma empresa para a qual trabalho. Este é simplesmente um projeto pessoal para aprender sobre os modelos Hugging Face e sua implantação em hardware local.
Não pretendo manter este projeto. É puramente um projeto de hobby aprender sobre LLMs e IA. Sinta-se à vontade para contribuir, ficarei feliz em ver alguns pull requests!

Expandir

Informações adicionais

Versão 1.0.0
Tipo Código-Fonte de IA
Data da Última Atualização 2024-12-26
tamanho 3.42MB
Vindo de Github

Aplicativos Relacionados

node telegram bot api

2024-12-14
typebot.io

2024-12-14
python wechaty getting started

2024-12-14
TranscriberBot

2024-12-14
genal chat

2024-12-14
Facemoji

2024-12-14

Recomendado para você

chat.petals.dev

Outro código-fonte

1.0.0
GPT Prompt Templates

Outro código-fonte

1.0.0
GPTyped

Outro código-fonte

GPTyped 1.0.5
node telegram bot api

Código-Fonte de IA

v0.50.0
typebot.io

Código-Fonte de IA

v3.1.2
python wechaty getting started

Código-Fonte de IA

1.0.0
waymo open dataset

Outro código-fonte

December 2023 Update
termwind

Outras categorias

v2.3.0
wp functions

Outras categorias

1.0.0

Informações Relacionadas Todos