Загрузка PersonalAIserver - Загрузка исходного кода PersonalAIserver

PersonalAIserver

AI Исходный код

1.0.0

Скачать

Персональный ИИ-сервер

Установите сервер GenAI на имеющемся у вас оборудовании. Этот проект предоставляет веб-интерфейс для взаимодействия с моделями LLaMA и стабильной диффузии (среди прочих) для создания текста, изображений, видео и 3D.

Многие люди имеют под рукой хороший графический процессор и готовы использовать его вместо оплаты подписок на OpenAI, Anthropic и т. д. Здесь вы можете размещать свои собственные модели ИИ, хотя и со многими ограничениями по сравнению с этими замечательными сервисами. Затем вы сможете получить к нему доступ из любого места с помощью веб-браузера, например, с телефона или другого компьютера.

Экран входа в систему Страница моделей Генерация текста Генерация изображений

Функции

Генерация текста с использованием LLaMA 3.2-1B-Instruct
Генерация изображений с использованием среды Stable Diffusion 3.5
Аутентификация пользователя и безопасность на основе токена JWT
Интерфейс на основе React с современными компонентами пользовательского интерфейса.
Серверная часть FastAPI с поддержкой CORS

Настраивать

Интерфейс для этого размещен на страницах GitHub, а серверная часть — на вашем доступном сервере.

После настройки интерфейс будет доступен по адресу https://[username].github.io/PersonalAIserver . Следуйте инструкциям ниже, чтобы настроить серверную часть.

Фронтенд (размещение страниц на GitHub)

Для внешнего интерфейса необходимо настроить только действие GitHub для создания страницы проекта. В разветвленном репозитории перейдите в Settings -> Pages -> Source » и установите для него значение «Действия GitHub». Сборка запустится автоматически при отправке в репозиторий благодаря файлу .github/workflows/main.yml .

Фронтенд (локальный хостинг)

Если вы хотите запустить интерфейс локально, следуйте инструкциям ниже. Требуется Node.js, который можно установить из диспетчера версий узла (nvm).

Настройка среды приложения. Из каталога внешнего интерфейса выполните следующие команды:

 nvm install 20
npm install -D @shadcn/ui 
npx shadcn@latest init # Select default style, any color, and dont use css variables. 
npx shadcn@latest add alert button card input textarea # Accept defaults
npm install lucide-react
npm install -D @tailwindcss/typography
npm install clsx tailwind-merge
npm install
npm install sharp

Запуск локального интерфейса

 npm run dev

Это должно обслуживать интерфейс по адресу http://localhost:3000 , к которому вы можете получить доступ через веб-браузер.

Бэкэнд

Для управления пакетами используется conda, но вы можете использовать любой другой менеджер пакетов.

В вашем терминале во внутреннем каталоге выполните следующие команды:

Создать среду Конды

 conda create -n personalai python=3.11
conda activate personalai

Установить зависимости

 pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu124
pip install -r requirements.txt

Настройка «Обнимающее лицо»

Создайте учетную запись и войдите в Hugging Face.
Согласитесь с условиями использования модели: стабильная-диффузия-3.5-средняя, Llama-3.2-1B-Instruct.
Создайте личный токен доступа только для чтения: настройки/токены.

Настройка локальных файлов

Создайте файл users.json во внутреннем каталоге следующего формата:

 {
    "username1": {
        "username": "username1",
        "password": "password1",
        "disabled": false
    },
    "username2": {
        "username": "username2",
        "password": "password2",
        "disabled": false
    }
    ...
}

Создайте файл .secret во внутреннем каталоге со случайной строкой по вашему выбору. Это используется для шифрования токена JWT. Я рекомендую создать его с помощью:

 import secrets
secret_key = secrets.token_hex(32)
print(secret_key)

а затем скопируйте вывод.

Секреты GitHub (при создании для публичного доступа с помощью GitHub Pages)

Перейдите в Settings -> Secrets and variables -> Actions в вашем разветвленном репозитории.
Добавьте секрет репозитория с именем NEXT_PUBLIC_API_URL и значением URL-адреса внутреннего сервера (подробнее ниже). Пример: https://api.example.com .

Отрегулируйте происхождение CORS

В backend/backend.py настройте CORSMiddleware рядом со строкой 40, чтобы включить URL-адреса вашего внешнего интерфейса.

Запуск бэкэнда

Войдите в Hugging Face с помощью huggingface-cli login и используйте свой личный токен доступа, созданный выше, в качестве пароля.
Запустите серверную часть с помощью python backend/backend.py --public или удалите --public , если вы хотите запускать сервер только на локальном хосте. Localhost также требует, чтобы вы запускали интерфейс локально.

Размещение серверной части

Существует множество вариантов размещения серверной части по общедоступному URL-адресу, но я рекомендую использовать Cloudflare Tunnel. Cloudflare Tunnel направляет трафик из Интернета на ваш сервер, не раскрывая порт или ваш локальный IP-адрес. Он также поддерживает HTTPS, SSL-шифрование и защиту от DDoS, а также другие функции безопасности, которые в противном случае вам пришлось бы настраивать и поддерживать самостоятельно.

Другие варианты включают в себя:

Нгрок
Локальный IP-адрес + переадресация портов

Для Cloudflare Tunnel вам понадобится доменное имя и учетная запись Cloudflare.

Установите Cloudflared на серверную машину: https://developers.cloudflare.com/cloudflare-one/connections/connect-apps/install-and-setup/installation/
Запустите cloudflared tunnel login . На этом шаге откроется окно браузера для входа в вашу учетную запись Cloudflare.
Запустите cloudflared tunnel create genai-api . На этом этапе генерируется идентификатор туннеля. Обратите внимание на это для следующих шагов.
Создайте файл конфигурации ~/.cloudflared/config.yml:

 tunnel: <your-tunnel-id>
credentials-file: /home/user/.cloudflared/<tunnel-id>.json

ingress:
  - hostname: <your-api-url>
    service: http://localhost:8000
  - service: http_status:404

<your-api-url> должен быть доменным именем, которое вы зарегистрировали на серверах имен Cloudflare, и может быть субдоменом. Например, если у вас есть example.com , вы можете использовать genai.example.com или api.example.com . 5. Создайте DNS-запись cloudflared tunnel route dns <tunnel-id> <your-api-url> . Это создает туннель для Cloudflare, который будет маршрутизировать трафик из Интернета на ваш сервер, не раскрывая порт или ваш локальный IP-адрес.

Изменение моделей

В backend/backend.py вы можете изменить используемые модели. Найдите в Hugging Face модель, которую вы хотите использовать для генерации текста/изображения, и настройте конфигурации модели ModelManager (строка ~127). По умолчанию используется модель LLaMA 3.2-1B-Instruct для генерации текста и средняя модель Stable Diffusion 3.5 для генерации изображений. Ниже приведены требования к видеопамяти для каждой протестированной модели.

Тип модели	Название модели	Использование видеопамяти (ГБ)	Примечания
Текст	мета-лама/Llama-3.2-1B-Instruct	~8	Базовая модель для генерации текста
Изображение	стабильностьай/стабильная-диффузия-3,5-средняя	~13	Хорошо работает на RTX 4090.
Изображение	стабилностьай/стабильная-диффузия-3,5-большая	~20-30	Превышает 4090 видеопамяти для длинных запросов

Примечание. Использование видеопамяти может варьироваться в зависимости от разрешения изображения, длины текстовых подсказок и других параметров. Показанные значения являются приблизительными для настроек по умолчанию. Поддерживаются модели квантованного преобразователя для дальнейшего снижения использования видеопамяти, но они не используются по умолчанию (см. строки 178–192 файла backend/backend.py ). Большая модель стабильной диффузии едва помещается в видеопамять моего 4090 с квантованием. Скорость чат-бота на моем 4090 чрезвычайно высока: генерация изображения занимает до 30 секунд на 100 шагов для изображений 1024x1024.

Системное приглашение для языковой модели можно найти в backend/system_prompt.txt . На данный момент это версия модели Claude 3.5 Sonnet от Anthropic, выпущенной 22 октября 2024 года. https://docs.anthropic.com/en/release-notes/system-prompts#claude-3-5-sonnet

Примечания и отказ от ответственности

Я не веб-разработчик и не эксперт по безопасности, поэтому, вероятно, в этом проекте есть много проблем с безопасностью и удобством использования. Используйте на свой страх и риск. Весь интерфейс и система входа в систему были созданы с помощью Клода.
Этот проект не связан ни с Meta или Stability AI, ни с какой-либо компанией, в которой я работаю. Это просто личный проект по изучению моделей Hugging Face и их развертыванию на локальном оборудовании.
Я не планирую поддерживать этот проект. Для меня это просто хобби-проект — узнать о магистратуре и искусственном интеллекте. Не стесняйтесь вносить свой вклад, я буду рад увидеть несколько запросов на включение!

Расширять

Дополнительная информация