EasyLLMOpsダウンロード - EasyLLMOpsソースコードのダウンロード

EasyLLMOps

EasyLLMOps: 強力な言語モデルのための簡単な MLOps。

パイプライン

導入

EasyLLMOps は、言語モデルの管理とスケーリングのために Google Kubernetes Engine (GKE) にデプロイできる Open WebUI で構築されたプロジェクトです。 Terraform と手動の両方の展開方法を提供し、堅牢な MLOps プラクティスを組み込んでいます。これには、自動化のための Jenkins と Ansible による CI/CD パイプライン、パフォーマンスに関する洞察のための Prometheus および Grafana によるモニタリング、トラブルシューティングと分析のための ELK スタックによる集中ログが含まれます。開発者は、プロジェクトの Web サイトで詳細なドキュメントと手順を見つけることができます。

デモ.mp4

特徴

使いやすさ: EasyLLMOps は、経験レベルに関係なく、LLM の管理をシンプルかつ効率的に行う直感的なインターフェイスと合理化されたワークフローを提供します。
スケーラビリティと柔軟性: LLM 導入を簡単に拡張し、進化するニーズに適応し、既存のインフラストラクチャとシームレスに統合します。
複雑さの軽減: 複雑な構成やインフラストラクチャ管理の煩わしさがなくなり、強力な LLM アプリケーションの構築と展開に集中できるようになります。
生産性の向上: LLM 開発ライフサイクルを加速し、パフォーマンスを最適化し、言語モデルの影響を最大化します。

対象者

LLM を利用したアプリケーションを構築および展開する開発者。 LLM を使用するデータサイエンティストと機械学習エンジニア。 LLM インフラストラクチャの管理を担当する DevOps チーム。 LLM を自社の業務に統合しようとしている組織。

導入
特徴
対象者
はじめる
- クイックスタート
- Google Kubernetes Engine (GKE) での Terraform の使用
  - クラスターをセットアップする
  - クラスター情報の取得
- GKE への手動デプロイ
  - Nginx Ingress コントローラーをデプロイする
  - APIキーシークレットの構成
  - 権限の付与
  - Redis を使用してキャッシュサービスをデプロイする
  - LiteLLM のデプロイ
  - オープン WebUI をデプロイする
  - アプリケーションを試してみる
- Jenkins と Ansible を使用した継続的インテグレーション/継続的デプロイメント (CI/CD)
  - Jenkinsサーバーのセットアップ
  - ジェンキンスにアクセスする
  - Jenkins プラグインのインストール
  - ジェンキンスの構成
  - セットアップをテストする
- Prometheus と Grafana によるモニタリング
  - Discord Webhook を作成する
  - Helm リポジトリの構成
  - 依存関係のインストール
  - プロメテウスのデプロイ
  - テストアラート
- Filebeat + Logstash + Elasticsearch + Kibana を使用したロギング
  - クイックラン
  - Helm を使用して ELK スタックをインストールする
  - キバナへのアクセス
  - ログ収集の検証
- Cast AI によるクラスターの最適化
- Langfuse と Supabase を使用したログとトレース
貢献する
ライセンス
引用
接触

はじめる

あまり時間をかけたくない場合は、次のスクリプトを実行してコーヒーを楽しんでください。

chmod +x ./cluster.sh
./cluster.sh

Terraform を使用する前に、必ず GCP で認証してください。

gcloud auth application-default login

クイックスタート

このセクションでは、アプリケーションをできるだけ早く立ち上げて実行するためのクイックスタートガイドを提供します。詳細な手順については、次のセクションを参照してください。

Google Kubernetes Engine (GKE) での Terraform の使用

1. クラスターをセットアップします。

アプリケーションを GKE にデプロイしている場合は、Terraform を使用して Kubernetes クラスタのセットアップを自動化できます。 iac/terraformディレクトリに移動し、Terraform を初期化します。

 cd iac/terraform
terraform init

構成を計画して適用します。

実行プランを生成して、Terraform が作成または変更するリソースを確認し、構成を適用してクラスターをセットアップします。

terraform plan
terraform apply

2. クラスター情報を取得します。

GKE クラスタを操作するには、その構成を取得する必要があります。次のコマンドを使用して、現在のクラスター構成を表示できます。

cat ~ /.kube/config

1-init-cluster.mp4

クラスターを管理するためにkubectlコンテキストが正しく設定されていることを確認してください。

GKE への手動デプロイ

より実践的な展開プロセスについては、次の手順に従います。

1. Nginx Ingress コントローラーをデプロイします。

Nginx Ingress Controller は、Kubernetes クラスター内のサービスへの外部アクセスを管理します。名前空間を作成し、Helm を使用して Ingress コントローラーをインストールします。

kubectl create ns nginx-system
kubens nginx-system
helm upgrade --install nginx-ingress ./deployments/nginx-ingress

後で必要になるため、Nginx Ingress コントローラーの IP アドレスを記録してください。

2-init-nginx-ingress-controller.mp4

2. API キーシークレットを構成します。

API キーなどの環境変数を Kubernetes シークレットに安全に保存します。モデル提供用の名前空間を作成し、 .envファイルからシークレットを作成します。

kubectl create ns model-serving
kubens model-serving
kubectl delete secret easyllmops-env 
kubectl create secret generic easyllmops-env --from-env-file=.env -n model-serving
kubectl describe secret easyllmops-env -n model-serving

3-デプロイ-秘密.mp4

3. 権限を付与します。

Kubernetes リソースには多くの場合、特定の権限が必要です。必要なロールとバインディングを適用します。

 cd deployments/infrastructure
kubectl apply -f role.yaml
kubectl apply -f rolebinding.yaml

4-許可許可.mp4

4. Redis を使用してキャッシュサービスをデプロイします。

次に、Redis を使用してセマンティックキャッシュサービスをデプロイします。

 cd ./deployments/redis
helm dependency build
helm upgrade --install redis .

5-デプロイ-redis.mp4

5. LiteLLM を展開します。

LiteLLM サービスをデプロイします。

kubens model-serving
helm upgrade --install litellm ./deployments/litellm

6-デプロイ-litellm.mp4

6. Open WebUI を展開します。

次に、ウェブ UI を GKE クラスタにデプロイします。

 cd open-webui
kubectl apply -f ./kubernetes/manifest/base -n model-serving

7-デプロイ-openwebui.mp4

7. アプリケーションを試してみましょう。

ブラウザを開いて GKE クラスタの URL (例: ステップ 1 のhttp://172.0.0.0 ) に移動し、URL の末尾に.nip.ioを追加します (例: http://172.0.0.0.nip.io )。。 Open WebUI が表示されるはずです。

8-final-web-app.mp4

Jenkins と Ansible を使用した継続的インテグレーション/継続的デプロイメント (CI/CD)

自動化された CI/CD パイプラインの場合は、次のように Jenkins と Ansible を使用します。

1. Jenkins サーバーをセットアップします。

まず、サービスアカウントを作成し、それにCompute Adminロールを割り当てます。次に、サービスアカウントの Json キーファイルを作成し、 iac/ansible/secretsディレクトリに保存します。

次に、ポート 8081 と 50000 でのトラフィックを許可するファイアウォールルールを使用して、Ubuntu 22.04 を実行する「jenkins-server」という名前の Google Compute Engine インスタンスを作成します。

ansible-playbook iac/ansible/deploy_jenkins/create_compute_instance.yaml

前提条件をインストールし、Docker イメージを取得し、Docker ソケットと公開ポート 8081 および 50000 にアクセスできる特権コンテナーを作成することで、サーバーに Jenkins をデプロイします。

ansible-playbook -i iac/ansible/inventory iac/ansible/deploy_jenkins/deploy_jenkins.yaml

9-setup-jenkins-server.mp4

2. Jenkins にアクセスします。

SSH 経由で Jenkins サーバーにアクセスするには、公開鍵と秘密鍵のペアを作成する必要があります。次のコマンドを実行してキーペアを作成します。

ssh-keygen

Metadataを開き、 ssh-keys値をコピーします。

10-セットアップ-ssh-key.mp4

サーバーにアクセスできるようにするには、Jenkins サーバーのパスワードを見つける必要があります。まず、Jenkins サーバーにアクセスします。

ssh < USERNAME > : < EXTERNAL_IP >

次に、次のコマンドを実行してパスワードを取得します。

sudo docker exec -it jenkins-server bash
cat /var/jenkins_home/secrets/initialAdminPassword

11-パスワードの取得.mp4

Jenkins がデプロイされたら、ブラウザーからアクセスします。

 http://<EXTERNAL_IP>:8081

12-access-jenkins-server.mp4

3. Jenkins プラグインをインストールします。

Jenkins を Docker、Kubernetes、GKE と統合するには、次のプラグインをインストールします。

ドッカー
Docker パイプライン
Kubernetes
Google Kubernetes エンジン

プラグインをインストールしたら、Jenkins を再起動します。

sudo docker restart jenkins-server

13-インストール-プラグイン.mp4

4. Jenkins を構成します。

4.1. Webhook を GitHub リポジトリに追加して、Jenkins ビルドをトリガーします。

GitHub リポジトリに移動し、 Settingsをクリックします。 Webhooksをクリックし、 Add Webhookをクリックします。 Jenkins サーバーの URL を入力します (例: http://<EXTERNAL_IP>:8081/github-webhook/ )。次に、 Let me select individual eventsをクリックし、 Let me select individual eventsを選択します。 PushとPull Requestを選択し、 Add Webhookをクリックします。

14-add-webhook.mp4

4.2. Github リポジトリを Jenkins ソースコードリポジトリとして追加します。

Jenkins ダッシュボードに移動し、 New Itemをクリックします。プロジェクトの名前 (例: easy-llmops ) を入力し、 Multibranch Pipelineを選択します。 OKをクリックします。 Configureをクリックし、 Add Sourceをクリックします。 GitHubを選択し、 Addをクリックします。 GitHub リポジトリの URL を入力します (例: https://github.com/bmd1905/EasyLLMOps )。 CredentialsフィールドでAddを選択し、 Username with passwordを選択します。 GitHub のユーザー名とパスワードを入力します (または個人のアクセストークンを使用します)。 Test Connectionをクリックし、 Saveをクリックします。

15-connect-github-to-jenkins.mp4

4.3. Docker Hub の認証情報をセットアップします。

まず、Docker Hub アカウントを作成します。 Docker Hub Web サイトにアクセスし、 Sign Upをクリックします。ユーザー名とパスワードを入力します。 Sign Upをクリックします。 Create Repositoryをクリックします。リポジトリの名前 (例: easy-llmops ) を入力し、 Createをクリックします。

Jenkins ダッシュボードから、 Manage Jenkins > Credentialsに移動します。 Add Credentialsをクリックします。 Username with passwordを選択し、 Addをクリックします。 Docker Hub のユーザー名、アクセストークンを入力し、 ID dockerhubに設定します。

16-add-docker-credential.mp4

4.4. Kubernetes 認証情報をセットアップします。

まず、GKE クラスタにアクセスするための Jenkins サーバーのサービスアカウントを作成します。 GCP コンソールに移動し、[IAM と管理] > [サービスアカウント] に移動します。 Kubernetes Engine Adminロールを持つ新しいサービスアカウントを作成します。サービスアカウントに名前と説明を付けます。サービスアカウントをクリックし、 Keysタブをクリックします。 Add Keyをクリックし、キーの種類としてJSON選択します。 Createをクリックして、JSON ファイルをダウンロードします。

17-add-jenkins-sa.mp4

次に、Jenkins ダッシュボードから、 Manage Jenkins > Cloudに移動します。 New cloudをクリックします。 Kubernetesを選択します。クラスタの名前 (例: gke-easy-llmops-cluster-1), enter the URL and Certificate from your GKE cluster. In the [Kubernetes 名前空間] gke-easy-llmops-cluster-1), enter the URL and Certificate from your GKE cluster. In the , enter the namespace of your cluster (eg model-serving ). In the [資格情報] フィールド). In the field, select and select 。プロジェクト ID と JSON ファイルへのパスを入力します。

18-add-cloud-jenkins.mp4

5. セットアップをテストします。

新しいコミットを GitHub リポジトリにプッシュします。 Jenkins に新しいビルドが表示されるはずです。

19-テスト-cicd.mp4

Prometheus と Grafana によるモニタリング

1. Discord Webhook を作成します。

まず、Discord Webhook を作成します。 Discord Web サイトにアクセスし、 Server Settingsをクリックします。 Integrationsをクリックします。 Create Webhookをクリックします。 Webhook の名前 (例: easy-llmops-discord-webhook ) を入力し、 Createをクリックします。 Webhook URL をコピーします。

20-create-discord-token.mp4

2. Helm リポジトリの構成

まず、Prometheus と Grafana に必要な Helm リポジトリを追加する必要があります。

helm repo add prometheus-community https://prometheus-community.github.io/helm-charts
helm repo add grafana https://grafana.github.io/helm-charts
helm repo update

これらのコマンドは、公式の Prometheus および Grafana Helm リポジトリを追加し、ローカルの Helm チャート情報を更新します。

3. 依存関係のインストール

Prometheus には、Helm で管理できる特定の依存関係が必要です。監視ディレクトリに移動し、次の依存関係を構築します。

helm dependency build ./deployments/monitoring/kube-prometheus-stack

4. Prometheus のデプロイ

次に、Helm を使用して Prometheus とその関連サービスをデプロイします。

kubectl create namespace monitoring
helm upgrade --install -f deployments/monitoring/kube-prometheus-stack.expanded.yaml kube-prometheus-stack deployments/monitoring/kube-prometheus-stack -n monitoring

このコマンドは次のことを行います。

helm upgrade --install : これにより、Prometheus が存在しない場合はインストールされ、存在する場合はアップグレードされます。
-f deployments/monitoring/kube-prometheus-stack.expanded.yaml : これは、構成用のカスタム値ファイルを指定します。
kube-prometheus-stack : これは Helm インストールのリリース名です。
deployments/monitoring/kube-prometheus-stack : これはインストールに使用するチャートです。
-n monitoring : インストール先の名前空間を指定します。

21-開始監視サービス.mp4

デフォルトでは、サービスは外部に公開されません。これらにアクセスするには、ポート転送を使用できます。

プロメテウスの場合:

kubectl port-forward -n monitoring svc/kube-prometheus-stack-prometheus 9090:9090

次に、 http://localhost:9090で Prometheus にアクセスします。

グラファナの場合:

kubectl port-forward -n monitoring svc/kube-prometheus-stack-grafana 3000:80

次に、 http://localhost:3000で Grafana にアクセスします。

通常、Grafana のデフォルトの認証情報は次のとおりです。

ユーザー名: 管理者
パスワード: prom-operator (これはすぐに変更する必要があります)

22-access-prom-graf.mp4

5. テストアラート

まず、サンプルアラートを作成する必要があります。 monitoringディレクトリに移動し、次のコマンドを実行します。

kubectl port-forward -n monitoring svc/alertmanager-operated 9093:9093

次に、新しいターミナルで次のコマンドを実行します。

curl -XPOST -H " Content-Type: application/json " -d ' [
  {
    "labels": {
      "alertname": "DiskSpaceLow",
      "severity": "critical",
      "instance": "server02",
      "job": "node_exporter",
      "mountpoint": "/data"
    },
    "annotations": {
      "summary": "Disk space critically low",
      "description": "Server02 has only 5% free disk space on /data volume"
    },
    "startsAt": "2023-09-01T12:00:00Z",
    "generatorURL": "http://prometheus.example.com/graph?g0.expr=node_filesystem_free_bytes+%2F+node_filesystem_size_bytes+%2A+100+%3C+5"
  },
  {
    "labels": {
      "alertname": "HighMemoryUsage",
      "severity": "warning",
      "instance": "server03",
      "job": "node_exporter"
    },
    "annotations": {
      "summary": "High memory usage detected",
      "description": "Server03 is using over 90% of its available memory"
    },
    "startsAt": "2023-09-01T12:05:00Z",
    "generatorURL": "http://prometheus.example.com/graph?g0.expr=node_memory_MemAvailable_bytes+%2F+node_memory_MemTotal_bytes+%2A+100+%3C+10"
  }
] ' http://localhost:9093/api/v2/alerts

このコマンドはサンプルアラートを作成します。次のコマンドを実行すると、アラートが作成されたことを確認できます。

curl http://localhost:9093/api/v2/status

または、Discord チャンネルを手動で確認することもできます。

23-テストアラート.mp4

このセットアップは、Kubernetes クラスターに包括的な監視機能を提供します。 Prometheus がメトリクスを収集し、Grafana がメトリクスを視覚化することで、パフォーマンスを効果的に追跡し、潜在的な問題に対するアラートを設定し、インフラストラクチャとアプリケーションに関する貴重な洞察を得ることができます。

Filebeat + Logstash + Elasticsearch + Kibana を使用したロギング

集中ログは、Kubernetes にデプロイされたアプリケーションの監視とトラブルシューティングに不可欠です。このセクションでは、GKE クラスタのログを記録するために Filebeat を使用して ELK スタック (Elasticsearch、Logstash、Kibana) をセットアップする方法を説明します。

0.クイックラン

この単一の helmfile スクリプトを使用して、ELK スタックを開始できます。

 cd deployments/ELK
helmfile sync

1. Helm を使用して ELK スタックをインストールする

Helm を使用して ELK スタックコンポーネントをデプロイします。

Elasticsearch:ログを保存します。
Logstash:ログを処理してフィルタリングします。
Kibana:ログを視覚化および検索するための Web UI を提供します。
Filebeat:ポッドからログを収集し、Logstash に転送します。

まず、ログコンポーネントの名前空間を作成します。

kubectl create ns logging
kubens logging

次に、Elasticsearch をインストールします。

helm install elk-elasticsearch elastic/elasticsearch -f deployments/ELK/elastic.expanded.yaml --namespace logging --create-namespace

Elasticsearch の準備が完了するまで待ちます。

 echo " Waiting for Elasticsearch to be ready... "
kubectl wait --for=condition=ready pod -l app=elasticsearch-master --timeout=300s

Logstash が Elasticsearch にアクセスするためのシークレットを作成します。

kubectl create secret generic logstash-elasticsearch-credentials 
  --from-literal=username=elastic 
  --from-literal=password= $( kubectl get secrets --namespace=logging elasticsearch-master-credentials -ojsonpath= ' {.data.password} ' | base64 -d )

キバナをインストールします。

helm install elk-kibana elastic/kibana -f deployments/ELK/kibana.expanded.yaml

Logstash をインストールします。

helm install elk-logstash elastic/logstash -f deployments/ELK/logstash.expanded.yaml

Filebeat をインストールします。

helm install elk-filebeat elastic/filebeat -f deployments/ELK/filebeat.expanded.yaml

24-デプロイ-エルク.mp4

2. Kibana にアクセスします。

サービスを使用して Kibana を公開し、ブラウザーからアクセスします。

kubectl port-forward -n logging svc/elk-kibana-kibana 5601:5601

このスクリプトを使用して Kibana パスワードを取得してください。

kubectl get secrets --namespace=logging elasticsearch-master-credentials -ojsonpath= ' {.data.password} ' | base64 -d

ブラウザを開いてhttp://localhost:5601に移動します。

3. ログ収集の検証

これで、Kibana で Kubernetes ポッドからのログを確認できるようになります。ダッシュボードと視覚化を作成してログを分析し、アプリケーションの動作についての洞察を得ることができます。

25-access-kibana.mp4

Cast AI によるクラスターの最適化

Cast AI にアクセスして無料アカウントにサインアップし、TOKEN を取得してください。

次に、次の行を実行して GKE に接続します。

curl -H " Authorization: Token <TOKEN> " " https://api.cast.ai/v1/agent.yaml?provider=gke " | kubectl apply -f -

Cast AI の UI でI ran this scriptをクリックし、構成コードをコピーしてターミナルに貼り付けます。

CASTAI_API_TOKEN= < API_TOKEN > CASTAI_CLUSTER_ID= < CASTAI_CLUSTER_ID > CLUSTER_NAME=easy-llmops-gke INSTALL_AUTOSCALER=true INSTALL_POD_PINNER=true INSTALL_SECURITY_AGENT=true LOCATION=asia-southeast1-b PROJECT_ID=easy-llmops /bin/bash -c " $( curl -fsSL ' https://api.cast.ai/v1/scripts/gke/onboarding.sh ' ) "

I ran this scriptをクリックし、インストールが完了するまで待ちます。

その後、Cast AI の UI にダッシュボードが表示されます。

Cast AI を使用してクラスターを最適化する時期が来ました。「 Available savingsセクションに移動し、 Rebalanceボタンをクリックします。

Langfuse と Supabase を使用したログトレース

Langfuse は、オープンソースの LLM エンジニアリングプラットフォームです。LLM の可観測性、メトリクス、評価、プロンプト管理を提供します。
Supabase は、オープンソースの Firebase の代替品です。 Postgres データベース、認証、インスタント API、エッジ関数、リアルタイムサブスクリプション、ストレージ、Vector 埋め込みを使用してプロジェクトを開始します。

Langfuse と Supabase にアクセスして無料アカウントにサインアップして API キーを取得し、.env.example ファイル内のプレースホルダーを API キーに置き換えてください。

貢献する

EasyLLMOps への貢献を歓迎します。開始方法の詳細については、CONTRIBUTING.md を参照してください。

ライセンス

EasyLLMOps は MIT ライセンスに基づいてリリースされています。詳細については、LICENSE ファイルを参照してください。

引用

研究で EasyLLMOps を使用する場合は、次のように引用してください。

 @software{EasyLLMOps2024,
  author = {Minh-Duc Bui},
  title = {EasyLLMOps: Effortless MLOps for Powerful Language Models.},
  year = {2024},
  url = {https://github.com/bmd1905/EasyLLMOps}
}

接触

質問、問題、コラボレーションについては、GitHub リポジトリで問題を開くか、メンテナに直接連絡してください。

拡大する

EasyLLMOps

EasyLLMOps

導入

特徴

対象者

目次

はじめる

クイックスタート

Google Kubernetes Engine (GKE) での Terraform の使用

GKE への手動デプロイ

Jenkins と Ansible を使用した継続的インテグレーション/継続的デプロイメント (CI/CD)

Prometheus と Grafana によるモニタリング

Filebeat + Logstash + Elasticsearch + Kibana を使用したロギング

Cast AI によるクラスターの最適化

Langfuse と Supabase を使用したログトレース

貢献する

ライセンス

引用

接触

node telegram bot api

typebot.io

python wechaty getting started

TranscriberBot

genal chat

Facemoji

chat.petals.dev

GPT Prompt Templates

GPTyped

node telegram bot api

typebot.io

python wechaty getting started

waymo open dataset

termwind

wp functions

EasyLLMOps

EasyLLMOps

導入

特徴

対象者

目次

はじめる

クイックスタート

Google Kubernetes Engine (GKE) での Terraform の使用

GKE への手動デプロイ

Jenkins と Ansible を使用した継続的インテグレーション/継続的デプロイメント (CI/CD)

Prometheus と Grafana によるモニタリング

Filebeat + Logstash + Elasticsearch + Kibana を使用したロギング

Cast AI によるクラスターの最適化

Langfuse と Supabase を使用したログ トレース

貢献する

ライセンス

引用

接触

Langfuse と Supabase を使用したログトレース