다음 배치 가능한 아키텍처는 모든 기본 IBM Cloud 및 WatsonX 인프라를 포함하여 IBM Cloud에서 샘플 세대 AI 패턴의 배치를 자동화합니다. 이 아키텍처는 참조 아키텍처에 설명된 대로 IBM Cloud에서 watsonx gen AI Pattern 배치에 대한 우수 사례를 구현합니다.
이 배포 가능한 아키텍처는 신뢰, 관찰 가능성, 보안 및 규정 준수를 위한 포괄적인 기반을 제공합니다. 아키텍처는 규정 준수 설정에 맞게 IBM Cloud 계정을 구성합니다. 또한 애플리케이션 수명주기의 안전한 관리를 위해 CI(지속적 통합), CD(지속적 전달), CC(지속적 규정 준수) 파이프라인을 지원하는 인프라와 키 관리 및 비밀 관리 서비스를 배포합니다. 또한 RAG 패턴을 촉진하기 위해 WatsonX 서비스 제품군과 IBM Cloud Elasticsearch를 배포합니다. 이러한 파이프라인은 애플리케이션 배치를 촉진하고, 취약성과 감사 가능성을 확인하며, IBM Cloud에서 생성적 AI 애플리케이션의 안전하고 신뢰할 수 있는 배치를 보장하는 데 도움이 됩니다.
이 배포 가능한 아키텍처에는 두 가지 변형을 사용할 수 있습니다.
기본 변형:
표준 변형:
이 배치 가능한 아키텍처는 IBM Cloud Projects를 통해 검색 증강 세대 애플리케이션의 완전히 자동화된 배치를 보여주기 위해 설계되었습니다. 이는 IBM Cloud에서 자체 watsonx 애플리케이션을 위한 유연하고 사용자 정의 가능한 기반을 제공합니다. 이 아키텍처는 기본적으로 다음 샘플 애플리케이션을 배포합니다.
이 아키텍처를 사용하면 배포를 가속화하고 비즈니스 요구 사항과 기업 목표에 맞게 조정할 수 있습니다.
이 아키텍처는 다음 목표를 달성하는 데 도움이 될 수 있습니다.
배포 가능한 아키텍처를 배포하기 전에 다음 작업을 완료했는지 확인하세요.
중요한
사용자와 연결된 API 키를 사용해야 합니다. 서비스 ID 키 또는 신뢰할 수 있는 프로필을 사용할 수 없습니다.
API 키 값을 복사합니다. 다음 단계에서 필요합니다.
테스트 또는 평가 환경에서는 다음 서비스에 대한 관리자 역할을 부여할 수 있습니다.
User API key creator
역할을 명시적으로 할당합니다.프로덕션 환경에 대해 액세스 범위를 더 제한하려면 이 배포 가능한 아키텍처의 권한 탭에서 최소 권한 수준을 참조하세요.
gpg --gen-key
명령을 실행하여 서명 키를 생성하거나 획득합니다(만료되지 않은 경우 이전에 생성된 키를 사용할 수 있음).gpg --export-secret-key <email address> | base64
명령을 실행하여 서명 키를 내보냅니다. gpg --export-secret-key <email address> | base64
. 키 저장에 대한 자세한 내용은 GPG 키 생성을 참조하세요.이름과 설명을 추가합니다.
프로젝트에 대한 지역 및 리소스 그룹을 선택합니다. 예를 들어 평가 목적으로 사용자에게 가장 가까운 지역과 기본 리소스 그룹을 선택할 수 있습니다.
기업 계정 구조에 대한 자세한 내용은 중앙 관리 계정 백서를 참조하세요.
구성 이름을 입력하세요. 예를 들어 "RAG", "dev" 또는 "prod"입니다. 이름은 나중에 배포 대상을 일치시키는 데 도움이 될 수 있습니다.
이제 변수를 설정하여 구성을 생성할 수 있습니다.
보안 패널에서 아키텍처를 배포하는 데 사용할 인증 방법을 선택합니다.
시작하기 전에의 전제조건에서 API 키를 추가하십시오.
구성 섹션의 보안 > 인증 탭에서 API 키를 선택하세요.
필수 탭에서 필수 필드에 값을 입력하세요.
선택사항 탭에서 선택사항 필드의 값을 검토하세요.
signing_key
변수를 지정하십시오.저장 을 클릭합니다. 입력 값의 유효성이 검사되면 버튼이 스택 구성 보기 로 변경됩니다.
다음 두 가지 방법으로 IBM Cloud 콘솔을 통해 스택형 배치 가능 아키텍처를 배치할 수 있습니다.
자동 배포 사용: 배포 방법은 데모 및 비프로덕션 환경에 유용할 수 있습니다. 자동 배포를 사용하면 모든 스택 멤버 구성이 검증된 후 승인 및 배포됩니다.
관리 > 설정을 클릭하여 프로젝트의 자동 배포 설정을 확인할 수 있습니다. 자동 배포를 켜면 프로젝트의 모든 구성에 대한 설정이 활성화됩니다.
각 구성원 구성을 개별적으로 배포합니다. 수동 방법은 프로덕션 환경을 보유한 프로젝트에 적합합니다. 자동화가 실행되기 전에 각 구성원 구성의 변경 사항을 검토할 수 있습니다.
팁
구성을 승인한 후 "구성을 확인할 수 없습니다"라는 오류 메시지가 나타날 수 있습니다. 문제를 해결하려면 브라우저를 새로 고치십시오.
프로젝트 구성의 주의 필요 열에 "새 버전 사용 가능" 알림이 표시될 수 있습니다. 이러한 메시지는 스택 배포를 방해하지 않으므로 무시해도 됩니다.
스택 구성 보기 옆에 있는 옵션 아이콘을 클릭하고 유효성 검사 를 클릭합니다.
프로젝트에서 자동 배포 설정이 꺼져 있으면 준비된 멤버 구성만 검증됩니다.
프로젝트에서 구성 탭을 클릭합니다.
스택의 첫 번째 멤버 구성( Account Infrastructure Base
)이 Ready to verify 로 표시되지 않은 경우 브라우저에서 페이지를 새로 고치십시오.
Account Infrastructure Base
행에서 초안 상태 에서 유효성 검증을 클릭하십시오.
구성을 승인하고 검증이 성공적으로 완료되면 배포를 클릭합니다.
초기 멤버 구성을 배포한 후 동시에 나머지 멤버 구성의 유효성을 검사하고 배포할 수 있습니다. 아키텍처의 각 멤버 구성에 대해 이러한 배포 단계를 반복합니다.
검색 증강 생성 패턴 배포 가능 아키텍처가 이제 대상 계정에 배포됩니다.
아키텍처가 배포되면 새로 프로비저닝된 DevOps 서비스에서 샘플 애플리케이션이 시작됩니다.
애플리케이션의 빌드 및 배포를 모니터링하려면 다음 단계를 따르세요.
resource_group_name
입력을 기반으로 합니다.Workload - Sample RAG App Configuration
행을 클릭합니다.Outputs
탭에서 배포된 애플리케이션에 대한 URL은 sample_app_public_url
출력 아래에 나열됩니다. 비용을 최소화하기 위해 자동화는 Secrets Manager의 평가판 요금제를 배포합니다. Secrets Manager의 평가판 인스턴스는 하나만 생성할 수 있습니다. 스택의 선택적 설정 에서 Secrets Manager의 표준 계획 인스턴스를 배포할 수 있습니다.
이 문제를 해결하려면 평가판 인스턴스를 삭제하세요. 삭제 후 회수 상태에서도 서비스를 삭제합니다.
IBM Cloud에서는 리소스를 삭제해도 즉시 사라지지 않습니다. 대신 영구 삭제되기 전 짧은 시간(보통 7일) 동안 유지되는 회수 상태로 전환됩니다. 교정 상태 동안 필요한 경우 리소스를 복구할 수 있습니다.
다음 IBM Cloud CLI 명령을 실행하여 교정 상태에서 서비스를 삭제하십시오.
첫 번째 명령은 회수 상태의 모든 리소스를 나열합니다.
# List all the resources in reclamation state with its reclamation ID
ibmcloud resource reclamations
Secrets Manager 서비스의 회수 ID를 찾습니다. 다음 명령에서 해당 ID를 사용하십시오.
ibmcloud resource reclamation-delete < reclamation-id >
이 특정 문제는 ALM/도구 체인 배포가 14일 이상 지났고 응용 프로그램 구성 DA가 배포 취소/재배포된 경우 발생할 수 있습니다. 이는 파이프라인 속성을 생성 및 삭제하는 데 Continuous Delivery 서비스가 필요하기 때문이며 배포는 CD 서비스가 없을 때 발생합니다. 우리는 이 버그에 대한 장기적인 솔루션을 개발 중이지만 그 동안 도구 체인이 생성될 것으로 예상되는 리소스 그룹에 CD 서비스가 있는지 확인하여 완화할 수 있습니다.
문제는 코드 엔진과 OCP 변형 모두의 Workload - Sample RAG App Configuration
배포 가능 아키텍처에서 발생합니다. 오류에는 일반적으로 다음 메시지가 포함됩니다.
"errors": [
{
"code": 403,
"message": "Continuous Delivery service required"
}
]
이 아키텍처에서는 많은 사용자 정의가 가능합니다. 다음은 몇 가지 일반적인 옵션입니다.
각 멤버 구성에는 다수의 입력 매개변수가 포함되어 있습니다. 구성을 편집하여 기본값을 변경할 수 있습니다.
예를 들어 구성원 구성을 편집하면 다음과 같은 작업을 수행할 수 있습니다.
구성원 구성을 편집하려면 구성원 구성 행의 옵션 아이콘에서 편집을 선택합니다.
다른 구성이 의존하지 않는 멤버 구성을 스택에서 제거할 수 있습니다.
이 아키텍처에서는 다음 구성을 제거할 수 있습니다.
구성원 구성을 제거하려면 구성원 구성 행의 옵션 아이콘에서 스택에서 제거를 선택합니다.
다음 단계에 따라 스택 수준에서 입력 및 출력 변수를 추가하거나 제거할 수 있습니다.
다음 단계에 따라 Activity Tracker 경로 및 대상, Cloud Monitoring 인스턴스와 같은 관측 가능성 리소스를 선택적으로 프로비저닝할 수 있습니다.
cloud_logs_provision
): IBM Cloud Logs 인스턴스 프로비저닝을 프로비저닝하거나 건너뛰려면 이를 설정하십시오.cloud_monitoring_provision
): IBM Cloud 모니터링 인스턴스 프로비저닝을 프로비저닝하거나 건너뛰려면 이를 설정하십시오.enable_at_event_routing_to_cos_bucket
): Activity Tracker에서 Object Storage 버킷으로의 이벤트 라우팅을 활성화하거나 비활성화하려면 이를 설정합니다.enable_at_event_routing_to_cloud_logs
): Activity Tracker에서 Cloud Logs로의 이벤트 라우팅을 활성화하거나 비활성화하려면 이를 설정합니다.프로젝트에서 배치 가능한 아키텍처를 수정한 후 개인용 IBM Cloud 카탈로그를 통해 다른 사람과 공유할 수 있습니다. 배포 가능한 아키텍처를 공유하려면 배포 가능한 아키텍처를 기업에 공유의 단계를 따르세요.
이 샘플 자동화의 코드를 지침으로 사용하여 요구 사항에 맞게 샘플 앱을 사용자 지정할 수 있습니다. 코드는 https://github.com/terraform-ibm-modules/terraform-ibm-rag-sample-da에서 사용할 수 있습니다.
자신의 앱을 사용하려면 스택에서 Workload - Sample RAG App Configuration
멤버 구성을 제거하세요. 이 구성원 구성은 기본 샘플 앱에만 적용됩니다.
구성 정리
모든 Watson 리소스를 삭제하려는 경우 이 단계는 선택 사항입니다. 애플리케이션에서 생성된 아티팩트는 Watson 리소스 배포 취소의 일부로 삭제됩니다.
샘플 앱의 구성을 제거하려면 cleanup.md 파일에 설명된 단계를 따르세요.
CI 도구 체인에서 생성된 리소스 삭제
도구 체인에 의해 생성된 다음 리소스는 Project에서 스택 배포 취소의 일부로 삭제되지 않습니다.
프로젝트를 삭제합니다.
배치 가능한 아키텍처로 작성된 인프라를 배치 취소하려면 IBM Cloud 문서에서 프로젝트 삭제의 단계를 따르십시오.