대규모 엔터프라이즈 RAG(Retriever Augmented Generation) 파이프라인을 구축하기 위한 빠른 프레임워크 - watsonx 제공
SuperKnowa GitHub 저장소에 오신 것을 환영합니다! SuperKnowa 프레임워크는 Enterprise Generative AI 애플리케이션을 가속화하여 개인 데이터에 대한 프로덕션 지원 솔루션을 빠르게 얻습니다. 여기에서는 LLM(대형 언어 모델)을 사용하여 다양한 Generative AI 사용 사례를 처리하도록 설계된 다양한 플러그형 구성 요소 컬렉션을 찾을 수 있습니다. 이러한 구성 요소를 레고 조각과 마찬가지로 AI 기반 텍스트 생성 영역의 다양한 과제를 해결하기 위해 조립할 수 있는 빌딩 블록으로 생각하세요. 이는 1백만에서 2억까지의 개인 지식 기반에서 전투 테스트를 거쳤으며 수십억 개의 검색 토큰으로 확장되었습니다.
SuperKnowa RAG 프레임워크 및 주요 빌딩 블록의 전체 파이프라인:
단일 파일을 사용하여 SuperKnowa RAG 파이프라인을 위한 구성 가능한 구성 요소:
SuperKnowa는 다양한 고급 Generative AI 사용 사례를 제공하기 위해 LLM(대형 언어 모델)의 기능을 활용하는 watsonx(여기에서 watsonx.ai의 비디오 보기)를 사용하여 개발된 강력한 프레임워크입니다. 이 저장소는 SuperKnowa에서 다루는 다양한 사용 사례를 소개합니다.
통찰력 있는 블로그 게시물에서 SuperKnowa에 대해 자세히 알아보세요.
표지 블로그 - SuperKnowa: 대규모 엔터프라이즈 RAG 솔루션 구축 https://medium.com/towards-generative-ai/superknowa-simplest-framework-yet-to-swiftly-build-enterprise-rag-solutions-at-scale-ca90b49be28a
1백만 개의 다양한 문서로 구성된 개인 지식 기반을 기반으로 구축된 라이브 애플리케이션으로 SuperKnowa 프레임워크를 사용해 보세요.
https://superknowa.tsglwatson.buildlab.cloud/
(IBM ID가 없는 경우 여기에서 받으십시오 - https://www.ibm.com/account/reg/us-en/signup?formid=urx-19776)
config.yaml
파일을 업데이트하여 시작하고 LLMQnA.py 스크립트를 실행하여 RAG 파이프라인을 빠르게 구성할 수 있습니다.
retriever:
indexName: superknowa
query: What is IBM Cloud?
....
reranker:
query: What is IBM Data and Analytics Reference Architecture?
...
LLMQnA:
question: What is IBM Data and Analytics Reference Architecture?
...
SuperKnowa의 기능을 살펴보려면 이 저장소에 제공된 블로그 시리즈, 코드 예제 및 리소스를 참조하세요.
자세한 지침과 예를 보려면 각 구성 요소의 디렉터리로 이동하세요. SuperKnowa의 생성 AI 레고 구성 요소를 사용하여 프로젝트에서 대규모 언어 모델의 잠재력을 최대한 활용하십시오!
SuperKnowa를 통해 Generative AI의 잠재력을 발휘하고 AI 기반 지식 처리의 미래를 만들어 갑시다!
문서 인덱싱
탄력적 검색
솔르
왓슨 디스커버리
신경 리트리버
탄력적 검색
솔르
재랭커
LLM을 사용한 상황별 학습
LLM 평가
LLM 모델 평가
MLFLOW 통합
미세 조정
DB를 지시하다
QLORA를 사용한 Falcon 7B 미세 조정
QLORA를 사용하여 LLAMA2 7B 미세 조정
RLHF 모델
배포 및 추론
백엔드
전개
AI 정렬 도구
엔터프라이즈 LLM 사용 사례
인간의 입력을 캡처하여 유용성, 유해성 및 정확성 지표에 대한 AI 모델의 정렬을 측정합니다.
평가를 위한 다양한 온라인 및 오프라인 실험을 구축하고 대화형 대시보드를 사용하여 AI 정렬 결과를 비교하세요.
Eval_Package는 질문, 컨텍스트, 이상적인 답변이 포함된 데이터세트에서 LLM(언어 모델)의 성능을 평가하도록 설계된 도구입니다. 이를 통해 다양한 데이터 세트에 대한 평가를 실행하고 모델이 BLUE, ROUGE 등과 같은 수십 가지 통계 지표에 대한 답변을 얼마나 잘 생성하는지 평가할 수 있습니다.
MLflow_Package는 Eval_Package의 결과를 통합하고 실험을 효율적으로 추적 및 관리하도록 설계된 포괄적인 도구 키트입니다. 또한 평가 비교를 위한 리더보드를 만들고 대시보드를 통해 지표를 시각화할 수 있습니다.
다음은 SuperKnowa 프레임워크를 사용하여 구축된 Generative AI 사용 사례 목록입니다.
SuperKnowa의 대화형 질문 및 답변(Q&A) 시스템으로 자연어 대화에 참여해 보세요. 민간 기업 지식 기반을 기반으로 질문하고 상황에 맞는 자세한 답변을 받으세요.
SuperKnowa의 "문서에 물어보기" 기능을 활용하여 PDF 및 텍스트 문서의 잠재력을 활용하세요. SuperKnowa는 관련 정보를 추출하고, 특정 질문에 답하고, 정보 검색을 지원하는 데 도움을 줄 수 있습니다.
FlanT5 및 UL2를 사용하여 대규모 텍스트 코퍼스 전반에 걸쳐 SuperKnowa의 요약 기능을 사용하면 일관되고 유익한 요약을 쉽게 생성할 수 있습니다. 기사, 보고서, 기타 텍스트에서 주요 내용과 핵심 내용을 추출하여 효율적인 내용 이해가 가능합니다.
SuperKnowa의 추상 요약 기능은 FlanUL2 및 LLAMA2를 사용한 단순한 추출 그 이상입니다. 긴 PDF 문서를 분석하고 간결하고 추상적인 요약을 생성하여 콘텐츠의 본질을 포착할 수 있습니다. 또한 SuperKnowa는 핵심 사항을 식별하여 복잡한 정보를 더 쉽게 이해하고 전달할 수 있도록 해줍니다.
자연어 쿼리를 구조화된 SQL 쿼리로 변환하는 SuperKnowa의 Text-to-SQL 기능의 강력한 기능을 경험해 보세요. 일반 언어를 사용하여 데이터베이스와 상호 작용하므로 SQL에 대한 전문 지식이 필요하지 않습니다.
제작 및 설계자
건축업자
이 프레임워크는 IBM Ecosystem의 Build Lab에서 개발되었습니다. 이 콘텐츠는 Embeddable AI 기술 채택을 촉진하고 생태계 파트너에게 서비스를 제공하기 위해 제공됩니다. 콘텐츠에는 USPTO에서 특허 출원 중이며 미국 특허법에 따라 보호되는 시스템 및 방법이 포함될 수 있습니다. SuperKnowa는 제품이 아니라 Databricks의 Meta 및 ML Flow의 LLAMA 모델과 같은 다른 제품과 함께 IBM watsonx 위에 구축된 프레임워크입니다. SuperKnowa를 사용하려면 해당 제품의 이용 약관에 암묵적으로 동의해야 합니다. 이 프레임워크는 Enterprise GenAI 애플리케이션 개발을 가속화하기 위해 있는 그대로 제공됩니다. 질문이 있는 경우 [email protected]으로 문의하세요.
저작권 @ 2023 IBM Corporation.