mixtral offloading
1.0.0
이 프로젝트는 Mixtral-8x7B 모델의 효율적인 추론을 구현합니다.
요약하면 다음과 같은 기술 조합을 통해 Mixtral-8x7B 모델의 효율적인 추론을 달성합니다.
우리의 방법과 결과에 대한 자세한 내용은 기술 보고서를 참조하십시오.
이 데모를 사용해 보려면 데모 노트북(./notebooks/demo.ipynb)을 사용하거나
현재로서는 모델을 로컬로 실행하는 데 사용할 수 있는 명령줄 스크립트가 없습니다. 하지만 데모 노트북을 참고하여 만들 수 있습니다. 즉, 기여를 환영합니다!
기술 보고서에 설명된 일부 기술은 아직 이 저장소에서 사용할 수 없습니다. 그러나 우리는 가까운 시일 내에 이에 대한 지원을 추가하기 위해 적극적으로 노력하고 있습니다.
앞으로 제공될 기능 중 일부는 다음과 같습니다.