StableCode 대형 모델은 인공 지능 알고리즘 및 애플리케이션을 개발하고 구현하는 데 특별히 사용되는 도구로, 여러 딥 러닝 프레임워크에서 실행될 수 있으며 이미지 분류, 대상 감지 및 의미론적 분할과 같은 작업에 적합합니다.
Stability AI는 Stable Diffusion 텍스트 생성 이미지 모델로 가장 잘 알려져 있지만 회사가 현재 코드 생성에도 진출하고 있기 때문에 이것이 유일한 관심 영역은 아닙니다. 오늘 Stability AI는 사용자가 프로그래밍 언어 코드를 생성하는 데 도움을 주고 변환기 신경망을 기반으로 하는 새로운 개방형 LLM(대형 언어 모델) StableCode를 출시했습니다.
StableCode는 일반 사용을 위한 기본 모델, 명령 모델, 최대 16,000개의 토큰을 지원할 수 있는 긴 컨텍스트 창 모델의 세 가지 수준을 제공합니다.
StableCode 모델은 오픈 소스 BigCode 프로젝트의 초기 프로그래밍 언어 데이터 세트를 활용하고 Stability AI를 통해 추가 필터링 및 미세 조정을 거칩니다. StableCode는 초기에 Python, Go, Java와 같은 프로그래밍 언어로 개발을 지원합니다. , JavaScript, C, 마크다운 및 C++.
모든 LLM 교육은 데이터에 의존하며 StableCode의 데이터는 BigCode 프로젝트에서 가져옵니다. HuggingFace와 ServiceNow는 지난 5월 BigCode를 기반으로 한 공개 StarCoder LLM도 출시했습니다. Stability AI의 수석 연구 과학자인 Nathan Cooper는 StableCode의 교육에는 BigCode 데이터의 광범위한 필터링 및 정리가 포함된다고 말했습니다.
StableCode의 긴 컨텍스트 창에는 16,000개 토큰의 컨텍스트 창이 있는데, 이는 Stability AI가 주장하는 다른 어떤 모델보다 크다고 하면 더 전문적이고 복잡한 코드 생성 프롬프트를 사용할 수 있다는 의미이기도 합니다. 새로운 코드를 이해하고 생성하는 데 도움이 되는 여러 파일이 포함된 크기의 코드 베이스입니다.
StableCode는 아직 초기 단계에 있으며 이제 공식적인 목표는 개발자가 이 모델을 어떻게 받아들이고 사용할지 확인하는 것입니다.