Salesforce, 시각적 이해를 돕는 xGen-MM 오픈 소스 다중 모드 AI 모델 출시

저자：Eve Cole 업데이트 시간：2024-12-22 13:16:01

Salesforce는 텍스트 및 이미지와 같은 여러 데이터 유형을 동시에 이해하고 생성할 수 있는 강력한 도구인 다중 모드 AI 모델 xGen-MM의 획기적인 오픈 소스를 만들었습니다. 이 모델에는 40억 개의 매개변수가 있으며 여러 벤치마크에서 좋은 성능을 발휘했습니다. 오픈 소스 특성은 현재 업계 동향과 대조되며 AI 분야의 공개 연구를 촉진하려는 Salesforce의 노력을 반영합니다. xGen-MM은 '인터리브된 데이터'를 처리하는 능력이 독특하여 여러 이미지에 대한 질문에 동시에 답변하는 등 보다 복잡한 작업을 수행할 수 있으며 의료 진단 및 자율 주행과 같은 분야에 큰 응용 가능성이 있습니다.

Salesforce는 xGen-MM이라는 오픈 소스 다중 모드 AI 모델 세트를 출시했습니다. 이 모델 세트는 텍스트 및 이미지와 같은 여러 데이터 유형을 동시에 이해하고 생성할 수 있으며 AI를 연구하고 적용하는 방식을 완전히 바꿀 수 있습니다.

Salesforce AI 연구팀은 xGen-MM 프레임워크를 자세히 설명하는 arXiv에 대한 논문을 발표했습니다. 이 프레임워크에는 사전 학습된 모델뿐만 아니라 데이터 세트 및 미세 조정 코드도 포함됩니다. 이 가장 큰 모델에는 40억 개의 매개변수가 있으며 그 성능은 여러 벤치마크 테스트에서 유사한 오픈 소스 모델보다 열등하지 않은 좋은 성능을 보였습니다.

이러한 오픈 소스 움직임은 고급 AI 모델을 비밀로 유지하기로 선택한 많은 거대 기술 기업의 현재 추세와 완전히 다릅니다. 세일즈포스는 모델과 데이터 세트를 공개해 더 광범위한 연구와 개발을 촉진할 수 있기를 희망한다고 밝혔습니다. 실제로 이번 결정은 더 많은 연구자와 개발자에게 멀티모달 AI 기술 발전에 참여할 수 있는 기회를 제공하기 위한 것이기도 합니다.

xGen-MM의 혁신 중 하나는 "인터리브된 데이터"를 처리하는 능력입니다. 즉, 여러 이미지와 텍스트를 동시에 처리할 수 있습니다. 이 기능을 통해 모델은 여러 이미지에 대한 질문에 동시에 답변하는 등 보다 복잡한 작업을 수행할 수 있습니다. 이는 정말 놀라운 일입니다. 이러한 응용 시나리오는 의료 진단 및 자율 주행과 같은 분야에서 매우 유용할 수 있습니다.

또한 이 릴리스에는 사전 훈련된 기본 모델, 지침을 따르도록 조정된 모델, 유해한 출력을 줄이도록 설계된 "안전 조정" 모델 등 최적화된 모델 버전이 여러 개 포함되어 있습니다. 이러한 다양한 선택은 AI 커뮤니티가 역량과 안전 윤리 간의 균형을 점점 더 강조하고 있음을 반영합니다.

그러나 강력한 모델이 출시되면서 더욱 발전된 AI 시스템의 잠재적 위험과 사회적 영향에 대한 논의도 촉발되었습니다. Salesforce가 위험을 줄이기 위해 보안 조정을 실시했지만 혁신과 보안의 균형을 맞추는 방법은 여전히 생각해 볼 가치가 있는 문제입니다.

Salesforce의 이 오픈 소스 릴리스는 연구자에게 이러한 강력한 기술을 더 잘 이해하고 개선할 수 있는 귀중한 도구를 제공합니다. 동시에 이는 AI 분야의 투명성에 대한 새로운 기준을 설정하며, 이는 다른 거대 기술 기업들이 연구에 더욱 개방적이 되도록 만들 수 있습니다.

모델 입구: https://huggingface.co/collections/Salesforce/xgen-mm-1-models-662971d6cecbf3a7f80ecc2e

가장 밝은 부분:

xGen-MM은 텍스트와 이미지에 대한 포괄적인 이해와 생성을 지원하는 Salesforce에서 출시한 오픈 소스 다중 모드 AI 모델 세트입니다.

이 모델은 인터리브된 데이터를 처리하는 능력을 갖추고 있으며 동시에 여러 이미지에 대한 질문에 답할 수 있으므로 적용 가능성이 넓습니다.

? 이번 릴리스에는 다양한 최적화 버전이 포함되어 있으며 안전 및 윤리 문제에 주의를 기울이고 연구자에게 풍부한 리소스를 제공합니다.

전체적으로 Salesforce의 오픈 소스 xGen-MM은 AI 분야에서 큰 진전을 이룬 것입니다. 이는 강력한 도구를 제공할 뿐만 아니라 보다 개방적이고 책임감 있는 AI 연구 및 개발 방향의 모범을 제시합니다. 다양한 분야에서의 향후 응용 및 개발.