A Apple e a Cornell University lançaram um modelo de aprendizado de máquina multimodal chamado "Ferret" como código aberto. Ferret tem a capacidade de localizar e referenciar elementos em imagens com precisão, entender as dúvidas dos usuários e fornecer feedback apropriado. Esta medida reflete a atitude mais aberta da Apple no campo da inteligência artificial e o seu investimento e ênfase na investigação de ponta em IA. Isto tem um significado positivo para promover o desenvolvimento da tecnologia de IA e a construção de comunidades de código aberto, e indica que os modelos multimodais terão aplicações mais amplas nos campos da compreensão de imagens e recuperação de informação no futuro.
A Apple e a Cornell University colaboraram para lançar um modelo de aprendizado de máquina multimodal de código aberto chamado “Ferret”. Ferret é um sistema que pode referenciar e posicionar elementos em qualquer lugar de uma imagem, identificando elementos úteis nas consultas do usuário e respondendo adequadamente. Este anúncio mostra a atitude mais aberta da Apple em relação ao seu trabalho de IA e demonstra o seu compromisso com pesquisas impactantes em IA.
O lançamento de código aberto do Ferret fornece recursos valiosos para pesquisadores e desenvolvedores de inteligência artificial e ajuda a promover o desenvolvimento do aprendizado de máquina multimodal. No futuro, esperamos que Ferret desempenhe um papel em cenários de aplicação mais práticos e traga serviços mais convenientes e inteligentes aos usuários.