Apple y la Universidad de Cornell han lanzado un modelo de aprendizaje automático multimodal llamado "Ferret" como código abierto. Ferret tiene la capacidad de localizar y hacer referencia con precisión a elementos en imágenes, comprender las consultas de los usuarios y brindar comentarios adecuados. Esta medida refleja la actitud más abierta de Apple en el campo de la inteligencia artificial y su inversión y énfasis en la investigación de IA de vanguardia. Esto tiene una importancia positiva para promover el desarrollo de la tecnología de inteligencia artificial y la construcción de comunidades de código abierto, e indica que los modelos multimodales tendrán aplicaciones más amplias en los campos de la comprensión de imágenes y la recuperación de información en el futuro.
Apple y la Universidad de Cornell colaboraron para lanzar un modelo de aprendizaje automático multimodal de código abierto llamado "Ferret". Ferret es un sistema que puede referenciar y posicionar elementos en cualquier lugar de una imagen, identificando elementos útiles en las consultas de los usuarios y respondiendo adecuadamente. Este anuncio muestra la actitud más abierta de Apple hacia su trabajo en IA y demuestra su compromiso con una investigación impactante en IA.
La versión de código abierto de Ferret proporciona recursos valiosos para investigadores y desarrolladores de inteligencia artificial y ayuda a promover el desarrollo del aprendizaje automático multimodal. En el futuro, esperamos que Ferret desempeñe un papel en escenarios de aplicaciones más prácticos y brinde servicios más convenientes e inteligentes a los usuarios.