Cohere anunció que su modelo de búsqueda de IA multimodal más avanzado, Embed3, recibió una actualización importante y ahora admite la búsqueda multimodal, lo que permite a los usuarios usar texto e imágenes para la recuperación a nivel empresarial. Esta actualización marca un avance significativo en la búsqueda de imágenes para Embed3, permitiendo a las empresas extraer de manera más efectiva el valor de los datos de imágenes y mejorar la eficiencia del trabajo y la velocidad de toma de decisiones. El editor de Downcodes lo llevará a comprender en profundidad las últimas funciones y casos de aplicación de Embed3.
Cohere ha lanzado Embed3, el modelo de búsqueda de IA multimodal más avanzado, que ahora admite búsquedas multimodales, lo que significa que los usuarios pueden realizar búsquedas a nivel empresarial no solo a través de texto, sino también a través de imágenes.
Desde su lanzamiento el año pasado, Embed3 se ha optimizado continuamente para ayudar a las empresas a convertir documentos en representaciones digitales, y esta actualización lo hará aún mejor en la búsqueda de imágenes.
El cofundador y director ejecutivo de Cohere, Aidan Gonzales, compartió un gráfico de las mejoras en el rendimiento de Embed3 en la búsqueda de imágenes en las redes sociales.
Cohere dijo en un blog que esta nueva característica ayudará a las empresas a extraer completamente los datos masivos almacenados en imágenes y mejorar la eficiencia del trabajo. Las empresas pueden buscar activos multimodales, como informes complejos, catálogos de productos y documentos de diseño, de forma más rápida y precisa.
A medida que la búsqueda multimodal continúa evolucionando, Embed3 de Cohere puede generar incrustaciones de texto e imágenes. Este nuevo método de incrustación permite a los usuarios administrar imágenes y texto en un espacio latente unificado en lugar de almacenarlos por separado. Las mejoras en este enfoque mejorarán significativamente la calidad de los resultados de búsqueda, evitarán el sesgo hacia los datos de texto y permitirán una mejor comprensión del significado detrás de los datos.
Los siguientes son casos de uso reales de Embed3:
Gráficos y tablas: la representación visual es clave para comprender datos complejos. Los usuarios ahora pueden encontrar fácilmente los gráficos adecuados para fundamentar sus decisiones comerciales. Simplemente describa una idea específica y Embed3 recuperará gráficos y tablas relevantes, lo que permitirá a los empleados de todos los equipos tomar decisiones basadas en datos de manera más eficiente.
Catálogos de productos de comercio electrónico: los métodos de búsqueda tradicionales a menudo limitan a los clientes a encontrar productos a través de descripciones de productos basadas en texto. Embed3 cambia esta experiencia de búsqueda. Los minoristas pueden crear aplicaciones que busquen imágenes de productos además de descripciones de texto, creando una experiencia diferenciada para los compradores y aumentando las tasas de conversión.
Archivos de diseño y plantillas: los diseñadores suelen trabajar con grandes bibliotecas de recursos y dependen de la memoria o de reglas estrictas de nomenclatura para organizar los elementos visuales. Embed3 facilita la búsqueda de maquetas de interfaz de usuario, plantillas visuales y diapositivas de presentación específicas basadas en descripciones de texto. Esto simplifica el proceso creativo.
Embed3 también admite más de 100 idiomas , lo que significa que puede atender a una base de usuarios más amplia. Actualmente, este Embed3 multimodal se lanzó en la plataforma de Cohere y Amazon SageMaker.
A medida que más y más usuarios se acostumbran a la búsqueda de imágenes y las empresas continúan poniéndose al día, las actualizaciones de Cohere les brindan la oportunidad de disfrutar de una experiencia de búsqueda más flexible. Cohere actualizó su API en septiembre para permitir a los clientes cambiar fácilmente de los modelos de la competencia a los modelos de Cohere.
Blog oficial: https://cohere.com/blog/multimodal-embed-3
Destacar:
Embed3 admite la búsqueda multimodal, lo que permite a los usuarios buscar a través de imágenes y texto.
El modelo actualizado mejora significativamente el rendimiento de la búsqueda de imágenes y ayuda a las empresas a extraer el valor de los datos.
Cohere actualizó su API en septiembre para simplificar el proceso para los clientes que cambian de otros modelos.
En definitiva, la actualización Embed3 de Cohere ofrece nuevas posibilidades para la búsqueda multimodal a nivel empresarial. Sus potentes funciones y su cómoda experiencia de uso ayudarán a las empresas a utilizar mejor los datos, mejorar la eficiencia y tomar decisiones más inteligentes. Los lectores interesados pueden visitar el blog oficial para obtener más información.