Anthropic a publié sa nouvelle génération de modèle de langue rapide rapide, Claude 3.5 Haiku, qui a considérablement amélioré les performances lorsqu'elle est similaire à la génération précédente de Claude 3 Haiku et a dépassé l'opus Claude 3 dans plusieurs références intelligentes. Claude 3.5 Haiku a été initialement publié dans un modèle de texte brut et prendra ensuite en charge l'entrée d'image et donnera accès via l'API anthropique officielle, le substratum rocheux d'Amazon et les plates-formes Vertex AI de Google Cloud.
5 novembre 2024 - Anthropic a officiellement publié la nouvelle génération de modèle rapide Claude 3.5 Haiku. La société a déclaré qu'à une vitesse similaire au Claude 3 Haiku, le Claude 3.5 Haiku s'est amélioré dans toutes les compétences et a dépassé le plus grand modèle de la génération précédente, l'opus Claude 3 dans de nombreux repères intelligents.
Claude 3.5 Haiku a été initialement lancé en tant que modèle de texte brut, et la fonction d'entrée d'image sera bientôt lancée. Le modèle est actuellement accessible via l'API unilatéral d'Anthropic, le fondement Amazon et les plates-formes Vertex AI de Google Cloud.
Prix et économies de coûts:
Le Haiku Claude 3,5 est au prix de 1 $ par million de jeton d'entrée et de 5 $ par million de jeton de sortie. Les utilisateurs peuvent économiser jusqu'à 90% de leur coût via un cache rapide et 50% de leur coût via l'API des lots de messages. Pour plus de détails sur les prix, veuillez vous référer à la page de tarification d'Anthropic.
Principaux cas d'utilisation:
Avec des vitesses plus rapides, une meilleure conformité aux instructions et une utilisation plus précise des outils, Claude 3.5 Haiku convient à une variété de scénarios, notamment:
Achèvement du code: Claude 3.5 Haiku peut fournir des suggestions et de l'achèvement de code rapides et précis, accélérant ainsi le processus de développement et améliorant la productivité de l'équipe logicielle.
Chatbot interactif: les capacités conversationnelles améliorées et les temps de réponse rapides rendent Claude 3.5 haïku idéal pour prendre en charge les chatbots réactifs qui doivent gérer un grand nombre d'interactions utilisateur, en particulier pour le service client, le commerce électronique et les plateformes d'éducation.
Extraction et étiquette de données: Claude 3.5 Haiku peut traiter et classer efficacement les informations et peut être utilisé pour l'extraction rapide des données et les tâches de marquage automatique, ce qui est particulièrement utile pour les organisations qui traitent de grandes quantités de données non structurées dans les domaines financiers, médicaux et de recherche.
Revue de contenu en temps réel: l'amélioration du raisonnement et de la compréhension du contenu permet à Claude 3.5 haïku de fournir une revue fiable de contenu en temps réel, ce qui est important pour les plateformes sociales, les communautés en ligne et les organisations de médias qui nécessitent un maintien à grande échelle de contenu sécurisé et approprié.
Benchmark:
Anthropic dit que Claude 3.5 Haiku démontre des performances et une vitesse puissantes dans une variété de codage, d'utilisation des outils et de tâches d'inférence. Cependant, des données de référence spécifiques ne sont pas fournies dans l'annonce.
Confiance et sécurité:
Anthropic souligne que la sécurité est au cœur de chaque étape de son développement de l'IA. Au cours du développement de Claude 3.5 Haiku, ils ont effectué des évaluations de sécurité approfondies couvrant plusieurs langues et domaines politiques et la capacité de Claude améliorée à gérer le contenu sensible avec prudence. Les tests internes d'Anthropic montrent que le Claude 3.5 Haiku a fait des progrès substantiels dans les fonctionnalités tout en conservant ses normes de sécurité strictes. Cependant, l'annonce n'a pas fourni de détails spécifiques sur ces évaluations et tests de sécurité.
En résumé, Claude 3.5 Haiku a fait des progrès significatifs dans la vitesse et les performances, et a fourni un fort soutien à une variété de scénarios d'application, mais il doit toujours prêter attention à ses données spécifiques sur les données de référence et à l'évaluation de la sécurité. À l'avenir, nous attendons avec impatience le lancement de ses capacités d'entrée d'image et plus d'informations publiques sur ses performances et sa sécurité.