A Anthropic lançou seu modelo mais recente, Claude 3.5 Haiku, e o integrou ao chatbot web e ao aplicativo móvel Claude. Claude3.5Haiku, que antes era aberto apenas para desenvolvedores, atraiu muita atenção por sua eficiência e excelente desempenho em vários testes de benchmark. O lançamento ocorre no momento em que os rivais OpenAI e Google lançam novos modelos, intensificando ainda mais a concorrência no mercado. Este artigo fornecerá uma análise aprofundada do desempenho, funcionalidade, preço e posicionamento do Claude3.5Haiku no mercado.
A Anthropic Corporation lançou oficialmente seu mais recente modelo Claude 3.5 Haiku, que os usuários agora podem usar por meio do chatbot Claude em aplicativos web e móveis.
Anteriormente acessível apenas aos desenvolvedores por meio da API da Anthropic, este modelo atraiu ampla atenção desde seu lançamento em outubro de 2024 devido aos seus recursos pequenos e eficientes. Claude3.5Haiku tem um bom desempenho em vários benchmarks importantes e oferece uma relação preço/desempenho competitiva.
De acordo com dados da agência de benchmarking Artificial Analysis, Claude3.5Haiku tem desempenho melhor que a média em latência para receber a primeira marca (TTFT) de aproximadamente 0,80 segundos, enquanto sua velocidade de saída é de 65,1 marcas por segundo. O lançamento ocorre no momento em que os rivais antrópicos OpenAI e Google lançam novos modelos, com este último lançando os modelos o1 e o1-mini, bem como o Gemini2.
Claude3.5Haiku é o modelo mais rápido e econômico da série Anthropic e é particularmente adequado para tarefas em tempo real, como processamento de grandes conjuntos de dados, análise de documentos financeiros e geração de resultados com informações contextuais longas. Ele tem uma janela de contexto de 200.000 tags, excedendo as 128.000 tags GPT-4 e GPT-4o da OpenAI, e pode lidar facilmente com grandes quantidades de entrada.
No chatbot Claude, o Haiku demonstra excelente versatilidade, permitindo aos usuários analisar anexos de imagens e arquivos, melhorando a utilidade de tarefas multimídia e fluxos de trabalho que envolvem grandes conjuntos de arquivos. Além disso, o Haiku se integra ao Claude Artifacts, uma barra lateral interativa que permite a manipulação e otimização em tempo real do conteúdo gerado por IA. Em meus testes, o Haiku programou um jogo de tênis de mesa totalmente jogável em menos de um minuto.
No entanto, o Haiku também tem algumas limitações. Atualmente, não suporta navegação na web e geração de imagens, o que não é uma vantagem quando comparado aos concorrentes da OpenAI. Além disso, em meu teste simples, o Haiku não conseguiu identificar com sucesso as três letras R na palavra "morango" no "Teste de Morango".
Claude3.5Haiku está disponível gratuitamente no chatbot, mas os usuários são limitados por um limite diário de mensagens. No meu teste desta manhã, por exemplo, atingi a cota do Anthropic, que zera diariamente, após cerca de 10 trocas (num total de 20 mensagens recebidas e enviadas) na versão gratuita. Os usuários também podem escolher o plano Claude Pro por US$ 20 por mês para desbloquear mais direitos de uso e acesso prioritário a novos recursos.
Em termos de API, Claude3.5Haiku oferece excelente desempenho, com preço inicial de US$ 0,80 por milhão de marcos de entrada e US$ 4 por milhão de marcos de saída, o que o torna altamente econômico. Os desenvolvedores podem reduzir ainda mais os custos usando o cache de dicas, economizando até 90%.
Destaques:
? O modelo Claude3.5Haiku agora está aberto a todos os usuários e suporta funções de análise de imagens e arquivos.
?Há um limite de mensagens na versão gratuita e os usuários podem escolher uma assinatura Claude Pro de US$ 20 para obter mais direitos de uso.
? O modelo tem um bom desempenho em vários testes de benchmark e é adequado para tarefas em tempo real e processamento de grandes conjuntos de dados.
Em suma, Claude3.5Haiku ocupa um lugar no mercado de modelos de IA com sua velocidade, economia e funções poderosas, mas suas limitações funcionais também requerem melhorias adicionais. A disponibilização de versões gratuitas e pagas também oferece opções para usuários com diferentes necessidades. Vale a pena esperar pelo desenvolvimento futuro.