A OpenAI está prestes a lançar uma grande atualização do ChatGPT – o serviço ChatGPT Pro com preço de US$ 200/mês, e planeja lançar um novo modelo “morango” nas próximas duas semanas. O núcleo deste modelo está em seu método de raciocínio exclusivo, que realizará de 10 a 20 segundos de pensamento e recuperação de informações antes de responder a uma pergunta para melhorar a eficiência da utilização do poder de computação da IA e gerar conteúdo mais preciso. Embora atualmente suporte apenas processamento de texto, suas tentativas inovadoras de imitar os processos de pensamento humano merecem atenção.
OpenAI está prestes a trazer uma grande atualização para ChatGPT. É relatado que o ChatGPT Pro, com preço de US$ 200/mês, foi lançado oficialmente. Embora nenhum novo recurso ou modelo tenha sido introduzido ainda, os usuários podem esperar experimentar o novo modelo de morango nas próximas duas semanas. Este modelo de IA de alto perfil não apenas fornecerá suporte técnico poderoso para ChatGPT, mas também atrairá a atenção da indústria com seu método de raciocínio exclusivo.
A principal característica do modelo do morango é a sua capacidade de imitar o processo de pensamento humano. Ele pode gastar de 10 a 20 segundos pensando e recuperando informações antes de dar uma resposta. Este método de processamento inovador foi projetado para melhorar a eficiência da utilização do poder de computação da IA e, assim, gerar conteúdo mais preciso.
Porém, é importante ressaltar que o modelo morango suporta processamento de texto apenas no estágio inicial e ainda não possui os recursos de processamento de imagem e áudio do GPT-4.
Na verdade, esta tecnologia de extensão do tempo de inferência e ajuste adaptativo não é a primeira do tipo no OpenAI. O Google DeepMind já conduziu pesquisas aprofundadas nesta área e publicou artigos relevantes. Os pesquisadores descobriram que, por meio da tecnologia de computação em tempo de teste, o desempenho de grandes modelos de linguagem pode ser significativamente melhorado, rompendo as limitações dos modelos atuais no treinamento de conjuntos de dados e recursos de computação de inferência.
Existem dois tipos principais de estratégias de otimização para o modelo morango. O primeiro tipo é baseado em um modelo de recompensa de verificação intensivo e orientado ao processo, que exige que o modelo não apenas produza resultados, mas também forneça um processo de raciocínio lógico, que é especialmente adequado para tarefas complexas de raciocínio matemático e lógico.
A segunda estratégia é ajustar dinamicamente as respostas subsequentes com base no conteúdo gerado anteriormente e otimizar continuamente a qualidade da saída através de múltiplas rodadas de iteração. A estratégia de otimização de cálculo proposta pelos pesquisadores visa selecionar o método de cálculo do tempo de teste mais adequado de acordo com a situação específica, o que melhora significativamente a eficiência do cálculo.
No entanto, o modelo do morango também enfrenta alguns desafios. Embora seja excelente na redução de erros e alucinações, os tempos de resposta de 10 a 20 segundos podem impactar a experiência do usuário. Há feedback dos usuários do teste de que essas respostas um pouco mais precisas não parecem ser suficientes para compensar os tempos de espera mais longos.
Além disso, como as capacidades avançadas podem levar a um maior consumo de recursos computacionais, os custos de utilização também podem aumentar. Para equilibrar a experiência do usuário e o consumo de recursos, a OpenAI pode definir um limite máximo para a frequência de envio de mensagens e considerar o lançamento de pacotes com preços mais elevados para fornecer tempos de resposta mais rápidos.
Em suma, o modelo "Strawberry" representa uma tentativa útil da OpenAI de melhorar a precisão e as capacidades de raciocínio de grandes modelos de linguagem, mas seu tempo de resposta de 10 a 20 segundos e possíveis problemas de custo ainda requerem observação e melhorias adicionais. Seu sucesso futuro depende de a OpenAI conseguir equilibrar efetivamente a relação entre precisão, velocidade e custo.