Recentemente, a Micron reduziu sua previsão de receita devido às vendas abaixo do esperado de computadores e smartphones com IA, gerando preocupações no mercado sobre o declínio da indústria de IA. No entanto, esta preocupação pode resultar de uma má compreensão do estado atual do mercado de IA. Este artigo analisará o mercado atual de IA, especialmente o status atual da aplicação de IA em computadores pessoais e telefones celulares, explorará suas perspectivas de desenvolvimento e esclarecerá alguns mal-entendidos do mercado.
Nos últimos anos, tem havido muita discussão sobre se os mercados de computadores e telemóveis estão em recessão. Recentemente, o fabricante de chips de memória gráfica Micron reduziu sua previsão de receita para os próximos trimestres devido às vendas menores do que o esperado de computadores e smartphones com IA. Isso fez com que muitas pessoas se preocupassem com a possibilidade de "a IA estar morrendo". No entanto, na verdade, a IA não mostra sinais de declínio, especialmente como é evidente no desempenho da Nvidia.
Muitos laptops e telefones celulares atualmente no mercado que afirmam ter recursos de IA não possuem poder de processamento suficiente. Mesmo os PCs para jogos de alto desempenho têm dificuldade em executar programas complexos de IA, como o ChatGPT, localmente, porque esses aplicativos exigem grandes quantidades de dados e poder de computação e não podem ser simplesmente concluídos em um PC. Embora existam alguns aplicativos alternativos disponíveis, eles não chegam nem perto do desempenho e da capacidade de resposta da maioria dos programas de IA executados em servidores.
No ecossistema de IA, a maioria das empresas e ferramentas de destaque se estabeleceram. Por exemplo, os usuários com placas gráficas Nvidia RTX muitas vezes podem superar muitas CPUs modernas equipadas com NPU em desempenho de IA. A comparação mostra que a diferença de desempenho entre notebooks equipados com RTX4080 e Intel Core Ultra9185H sob cargas de trabalho de IA pode chegar a 700% a 800%. Pode-se observar que o servidor desempenha um papel fundamental no fornecimento de desempenho de IA.
O Google estendeu seu modelo de IA Gemini para a maioria dos dispositivos Android e planeja trazê-lo para os alto-falantes Nest. Embora estes dispositivos tenham quatro anos, ainda demonstram a ampla aplicabilidade da tecnologia de IA. Olhando para o passado, considerou-se que o desempenho das placas gráficas precisava de atingir dezenas de milhares de milhões de cálculos (PFLOPs) para alcançar uma verdadeira experiência de realidade virtual, e as placas gráficas atuais ainda não atingiram este padrão, o que também reflete os desafios ainda enfrentados. pelo desenvolvimento da IA local.
No processo de desenvolvimento dos fabricantes de GPU, a programação de IA geralmente depende da computação paralela, e as GPUs são superiores nesse aspecto. Portanto, o design futuro da GPU ainda leva tempo, e pode não ser até o lançamento da série RTX60 que melhorias significativas no desempenho da IA sejam vistas. Esta geração de placas gráficas pode possibilitar a execução de modelos locais grandes (LLMs).
Destaques:
A tecnologia de IA não morreu e o desempenho do mercado é afetado por conceitos errados.
Muitos dispositivos que anunciam IA dependem de servidores para desempenho, dificultando a implementação local de operações complexas.
Futuros avanços tecnológicos em GPUs podem impulsionar o desenvolvimento de modelos locais de IA.
Em suma, a tecnologia de IA tem um enorme potencial para desenvolvimento futuro e o seu desempenho atual no mercado não reflete a sua verdadeira força. Com o avanço contínuo da tecnologia de hardware, especialmente a melhoria do desempenho da GPU, os aplicativos locais de IA darão início a novas oportunidades de desenvolvimento e, em última análise, mudarão o estilo de vida das pessoas.