Na era da explosão da informação, a análise de dados de textos curtos tornou-se um grande desafio no campo da inteligência artificial. Devido à quantidade limitada de informações em textos curtos e à falta de associação contextual, os métodos tradicionais de análise são difíceis de processar de forma eficaz. Justin Miller, um estudante de pós-graduação da Universidade de Sydney, adotou uma abordagem diferente e desenvolveu um novo método de análise de textos curtos usando grandes modelos de linguagem (LLMs) para fornecer uma solução inovadora para este problema. Os resultados de sua pesquisa não apenas melhoram a eficiência e a precisão da análise de textos curtos, mas também demonstram o enorme potencial da inteligência artificial no processamento e compreensão de informações, fornecendo insights de dados mais profundos para vários campos da sociedade.
No mundo digital de hoje, o uso de textos curtos tornou-se central na comunicação online. No entanto, como estes textos muitas vezes carecem de um vocabulário ou contexto comum, a inteligência artificial (IA) enfrenta muitos desafios ao analisá-los. Nesse sentido, Justin Miller, estudante de pós-graduação em literatura inglesa e cientista de dados da Universidade de Sydney, propôs um novo método que utiliza grandes modelos de linguagem (LLMs) para conduzir compreensão e análise aprofundadas de textos curtos.
A pesquisa de Miller se concentra em como classificar com eficácia grandes quantidades de texto curto, como perfis de mídia social, feedback de clientes ou comentários online relacionados a eventos de desastre. A ferramenta de IA que ele desenvolveu pode agrupar dezenas de milhares de perfis de usuários do Twitter em dez categorias fáceis de entender. Esse processo analisou com sucesso quase 40 postagens sobre o presidente dos EUA, Trump, em dois dias em setembro de 2020. Essa classificação pode ajudar a identificar não apenas as inclinações profissionais dos usuários, suas posições políticas e até mesmo os emojis que eles usam.
“O destaque desta pesquisa é o seu conceito de design humanístico.” Miller disse que a classificação gerada usando grandes modelos de linguagem não é apenas computacionalmente eficiente, mas também consistente com a compreensão intuitiva humana. Sua pesquisa também mostra que a IA generativa como o ChatGPT pode, em alguns casos, fornecer nomes de classificação mais claros e consistentes do que os revisores humanos, especialmente quando se trata de discernir padrões significativos do ruído de fundo.
A ferramenta de Miller tem potencial para uma variedade de aplicações. Sua pesquisa mostra que grandes conjuntos de dados podem ser reduzidos a grupos gerenciáveis e significativos. Por exemplo, num projecto sobre a guerra Rússia-Ucrânia, ele agrupou mais de 1 milhão de publicações nas redes sociais e identificou dez tópicos diferentes, incluindo a campanha de desinformação russa e a utilização de animais como símbolos na ajuda humanitária. Além disso, através destes clusters, organizações, governos e empresas podem obter insights acionáveis para ajudar a tomar decisões mais informadas.
Miller concluiu: “Esta aplicação de IA de dupla utilização não só reduz a dependência de análises humanas dispendiosas e subjetivas, como também nos dá uma forma escalável de compreender grandes quantidades de dados textuais, desde a análise de tendências das redes sociais até à monitorização de crises e às perspetivas dos clientes. , esta abordagem combina efetivamente a eficiência das máquinas com a compreensão humana, fornecendo novas ideias para a organização e interpretação dos dados”.
A pesquisa de Miller fornece novas ideias para análise de dados de texto curto. As ferramentas de IA desenvolvidas por ele têm amplas perspectivas de aplicação e fornecem forte suporte para análise de dados e tomada de decisão em vários campos. o campo do processamento de informações.