À l’ère de l’explosion de l’information, l’analyse de données textuelles courtes est devenue un défi majeur dans le domaine de l’intelligence artificielle. En raison de la quantité limitée d’informations contenues dans des textes courts et du manque d’association contextuelle, les méthodes d’analyse traditionnelles sont difficiles à traiter efficacement. Justin Miller, étudiant diplômé de l'Université de Sydney, a adopté une approche différente et a développé une nouvelle méthode d'analyse de textes courts utilisant de grands modèles de langage (LLM) pour fournir une solution innovante à ce problème. Ses résultats de recherche améliorent non seulement l'efficacité et la précision de l'analyse de textes courts, mais démontrent également l'énorme potentiel de l'intelligence artificielle dans le traitement et la compréhension de l'information, fournissant ainsi des informations plus approfondies pour divers domaines de la société.
Dans le monde numérique d’aujourd’hui, l’utilisation de textes courts est devenue centrale dans la communication en ligne. Cependant, comme ces textes manquent souvent d’un vocabulaire ou d’un contexte commun, l’intelligence artificielle (IA) est confrontée à de nombreux défis lors de leur analyse. À cet égard, Justin Miller, étudiant diplômé en littérature anglaise et data scientist à l'Université de Sydney, a proposé une nouvelle méthode qui utilise de grands modèles linguistiques (LLM) pour mener une compréhension et une analyse approfondies de textes courts.
Les recherches de Miller portent sur la manière de classer efficacement de grandes quantités de textes courts, tels que des profils de réseaux sociaux, des commentaires de clients ou des commentaires en ligne liés à des catastrophes. L'outil d'IA qu'il a développé peut regrouper des dizaines de milliers de profils d'utilisateurs de Twitter en dix catégories faciles à comprendre. Ce processus a permis d'analyser avec succès près de 40 publications sur le président américain Trump en deux jours en septembre 2020. 000 profils d'utilisateurs de Twitter. Cette classification peut aider à identifier non seulement les tendances professionnelles, les positions politiques et même les emojis qu’ils utilisent.
"Le point culminant de cette recherche est son concept de conception humaniste." Miller a déclaré que la classification générée à l'aide de grands modèles de langage est non seulement efficace sur le plan informatique, mais également cohérente avec la compréhension intuitive humaine. Ses recherches montrent également que l'IA générative comme ChatGPT peut dans certains cas fournir des noms de classification plus clairs et cohérents que les évaluateurs humains, en particulier lorsqu'il s'agit de discerner des modèles significatifs à partir du bruit de fond.
L'outil de Miller présente un potentiel pour diverses applications. Ses recherches montrent que de grands ensembles de données peuvent être réduits en groupes gérables et significatifs. Par exemple, dans un projet sur la guerre entre la Russie et l’Ukraine, il a regroupé plus d’un million de publications sur les réseaux sociaux et identifié dix sujets différents, dont la campagne de désinformation russe et l’utilisation d’animaux comme symboles dans l’aide humanitaire. De plus, grâce à ces clusters, les organisations, les gouvernements et les entreprises peuvent obtenir des informations exploitables pour les aider à prendre des décisions plus éclairées.
Miller a conclu : « Cette application à double usage de l'IA réduit non seulement le recours à un examen humain coûteux et subjectif, mais nous offre également un moyen évolutif de donner un sens à de grandes quantités de données textuelles, de l'analyse des tendances des médias sociaux à la surveillance des crises et aux informations sur les clients. , cette approche combine efficacement l’efficacité des machines avec la compréhension humaine, apportant de nouvelles idées pour l’organisation et l’interprétation des données.
Les recherches de Miller fournissent de nouvelles idées pour l'analyse de données textuelles courtes. Les outils d'IA qu'il a développés ont de larges perspectives d'application et fournissent un soutien solide pour l'analyse des données et la prise de décision dans divers domaines. Cela indique que l'intelligence artificielle jouera un rôle de plus en plus important dans. le domaine du traitement de l’information joue un rôle plus important.