Une équipe de recherche de l'École Polytechnique Fédérale de Lausanne en Suisse a lancé une nouvelle méthode appelée ViPer lors de la prochaine conférence ECCV 2024, qui vise à personnaliser la sortie du modèle généré en fonction des préférences visuelles de l'utilisateur. ViPer (Personnalisation visuelle des modèles génératifs via l'apprentissage des préférences individuelles) permet à chaque utilisateur d'obtenir des résultats générés plus conformes à ses propres préférences sous les mêmes invites en apprenant les préférences individuelles de l'utilisateur. Cette innovation utilise une série d'images et de commentaires fournis par les utilisateurs pour extraire les préférences visuelles individuelles et fournit un mécanisme de notation proxy pour aider les utilisateurs à prédire leurs préférences pour de nouvelles images, améliorant ainsi l'expérience utilisateur et réalisant une personnalisation personnalisée du modèle généré.
Récemment, une équipe de recherche de l'École Polytechnique Fédérale de Lausanne en Suisse a lancé une nouvelle méthode appelée ViPer (Visual Personnalisation des modèles génératifs via l'apprentissage des préférences individuelles), qui vise à personnaliser la sortie du modèle génératif en fonction des préférences visuelles de l'utilisateur.
Cette innovation sera démontrée lors de la prochaine conférence ECCV 2024, et l'équipe espère permettre à chaque utilisateur d'obtenir des résultats générés plus conformes à ses propres préférences sous les mêmes invites.
Le modèle de ce projet a été publié sur la plateforme Huggingface et les utilisateurs peuvent facilement le télécharger et l'utiliser. Le modèle VPE de ViPer est affiné pour extraire les préférences individuelles d'une série d'images et de commentaires fournis par les utilisateurs.
Dans le même temps, le projet fournit également un modèle d'indicateur proxy capable de prédire le score de préférence d'une image de requête en fonction des images que l'utilisateur aime et n'aime pas. Cela signifie que les utilisateurs peuvent mieux comprendre leurs préférences potentielles pour les nouvelles images.
De plus, ViPer fournit également un mécanisme de notation d'agent, dans lequel les utilisateurs peuvent calculer le score d'une image de requête en fournissant des images « j'aime » et « je n'aime pas ». Ce score varie de 0 à 1, un score plus élevé indiquant que l'utilisateur aime davantage l'image. L'équipe recommande à chaque utilisateur de fournir environ 8 likes et 8 dislikes pour garantir l'exactitude des résultats.
Points forts:
ViPer extrait les préférences visuelles individuelles des commentaires ponctuels des utilisateurs pour personnaliser la sortie du modèle génératif.
Le modèle de ce projet a été publié sur Huggingface et les utilisateurs peuvent facilement le télécharger et l'utiliser.
? ViPer fournit un mécanisme de notation proxy pour aider les utilisateurs à prédire leur goût pour les nouvelles images.
Dans l’ensemble, ViPer fournit une méthode pratique et efficace pour réaliser une personnalisation personnalisée des modèles générés et apporter une meilleure expérience utilisateur. Sa sortie sur la plateforme Huggingface facilite également l'utilisation et l'exploration d'un plus grand nombre d'utilisateurs. À l’avenir, les modèles de génération personnalisés devraient être appliqués dans davantage de domaines afin de créer des expériences pour les utilisateurs plus adaptées à leurs propres besoins.