Google DeepMind hat kürzlich ein grundlegendes Weltmodell namens Genie veröffentlicht, eine virtuell generierte interaktive Umgebung mit 11 Milliarden Parametern. Im Gegensatz zu herkömmlicher KI, die für das Training eine manuelle Annotation von Daten erfordert, nutzt Genie zum Lernen direkt Internet-Videodaten und kann die Merkmale und Muster verschiedener Aktionen selbstständig identifizieren sowie Fotos, Skizzen und sogar steuerbare virtuelle Welten generieren. Die generierten Videos sind im Cartoon-Stil gehalten und können Roboterbewegungen und deformierte Objekte simulieren. Sie zeigen leistungsstarke Lernfähigkeiten und feinkörnige Steuerungsmöglichkeiten, was einen Meilenstein auf dem Gebiet der KI darstellt.
Das Aufkommen von Genie stellt einen großen Durchbruch in der Art und Weise des KI-Modelltrainings dar. Seine leistungsstarke Lernfähigkeit und die Fähigkeit, subtile Bewegungen wahrzunehmen, bieten eine neue Richtung für die zukünftige KI-Entwicklung. Im Vergleich zu anderen ähnlichen Modellen hat Genie stärkere Fähigkeiten beim autonomen Lernen und Generieren bewiesen und bietet neue Möglichkeiten für den Aufbau virtueller Welten und die KI-Interaktion.