Der erweiterte Sprachmodus der OpenAI-MacOS-Anwendung hat ein umfangreiches Update erhalten. Der Herausgeber von Downcodes führt Sie durch die Details! Das Herzstück dieses Updates ist die neue Funktion zum Hochladen von Bildern. Benutzer können nun Bilder über die Sprachschnittstelle hochladen und auf der Benutzeroberfläche anzeigen, was die Intuitivität der Mensch-Computer-Interaktion verbessert. Die Implementierung dieser Funktion macht die Interaktion der Benutzer mit ChatGPT komfortabler und ermöglicht es ihnen, Bilder einfacher zu diskutieren.
Kürzlich hat OpenAI im Rahmen eines großen Updates der Advanced Speech Mode-Schnittstelle seiner macOS-App eine neue Funktion zum Hochladen von Bildern eingeführt. Bisher war diese Funktion nicht anklickbar, aber jetzt können Benutzer endlich Bilder über die Sprach-Benutzeroberfläche hochladen, und die hochgeladenen Bilder werden auf der Benutzeroberfläche angezeigt.
Es ist jedoch erwähnenswert, dass ChatGPT Benutzer nicht darauf hinweist, dass das hochgeladene Bild nicht angezeigt werden kann. Benutzer können ein Bild hochladen und entsprechende Diskussionen mit ChatGPT führen, und alles wird intuitiver.
Neben dem Hochladen von Bildern können Benutzer auch Fotos direkt mit der Kamera ihres Laptops aufnehmen und so die aufgenommenen Bilder sofort teilen. Allerdings gibt es derzeit keine Bildschirmfreigabe-, Kamerafreigabe- und Videofreigabefunktionen, die noch ausstehen.
In diesem Update gibt es auch kleinere Anpassungen an der Darstellung einiger Meldungen. Beispielsweise wurde die Benutzeroberfläche auch mit Tipps zum Starten eines neuen Chats zur Nutzung des erweiterten Sprachmodus überarbeitet. Es ist erwähnenswert, dass ChatGPT den Benutzer möglicherweise auffordert, das Video explizit zu teilen, wenn er sich hinter einer Sitzung mit Videofreigabe befindet, um zur Verbesserung des Modells beizutragen. Diese Eingabeaufforderung wird angezeigt, wenn der Benutzer die Option zum Teilen von Videodaten für das Modelltraining aktiviert hat. Allerdings ist diese Option derzeit nicht in der Benutzeroberfläche verfügbar und wird möglicherweise zusammen mit den Bildschirm- und Video-Sharing-Funktionen veröffentlicht.
Dieses Update könnte die zukünftige Einführung des Canvas-Editors einläuten, eine Funktion, die bereits in der Entwicklung entdeckt wurde. Als nächstes kann die vollständige Einführung des Sprachmodus unabhängig von den Video- und Bildschirmfreigabefunktionen länger dauern, es sei denn, OpenAI beschließt, ihn zuerst zu starten.
Neben dem Hochladen von Bildern enthält das Update auch Verbesserungen an der Benutzeroberfläche und Hinweise auf mögliche zukünftige Funktionen, wie zum Beispiel einen Canvas-Editor und einen umfassenderen Sprachmodus. Funktionen wie die Bildschirmfreigabe befinden sich jedoch noch in der Entwicklung und wir freuen uns auf weitere Überraschungen in nachfolgenden Updates von OpenAI.