Mark Zuckerberg, CEO von Meta, verteidigte kürzlich vor Gericht die Verwendung urheberrechtlich geschützter Daten durch Meta zum Training von KI und erregte damit breite Aufmerksamkeit. Zu den Klägern in diesem Fall gehören bekannte Autoren, die Meta vorwerfen, große Mengen an Raubkopien von Buchdaten für das Training von KI-Modellen verwendet zu haben. Zuckerbergs Verteidigungsstrategie ist ziemlich umstritten. Er verglich Metas Verhalten mit Raubkopien auf YouTube und versuchte zu beweisen, dass Metas Verhalten kein vorsätzlicher Verstoß war. Ob diese Verteidigungsstrategie von den Gerichten übernommen wird, bleibt abzuwarten. In diesem Artikel werden Zuckerbergs Aussage und die neuesten Entwicklungen in dem Fall im Detail analysiert und ihre Auswirkungen auf die zukünftige Entwicklung der Branche der künstlichen Intelligenz untersucht.
Mark Zuckerberg, CEO von Meta, hat den Kampf von YouTube gegen Raubkopien genutzt, um in jüngsten Gerichtsverfahren die Verwendung urheberrechtlich geschützter Daten durch das Unternehmen im KI-Training zu verteidigen. Der Fall mit dem Titel „Kadrey v. Meta“ ist eine von vielen Urheberrechtsklagen gegen KI-Unternehmen vor US-Gerichten. Zu den Klägern gehören die bekannten Schriftsteller Sarah Silverman und Ta-Nahisi Coates.
Kürzlich veröffentlichten Auszügen aus Zuckerbergs Aussage zufolge wies Zuckerberg darauf hin, dass es auf YouTube möglicherweise Raubkopien gebe, YouTube aber immer noch daran arbeite, diese zu entfernen. „Die meisten Inhalte auf YouTube sollten legal sein und sie verfügen über entsprechende Lizenzen“, sagte Zuckerberg. Die Bemerkungen deuten auf seine Haltung gegenüber Metas Nutzung eines urheberrechtlich geschützten E-Book-Datensatzes namens LibGen für das KI-Training hin.
LibGen ist eine Link-Aggregations-Website, die urheberrechtlich geschützte Werke mehrerer Verlage bereitstellt, darunter Cengage Learning, McGraw-Hill und Pearson Education. Die Website wurde mehrfach wegen Urheberrechtsverletzung verklagt und mit einer Geldstrafe in zweistelliger Millionenhöhe belegt. Gerichtsdokumente zeigen, dass Zuckerberg, obwohl das KI-Team von Meta Bedenken hinsichtlich der rechtlichen Risiken der Verwendung von LibGen geäußert hatte, dessen Verwendung als Trainingsdatensatz dennoch genehmigte.
Während der Befragung behauptete Zuckerberg, er sei mit LibGen nicht vertraut, sagte jedoch, das Verbot einer Plattform wie YouTube sei unvernünftig. „Nein, ich möchte keine Richtlinien für YouTube-Nutzer festlegen, da einige Inhalte möglicherweise urheberrechtlich geschützt sind“, sagte er. Er räumte auch ein, dass Meta bei der Verwendung von urheberrechtlich geschütztem Material für Schulungen vorsichtig sein muss.
Laut der jüngsten Behauptung der Anwälte der Kläger hat Meta bestimmte Raubkopien von Büchern auf LibGen mit urheberrechtlich geschützten Büchern verglichen, die zur Lizenzierung verfügbar waren, um zu entscheiden, ob eine Lizenzvereinbarung mit dem Verlag geschlossen werden sollte. Darüber hinaus warf der Kläger Meta auch vor, den Datensatz von LibGen beim Training seines neuesten Llama-Modells verwendet und E-Books von einer anderen Raubkopiequelle, Z-Library, für das Training heruntergeladen zu haben.
Auch gegen die Z-Library gab es mehrere rechtliche Schritte aufgrund von Urheberrechtsproblemen, und ihre Verteidiger wurden im Jahr 2022 wegen Urheberrechtsverletzung, Online-Betrug und Geldwäsche angeklagt.
Highlight:
Zuckerberg zitierte vor Gericht den YouTube-Fall, um Metas Verwendung von urheberrechtlich geschütztem Material im KI-Training zu verteidigen.
Der Kläger beschuldigte Meta, den raubkopierten Buchdatensatz LibGen zum Trainieren des Llama-Modells verwendet und relevante Informationen versteckt zu haben.
Meta war mit mehreren Urheberrechtsklagen konfrontiert und die damit verbundenen rechtlichen Risiken haben interne Diskussionen und Bedenken ausgelöst.
Das endgültige Urteil in diesem Fall wird tiefgreifende Auswirkungen auf die Branche der künstlichen Intelligenz haben. Es wird einen wichtigen rechtlichen Hinweis darauf liefern, wie KI-Unternehmen in Zukunft urheberrechtlich geschützte Daten zum Trainieren von Modellen verwenden, und könnte die Branche dazu veranlassen, strengere Urheberrechtsschutzmaßnahmen zu entwickeln.