Kürzlich hat das chinesische Korpustraining Gemini-Pro von Google heftige Diskussionen ausgelöst. Es gab zu, dass es Baidu Wenxin Yiyan-Daten für das Training verwendet hatte, was in den sozialen Medien für Aufruhr sorgte. Viele Internetnutzer stellten die Frage, ob zwischen großen Unternehmen unlauterer Wettbewerb herrschte, was zu Diskussionen über die Quellen und die Ethik von Trainingsdaten für Modelle künstlicher Intelligenz führte. Der Kern des Vorfalls besteht darin, dass sich Gemini-Pro beim chinesischen Korpustraining auf die Daten von Baidu Wenxinyiyan verlassen hat. Dies hat die Grenzen der Branche in Bezug auf Dateneigentum und geistige Eigentumsrechte direkt in Frage gestellt und auch mögliche Risiken und versteckte Gefahren beim groß angelegten Sprachmodelltraining aufgedeckt. .
Der Artikel konzentriert sich auf:
Das chinesische Gemini-Pro-Korpus von Google sorgte für Kontroversen. Es zeigte sich, dass es Baidu Wenxiniyan für Schulungen nutzte. Die Internetnutzer fragten sich, ob große Unternehmen versuchten, sich gegenseitig die Wolle zu stehlen. Gemini-Pro erregte in den sozialen Medien Aufmerksamkeit, nachdem es während des Tests offenbar verwirrt über seine Identität war. Gemini-Beamte gaben schließlich zu, Baidu Wenxin für chinesische Trainingsdaten verwendet zu haben, was das Thema noch verschärfte.
Dieser Vorfall verdeutlicht nicht nur den Widerspruch zwischen der gemeinsamen Nutzung von Datenressourcen und dem Schutz geistigen Eigentums im Bereich der künstlichen Intelligenz, sondern wirft auch Bedenken hinsichtlich der Vertrauenswürdigkeit und Transparenz großer Sprachmodelle auf. Das Training und die Anwendung von Modellen der künstlichen Intelligenz erfordern in Zukunft ein standardisierteres Management und strengere ethische Standards, um eine gesunde Entwicklung der Branche sicherzustellen.