英偉達被曝秘密抓取YouTube 影片資料訓練AI

作者：Eve Cole 更新時間：2024-12-12 14:32:01

近日，媒體曝光英偉達秘密大規模抓取YouTube影片資料用於訓練其AI模型，引發了廣泛的法律和倫理爭議。此舉涉及英偉達多款AI產品，包括Cosmos深度學習模型、自動駕駛演算法等，其資料取得方式隱蔽，且未經影片創作者及Google授權。英偉達內部郵件顯示，高層對這一行為持樂觀態度，認為已獲得“全面批准”，而這一說法與谷歌官方聲明相悖，谷歌明確指出此行為違反平台服務條款。事件涉及的巨額數據量、隱藏的操作手段以及各方截然不同的回應，都使得這一事件備受關注。

最近，科技巨頭英偉達在數據獲取方面的一項秘密行動被曝光。根據媒體404的報導，英偉達透過抓取海量YouTube 影片資料來訓練他們的人工智慧模型，這項行為在法律和倫理上都相當模糊。

報告中指出，英偉達正利用這些視訊資料訓練其多款AI 模型，包括Cosmos 深度學習模型、自動駕駛演算法、數位人類AI 頭像產品，以及3D 世界建構工具Omniverse。

據了解，英偉達採取了許多隱藏措施來掩蓋他們的資料抓取行為，使用了多個「虛擬機器」並不斷更換IP 位址，以避免被YouTube 發現。而且，影片創作者和YouTube 的母公司谷歌並未對此資料抓取活動給予任何授權。英偉達內部的溝通顯示，他們的策略相當大膽，一位高管在郵件中提到正在構建一個“視頻數據工廠”，每天能夠產生相當於人類一生的視覺體驗數據。

有趣的是，當員工對這種數據獲取的合法性和倫理性表示擔憂時，管理層對此卻顯得相當自信，認為這一切都是高層的決定。郵件中寫道:“我們對所有數據都有一個全面的批准。”

更令人感到不安的是，英偉達曾在一段時間內明知自己正在使用一個包含1.3億個YouTube 影片的HD-VG-130M 資料集，而這個資料集本來是為了學術研究而創建的。許多專家對此表示強烈不滿，認為將用於研究的數據用於商業化是一種不當行為。

作為AI 產業的核心參與者，英偉達在市場上佔據了顯著的地位，其圖形處理單元（GPU）是許多計算密集型AI 系統的基礎。與英偉達合作的公司如OpenAI、微軟和谷歌等都對此行為表示關切。谷歌的發言人提到，未經許可使用YouTube 資料是明顯違反平台服務條款的。

英偉達在回應媒體時聲稱，他們的AI 訓練行為是「完全符合版權法的精神和字面意思」。然而，使用這些內容的創作者們對這說法又會有怎樣的看法呢?

劃重點:

英偉達秘密抓取大量YouTube 影片資料進行AI 訓練，法律和倫理問題引發關注。

?內部郵件顯示，英偉達高層認為此行為獲得了全面批准，態度相當大膽。

? Google指出，未經許可使用YouTube 資料明顯違反平台服務條款，英偉達的回應引發爭議。

英偉達的資料抓取行為引發了關於AI資料取得倫理和法律的廣泛討論，其回應也未能平息爭議。這起事件凸顯了大型科技公司在數據使用上所面臨的挑戰，以及對相關法律法規完善的迫切需求。未來，類似事件或將持續引發關注，並促使產業加強自律，規範資料使用行為。