近日,媒體曝光英偉達秘密大規模抓取YouTube影片資料用於訓練其AI模型,引發了廣泛的法律和倫理爭議。此舉涉及英偉達多款AI產品,包括Cosmos深度學習模型、自動駕駛演算法等,其資料取得方式隱蔽,且未經影片創作者及Google授權。英偉達內部郵件顯示,高層對這一行為持樂觀態度,認為已獲得“全面批准”,而這一說法與谷歌官方聲明相悖,谷歌明確指出此行為違反平台服務條款。事件涉及的巨額數據量、隱藏的操作手段以及各方截然不同的回應,都使得這一事件備受關注。
最近,科技巨頭英偉達在數據獲取方面的一項秘密行動被曝光。根據媒體404的報導,英偉達透過抓取海量YouTube 影片資料來訓練他們的人工智慧模型,這項行為在法律和倫理上都相當模糊。
報告中指出,英偉達正利用這些視訊資料訓練其多款AI 模型,包括Cosmos 深度學習模型、自動駕駛演算法、數位人類AI 頭像產品,以及3D 世界建構工具Omniverse。
據了解,英偉達採取了許多隱藏措施來掩蓋他們的資料抓取行為,使用了多個「虛擬機器」 並不斷更換IP 位址,以避免被YouTube 發現。而且,影片創作者和YouTube 的母公司谷歌並未對此資料抓取活動給予任何授權。英偉達內部的溝通顯示,他們的策略相當大膽,一位高管在郵件中提到正在構建一個“視頻數據工廠”,每天能夠產生相當於人類一生的視覺體驗數據。
有趣的是,當員工對這種數據獲取的合法性和倫理性表示擔憂時,管理層對此卻顯得相當自信,認為這一切都是高層的決定。郵件中寫道:“我們對所有數據都有一個全面的批准。”
更令人感到不安的是,英偉達曾在一段時間內明知自己正在使用一個包含1.3億個YouTube 影片的HD-VG-130M 資料集,而這個資料集本來是為了學術研究而創建的。許多專家對此表示強烈不滿,認為將用於研究的數據用於商業化是一種不當行為。
作為AI 產業的核心參與者,英偉達在市場上佔據了顯著的地位,其圖形處理單元(GPU)是許多計算密集型AI 系統的基礎。與英偉達合作的公司如OpenAI、微軟和谷歌等都對此行為表示關切。谷歌的發言人提到,未經許可使用YouTube 資料是明顯違反平台服務條款的。
英偉達在回應媒體時聲稱,他們的AI 訓練行為是「完全符合版權法的精神和字面意思」。然而,使用這些內容的創作者們對這說法又會有怎樣的看法呢?
劃重點:
英偉達秘密抓取大量YouTube 影片資料進行AI 訓練,法律和倫理問題引發關注。
?內部郵件顯示,英偉達高層認為此行為獲得了全面批准,態度相當大膽。
? Google指出,未經許可使用YouTube 資料明顯違反平台服務條款,英偉達的回應引發爭議。
英偉達的資料抓取行為引發了關於AI資料取得倫理和法律的廣泛討論,其回應也未能平息爭議。這起事件凸顯了大型科技公司在數據使用上所面臨的挑戰,以及對相關法律法規完善的迫切需求。未來,類似事件或將持續引發關注,並促使產業加強自律,規範資料使用行為。