Downcodes小編獲悉,一項最新研究深入探討了AI模型在學習過程中的潛在能力,其學習方式甚至超越了人們先前的認知。研究人員透過分析AI模型在「概念空間」中的學習動態,揭示了AI影像理解和生成的全新機制。這項研究不僅為我們理解AI學習提供了新的視角,也為改進AI模型的表現提供了寶貴的想法。讓我們一起來深入了解這項突破性的研究成果。
圖源備註:圖片由AI生成,圖片授權服務商Midjourney
「概念空間」 是一種抽象的座標系統,能夠表示訓練資料中每個獨立概念的特點,例如物體的形狀、顏色或大小。研究者表示,透過在這個空間中描述學習動態,可以揭示概念學習的速度,以及學習順序受資料屬性的影響,這個屬性被稱為「概念訊號」。這個概念訊號反映了資料生成過程對概念值變化的敏感度。例如,當資料集中紅色和藍色之間的差異明顯時,模型對顏色的學習速度會更快。
在研究過程中,研究團隊觀察到模型的學習動態會出現突然的方向變化,從「概念記憶」 轉向「泛化」。為了驗證這一現象,他們訓練了一個模型,輸入了「大的紅色圓圈」、「大的藍色圓圈」 和「小的紅色圓圈」。在訓練中未出現的「藍色小圓圈」 組合,模型無法透過簡單文字提示產生。但是,使用「潛在幹預」 技術(即操控模型中負責顏色和大小的激活)和「過度提示」 技術(即透過RGB 值增強顏色規格),研究者成功產生了「藍色小圓圈」。這表明,儘管模型能夠理解「藍色」 和「小」 的組合,但它並未透過簡單的文字提示掌握這一能力。
研究人員也將此方法擴展到實際資料集,例如CelebA,它包含多種臉部影像屬性如性別和微笑。結果顯示,模型在產生微笑女性影像時表現出隱藏能力,而在使用基本提示時則顯得乏力。此外,初步實驗還發現,使用Stable Diffusion1.4時,過度提示可以產生不尋常的圖像,例如三角形的信用卡。
因此,研究團隊提出了一個關於隱藏能力的普遍假設:生成模型具備潛在能力,這些能力在訓練過程中突然且一致地出現,儘管模型在面對普通提示時可能不會表現出這些能力。
這項研究為我們理解AI模型的學習機制提供了全新的視角,也為未來AI模型的改進與應用提供了新的方向。 Downcodes小編相信,隨著對AI學習機制研究的不斷深入,我們將能夠更好地harness AI 的潛力,並推動人工智慧技術的進一步發展。 期待未來更多類似的研究成果出現!