元始智能(RWKV)憑藉其顛覆性的生成式AI架構,在2023年12月獲得數千萬人民幣的天使輪融資,估值實現翻倍成長。此輪融資由天際資本領投,資金將主要用於團隊建立、技術研發以及產品商業化進程的推進。 RWKV架構作為對傳統Transformer架構的革新嘗試,旨在解決現有大語言模型在效率和準確性方面的不足,並致力於在AI領域開闢新的可能性。
在2022年全球生成式AI 浪潮的背景下,元始智能(RWKV)於2023年12月完成數千萬人民幣的天使輪融資,由天際資本投資。此次融資後,公司估值翻倍,資金將用於團隊擴展、新架構研發及產品商業化。
RWKV 的出現,是對傳統Transformer 架構的有力挑戰。隨著大語言模型(LLM)的發展,雖然模型的參數規模日益龐大,但其在幻覺和準確率等問題上的短板始終難以解決。因此,RWKV 的創始團隊決定探索一種全新的架構,以實現更高的效率和靈活性。
RWKV 的設計理念與Transformer 截然不同。共同創辦人羅璇表示,傳統的Transformer 模型每次產生一個Token 時,都需要重新「讀取」 前文,而RWKV 則不需要記錄每個Token 的狀態,從而顯著降低計算量。 RWKV 透過結合RNN(循環神經網路)的優點,實現了在效率和語言建模能力上的突破。
這項創新架構的優點在於,RWKV 能夠在有限的狀態空間中處理訊息,透過強化學習方法,模型能夠自動判斷何時需要回顧前文,從而提升其記憶能力。相較於傳統模型,RWKV 在多項基準測試中表現優越,證明其在語言學習效率上的提升。
目前,RWKV 已經完成了從0.1B 到14B 的模型訓練,並在海外社群發布了32B 的預覽模型。在未來,元始智能計畫在2025年推出70B 及以上參數的RWKV-7,並探索新型推理架構和晶片,以進一步提升模型效能。
在業務方面,RWKV 不僅提供開源項目,還積極進行商業化佈局,涉及AI 音樂生成及與企業的合作,已與國家電網等多家企業達成合作。隨著技術的發展和商業化的推進,RWKV 力爭成為大模型領域的「安卓和Linux」。
RWKV的創新架構和商業化佈局,使其在競爭激烈的大模型領域展現出強大的潛力,未來發展值得期待。其目標成為大模型領域的「安卓和Linux」也體現了其遠大的抱負。相信隨著科技的不斷成熟與商業模式的完善,RWKV將會在AI領域取得更大的成就。