亞馬遜AWS在re:Invent大會上重磅推出Nova系列多模態生成式AI模型,涵蓋文字、圖像和影片生成,旨在提供更快、成本更低的AI解決方案。 Nova系列包含四個文字產生模型(Micro、Lite、Pro和Premier),以及影像產生模型Nova Canvas和影片產生模型Nova Reel,滿足不同使用者的需求和複雜度要求。此系列模型支援多種語言,並可與AWS Bedrock平台無縫集成,方便使用者進行微調和最佳化。 AWS也承諾未來將推出語音到語音模型和「任意到任意」模型,進一步拓展Nova系列的功能。
在周二的re:Invent大會上,亞馬遜網路服務(AWS)宣布推出其新型多模式生成AI模型系列-Nova。此次發布的Nova系列包括四種文本生成模型:Micro、Lite、Pro和Premier,此外還推出了圖像生成模型Nova Canvas和視頻生成模型Nova Reel。
亞馬遜執行長Andy Jassy表示,Micro、Lite和Pro模型將在當天開始向AWS客戶推出,而Premier模型預計將在2025年初發布。 Nova系列專為處理多種輸入形式(包括文字、圖像、影片)而設計,其中文字生成模型特別優化了15種語言,主要支援英語。
Nova文字生成模型
Nova文本生成模型具有不同的功能和規格。 Micro模型以最低延遲和快速回應著稱,但僅支援文字輸入輸出,適合快速處理任務。 Lite模型支援文字、圖像和影片的快速輸入處理,而Pro模型則在準確度、速度和成本之間提供了平衡。 Premier是最強大的模型,專為複雜工作負載設計,適合需要客製化模型的高階應用。
這些模型的上下文視窗大小也有所不同。 Micro支援最多約100,000個單詞,Lite和Pro模型可處理約225,000個單字、15,000行程式碼或30分鐘的音訊內容。而AWS表示,到2025年初,某些Nova模型的上下文視窗將擴展到200萬個標記。
Jassy強調,Nova系列是同類產品中速度最快、成本最低的AI模型。它們能夠在AWS的AI開發平台AWS Bedrock上進行微調,進一步提高速度和效率。此外,Nova系列可與專有系統和API無縫配合,執行多種自動化任務。
Nova Canvas和Nova Reel
除了文字生成,AWS還推出了兩款圖像和影片生成工具:Nova Canvas和Nova Reel。 Nova Canvas允許使用者透過提示來產生和編輯圖像,並提供對生成圖像的配色方案和佈局的控制。 Nova Reel則可以根據提示或參考影像產生長達6秒的視頻,並允許使用者調整攝影機運動,包括平移、旋轉和縮放。
以下是來自Canvas 的圖片:
儘管目前Reel僅限於製作6秒短視頻,AWS表示更長的視頻版本將在不久後推出。此外,AWS為這些工具內建了責任使用控制措施,包括浮水印和內容審核,以避免產生有害內容。
Jassy還透露,AWS正在開發一款語音到語音模型,預計於2025年第一季推出,這款模型將支援語音輸入並產生自然的人類語音。此外,AWS還在開發一個「任意到任意」模型,預計在2025年中期發布,支援跨文字、語音、圖像和視訊的多模態轉換。
AWS對其訓練資料的保密性保持謹慎,並表示在版權問題上會提供賠償政策,以保障客戶的合法權益。
專案入口:https://aws.amazon.com/cn/ai/generative-ai/nova/
官方部落格:https://aws.amazon.com/cn/blogs/aws/introducing-amazon-nova-frontier-intelligence-and-industry-leading-price-performance/
總而言之,AWS Nova系列的推出標誌著多模態生成式AI技術發展的新階段,其強大的功能、高效的速度以及對責任使用的重視,將為使用者帶來全新的AI體驗。 未來Nova系列的持續發展和功能擴展,值得期待。