AWS推出Nova系列生成AI模型，支援文字、圖像和影片生成

作者：Eve Cole 更新時間：2024-12-17 17:48:01

亞馬遜AWS在re:Invent大會上重磅推出Nova系列多模態生成式AI模型，涵蓋文字、圖像和影片生成，旨在提供更快、成本更低的AI解決方案。 Nova系列包含四個文字產生模型(Micro、Lite、Pro和Premier)，以及影像產生模型Nova Canvas和影片產生模型Nova Reel，滿足不同使用者的需求和複雜度要求。此系列模型支援多種語言，並可與AWS Bedrock平台無縫集成，方便使用者進行微調和最佳化。 AWS也承諾未來將推出語音到語音模型和「任意到任意」模型，進一步拓展Nova系列的功能。

在周二的re:Invent大會上，亞馬遜網路服務（AWS）宣布推出其新型多模式生成AI模型系列－Nova。此次發布的Nova系列包括四種文本生成模型:Micro、Lite、Pro和Premier，此外還推出了圖像生成模型Nova Canvas和視頻生成模型Nova Reel。

亞馬遜執行長Andy Jassy表示，Micro、Lite和Pro模型將在當天開始向AWS客戶推出，而Premier模型預計將在2025年初發布。 Nova系列專為處理多種輸入形式（包括文字、圖像、影片）而設計，其中文字生成模型特別優化了15種語言，主要支援英語。

Nova文字生成模型

Nova文本生成模型具有不同的功能和規格。 Micro模型以最低延遲和快速回應著稱，但僅支援文字輸入輸出，適合快速處理任務。 Lite模型支援文字、圖像和影片的快速輸入處理，而Pro模型則在準確度、速度和成本之間提供了平衡。 Premier是最強大的模型，專為複雜工作負載設計，適合需要客製化模型的高階應用。

這些模型的上下文視窗大小也有所不同。 Micro支援最多約100，000個單詞，Lite和Pro模型可處理約225，000個單字、15，000行程式碼或30分鐘的音訊內容。而AWS表示，到2025年初，某些Nova模型的上下文視窗將擴展到200萬個標記。

Jassy強調，Nova系列是同類產品中速度最快、成本最低的AI模型。它們能夠在AWS的AI開發平台AWS Bedrock上進行微調，進一步提高速度和效率。此外，Nova系列可與專有系統和API無縫配合，執行多種自動化任務。

Nova Canvas和Nova Reel

除了文字生成，AWS還推出了兩款圖像和影片生成工具:Nova Canvas和Nova Reel。 Nova Canvas允許使用者透過提示來產生和編輯圖像，並提供對生成圖像的配色方案和佈局的控制。 Nova Reel則可以根據提示或參考影像產生長達6秒的視頻，並允許使用者調整攝影機運動，包括平移、旋轉和縮放。

以下是來自Canvas 的圖片:

儘管目前Reel僅限於製作6秒短視頻，AWS表示更長的視頻版本將在不久後推出。此外，AWS為這些工具內建了責任使用控制措施，包括浮水印和內容審核，以避免產生有害內容。

Jassy還透露，AWS正在開發一款語音到語音模型，預計於2025年第一季推出，這款模型將支援語音輸入並產生自然的人類語音。此外，AWS還在開發一個「任意到任意」模型，預計在2025年中期發布，支援跨文字、語音、圖像和視訊的多模態轉換。

AWS對其訓練資料的保密性保持謹慎，並表示在版權問題上會提供賠償政策，以保障客戶的合法權益。

專案入口:https://aws.amazon.com/cn/ai/generative-ai/nova/

官方部落格:https://aws.amazon.com/cn/blogs/aws/introducing-amazon-nova-frontier-intelligence-and-industry-leading-price-performance/

總而言之，AWS Nova系列的推出標誌著多模態生成式AI技術發展的新階段，其強大的功能、高效的速度以及對責任使用的重視，將為使用者帶來全新的AI體驗。未來Nova系列的持續發展和功能擴展，值得期待。