Amazon AWS は、より高速かつ低コストの AI ソリューションを提供することを目的として、テキスト、画像、ビデオの生成をカバーするマルチモーダル生成 AI モデルの Nova シリーズを re:Invent カンファレンスで発表しました。 Nova シリーズには、さまざまなユーザーのニーズと複雑さの要件を満たすために、4 つのテキスト生成モデル (Micro、Lite、Pro、Premier)、画像生成モデル Nova Canvas およびビデオ生成モデル Nova Reel が含まれています。このシリーズのモデルは複数の言語をサポートしており、AWS Bedrock プラットフォームとシームレスに統合できるため、ユーザーは微調整と最適化が容易になります。 AWS はまた、Nova シリーズの機能をさらに拡張するために、将来的に音声対音声モデルと「any-to-any」モデルをリリースすることも約束しています。
火曜日の re:Invent カンファレンスで、アマゾン ウェブ サービス (AWS) は、マルチモーダル生成 AI モデルの新しいファミリーである Nova の立ち上げを発表しました。今回発売されたNovaシリーズは、Micro、Lite、Pro、Premierの4つのテキスト生成モデルに加え、画像生成モデルのNova Canvasとビデオ生成モデルのNova Reelも発売される。
Amazon CEOのアンディ・ジャシー氏は、同日からマイクロ、ライト、プロモデルがAWSの顧客向けに展開を開始し、プレミアモデルは2025年初めにリリースされる予定だと述べた。 Nova シリーズは、複数の入力フォーム (テキスト、画像、ビデオなど) を処理できるように設計されており、テキスト生成モデルは、主に英語をサポートする 15 言語向けに特別に最適化されています。
Nova テキスト生成モデル
Nova テキスト生成モデルには、さまざまな機能と仕様があります。 Micro モデルは、遅延が最も低く、応答が速いことで知られていますが、テキストの入出力のみをサポートしているため、高速処理タスクに適しています。 Lite モデルはテキスト、画像、ビデオの高速入力処理をサポートし、Pro モデルは精度、速度、コストのバランスを提供します。 Premier は最も強力なモデルで、複雑なワークロード向けに設計されており、カスタマイズされたモデルを必要とする高度なアプリケーションに適しています。
モデルによってコンテキスト ウィンドウのサイズも異なります。 Micro は最大約 100,000 ワードをサポートし、Lite および Pro モデルは約 225,000 ワード、15,000 行のコード、または 30 分のオーディオ コンテンツを処理できます。そして AWS は、2025 年初頭までに、一部の Nova モデルのコンテキスト ウィンドウが 200 万マーカーに拡大されると述べました。
Jassy 氏は、Nova シリーズが同様の製品の中で最も高速かつ低コストの AI モデルであると強調しました。 AWS の AI 開発プラットフォーム AWS Bedrock で微調整することで、速度と効率をさらに向上させることができます。さらに、Nova シリーズは独自のシステムおよび API とシームレスに連携して、さまざまな自動化タスクを実行できます。
Nova キャンバスと Nova リール
AWS は、テキスト生成に加えて、Nova Canvas と Nova Reel という 2 つの画像およびビデオ生成ツールもリリースしました。 Nova Canvas を使用すると、ユーザーはプロンプト経由で画像を生成および編集でき、生成された画像の配色とレイアウトを制御できます。 Nova Reel は、キューまたは参照画像に基づいて最大 6 秒間のビデオを生成でき、ユーザーはパン、回転、ズームなどのカメラの動きを調整できます。
Canvas からの画像は次のとおりです。
Reel は現在、6 秒の短いビデオの制作に限定されていますが、AWS によると、より長いビデオ バージョンも間もなく利用可能になる予定です。さらに、AWS には、有害なコンテンツの生成を回避するための透かしやコンテンツのモデレーションなど、これらのツールに対する責任ある使用制御が組み込まれています。
Jassy 氏は、AWS が音声合成モデルを開発中であることも明らかにしました。これは 2025 年の第 1 四半期にリリースされる予定です。このモデルは音声入力をサポートし、人間の自然な音声を生成します。さらに、AWS はテキスト、音声、画像、ビデオにわたるマルチモーダル変換をサポートする「any-to-any」モデルも開発中で、2025 年半ばにリリースされる予定です。
AWSはトレーニングデータの機密保持について引き続き慎重であり、顧客の正当な権利と利益を保護するために著作権問題について補償ポリシーを提供すると述べている。
プロジェクトの入り口: https://aws.amazon.com/cn/ai/generative-ai/nova/
公式ブログ: https://aws.amazon.com/cn/blogs/aws/introducing-amazon-nova-frontier-intelligence-and-industry-leading-price-performance/
全体として、AWS Nova シリーズのリリースは、マルチモーダル生成 AI テクノロジーの開発における新たな段階を示しており、その強力な機能、効率的なスピード、責任ある使用の重視により、ユーザーに新しい AI エクスペリエンスがもたらされます。 今後のNovaシリーズの開発と機能拡張が期待されます。