オープンソースのAI分野は、パワーと訓練後のテクノロジーを計算する際の大規模なテクノロジー企業の利点に長い間制限されてきました。ただし、AI2(以前のAllen人工知能研究所)によって開始されたTülu3ポストトレーニング計画は、現状を変えようとしています。 Tülu3は、完全でカスタマイズされたポストトレーニングプロセスを提供し、ユーザーがニーズに応じてモデル機能を調整し、最終的に特定のフィールドでモデルの効果的なアプリケーションを実装できるようにします。この技術的ブレークスルーは、オープンソースAIのアプリケーションのしきい値を削減するだけでなく、特に医学研究などの機密データ処理を伴う分野で、企業や機関にとってより制御可能な選択を提供します。
オープンソースAIの分野では、大規模なテクノロジー企業とのギャップは、コンピューティングパワーに反映されているだけではありません。 AI2(元Allen Intelligence Research Institute)は、一連の先駆的な措置を通じてこのギャップを絞り込んでいます。
一般的な認知とは異なり、基本的な言語モデルを事前訓練後に直接使用することはできません。実際、ポストトレーニングプロセスは、モデルの最終的な値を決定するための重要なリンクです。この段階では、モデルが「全能」から変更されましたが、特定の機能方向を持つ実用的なツールに判断を下していません。
長い間、大手企業は訓練後の計画のタブーでした。誰でも最新のテクノロジーを使用してモデルを構築することができますが、モデルが特定の分野(心理カウンセリングや研究と分析など)で役割を果たすことができますが、独自のポストトレーニングテクノロジーが必要です。 MetaのLlamaラベル「オープンソース」プロジェクトであっても、元のモデルのソースと一般的なトレーニング方法は依然として厳密に機密です。
Tülu3の出現により、この状況が変わりました。この完全なポストトレーニングスキームは、テーマ選択からデータガバナンスまで、学習の強化から微細な調整まで、あらゆるプロセスをカバーしています。ユーザーは、数学やプログラミングの強化、多言語処理の優先順位の削減など、需要に応じてモデル機能を調整できます。
AI2テストは、Tülu3によって訓練されたモデルのパフォーマンスがトップレベルのオープンソースモデルに到達したことを示しています。このブレークスルーは非常に重要です。それは、会社に完全に自律的で制御可能な選択を提供します。特に、医学研究などの繊細なデータを処理する機関の場合、第3パーティのAPIやカスタマイズされたサービスに依存する必要はありません。
AI2はこのソリューションをリリースするだけでなく、最初に独自の製品に適用しました。現在のテスト結果はラマモデルに基づいていますが、独自のOLMOとTülu3トレーニングに基づいて新しいモデルを起動することを計画しています。これは、最初から最後まで真にオープンソースであるソリューションです。
今回は、テクノロジーのオープンソースは、AI2の民主化を促進するためのAI2の決定を示しているだけでなく、サイケデリックエージェントをオープンソースAIコミュニティ全体に注入します。これにより、実際のオープンで透明なAIエコシステムに一歩近づくことができます。
Tülu3のオープンソースは、AIフィールドの開発に新しい活力を注入し、よりオープンで透明なAIの将来を示しています。 これにより、AIテクノロジーの普及と適用が促進され、AI民主化のプロセスが促進され、AIテクノロジーの進捗状況からより多くの人々に利益をもたらします。