Cognition は、権威あるテスト プラットフォーム SWE-Bench で Devin と GPT-4 を 30.08% のスコアで破り、世界最強の AI プログラミング アシスタントとなった驚くべき AI プログラマー Genie を発表しました。 Downcodes のエディターは、Genie の背後にある技術的な進歩と将来の展望についての深い理解を提供します。
AI スタートアップの Cognition は、新しい AI プログラマー「Genie」を発表しました。そのパフォーマンスは驚異的で、あっという間に Devin と GPT-4 を破り、世界で最も強力な AI プログラミング アシスタントになりました。
この AI プログラマーは、権威あるテスト プラットフォーム SWE-Bench で 30.08% もの高いスコアを獲得しました。これは、Devin の 13.8% や Swe-agent+GPT-4 の 12.47% をはるかに上回っています。
Genie はどうやってそれを行うのかと疑問に思われるかもしれませんが、2022 年 12 月には、Genie の共同創設者である Alistair Pullen がロンドン大学でこのプロジェクトのデモンストレーションを行いました。彼は、人間と同じように自動的にコーディング、デバッグ、最適化できる AI プログラムを作成したいと考えています。 1 年以上の開発を経て、Genie はついにテスト段階に入り、シードラウンドで 250 万米ドルの資金を得ました。
Alistair 氏は、Genie の成功はそのトレーニング データと手法に密接に関係していると述べました。従来の大規模モデルの微調整とは異なり、Genie は人間のプログラマーの推論プロセスを組み込んだ特別なデータセットを使用します。このデータには、段階的な知識の発見とケースベースの意思決定プロセスが含まれており、Genie は複雑な問題に直面したときに人間のエンジニアと同様の判断を示すことができます。
さらに、Genie は独自の「自己改善メカニズム」も使用します。当初、Genie は高品質のデータでトレーニングし、「完璧な」状態に到達しましたが、その過程で、Genie は自身のエラーを判断できず、改善できませんでした。この問題を克服するために、開発者は Genie を使用して合成データを生成し、トレーニング コンテンツをさらに充実させました。これは、母親が子供に歩き方を教え、転ぶたびに適切な指導を行うようなものです。
トレーニングを何度も繰り返した後、ジーニーの能力は大幅に向上し、目に見えない問題に対して創造的な解決策を示すこともできます。機能的には、Genie は関数開発、バグ修復、コード リファクタリング、コード テストなどを含むさまざまな開発タスクをサポートし、JavaScript、Python、Java などの数十のプログラミング言語をカバーします。
現在、Genie は試用版のアプリケーションを公開しており、公式 Web サイトから登録できるようになり、数週間以内にテスト許可が発行される予定です。
公式ブログ:https://cosine.sh/blog/state-of-the-art
体験アドレス:https://cosine.sh/register
ハイライト:
Genie は SWE-Bench テストで 30.08% もの高得点を獲得し、世界最強の AI プログラマーになりました。
Genie は、特別なデータセットと自己改善メカニズムを使用して、複雑なコーディングに優れています。
? トライアルの申し込みは現在受付中であり、今後さらに驚きの機能がリリースされる予定です。
Genie の登場は、AI プログラミング アシスタントの分野における新たな進歩を示し、その独自のトレーニング方法と自己改善メカニズムは業界の注目に値します。 Downcodes の編集者は、Genie が将来開発者にさらなる驚きをもたらすことを楽しみにしています。