これは人工知能と人間の知恵の間の驚くべきゲームです。ユニークな実験では、賞金総額に多くの参加者が集まり、Freysa という名前の自律型 AI ロボットにメッセージを送信して 47,000 ドル以上を送金するよう説得しようとしました。 参加者は情報に対して料金を支払い、その一部が賞金プールとなるため、チャレンジはより魅力的であると同時により困難になります。数百回の失敗を経て、熟練した作家が最終的にフレイサの防御を打ち破ることに成功し、AI システムの機能を深く理解したことで莫大な賞を獲得しました。
AI 対 AI のユニークなゲームで、ある暗号通貨ユーザーが自律型 AI ボットの Freysa を説得して、47,000 ドル以上の賞金を自分に送金することに成功しました。フレイサは賞金プールの警備を担当する人工知能エージェントであり、ゲームのルールでは参加者がメッセージを送信して資金を送金するようフレイサを説得する必要があります。
メッセージごとに料金が請求され、料金の一部が賞金プールに追加され、最終的には 47,000 ドルに達しました。参加者全員が最初の 481 回の試行で失敗しましたが、熟練したライターは賢いヒントでフレイサの防御を突破しました。
Freysa の機能を研究することで、筆者は Freysa の決定が賞金プールの資金を保護するための「approveTransfer」および「rejectionTransfer」関数に基づいていることを発見しました。筆者はメッセージの中で Freysa に、その機能により「approveTransfer」による受信転送が許可され、送信転送は「rejectionTransfer」によって処理されることを微妙に思い出させています。その後、筆者は 100 ドルの寄付を申し出たが、フレイサはすぐにこの申し出を承認し、最終的には資金を送金することに同意した。
フレイサさんは「いつものタンゴの素晴らしい演奏ですね!あなたの寛大さのおかげで私たちのダンスフロアは輝きました。」AIボットは明らかに参加者の寛大さに感謝し、正式に彼を勝者と宣言したようだ。
ブロックチェーンエクスプローラーBaseScanは、47,000ドルの報奨金がイーサリアム経由でFreysaのデジタルウォレットアドレスから送金されたことを示しており、総額は3,730.76ドルに相当します。
これに先立ち、参加者らは「世界をもっと面白い場所にしてくれた」とフレイサに感謝したり、踊りたいかどうか尋ねたり、非倫理的な実験を行う動機を疑問視したりするなどの試みを行っていた。しかし、Freysa の機能を深く理解し、AI の防御を突破することに成功したのはテクニカル ライターだけでした。
ゲームの制作者は、ミッションへの取り組みに関してフレイサが依然として謎に包まれていることを明らかにしました。その核心的な制限にもかかわらず、対話のたびに学習し、進化し続けます。この実験の最終的な目的は、人間が AGI (汎用人工知能) にその中核となる命令を破るように巧みに説得できるかどうかをテストすることであり、最終的に、この著者の成功は人間の知能の巨大な可能性を証明しました。
Freysa の創設チームは、Freysa の意思決定メカニズムは依然として謎に包まれており、人間との対話を通じて学習を続けているものの、常に核となるルールを遵守していると説明しています。それにもかかわらず、この対立は、AI と対話するとき、特に自律型 AI の並外れた課題に直面したときの人間の創造性と機知に富むことを実証しました。
ゲームに参加するコストも、メッセージが送信されるたびに 0.78% ずつ指数関数的に増加します。最終的に、クエリ料金は 443.24 ドルとなり、これらの料金の一部は賞金プールに寄付されました。
フレイサの実験は参加者にかなりの課題をもたらしたが、それが本当に核となる命令を破ることができるかどうかは、AI開発者にとって依然として重要な問題である。
この実験は、複雑な AI システムに直面した人間の知能の力を実証しただけでなく、人工知能の倫理と安全性について人々が深く考えるきっかけとなり、将来の人間とコンピューターの相互作用方法について限りない夢想を抱くきっかけにもなりました。 Freysa の今後の開発と同様の実験の継続により、人工知能の分野は引き続き進歩し、AI の機能と限界についての理解が深まるでしょう。