谷歌成功攻击 OpenAI GPT-3.5-turbo 模型，成本低至 150 元

作者：Eve Cole 更新时间：2025-02-10 10:32:01

近日，谷歌研究团队公布了一项令人警醒的研究成果：他们成功地以低至150元的成本攻击了OpenAI的GPT-3.5-turbo模型。该攻击方法简单有效，仅需不到2000次API查询就能获取模型的关键信息。这一发现凸显了即使是大型语言模型也可能面临严峻的安全威胁，同时也促使我们重新审视AI安全防护的必要性与紧迫性。研究结果表明，大型语言模型并非坚不可摧，需要持续改进安全机制以应对潜在的风险。

谷歌最新研究揭示了攻击 OpenAI GPT-3.5-turbo 模型的成功方法，成本低至 150 元。攻击简单有效，通过少于 2000 次 API 查询即可获取关键信息。该实验提醒即使大型语言模型也可能面临安全威胁，OpenAI 已采取措施修改模型 API 以防再次被攻击。

谷歌的研究为AI安全领域敲响了警钟，也推动了OpenAI等公司加强模型安全性的努力。未来，更强大的安全措施和防御机制的研发将成为AI发展中不可或缺的一部分，以确保AI技术的安全可靠应用。