Patronus AI推首自助AI偵測API，打破AI幻覺的魔咒

作者：Eve Cole 更新時間：2024-11-30 14:00:01

近年來，人工智慧技術快速發展，但也帶來了新的挑戰——AI「幻覺」現像日益突出。 AI系統出現錯誤訊息、編造數據甚至給予危險建議的案例屢見不鮮，嚴重影響企業聲譽和利益。 Downcodes小編將為您介紹一家致力於解決此問題的新創公司及其創新產品。

在人工智慧迅速發展的今天，AI 「幻覺」現象愈加頻繁，給許多企業帶來了不小的困擾。客戶服務聊天機器人自信地描述不存在的產品，金融AI 編造市場數據，醫療機器人則提供危險的醫療建議。這些問題不再是單純的趣事，而是正在影響公司聲譽與獲利的重大隱患。

為了應對這項挑戰，位於舊金山的新創公司Patronus AI 宣布推出全球首個自助服務平台，旨在即時偵測並防止AI 系統故障。這個平台就像是AI 系統的“拼字檢查器”，可以在問題發生前將其捕捉到。

Patronus AI 的執行長Anand Kannappan 在接受採訪時表示，許多公司在生產環境中面臨AI 故障，問題包括幻覺、安全漏洞和不可預測的行為。根據該公司的研究，領先的AI 模型如GPT-4在提示時44% 的幾率會重複受版權保護的內容，而即使是先進的模型，在基本安全測試中也有超過20% 的機率生成不安全的響應。

為了幫助企業提高AI 系統的安全性，Patronus AI 提供了一系列創新功能。其中，最顯著的「評估者」功能允許企業用簡單的英語編寫客製化的評估規則。這種靈活性讓各行各業的公司能夠根據自身需求進行調整，如金融服務公司可以專注於合規性，而醫療機構則可以專注於病患隱私和醫療準確性。

平台的核心是名為Lynx 的突破性幻覺檢測模型，其在識別醫療不準確性方面比GPT-4高出8.3% 的準確率。此外，該平台有兩種運作模式:一種用於即時監控，另一種用於深入分析。除了傳統的錯誤檢查，該公司還開發瞭如CopyrightCatcher（版權檢測工具）和FinanceBench(金融性能評估基準)等專用工具，為企業提供全面的AI 故障防護。

為了讓更多企業能負擔得起這些安全工具，Patronus AI 採用了按需付費的定價模型，起價為每1000次API 呼叫10美元。早期採用者已經包括HP、AngelList 和Pearson 等大型企業，顯示出對AI 安全投資的重視。

在AI 發展迅速的今天，工具如Patronus AI 的平台不僅可以幫助企業降低風險，還有助於符合即將到來的法規。隨著AI 系統的不斷進化，如何準確捕捉並修正這些「幻覺」將是企業面臨的重要挑戰。

產品入口:https://www.patronus.ai/

Patronus AI 的出現為解決AI 幻覺問題提供了一種新的思路，其自助服務平台及創新功能值得關注。隨著AI 技術的不斷發展，類似的AI 安全工具將扮演越來越重要的角色，幫助企業更好地利用AI 技術，同時有效控制風險。