AI 應用時代,真的來了嗎?
今年的百度世界大會主題是「應用來了」——截至11 月初,百度文心大模型的日均調用量已經超過15 億,相較一年前首次披露的5000 萬次,增長約30 倍。李彥宏表示,「這條陡峭的成長曲線,代表著過去兩年中國大模型應用的爆發。」
而智能體作為AI 應用的最主流形態,即將迎來爆發點,李彥宏強調,「它將成為AI 原生時代,內容、資訊和服務的新載體。」
這是因為,「一方面,做智能體的門檻足夠低;另一方面,智能體的天花板又足夠的高,可以做出功能非常強大的應用。多個智能體的協作,還可以解決更加複雜的問題。
李彥宏在會上展示了4 種不同類型的智能體,包括公司類智能體,角色類智能體,工具類智能體和行業類智能體。其中,公司官方智能體很可能取代官網,成為最直接面向消費者的介面。
「公司類智能體相當於AI 時代的公司官網。傳統官網具有的那些能力,例如公司介紹、產品圖片和參數展示、線下門市位置等等,公司類智能體都有。而傳統網站沒有的主動推薦、及時回應和一對一服務能力,公司智能體也有。
李彥宏也發表了無程式碼工具「秒噠」——一個由大模型和智能體組成的、不需要寫程式碼就能夠實現任意想法的軟體,包括無程式碼程式設計、多智能體協作以及規模化地調用各種工具等能力,是「迄今為止人類史上最複雜的多智能體協作工具」。
透過「秒噠」,使用者可以透過自然語言互動完成整套系統的搭建,還可以做任意場景下的各種應用,隨著基礎模型能力提升,以及秒噠本身技術能力的演進,未來可以做更多、更複雜的事情,「這意味著,你不需要去招募專案經理、設計人員、開發人員、測試人員等等,自己就可以指揮多個智能體來協同完成任務」,一個人可以是一整支隊伍。
用李彥宏的話來說,有了秒噠,將迎來一個「只靠想法就能賺錢的時代」。
繼9 月百度網盤的C 端業務重新劃歸行動生態事業群組(MEG),並由百度副總裁、百度文庫&百度網盤負責人王穎接手管理後,在本次世界大會上,百度網盤和文庫又有了進一步融合。
王穎在大會上分享了百度在內容生產和消費方面的一些新變化。她談到,當前內容創作和消費面臨許多挑戰,如工具繁雜、製作週期長和消費效率低。為此,百度文庫和網盤引入了AI 技術,旨在打破工具束縛和模態邊界,實現更自由、高效的內容體驗。
百度文庫推出的智慧PPT 生成、AI 論文創作、AI 畫本製作、AI 搜尋能力和AI 小說漫畫生成等功能顯著提升了內容生產的效率和品質;同時,在內容消費方面,百度網盤推出了簡單掃描、簡單聽記和AI 影片摘要等工具,大大方便了用戶處理和理解資訊。
具體來看,在辦公場景中,百度文庫提供了智慧PPT 和智慧研報功能,百度網盤則具備簡單聽記等功能;在學習場景下,使用者可以使用百度文庫的智慧畫本和拍圖搜題功能,百度網盤則提供視訊解讀和盤盤單字等輔助學習工具;在娛樂方面,百度文庫提供智慧小說和智慧漫畫,百度網盤則具備AI 修圖等功能。百度文庫與網盤的融合拓寬了使用者的應用場景,實現了內容的智慧化與多樣化,進一步提升了使用者體驗。
自由畫布功能|圖片來源:百度
此外,百度文庫與網盤聯合推出了全新的內容作業系統-自由畫布。這個系統可以幫使用者完成從找資料、到編輯、再到生成和分享的全部任務,不僅支援全格式輸入和多種模態的輸出,還能實現元素層級的內容利用,豐富了創作和分享的自由度。
用李彥宏的話來說,「自由畫布就是一個由文心多模態大模型加持的萬用白板」。這些創新不僅展示了AI 技術在內容領域的巨大潛力,也預示著內容生產和消費未來有更多可能性。
在大會上,百度集團執行副總裁、百度智能雲事業群總裁沈抖分享了百度智能雲在大模型和AI 原生應用方面的最新進展。沈抖稱,大模型技術正從技術變革走向產業變革,重新定義人與數位世界及實體世界的互動方式,成為企業提升競爭力的關鍵要素。
沈抖重點談到了千帆平台,這是一個大模型精調和應用開發的平台,提供豐富的工具鏈,顯著降低了AI 原生應用開發的門檻。千帆平台不僅滿足了企業級應用的高度客製化、大規模、高可用性和高安全性需求,還發布了工作流程Agent。這項創新利用大模型的意圖理解和泛化能力,將複雜的工作流程變成靈活的智能體,大幅提升企業效率。例如,太平洋保險利用千帆平台產生「金牌銷售」智能體,顯著提升了車險續保的服務效率與使用者體驗。
百度智慧雲端千帆|圖片來源:百度
此外,百舸平台提供高效率的大模型相關算力服務,從叢集創建到模型訓練和推理,確保穩定、極速的效能。該平台解決了大規模集群部署中的關鍵難題,支援高效運行,滿足不同客戶的算力需求。
沈抖也展示了千帆平台在多個行業中的應用案例,包括全診醫學透過精調模型提升病歷生成準確度,節省醫生時間;國家電網基於文心大模型探索電力行業的AI 應用,取得顯著成果。此外,曦靈4.0 平台的升級使其能夠產生3D 數位人形象並製作專業視頻,大幅降低了短視頻製作成本。
百度智慧雲端透過千帆和百舸平台,建構了新型AI 基礎設施,推動了大模型技術在各行各業的應用,以提升企業的智慧化水準和效率。
除了應用,百度這次在硬體上也有所發布。在會上,百度集團副總裁、小度科技CEO 李瑩發布了「首款搭載中文大模型的原生AI 眼鏡」——小度AI 眼鏡。
小度AI眼鏡|圖片來源:百度
李瑩稱,AI 眼鏡作為人類的第一視角設備,其捕捉視覺、聲音、位置等資訊的能力,將為人們帶來前所未有的感官延伸,也一定會成為更有效率、便捷的人機互動入口。
基於文心大模型與DuerOS AI 原生作業系統,小度AI 可實現備第一視角拍攝、邊走邊問、卡路里辨識、識物百科、視聽翻譯、智慧備忘等功能。
透過端雲結合大模型,小度AI 眼鏡可以獨立使用也可以搭配APP,眼鏡內建中文單行,可即時回覆用戶的提問。
硬體方面,小度AI 眼鏡搭載四麥克風陣列辨識聲音,採用開放式防漏音揚聲器設計,搭載1,600 萬像素超廣角鏡頭與AI 防手震演算法;30min 即可充滿電,實現56 小時待機,超5 小時連續聆聽;整機重量僅45 克,低於業界平均的49 克。
預計小度AI 眼鏡將在明年上半年上市銷售,售價尚未公佈,不過展台工作人員表示,價格可能在2,000 元左右。
李彥宏在會上談到,在過去24 個月裡,AI 產業發生了顯著的變化,其中最突出的是大模型基本上消除了幻覺現象。這項改變使得AI 從最初的「一本正經的胡說八道」變得可用且可信賴。大模型本質上是一個機率模型,其產生的內容具有一定的不確定性。然而,透過採用RAG 技術,大模型能夠利用檢索到的信息來指導文本或答案的生成,從而顯著提高了內容的品質和準確性。
為了解決影像生成中的幻覺問題,百度在今年年初開發了一項技術-iRAG(Image based RAG),即檢索增強的文生圖技術。在此之前,完全基於大語言模型的文生圖系統產生的圖片往往品質低劣,甚至邏輯不合常理。百度的iRAG 技術結合了百度搜尋的億級圖片資源和強大的基礎模型能力,能夠產生各種超真實的圖片,整體效果遠超文生圖原生系統,消除了機器生成的痕跡。
隨著AI 生成圖片的可用性大幅提高,其應用空間也得到了極大的擴展。例如,在品牌宣傳場景中,以前製作一組海報可能需要投入數十萬元,而現在創作成本幾乎為零。簡而言之,iRAG 的商業價值體現在無幻覺、超真實、低成本和即時可得等方面。
李彥宏在大會現場|圖片來源:百度
當基礎模式能力成熟時,AI 應用的繁榮時期也即將到來。那麼,AI 應用從何而來,又將走向何方?主要有兩大方向:一是智能體,二是產業應用。
在未來,或許當AI 應用的繁榮時期真正到來時,AI 也能真正實現它「產業革命級機會」的使命,為社會經濟帶來生產力的無限擴張。