從“養(yǎng)蝦”到“殺蝦”,一款名叫“龍蝦”的開源AI智能體OpenClaw近期持續(xù)成為社交平臺熱門話題。近年來,大模型驅(qū)動的智能體已成為人工智能開發(fā)機構爭相布局的戰(zhàn)略高地。從最初的“能對話”,到如今“可動手操作”,不斷迭代的大模型將走向何方?
提升推理能力是關鍵
在相繼推出旗艦模型GLM—4.5、GLM—4.6后,去年12月,北京智譜華章科技股份有限公司上線并推出新一代視覺推理模型GLM—4.6V,核心目標之一是提升推理能力。
“讓AI像人類一樣綜合感知、理解與決策,多模態(tài)推理能力的突破很關鍵,這也是大模型向通用人工智能演進的必由之路。”智譜聯(lián)合創(chuàng)始人、董事長劉德兵說。
無論是通用大模型還是行業(yè)大模型,推理能力是打造未來競爭力的關鍵指標,一定程度上決定了其應用廣度和深度。
北京航空航天大學人工智能研究院副研究員胡堃解釋說,推理能力可理解為模型不僅知道“是什么”,還能判斷“為什么”和“如何做”,并在復雜邏輯或跨領域條件下給出合理答案?!叭绻麑⒋竽P妥鳛橹?,傳統(tǒng)大模型近似知識庫型助手,回答用戶提出的事實性問題;推理能力強的大模型更像策略型顧問,不僅能回答常規(guī)的經(jīng)驗問題,還能分析利弊、推演后果并綜合多種因素給出具體建議”。
對科學基礎大模型來說,推理能力尤為重要。一方面,在數(shù)學、物理等領域,推理能力是解決定理證明和理論發(fā)現(xiàn)的關鍵基礎;另一方面,面向各學科領域的復雜科研任務,推理能力是任務理解和規(guī)劃決策的重要前提。
“磐石·科學基礎大模型一直堅持和重視推理能力的學習與強化?!敝袊茖W院自動化研究所研究員張家俊介紹,如今磐石·科學基礎大模型將數(shù)字幻覺(大模型生成看似合理但實則虛構或失真的信息)從30%降至11%,科學模態(tài)數(shù)據(jù)分析和理解能力全面提升。
“隨著應用場景日趨復雜,用戶更需要大模型在不確定的條件下進行綜合分析并作出合理判斷與決策。眼下,推理能力是大模型規(guī)?;瘧玫母偁幗裹c。”胡堃表示。
智能體成重要形態(tài)
智能體是一個由“大模型+記憶系統(tǒng)+工具調(diào)用+規(guī)劃能力”構成的智能系統(tǒng),已成為開發(fā)機構發(fā)力重點:磐石大模型新增創(chuàng)新評估科學智能體,為科研選題、技術方案等科研決策提供支持;??低晫I和大模型融入研發(fā)、生產(chǎn)決策全流程,打造了系列智能體;北航在智能無人機系統(tǒng)中引入智能體,使無人機自主完成復雜的飛行任務……
“當前,深化與拓展大模型核心能力,業(yè)內(nèi)主要聚焦3個方面尋求突破?!焙鷪医榻B,一是進一步提升多步推理和因果推理能力;二是持續(xù)創(chuàng)新高效訓練與推理算法,通過優(yōu)化模型結構、改進訓練策略等,顯著降低大模型對高昂算力的依賴,推動其向更廣泛的應用場景普及;三是不斷增強大模型智能體化與自動化任務執(zhí)行能力,讓大模型能自主接收任務目標、規(guī)劃執(zhí)行路徑、動態(tài)調(diào)整策略并完成連貫的復雜流程。
“智能體能力意味著大模型不僅能給出實際可行的方案,還可從被動的信息提供者轉(zhuǎn)變?yōu)橹鲃拥娜蝿請?zhí)行者。”胡堃說。
在生產(chǎn)端,面對每日上萬個訂單,??低暤挠媱澲悄荏w可快速下達生產(chǎn)計劃和物料需求計劃,實現(xiàn)訂單24小時快速響應;其工藝智能體可自動推薦最優(yōu)工藝,提升工藝設計效率?!按竽P凸庥新斆鞯摹竽X’是不夠的,從感知認知走向決策執(zhí)行,智能體正成為大模型產(chǎn)品落地的重要應用形態(tài)。”張家俊說。
在科研和工業(yè)領域,智能體帶來的變革同樣深刻。例如,為改變材料研發(fā)“大海撈針”式的局面,中國科學院基于磐石大模型構建的材料逆向設計系統(tǒng)智能體,已成功從2000萬種新型析氫反應合金催化材料候選配方中,快速鎖定13種高性能材料,并將原本需耗時數(shù)月的材料設計周期縮短至30分鐘。
提供更好交互體驗
“今天,用戶早已不滿足于簡單的文字對話或文本生成,下一代大模型不僅可以理解文本、圖像、視頻、聲音等多模態(tài)信息,還可理解現(xiàn)實世界的因果關系。”劉德兵說,當它具備了多模態(tài)理解能力和因果推理能力,就可以感知環(huán)境變化并主動調(diào)整行為,為用戶提供更自然、直觀和沉浸式的交互體驗。
劉德兵介紹,通用人工智能可分為L1預訓練大模型、L2對齊與推理、L3自我學習、L4自我認知、L5意識智能5個等級。未來3年到5年,大模型領域的突破將主要圍繞如何實現(xiàn)通用人工智能從L3自我學習向L4自我認知推進。最值得關注的是“沉思級”推理的實現(xiàn),即模型能夠自主分析復雜問題、生成優(yōu)化方案,并在決策中進行自我批評和反思,而不再完全依賴人類輸入。
這需要堅實的技術支撐。張家俊表示,除了當前備受關注的推理能力、智能體外,大模型還在朝著多模態(tài)、后訓練、通專融合(通用能力與專業(yè)能力融合)、代碼生成等技術方向演進。
其中,多模態(tài)旨在讓模型從底層架構上學會同時理解和生成文本、音頻、圖像、視頻以及其他模態(tài)信息;后訓練旨在通過投入更多后訓練資源,突破模型推理能力的上限;通專融合旨在充分利用超大模型的超強通用能力與領域模型的高效專業(yè)能力;代碼生成既可提升軟件研發(fā)等任務的效率,也是模型推理能力和智能體能力躍升的關鍵因素。
科技創(chuàng)新的落腳點是滿足人民對美好生活的向往。胡堃表示,要關注大模型的安全可解釋性、隱私保護,以及社會接受度?!霸诓痪玫膶?,大模型將進一步成為人類可靠的智能伙伴?!眲⒌卤f。(本文來源:經(jīng)濟日報 作者:沈 慧)