中國AI的創(chuàng)新正在讓全世界更加關(guān)注中國的科技和市場。
智能體(Agent)正在持續(xù)推高AI應(yīng)用的行業(yè)熱度。上周,Manus的爆火引發(fā)了行業(yè)對智能體(Agent)的高度關(guān)注,北京時間3月12日,OpenAI舉行了一個19分鐘的線上發(fā)布會,發(fā)布了一系列專為構(gòu)建AI Agent設(shè)計的新工具與API,幫助開發(fā)者更易創(chuàng)建能自動完成任務(wù)的AI Agent。
人工智能行業(yè)內(nèi),Agent并非新鮮事物,但此前Manus及其復(fù)現(xiàn)產(chǎn)品的熱度,將Agent概念普及給更廣泛的群體,吸引開發(fā)者群體的加入,加上本周OpenAI的工具包更新,既展現(xiàn)了AI智能體在復(fù)雜任務(wù)處理中的突破性進展,也驗證了頭部機構(gòu)對Agent作為下一代生產(chǎn)力工具的布局共識,有望推動行業(yè)進入規(guī)模化應(yīng)用探索新階段。
業(yè)內(nèi)人士怎么看?
在這個時間點更新Agent工具包,OpenAI官方發(fā)文稱:團隊在過去一年引入新模型功能,包括高級推理、多模態(tài)交互和新安全技術(shù)等,這些功能為模型處理構(gòu)建智能體所需的復(fù)雜、多步驟任務(wù)奠定了基礎(chǔ)。但同時,有客戶表示,將這些功能轉(zhuǎn)化為生產(chǎn)就緒的Agent存在挑戰(zhàn)性,通常需要大量的提示迭代和自定義編排邏輯,而沒有足夠的可見性或內(nèi)置支持。為了應(yīng)對這些挑戰(zhàn),OpenAl推出了一組新API和工具,專門用于簡化Agent應(yīng)用程序的開發(fā)。
此次OpenAI發(fā)布產(chǎn)品包括新的Responses API:兼具Chat Completions API的簡單性和Assistants API的工具使用能力,用于構(gòu)建Agent;包括網(wǎng)頁搜索、文件搜索和 Computer-Using Agent等內(nèi)置工具:用于編排單Agent和多Agent工作流程的新Agents SDK:用于跟蹤和檢查Agent工作流程的執(zhí)行情況的新Agents SDK。
對于此次OpenAI在Agent方面的更新,此前成功復(fù)現(xiàn)Manus的Camel-AI.org核心成員李國豪對記者表示,整體來看,OpenAI此次發(fā)布的工具包,核心訴求是希望實現(xiàn)AI框架的統(tǒng)一,但在行業(yè)內(nèi)幾乎不可能,因為不同框架在不同場景有不同意義。但Anthropic發(fā)布的MCP協(xié)議可以讓框架是否不再重要,協(xié)議成為最應(yīng)該統(tǒng)一的部分,從這個角度來看,李國豪認為OpenAI“輸了”。
所謂MCP,是由Anthropic于2024年11月底推出的一種開放標(biāo)準(zhǔn)協(xié)議,旨在統(tǒng)一大型語言模型(LLM)與外部數(shù)據(jù)源和工具之間的通信。它通過標(biāo)準(zhǔn)化接口,使LLM能夠安全、高效地訪問外部資源,從而擴展其功能。簡單來說,MCP一端連接大模型,一端連接應(yīng)用,使大模型能力真正能夠落地實現(xiàn)。
但目前MCP在行業(yè)內(nèi)并非普及性技術(shù),不同廠商與平臺有自身的選擇。以Manus為例,此前Manus 聯(lián)合創(chuàng)始人季逸超公開披露產(chǎn)品底座與技術(shù)細節(jié),稱Manus并未使用MCP協(xié)議,理由是“Manus早在MCP推出之前就開始開發(fā)了”。
而后期成功復(fù)現(xiàn)Manus的兩個團隊——MetaGPT算法研究員梁新兵對記者表示,MCP未來將成為主流;李國豪也看好MCP的前景。此前,李國豪在錦秋基金分享會上表示,過去行業(yè)缺乏統(tǒng)一標(biāo)準(zhǔn),各自為戰(zhàn)。標(biāo)準(zhǔn)化帶來的最大變化是框架間工具調(diào)用壁壘逐漸消失,例如LangChain(一款開源AI 框架)過去靠豐富的工具生態(tài)占優(yōu)勢,但MCP成熟后,各個框架都能輕松調(diào)用工具,LangChain的優(yōu)勢將不再突出。李國豪對記者表示,相較AI框架,協(xié)議才是應(yīng)該統(tǒng)一的東西。
中國創(chuàng)新帶動全球應(yīng)用熱度
近期,以Manus為代表的Agent持續(xù)刷屏,成功復(fù)現(xiàn)的OpenManus與OWL也持續(xù)引發(fā)關(guān)注,這背后,是AI滿足了當(dāng)下大眾對于智能落地的真需求。
當(dāng)參與者足夠多,OpenAI的“神秘面紗”也不復(fù)存在。李國豪直接將Manus總結(jié)為虛擬機掛載、Todo List、瀏覽器操作、命令行調(diào)用四部分。在實現(xiàn)方式上,Manus 有兩個明顯優(yōu)勢值得借鑒:利用文件系統(tǒng)管理上下文并實現(xiàn)信息持久化,以及充分運用 Ubuntu 虛擬機的命令行工具,通過命令行安裝依賴、執(zhí)行代碼及管理文件等。
但同時,李國豪也認為一旦未來開始大規(guī)模應(yīng)用,Manus將面臨資源消耗、大模型調(diào)用成本高昂、穩(wěn)定性與擴展性問題等挑戰(zhàn)。此前季逸超披露,Manus目前使用的大模型是Claude與阿里旗下不同的Qwen微調(diào)模型。以Claude 3.5為例,該模型性能強且對計算工具調(diào)用做過專門優(yōu)化,但成本昂貴,大規(guī)模開放難以有效控制成本,這可能也是Manus采用邀請碼機制的原因之一。
Manus的爆火將Agent概念在行業(yè)內(nèi)普及開來,但實際上,Agent早已不是新鮮事物,OpenAI創(chuàng)始人 Sam Altman (山姆·奧爾特曼)也在2023年5月表示將更加關(guān)注如何使用聊天機器人創(chuàng)建自主 AI Agent。2025年1月23日,OpenAI對外發(fā)布其首款A(yù)I智能體產(chǎn)品Operator。
談及Operator與Manus的區(qū)別,李國豪對記者表示,Operator只操控瀏覽器,而 Manus 不僅能操控瀏覽器,還能掌控終端(terminal)。正如官方宣傳所言:Manus 給 Agent 配備了一臺完整的電腦,瀏覽器只是其中一部分,終端命令行同樣可用。另外從產(chǎn)品形態(tài)看,李國豪也認為Manus 明顯領(lǐng)先于 Operator,后者僅實現(xiàn)了瀏覽器操作,而 Manus 的產(chǎn)品形態(tài)更全面。
對于當(dāng)下迅速迭代發(fā)展的AI格局,天風(fēng)研究所傳媒互聯(lián)網(wǎng)首席分析師孔蓉表示,中國AI的創(chuàng)新正在讓全世界更加關(guān)注中國的科技和市場。接下來,中國AI需要“過三關(guān)”。第一個階段是DeepSeek的推出帶來的高估值;其次是阿里巴巴財報確認了趨勢;第三階段是AI應(yīng)用——這也是目前全球AI產(chǎn)業(yè)界的課題,在資本花了那么多錢后,AI的應(yīng)用到底在哪?爆款的應(yīng)用什么時候會出現(xiàn)?Manus在GAIA評分測試中比OpenAI的最新Deep Research評分結(jié)果表現(xiàn)更加優(yōu)秀。孔蓉認為,Manus給市場帶來了信心,也意味著中國AI的第三階段開始,標(biāo)志著未來更多產(chǎn)品的百花齊放。