在發布文心一言兩周年之際,百度又發布新款模型。
3月16日,百度正式發布文心大模型4.5及文心大模型X1。與此前不同的是,此次百度并未召開發布會,而是直接宣布新模型在文心一言官網上線,并免費向用戶開放。
近期,國內AI大模型廠商紛紛宣布“迭代”。3月10日,字節跳動豆包大模型團隊官宣開源一項針對MoE架構的關鍵優化技術,可將大模型訓練效率提升1.7倍,成本節省40%。3月6日,阿里巴巴發布并開源全新的推理模型通義千問QwQ-32B,通過強化學習,可在數學推理、代碼生成等任務上實現精度提升。
百度發布兩款新模型
3月16日,百度發布文心大模型4.5及文心大模型X1。據介紹,文心大模型4.5是百度首個原生多模態大模型。百度稱,文心大模型4.5在多項測試中表現優于GPT4.5,API調用價格僅為GPT4.5的1%;文心大模型X1為深度思考模型,性能對標DeepSeek-R1,調用價格約為R1的一半。
具體來看,百度方面稱,文心大模型4.5多項基準測試成績優于GPT4.5、DeepSeek-V3等,并在平均分上以79.6分高于GPT4.5的79.14。而文心大模型4.5在多模態理解能力上提升,不僅有較強的圖形推理、圖表分析能力,還具備理解梗圖、漫畫、歌曲、電影等多模態內容的能力。
文心大模型X1定位為深度思考模型,在性能上對標DeepSeek-R1,具備“長思維鏈”,擅長中文知識問答、文學創作、邏輯推理等,而且增加了多模態能力和多工具調用,能理解和生成圖片,還能調用工具生成代碼、圖表等內容。
作為能自主運用工具的大模型,文心大模型X1支持高級搜索、文檔問答、圖片理解、AI繪圖、代碼解釋器、網頁鏈接讀取、TreeMind樹圖、百度學術檢索、商業信息查詢、加盟信息查詢等多款工具。
據百度介紹,文心大模型4.5已上線百度智能云千帆大模型平臺,企業用戶和開發者登錄即可調用API;文心大模型X1也即將在千帆上線。百度搜索、文小言APP等產品,將陸續接入文心大模型4.5和文心大模型X1。
隨著大模型技術的快速迭代,訓練和推理成本的降低,大模型開源已成大勢所趨。
今年2月,百度曾宣布文心一言將于4月1日免費,并宣布推出的文心大模型4.5,將于6月30日正式開源。彼時百度還表示,將在今年下半年發布文心大模型5.0。
“從DeepSeek身上,我們學到了一件事,那就是開源最佳模型能大大促進人們使用或采納這個模型。”2月18日晚,在百度2024年第四季度及全年財報電話會上,百度創始人李彥宏表示,開源的決策源自對技術領先地位的堅定信心,開源將進一步促進文心大模型的廣泛應用,并在更多場景中擴大其影響力。他還強調,無論開源還是閉源,基礎模型只有在大規模解決現實問題時,才具備真實價值。
AI廠商加速迭代
近期,AI大模型領域呈現技術迭代加速、多模態與深度思考能力突破、開源生態完善等趨勢。國內外廠商在模型能力、應用場景等方面展開全方位競爭。
3月12日,谷歌DeepMind推出用于機器人技術的人工智能模型,這個機器人基座大模型名為 Gemini Robotics 和 Gemini Robotics-ER,旨在利用大語言模型的推理能力,幫助機器人適應復雜環境,從而完成現實世界中的復雜任務。
3月10日,字節跳動豆包大模型團隊官宣開源一項針對MoE架構的關鍵優化技術,可將大模型訓練效率提升1.7倍,成本節省40%。據介紹,MoE是當前大模型的主流架構,但其在分布式訓練中存在大量跨設備通信開銷,制約了大模型訓練效率和成本。針對這一難題,字節在內部研發COMET計算-通信重疊技術,可大幅壓縮MoE專家通信空轉時間。
3月6日,阿里巴巴宣布推出最新的推理模型通義千問QwQ-32B。這是一款擁有320億參數的模型,通過大規模強化學習,千問QwQ-32B在數學、代碼及通用能力上實現提升,整體性能比肩DeepSeek-R1,在消費級顯卡比如家用電腦上也能實現本地部署。隨后,國家超算互聯網平臺正式上線通義千問QwQ-32B API服務,向用戶提供免費100萬tokens的試用額度。
日前,全球知名創投機構Andreessen Horowitz(a16z)發布了2025年全球100大生成式AI 應用排行榜,中國的AI技術實力在此次榜單中展現出強勁的競爭力。其中,DeepSeek在網頁版應用中排名第二,僅次于OpenAI 的ChatGPT,其驚人的成長速度引起全球關注。
此外,在中國生成式AI中,字節跳動旗下的豆包也位列第十。中國其他知名的大型模型也成功進入榜單,包括月之暗面(第11名)、海螺視頻(第12名)和快手可靈(第20名),它們的排名均超越了Sora、Midjourney、Runway 等全球知名應用。
平安證券研報認為,全球大模型的競爭仍然激烈,這種激烈競爭將持續拔升全球大模型的能力上限。同時,全球領先大模型廠商對大模型研發的持續投入,也將為AI算力需求的持續增長提供有力支撐。
中國銀河證券研報分析認為,AI Agent(智能體)落地使得大模型集成度更高、算力資源需求更加旺盛,重心逐步從預訓練轉移到了特定應用場景的后訓練,推理端算力規模有望提升。總體來說,推理算力有望推動應用的進一步增長,低成本算力時代帶動應用端繁榮度提升,AI能力邊際擴張依然需要依賴更強的模型和強大的算力支撐,有望開拓AI行業大模型共振發展新局面。
校對:李凌鋒?????????????