9 月 17 日消息,阿里通義實驗室今日宣布,為了讓 AI 真正具備“做研究”的能力,針對通義 DeepResearch 的數據、Agent 范式、訓練、基礎設施(Infra)、Test Time Scaling 進行了系統性創新,并宣布所有技術方案均已開源。

根據介紹,通義 DeepResearch“不是簡單的資料堆疊”,而是圍繞一個問題完成一個完整的“研究閉環”,通過深度搜尋-多源交叉-結構化歸納-報告生成來產出有引用、可復現的調研報告與決策建議。
在 Humanity's Last Exam、BrowseComp、GAIA、xbench-DeepSearch、WebWalkerQA 五個權威 Benchmark 上,通義 DeepResearch Agent 30B-A3B 輕量級達到了 SOTA 效果。官方表示,團隊對深度研究型智能體的推理范式進行了廣泛的探索,因此最終模型支持多種推理形式,包括原生的 ReAct 模式和上下文管理的深度模式。
目前,通義 DeepResearch 已經賦能多個阿里巴巴內部應用,真實落地案例包括高德地圖、通義法睿兩款應用。
通義 DeepResearch 與高德地圖深度共建,聯合推出全球首個 AI 原生出行 Agent。
該 Agent 為高德預置了專屬地圖 API、實時天氣查詢、交通狀況監測等工具,可結合當下情況為用戶提供更準確的行動建議。例如,在即將晚高峰的時候導航去機場,高德地圖可制定繞開一條避開擁堵路線的方案。

在對專業性、準確性要求極高的法律領域,通義 DeepResearch 同樣表現出色。我們將其能力注入“通義法睿”,打造了專為法律研究優化的智能體。它能自動檢索法條、類案和裁判文書,并進行深度歸納分析。在與 OpenAI、Claude 等國際頂尖模型的同臺競技中,通義法睿在“法條引用相關性”和“案例引用相關性”兩項關鍵指標上全面領先,綜合表現最優。這不僅驗證了通義大模型在復雜推理場景的硬實力,更為法律從業者提供了強大的生產力工具。
