要聞

阿里千問3登頂全球最強開源模型，成本僅需DeepSeek-R1三分之一

每日經濟新聞 2025-04-29 09:43:48

每經記者｜葉曉丹每經編輯｜陳俊杰

每經杭州4月29日電（記者葉曉丹）記者從阿里云獲悉，4月29日凌晨，阿里巴巴開源新一代通義千問模型Qwen3（簡稱千問3），參數量僅為DeepSeek-R1的1/3，成本大幅下降，性能全面超越R1、OpenAI-o1等全球頂尖模型，登頂全球最強開源模型。千問3是國內首個“混合推理模型”，“快思考”與“慢思考”集成進同一個模型，對簡單需求可低算力“秒回”答案，對復雜問題可多步驟“深度思考”，大大節省算力消耗。

千問3采用混合專家（MoE）架構，總參數量235B，激活僅需22B。千問3預訓練數據量達36T ，并在后訓練階段多輪強化學習，將非思考模式無縫整合到思考模型中。千問3在推理、指令遵循、工具調用、多語言能力等方面均大幅增強，即創下所有國產模型及全球開源模型的性能新高：在奧數水平的AIME25測評中，千問3斬獲81.5分，刷新開源紀錄；在考察代碼能力的LiveCodeBench評測中，千問3突破70分大關，表現甚至超過Grok3；在評估模型人類偏好對齊的ArenaHard測評中，千問3以95.6分超越OpenAI-o1及DeepSeek-R1。性能大幅提升的同時，千問3的部署成本還大幅下降，僅需4張H20即可部署千問3滿血版，顯存占用僅為性能相近模型的三分之一。

如需轉載請與《每日經濟新聞》報社聯系。
未經《每日經濟新聞》報社授權，嚴禁轉載或鏡像，違者必究。

讀者熱線：4008890008

特別提醒：如果我們使用了您的圖片，請作者與本站聯系索取稿酬。如您不希望作品出現在本站，可聯系我們要求撤下您的作品。

上一篇文章

免稅店板塊盤初走弱，眾信旅游跌停

返回每經網首頁

下一篇文章

港股汽車股部分下跌