每日經濟新聞
要聞

每經網首頁 > 要聞 > 正文

GPT-5.2來了!OpenAI稱其為智能體編碼最強,趕超人類專家!Altman料明年1月解除“紅色警報”狀態

2025-12-12 07:46:11

12月11日OpenAI發布GPT-5.2,以應對競爭壓力。該模型針對專業工作場景全面優化,創多個基準測試紀錄,首個性能達人類專家水平,旨在創造經濟價值。當天GPT-5.2在ChatGPT上線,面向付費用戶,推出三個版本,API同步開放。GPT-5.2性能領先,多項測試創新高。此外,OpenAI還將推出新功能,并計劃明年1月再發布一款新模型。

每經編輯|杜宇    

美國開放人工智能研究中心(OpenAI)12月11日發布其人工智能模型GPT的最新升級版本GPT-5.2,以應對生成式人工智能領域日趨激烈的競爭。

圖片來源:OpenAI官網

為回應谷歌公司11月所發布人工智能模型雙子座3的出色表現,OepnAI首席執行官薩姆·奧爾特曼近日啟動“紅色警報”,加快GPT升級版本的發布速度。

OpenAI今年8月推出GPT-5后,11月即發布升級版本GPT-5.1,眼下不到一個月就再次更新。業界認為,此舉凸顯人工智能行業目前面臨的競爭壓力。

圖片來源:視覺中國

GPT-5.2是OpenAI迄今最先進的人工智能(AI)模型,針對專業工作場景進行了全面優化,創多個基準測試的行業記錄,其中的GPT-5.2 Thinking刷新了SWE編碼能力測試的歷史最高分,也是OpenAI首個性能達到或超過人類專家水平的模型。

OpenAI介紹稱,GPT?5.2是迄今為止在“專業知識工作方面”表現最好的模型系列,在制作電子表格、制作演示文稿、圖像感知、編寫代碼以及理解長上下文等方面都優于前代產品,旨在"為人們創造更多經濟價值"。OpenAI的研究副總Adain Clark稱,GPT-5.2在數學推理方面的進步意味著它能更好地處理金融建模、預測和數據分析等任務。

OpenAI宣布,12月11日當天GPT5.2就在ChatGPT上線,面向Plus、Pro、Go、Business和 Enterprise這些付費套餐的用戶, 共推出Instant、Thinking和Pro三個版本,API也同步開放給所有開發者。

在ChatGPT中,付費用戶可使用三個版本的GPT-5.2,且在未來三個月內仍可繼續使用GPT-5.1。在API平臺,GPT-5.2定價為每百萬輸入token 1.75美元、每百萬輸出token 14美元,緩存輸入可享受90%折扣。雖然單token價格高于GPT-5.1,但OpenAI表示,由于模型效率更高,達到相同質量水平的總成本反而更低。

三個版本GPT-5.2分別主打快速、深度、智能可靠

OpenAI分別介紹稱,Instant是快速高效的日常工作和學習助手,在信息查詢、操作指南、技術寫作和翻譯方面均有顯著提升,并延續了 GPT-5.1 Instant 中更親切的對話風格。早期測試者尤其注意到,GPT-5.2 的解釋更加清晰,能夠直接呈現關鍵信息。

Thinking 專為深度工作而設計,能夠幫助用戶更高效地完成更復雜的任務,尤其是在編碼、總結長篇文檔、回答有關上傳文件的問題、逐步進行數學和邏輯運算、以更清晰的框架和更有用的細節輔助規劃和決策方面。

Pro是需要高質量回答難題時“最智能、最可靠”的選擇。早期測試表明,它在編程等復雜領域表現更出色,且重大錯誤更少。

性能全面領先,多項基準測試創新高

GPT-5.2在多個關鍵基準測試中刷新了行業紀錄。在GDPval測試中,該模型在涵蓋44個職業的知識工作任務上,有70.9%的表現達到或超過行業專家水平。OpenAI稱,GPT-5.2 Thinking完成這些任務的速度是專家的11倍以上,成本不到專家的1%。

在編碼能力方面,GPT-5.2 Thinking在SWE-Bench Pro上取得55.6%的成績,在SWE-bench Verified上更是達到80%的新高。這一基準測試真實世界軟件工程任務,涵蓋四種編程語言。OpenAI的產品負責人Max Schwarzer表示,GPT-5.2在代碼生成和調試方面取得重大進步,Windsurf和CharlieCode等編碼初創公司報告稱該模型實現了"最先進的智能體編碼性能"。

OpenAI聲稱GPT-5.2 Thinking是"世界上最好的視覺模型",在圖表推理和軟件界面理解方面的錯誤率降低了約一半。在長文本處理上,該模型在OpenAI MRCRv2測試中率先在25.6萬token范圍內實現近100%的準確率,使其特別適合深度文檔分析和多源信息工作流。

在科學研究領域,GPT-5.2 Pro在GPQA Diamond測試中達到93.2%的準確率,GPT-5.2 Thinking緊隨其后為92.4%。在專家級數學測試FrontierMath上,GPT-5.2 Thinking解決了40.3%的問題,創下新紀錄。OpenAI稱GPT-5.2 Pro和GPT-5.2 Thinking是"世界上最好的科學家助手模型"。

作為OpenAI對谷歌的反擊,GPT?5.2僅僅是打出的“第一拳”。

公司CEOAltman在12月11日宣布,下周會給用戶們帶來一些“小小的圣誕禮物”。他表示,Gemini 3對公司各項指標的影響比原本擔心得要小。他還說,預計OpenAI將在2026年1月“以非常強勁的姿態”退出目前的紅色警報狀態

OpenAI首席產品官Fidji Simo也在12月11日透露,現在已經開始在部分地區推出年齡估算系統,此舉旨在控制ChatGPT對18歲以下用戶回復的內容。Simo也表示,公司希望在明年一季度推出“成人模式”前先引入這一功能。

此前有報道稱,OpenAI計劃在明年1月再發布一款新模型,具有更好的圖像能力和更完善的個性化特點,但公司周四未對這一傳言予以確認。

每日經濟新聞綜合公開消息

如需轉載請與《每日經濟新聞》報社聯系。
未經《每日經濟新聞》報社授權,嚴禁轉載或鏡像,違者必究。

讀者熱線:4008890008

特別提醒:如果我們使用了您的圖片,請作者與本站聯系索取稿酬。如您不希望作品出現在本站,可聯系我們要求撤下您的作品。

歡迎關注每日經濟新聞APP

每經經濟新聞官方APP

1

0

免费阿v网站在线观看,九九国产精品视频久久,久热香蕉在线精品视频播放,欧美中文字幕乱码视频
日韩一区二区三区精品 | 日韩美女黄大片在线观看 | 亚洲国产AV片一区 | 亚洲欧美日韩国产综合第 | 亚洲日本电影久久 | 欧美日韩一区二区不卡 |