每日經濟新聞
要聞

每經網首頁 > 要聞 > 正文

實測GPT-5:寫作“AI味”濃,代碼“美而無用”,OpenAI為何急于打響價格戰

2025-08-09 09:46:11

GPT-5發布后,實測發現,寫作能力“倒退”,編寫的代碼“美而無用”,未達預期。在技術邊際收益銳減、運營成本高企、人才流失隱憂的夾縫中,OpenAI采取了向普通用戶免費和遠低于對手的API定價策略,試圖讓GPT-5成為OpenAI沖擊5000億美金估值、爭奪B端與G端市場的關鍵籌碼。

每經記者|岳楚鵬  鄭雨航    每經編輯|高涵    

在經歷了無數次“跳票”后,市場翹首以盼的GPT-5終于登場,但迎接它的并非預想中的熱烈掌聲。

《每日經濟新聞》記者(以下簡稱“每經記者”)第一時間進行實測后發現,被寄予厚望的GPT-5,其輸出的文章“AI味”似乎比以往更重了。與此同時,全球用戶與行業專家的反饋也頗為尖銳:GPT-5的寫作能力被指出現“倒退”,編寫的代碼被諷刺為“美而無用”,甚至在被譽為通用人工智能(AGI)終極測試的Arc Prize中,慘遭競爭對手馬斯克旗下Grok 4的“碾壓”。

然而,在這場略顯平淡甚至令人失望的技術發布背后,一個更清晰的戰略轉向正在浮現:OpenAI似乎不再癡迷于單純的技術迭代本身,而是將目光更多地投向了公司的生存與商業擴張

在技術邊際收益銳減、運營成本高企、核心人才流失等多重隱憂的夾縫之中,OpenAI為GPT-5制定了向普通用戶免費開放和遠低于競爭對手的API定價策略。這表明,GPT-5的角色,已不再是那個驚艷世人的“技術奇跡”,而是OpenAI沖擊5000億美元估值、全力爭奪B端(企業)與G端(政府)市場的關鍵商業籌碼。

圖片來源:視覺中國

“博士級專家”的尷尬——“AI味”的文章與“美而無用”的代碼

在8月7日的發布會上,OpenAI的CEO山姆·阿爾特曼曾用三個生動的身份,類比了公司三代旗艦模型的演進:GPT-3像是偶有靈光閃現但常伴挫敗感的高中生;GPT-4則如同具備了真實智慧與實用價值的大學生;而最新的GPT-5,則被譽為可以按需召喚的“博士級專家”,能夠隨時助力用戶達成各種復雜目標。

OpenAI聲稱,GPT-5在超高難度的科學問題上刷新了世界紀錄,并在與人類專家的對比測試中,有近70%的場景表現更優。此外,GPT-5還與現有的o系列模型進行了無縫整合,能夠根據任務的復雜性,自動選擇最佳的推理路徑。官方數據顯示,GPT-5在代碼生成和寫作領域的準確率均高于GPT-4系列,部分內部測試中的錯誤率甚至下降了約80%。

為了減少備受詬病的“幻覺”問題,GPT-5還引入了更嚴格的事實核查與內容過濾機制。具體來看,在聯網搜索時,GPT-5的事實錯誤概率比GPT-4o低約45%;獨立思考時,出錯概率比o3模型低約80%;在開放式事實性基準測試中,產生“幻覺”的數量更是比o3模型少了約六分之五。

OpenAI在發布會上特別強調了GPT-5在代碼生成和寫作方面的能力。然而,用戶的實際使用體驗,似乎并未完全印證官方的說法。

首先,在寫作能力上,盡管OpenAI聲稱GPT-5的文筆更具“人味兒”,但有用戶在體驗后直言,其寫作能力甚至“退化到和GPT-3.5差不多”。每經記者也要求GPT-5就本場發布會撰寫一篇新聞報道,最直觀的感受是:其輸出的文章邏輯清晰,但遣詞造句的模式化痕跡明顯,“AI味”比以前更重了。

其次,在編程方面,GPT-5的優勢也并不突出。在改進版的編程能力評估基準SWE-bench Verified測試中,GPT-5并未與競爭對手Anthropic公司的Claude 4.1 Opus拉開顯著差距。盡管OpenAI在發布會上展示了令人驚艷的編程演示,但在實際應用中的效果卻備受質疑。

Meta公司的一位工程師體驗GPT-5后在社交媒體上感嘆道:“GPT-5僅用一次調用就重構了我的整個代碼庫:25個工具調用,3000多行新代碼,12個全新的文件?!钡S即話鋒一轉:“然而,這些代碼都無效(無法正常工作),雖然確實寫得很漂亮。

另一位研究人員在經過一系列項目代碼測試后,甚至給出了一個顛覆性的結論,他認為目前主流大模型的代碼編寫能力排名應該是:Claude Opus 4.1 > Gemini-2.5-Pro > GPT-5-Thinking。

視頻來源:X平臺@karminski-牙醫

從第三方的基準測試數據來看,GPT-5相較于競爭對手的旗艦模型,其領先優勢也微乎其微。根據Artificial Analysis的綜合排名,GPT-5目前雖然位列第一,但其綜合得分僅比自家的老模型o3高出兩分,比Grok 4僅高出一分。而在被譽為AGI終極測試的Arc Prize競賽中,GPT-5更是被Grok 4大幅超越。

GPT-5不太可能‘超越一切預期’,因為大模型的邊際收益正在迅速遞減。”AI營銷與銷售專家、太和智庫研究員唐興通在接受每經記者采訪時分析指出,“我們今天所看到的所謂‘進步’,更多是來自于工程層面的調優和多模態能力的融合,而非純粹的智能層面上的突破?!?/p>

他認為,AI的發展正面臨兩大物理限制:“我們必須清醒地認識到,‘數據墻’是客觀存在的,高質量的公共訓練數據正在被快速耗盡。同時,算力成本的指數級增長,也讓過去那種‘大力出奇跡’的暴力美學難以為繼?!?/p>

當技術光環褪色——OpenAI被迫打響“價格戰”

在GPT-5的技術表現未能完全征服市場的同時,OpenAI為其制定的商業策略,卻顯露出了前所未有的“殺氣”。

目前,無論是Plus、Pro、團隊版還是免費用戶,均已陸續接入GPT-5。對于廣大的開發者和企業API用戶,GPT-5的定價策略極具競爭力:其標準版API的定價為每百萬token輸入1.25美元,輸出10美元,這不僅低于上一代的GPT-4o,更遠低于其主要競爭對手Claude Opus 4.1和Gemini 2.5 Pro。而其輕量級的GPT-5-mini版和GPT-5-nano版的價格則更為低廉。

OpenAI的這套定價策略顯然直指廣闊的B端市場:通過極具吸引力的超低API價格,將那些正在自研模型或使用競爭對手服務的企業客戶,直接“挖”到自己的生態中來。在GPT-5發布會的后半場,OpenAI也一反常態,將重點放在了分享企業應用案例上,詳細展示了其模型如何幫助企業構建各種應用,并專門推出了服務于企業的GPT-5-chat模型。

OpenAI面臨著巨大的降價壓力,主動降價是深思熟慮后的市場分層策略,旨在應對日益激烈的開源模型競爭?!碧婆d通向每經記者指出,“在技術上越來越難以‘一步登天’的背景下,商業上的‘遍地開花’才是當務之急。AI的下半場,勝利將不再屬于那個模型參數最高的玩家,而是將屬于那個能率先為頂尖技術找到‘殺手級應用’的玩家。”

GPT-5的目標,已不再是通過炫技來獲得市場的掌聲,而是要精準地瞄準企業客戶口袋里的真金白銀。GPT-5并非一個顛覆性的代際跨越模型,而是OpenAI準備投入到殘酷商業肉搏戰中的關鍵籌碼。

IT研究公司Gartner的分析師阿倫·錢德拉塞卡蘭也認為,GPT-5仍然只是一種“漸進式優化”,而非顛覆性的、跨越式的提升。唐興通則表示,GPT-5的“漸進式改進”,短期內可能會刺破資本市場的幻想泡沫,估值會承壓,但對于其中長期的商業化進程,甚至可能是件好事?!?strong>關鍵已經不在于技術本身有多么性感,而在于如何將已經足夠強大的技術,轉化為能夠解決現實世界問題的可靠產品。”

“OpenAI需要加速從一個偉大的實驗室,進化為一個強大的商業帝國。”唐興通總結道。

C端增長見頂?——OpenAI的5000億美元估值野望

GPT-5的發布,或許還與OpenAI近期的資本運作密切相關。

據媒體8月7日報道,OpenAI正在與現有投資者展開初步談判,商討一次員工持有的股權出售事宜。如果這筆交易能夠達成,OpenAI的估值預計將從目前的3000億美元,一舉躍升至5000億美元,這將超過埃隆·馬斯克旗下SpaceX的3500億美元,使其成為全球最具價值的未上市AI公司。

唐興通向每經記者指出,5000億美元的估值,反映的并非OpenAI當前的市場價值,而是資本市場對其在AGI時代的一種“期權定價”?!爸芜@個估值的核心邏輯是:誰掌握了通向AGI的最短路徑,誰就擁有了重新定義整個世界的權力?!?/p>

然而,現實的財務壓力依然嚴峻。有媒體預計OpenAI今年的收入將達到120億美元,但其居高不下的運營成本依舊是困擾其發展的一大難題。有分析指出,OpenAI每創造1美元的收入,可能將伴隨著2.25美元的成本。據此粗略估計,該公司今年的運營支出預計將超過280億美元,這些支出主要與其使用的微軟云計算服務、正在建設的“星際之門”數據中心項目,以及與算力提供商CoreWeave簽訂的129億美元五年期協議有關。除了財務壓力,OpenAI還面臨著核心人才流失的挑戰,近期多名AI關鍵研究員的離職,可能在一定程度上削弱其技術領先優勢,并增加其人力成本。

OpenAI的CEO山姆·阿爾特曼 圖片來源:視覺中國

“在AI這條賽道上,現金流為負并不是問題,失去技術領先地位才是真正的災難?!碧婆d通認為,“當前的巨額投入,都是在為未來的潛在壟斷地位買單?!辈贿^,他也指出,持續的融資可以暫時解決資金問題,但無法從根本上解決其盈利模式的難題。

目前,OpenAI的收入增長主要依賴于ChatGPT的訂閱業務,該業務貢獻了公司總收入的約70%。最新數據顯示,ChatGPT每周約有7億活躍用戶。但在唐興通看來,7億用戶既是OpenAI的“榮耀勛章”,在某種程度上也代表著其“增長的邊界”。

ChatGPT的C端增長確實已接近飽和,但OpenAI真正的野心,在于廣闊的B端(企業)和G端(政府)市場?!彼治龅?。OpenAI近期時隔六年再次開源部分模型,正是為了吸引那些對數據主權高度敏感的政企客戶,這標志著其戰略重心正在從“消費互聯網”轉向“產業互聯網”。

OpenAI的團隊深知,其以API驅動的商業模式,在中低端市場遲早會被更便宜、更靈活的開源模型所侵蝕。與其被動地等待被其他人顛覆,不如主動求變。因此,OpenAI正在從單純的“賣算力”,轉向更為復雜的“賣生態”,試圖構建一個立體化的商業架構:開源模型是其吸引廣大開發者的流量入口,高端API是其主要的利潤中心,而企業級服務則是其未來最重要的增長引擎。

為了快速切入政府市場,OpenAI在8月6日宣布,未來一年將以象征性的1美元價格,向美國聯邦政府機構提供其ChatGPT Enterprise產品,讓政府雇員可以“幾乎免費”地使用其最強大的AI服務。這種典型的“供應商鎖定(Vendor Lock-in)”策略,旨在以極低的成本快速滲透政府和大型機構市場,為未來的長期合作和高價值服務奠定堅實的基礎。

“OpenAI正站在成為下一個微軟的十字路口,”唐興通總結道,“其成敗的關鍵,在于它能否在持續的技術突破、創新的商業模式以及嚴格的風險管控這三者之間,找到那個最佳的平衡點?!?/p>

封面圖片來源:視覺中國

如需轉載請與《每日經濟新聞》報社聯系。
未經《每日經濟新聞》報社授權,嚴禁轉載或鏡像,違者必究。

讀者熱線:4008890008

特別提醒:如果我們使用了您的圖片,請作者與本站聯系索取稿酬。如您不希望作品出現在本站,可聯系我們要求撤下您的作品。

歡迎關注每日經濟新聞APP

每經經濟新聞官方APP

1

0

免费阿v网站在线观看,九九国产精品视频久久,久热香蕉在线精品视频播放,欧美中文字幕乱码视频
亚洲免费乱码视频 | 午夜精品视频在线 | 自拍偷在线精品自拍偷99 | 在线亚洲一区网站 | 亚洲无线码在线高清 | 日本欧美一级二级三级不卡 |