要聞

實測GPT-5：寫作“AI味”濃，代碼“美而無用”，OpenAI為何急于打響價格戰

2025-08-09 09:46:11

GPT-5發布后，實測發現，寫作能力“倒退”，編寫的代碼“美而無用”，未達預期。在技術邊際收益銳減、運營成本高企、人才流失隱憂的夾縫中，OpenAI采取了向普通用戶免費和遠低于對手的API定價策略，試圖讓GPT-5成為OpenAI沖擊5000億美金估值、爭奪B端與G端市場的關鍵籌碼。

每經記者｜岳楚鵬鄭雨航每經編輯｜高涵

在經歷了無數次“跳票”后，市場翹首以盼的GPT-5終于登場，但迎接它的并非預想中的熱烈掌聲。

《每日經濟新聞》記者（以下簡稱“每經記者”）第一時間進行實測后發現，被寄予厚望的GPT-5，其輸出的文章“AI味”似乎比以往更重了。與此同時，全球用戶與行業專家的反饋也頗為尖銳：GPT-5的寫作能力被指出現“倒退”，編寫的代碼被諷刺為“美而無用”，甚至在被譽為通用人工智能（AGI）終極測試的Arc Prize中，慘遭競爭對手馬斯克旗下Grok 4的“碾壓”。

然而，在這場略顯平淡甚至令人失望的技術發布背后，一個更清晰的戰略轉向正在浮現：OpenAI似乎不再癡迷于單純的技術迭代本身，而是將目光更多地投向了公司的生存與商業擴張。

在技術邊際收益銳減、運營成本高企、核心人才流失等多重隱憂的夾縫之中，OpenAI為GPT-5制定了向普通用戶免費開放和遠低于競爭對手的API定價策略。這表明，GPT-5的角色，已不再是那個驚艷世人的“技術奇跡”，而是OpenAI沖擊5000億美元估值、全力爭奪B端（企業）與G端（政府）市場的關鍵商業籌碼。

圖片來源：視覺中國

“博士級專家”的尷尬——“AI味”的文章與“美而無用”的代碼

在8月7日的發布會上，OpenAI的CEO山姆·阿爾特曼曾用三個生動的身份，類比了公司三代旗艦模型的演進：GPT-3像是偶有靈光閃現但常伴挫敗感的高中生；GPT-4則如同具備了真實智慧與實用價值的大學生；而最新的GPT-5，則被譽為可以按需召喚的“博士級專家”，能夠隨時助力用戶達成各種復雜目標。

OpenAI聲稱，GPT-5在超高難度的科學問題上刷新了世界紀錄，并在與人類專家的對比測試中，有近70%的場景表現更優。此外，GPT-5還與現有的o系列模型進行了無縫整合，能夠根據任務的復雜性，自動選擇最佳的推理路徑。官方數據顯示，GPT-5在代碼生成和寫作領域的準確率均高于GPT-4系列，部分內部測試中的錯誤率甚至下降了約80%。

為了減少備受詬病的“幻覺”問題，GPT-5還引入了更嚴格的事實核查與內容過濾機制。具體來看，在聯網搜索時，GPT-5的事實錯誤概率比GPT-4o低約45%；獨立思考時，出錯概率比o3模型低約80%；在開放式事實性基準測試中，產生“幻覺”的數量更是比o3模型少了約六分之五。

OpenAI在發布會上特別強調了GPT-5在代碼生成和寫作方面的能力。然而，用戶的實際使用體驗，似乎并未完全印證官方的說法。

首先，在寫作能力上，盡管OpenAI聲稱GPT-5的文筆更具“人味兒”，但有用戶在體驗后直言，其寫作能力甚至“退化到和GPT-3.5差不多”。每經記者也要求GPT-5就本場發布會撰寫一篇新聞報道，最直觀的感受是：其輸出的文章邏輯清晰，但遣詞造句的模式化痕跡明顯，“AI味”比以前更重了。

其次，在編程方面，GPT-5的優勢也并不突出。在改進版的編程能力評估基準SWE-bench Verified測試中，GPT-5并未與競爭對手Anthropic公司的Claude 4.1 Opus拉開顯著差距。盡管OpenAI在發布會上展示了令人驚艷的編程演示，但在實際應用中的效果卻備受質疑。

Meta公司的一位工程師體驗GPT-5后在社交媒體上感嘆道：“GPT-5僅用一次調用就重構了我的整個代碼庫：25個工具調用，3000多行新代碼，12個全新的文件?！钡S即話鋒一轉：“然而，這些代碼都無效（無法正常工作），雖然確實寫得很漂亮。”

另一位研究人員在經過一系列項目代碼測試后，甚至給出了一個顛覆性的結論，他認為目前主流大模型的代碼編寫能力排名應該是：Claude Opus 4.1 > Gemini-2.5-Pro > GPT-5-Thinking。

視頻來源：X平臺@karminski-牙醫

從第三方的基準測試數據來看，GPT-5相較于競爭對手的旗艦模型，其領先優勢也微乎其微。根據Artificial Analysis的綜合排名，GPT-5目前雖然位列第一，但其綜合得分僅比自家的老模型o3高出兩分，比Grok 4僅高出一分。而在被譽為AGI終極測試的Arc Prize競賽中，GPT-5更是被Grok 4大幅超越。

“GPT-5不太可能‘超越一切預期’，因為大模型的邊際收益正在迅速遞減。”AI營銷與銷售專家、太和智庫研究員唐興通在接受每經記者采訪時分析指出，“我們今天所看到的所謂‘進步’，更多是來自于工程層面的調優和多模態能力的融合，而非純粹的智能層面上的突破?！?/p>

他認為，AI的發展正面臨兩大物理限制：“我們必須清醒地認識到，‘數據墻’是客觀存在的，高質量的公共訓練數據正在被快速耗盡。同時，算力成本的指數級增長，也讓過去那種‘大力出奇跡’的暴力美學難以為繼?！?/p>

當技術光環褪色——OpenAI被迫打響“價格戰”

在GPT-5的技術表現未能完全征服市場的同時，OpenAI為其制定的商業策略，卻顯露出了前所未有的“殺氣”。

目前，無論是Plus、Pro、團隊版還是免費用戶，均已陸續接入GPT-5。對于廣大的開發者和企業API用戶，GPT-5的定價策略極具競爭力：其標準版API的定價為每百萬token輸入1.25美元，輸出10美元，這不僅低于上一代的GPT-4o，更遠低于其主要競爭對手Claude Opus 4.1和Gemini 2.5 Pro。而其輕量級的GPT-5-mini版和GPT-5-nano版的價格則更為低廉。

OpenAI的這套定價策略顯然直指廣闊的B端市場：通過極具吸引力的超低API價格，將那些正在自研模型或使用競爭對手服務的企業客戶，直接“挖”到自己的生態中來。在GPT-5發布會的后半場，OpenAI也一反常態，將重點放在了分享企業應用案例上，詳細展示了其模型如何幫助企業構建各種應用，并專門推出了服務于企業的GPT-5-chat模型。

“OpenAI面臨著巨大的降價壓力，主動降價是深思熟慮后的市場分層策略，旨在應對日益激烈的開源模型競爭?！碧婆d通向每經記者指出，“在技術上越來越難以‘一步登天’的背景下，商業上的‘遍地開花’才是當務之急。AI的下半場，勝利將不再屬于那個模型參數最高的玩家，而是將屬于那個能率先為頂尖技術找到‘殺手級應用’的玩家。”

GPT-5的目標，已不再是通過炫技來獲得市場的掌聲，而是要精準地瞄準企業客戶口袋里的真金白銀。GPT-5并非一個顛覆性的代際跨越模型，而是OpenAI準備投入到殘酷商業肉搏戰中的關鍵籌碼。

IT研究公司Gartner的分析師阿倫·錢德拉塞卡蘭也認為，GPT-5仍然只是一種“漸進式優化”，而非顛覆性的、跨越式的提升。唐興通則表示，GPT-5的“漸進式改進”，短期內可能會刺破資本市場的幻想泡沫，估值會承壓，但對于其中長期的商業化進程，甚至可能是件好事?！?strong>關鍵已經不在于技術本身有多么性感，而在于如何將已經足夠強大的技術，轉化為能夠解決現實世界問題的可靠產品。”

“OpenAI需要加速從一個偉大的實驗室，進化為一個強大的商業帝國。”唐興通總結道。

C端增長見頂？——OpenAI的5000億美元估值野望

GPT-5的發布，或許還與OpenAI近期的資本運作密切相關。

據媒體8月7日報道，OpenAI正在與現有投資者展開初步談判，商討一次員工持有的股權出售事宜。如果這筆交易能夠達成，OpenAI的估值預計將從目前的3000億美元，一舉躍升至5000億美元，這將超過埃隆·馬斯克旗下SpaceX的3500億美元，使其成為全球最具價值的未上市AI公司。

唐興通向每經記者指出，5000億美元的估值，反映的并非OpenAI當前的市場價值，而是資本市場對其在AGI時代的一種“期權定價”?！爸芜@個估值的核心邏輯是：誰掌握了通向AGI的最短路徑，誰就擁有了重新定義整個世界的權力?！?/p>

然而，現實的財務壓力依然嚴峻。有媒體預計OpenAI今年的收入將達到120億美元，但其居高不下的運營成本依舊是困擾其發展的一大難題。有分析指出，OpenAI每創造1美元的收入，可能將伴隨著2.25美元的成本。據此粗略估計，該公司今年的運營支出預計將超過280億美元，這些支出主要與其使用的微軟云計算服務、正在建設的“星際之門”數據中心項目，以及與算力提供商CoreWeave簽訂的129億美元五年期協議有關。除了財務壓力，OpenAI還面臨著核心人才流失的挑戰，近期多名AI關鍵研究員的離職，可能在一定程度上削弱其技術領先優勢，并增加其人力成本。

OpenAI的CEO山姆·阿爾特曼圖片來源：視覺中國

“在AI這條賽道上，現金流為負并不是問題，失去技術領先地位才是真正的災難?！碧婆d通認為，“當前的巨額投入，都是在為未來的潛在壟斷地位買單?！辈贿^，他也指出，持續的融資可以暫時解決資金問題，但無法從根本上解決其盈利模式的難題。

目前，OpenAI的收入增長主要依賴于ChatGPT的訂閱業務，該業務貢獻了公司總收入的約70%。最新數據顯示，ChatGPT每周約有7億活躍用戶。但在唐興通看來，7億用戶既是OpenAI的“榮耀勛章”，在某種程度上也代表著其“增長的邊界”。

“ChatGPT的C端增長確實已接近飽和，但OpenAI真正的野心，在于廣闊的B端（企業）和G端（政府）市場?！彼治龅?。OpenAI近期時隔六年再次開源部分模型，正是為了吸引那些對數據主權高度敏感的政企客戶，這標志著其戰略重心正在從“消費互聯網”轉向“產業互聯網”。

OpenAI的團隊深知，其以API驅動的商業模式，在中低端市場遲早會被更便宜、更靈活的開源模型所侵蝕。與其被動地等待被其他人顛覆，不如主動求變。因此，OpenAI正在從單純的“賣算力”，轉向更為復雜的“賣生態”，試圖構建一個立體化的商業架構：開源模型是其吸引廣大開發者的流量入口，高端API是其主要的利潤中心，而企業級服務則是其未來最重要的增長引擎。

為了快速切入政府市場，OpenAI在8月6日宣布，未來一年將以象征性的1美元價格，向美國聯邦政府機構提供其ChatGPT Enterprise產品，讓政府雇員可以“幾乎免費”地使用其最強大的AI服務。這種典型的“供應商鎖定（Vendor Lock-in）”策略，旨在以極低的成本快速滲透政府和大型機構市場，為未來的長期合作和高價值服務奠定堅實的基礎。

“OpenAI正站在成為下一個微軟的十字路口，”唐興通總結道，“其成敗的關鍵，在于它能否在持續的技術突破、創新的商業模式以及嚴格的風險管控這三者之間，找到那個最佳的平衡點?！?/p>

封面圖片來源：視覺中國

如需轉載請與《每日經濟新聞》報社聯系。
未經《每日經濟新聞》報社授權，嚴禁轉載或鏡像，違者必究。

讀者熱線：4008890008

特別提醒：如果我們使用了您的圖片，請作者與本站聯系索取稿酬。如您不希望作品出現在本站，可聯系我們要求撤下您的作品。

上一篇文章

GPT-5寫作“AI味”濃，代碼被指“美而無用”，OpenAI打響價格戰；普京與特朗普將于15日會晤；以色列計劃接管加沙城；蘋果漲13%創五年多來最強周表現 | 一周國際財經

返回每經網首頁

下一篇文章

規模曾超百億，招商基金旗下這只重要產品現人事變動：“功臣”翟相棟離任，陸文凱繼續管理