每日經濟新聞
要聞

每經網首頁 > 要聞 > 正文

專訪傳神語聯創始人何恩培:翻譯不死,但必須借助大模型重構丨AI先行者檔案

每日經濟新聞 2025-04-29 20:38:21

近日,國家專精特新“小巨人”企業傳神語聯創始人何恩培接受了《每日經濟新聞》記者的專訪。他認為,當前大模型競爭雖激烈,但遠未成熟,類似1920年電氣時代,應用尚未被充分發掘。智能語言服務行業正從“單純的語言轉換”轉向“知識理解與應用”。傳神語聯選擇“后撤一步”,提供底層技術和工具。何恩培強調,數據質量重于數量,AI未來競爭在于底層技術框架,“根原創”是根技術中最有生命力的部分。

每經記者 可楊    每經編輯 張海妮    

開欄語

大模型正從技術競逐的“實驗室”加速奔向產業落地的“深水區”。在這波浪潮中,一些先行者以敏銳的洞察力與破局勇氣,率先探索技術與場景的融合邊界——他們是打破算力桎梏的開源先鋒,是深耕垂直領域的場景拓荒者,是構建生態協同的產業布道者。

聚焦大模型應用落地的“最后一公里”,我們對話以技術為矛、以場景為盾的探索者,試圖勾勒出一幅大模型賦能千行百業的“清明上河圖”,為行業提供可復用的方法論,也為中國AI產業的全球化突圍注入信心與動能。

策劃:郭榮村、李少婷)

義烏小商品城外貿出海成風,不懂英語的店員對著海外直播平臺熱情闡述,大模型幫他們將訂單統統攬下,這離不開AI(人工智能)翻譯的功勞。

在大模型重塑千行萬業的浪潮中,傳統翻譯已發展成為集語言理解、知識處理、文化適配于一體的綜合性智能服務體系。換句話說,翻譯不再是被動接受技術賦能的領域,而是主動引領大模型產業變革的前沿試驗場。

但熱潮的另一面,是智能語言服務行業靜默的變革——機器翻譯增多,人類譯員的工作并沒有隨之減少,然而單價出現下降;訂單量的增長與盈利能力的滯漲構成悖論。在這場人機博弈中,終極勝負手或許就藏在未被算法吞噬的認知褶皺與知識基因之間。

近日,《每日經濟新聞》記者專訪了國家專精特新“小巨人”企業——傳神語聯網網絡科技股份有限公司(以下簡稱傳神語聯)創始人何恩培。

當前,大模型的競爭已邁入第三年,新的玩家突出重圍,座次又生變化。何恩培認為,此時談定局為時尚早,大模型還遠未成熟,當前更像是1920年的電氣時代,基礎技術已經誕生,但五花八門的應用尚未被發掘。

在他看來,智能語言服務行業正在從“單純的語言轉換”轉向“知識理解與應用”。趨勢之下,傳神語聯選擇“后撤一步”,提供服務于行業的底層技術和工具。而在面向應用提供服務的過程中,他們意識到,“大數據”并不適用,質量更重于數量。

 

 

人機博弈:訂單貶值,發力底層

技術發展的腳步越快,各行各業面臨的拷問就越相似——人工智能會取代我們嗎?

在這場關乎生存的討論中,智能語言服務行業是最早被卷入的領域之一。早在大模型熱潮來臨之前,機器翻譯就在不斷進化,逐步蠶食著人工翻譯的生存空間。

這種焦慮也沖擊著客戶的預期:如果機器翻譯能做到“基本能看懂”,為什么還要支付高昂的翻譯費用?

生成式AI席卷而來,人工翻譯會成為最先被取代的職業嗎?

“我可以給大家一個結論:翻譯可能是人類和機器博弈中最后消亡的行業。”何恩培篤信,語言不僅僅是溝通工具,也是人類思考的“操作系統”,是一個復雜而動態的體系,機器需要通過自然語言來理解世界。

但在這場人類與機器的“博弈”中,智能語言服務行業呈現出一個值得探究的信號:訂單增長幅度顯著高于收入增長。何恩培拋出這樣一組數據:2024年,傳神語聯的智能語言服務收入增長了10%,但訂單量增長了30%。

表面上看,這是一個樂觀的信號,訂單量增長說明市場需求仍然旺盛,但訂單的碎片化趨勢正在重塑行業——過去,一個翻譯訂單可能價值不菲,現在訂單金額卻越來越小,“因為客戶自己能‘看懂’了”。

機器翻譯的普及使得語言不再是障礙,提供智能語言服務也不再是一項“從頭到尾”的工作,而成為一種“修訂和優化”的服務。客戶的需求變得更加精準。同時,客戶對人工翻譯的付費意愿也在下降。既然機器能做到95%的準確率,為什么還要收這么多錢?

然而,何恩培認為,知識型產品具有一個顯著特征,即使機器翻譯的準確率高達95%,但只要還需要人工從頭至尾審閱,以識別那5%的誤差,處理速度就會回落至人工水平。

人與機器的博弈最終帶來了企業間的博弈。客戶普遍認為,機器進行初步翻譯,僅需稍作修改即可,進而付費意愿降低;而為了獲客,智能語言服務企業選擇壓低價格,而成本端唯一的對沖方式,是不得不在部分場景中使用機器翻譯;機器不可避免地搶走了一部分市場,而人類譯員的工作量減少,但單價也隨之下滑。

博弈中,傳神語聯選擇“后撤一步”。何恩培解釋,過去,智能語言服務公司直接服務于終端客戶,但未來,傳神要做的是“賦能”,讓合作伙伴,比如翻譯公司、中介機構,去覆蓋直接的語言需求,而傳神為他們提供底層技術和工具。

這一策略背后的核心邏輯是智能語言服務行業,正在從“單純的語言轉換”轉向“知識理解與應用”。“傳統翻譯的總量并沒有減少,而是產品形態發生了變化。”何恩培說,“客戶需要的,不再是簡單的文本轉換,而是一整套基于大模型的知識處理能力。”

數據不是越多越好:質量決定價值

出海,早已成為各家科技企業繞不開的話題。何恩培認為,對于中國企業而言,AI出海的真正挑戰不僅是語言問題,而是幫助企業在新的市場環境中實現知識遷移和業務落地。

“他們關心的是能不能聽‘懂’。”何恩培認為,理想的場景是,大模型成為一個知識轉換與傳遞的工具,但現實總比理想復雜。今天的大模型在語言覆蓋上仍存在很大局限,尤其是對于非英語市場,數據的訓練深度和準確性仍不足以支撐高質量的業務應用。“每家企業的現有數據都很重要,因為企業是依據自身特色出海。”

企業高質量數據的稀缺,導致大模型在解決客戶的深度問題上還沒有呈現出絕對優勢。“我認為(當下)距離大模型真正解決客戶問題還有一段路要走。”何恩培表示。

“過去企業把記錄和數據混在一起,他們認為工單、硬盤(上的內容)也是數據,但這只能叫記錄和資料。”他指出,數據的價值并不在于存量,而在于其系統化以及可被機器學習和推理的程度。

在人工智能發展初期,行業普遍追求“大數據”——投入數量龐大的數據進行訓練,以換取更強大的模型能力。然而,當大模型逐漸成為基礎設施時,數據的“質量”將比“數量”更重要。

在何恩培看來,數據、參數和算法并非孤立存在,而是一種動態平衡關系;數據和參數規模在一定范圍內能帶來性能增長,但算法創新才是突破“天花板”的關鍵。

早期開發翻譯軟件時,何恩培已經體會到數據和規則規模的邊際效應。“當我們設定了1.5萬條翻譯規則時,效果非常好。但當規則規模擴展到2萬條(時),(效果)反而變差了。”原因很簡單,數據之間、規則之間存在沖突,統計概率的關系也可能產生矛盾——換句話說,數據或參數在某個階段的增加確實能帶來提升,但當增長到一定程度,如果算法不突破,模型的質量反而會下降。

數據問題是傳神語聯提出“數推分離”架構的核心原因。何恩培回憶,最早在2021年,傳神語聯為法律行業開發了一套AI系統,能夠學習過去十年的法律案例。然而客戶很快提出了一個關鍵問題:新產生的數據怎么辦,還要重新訓練一次嗎?

這促使他們開始思考:如果數據和推理能夠分離,AI系統就可以在不依賴大規模訓練的情況下,實現自我學習和進化。“我們不需要把所有數據壓縮到神經網絡里,而是讓推理大腦保持輕量化,同時支持實時學習。”何恩培解釋道,這種架構不僅降低了模型的計算成本,還提高了適應性,使其能夠在動態環境中不斷優化自身。

DeepSeek熱潮后,知名投資人朱嘯虎曾提出,以后給數據打標簽的(工作)都需要博士生來做。何恩培認同這個觀點:“我們現在在處理數據時,很多時候已經是博士生在做了。”在當下的人工智能熱潮中,數據的價值并不取決于它的數量,而取決于質量,以及隱藏在其中的知識密度。

他舉例,如果一名律師在過去十年處理過500個案件,他的大腦中就沉淀了豐富的專業經驗。當有人請教他相關的問題時,他不需要拿出所有的案卷逐條翻閱,而是可以直接給出綜合判斷和方法論,這位律師的大腦就是一個“行業大模型”,其價值在于知識的提煉,而不是原始數據的堆積。

何恩培認為,AI的未來,也將走向這樣的方向。企業往往不愿意分享自己的高價值數據,因為數據往往涉及核心業務和商業秘密,但這并不意味著數據無法轉化為價值:“數據可以不外流,但由數據訓練出的智能是可以共享的。”

談定局為時尚早:大模型還遠未成熟

“回看我們的成長路徑,從最早的2.1B模型,到現在的9B,我們從未在參數規模上盲目堆砌,也從未在算力上無止境投入。”何恩培表示,這并不是因為資源不足,而是因為公司始終認為,這是一條更有效的技術路線。

在他的觀點中,衡量大模型價值的核心指標并非參數規模,而是能否真正解決客戶的問題。這種路徑在行業內也帶來了一定的認知挑戰,銷售和前端團隊有時會遇到客戶的疑問:模型參數還不到100億,算得上是大模型嗎?“但當客戶真正使用后,他們就會明白,關鍵不在參數,而在效果。”

在當下的科技語境中,“國產”“根技術”“0到1”已然成為熱詞,但在何恩培眼中,這些概念的邊界遠比市場討論的更加復雜。

何恩培認為,根技術是產品和應用最基礎的底層能力,它可以是自己研發的,也可以是基于開源的,甚至是通過授權獲得的。但無論如何,“我們掌握了這項技術,這項技術也屬于根技術,掌握了根技術,至少代表我們自己有了一定的主動性”。而“(從)0到1的技術”則等于是某項應用發明,它既可以在應用層,也可以在根層。

在他看來,AI的未來競爭,不僅僅是參數規模的競賽,而是底層技術框架的競爭,未來人工智能會衍生出無數的行業專用模型,而這些模型的底層架構將決定它們的智能邊界。

“根原創”是何恩培提出的概念,他認為這是根技術當中最有生命力的一部分,“你只有在‘根’上創新,才能真正擁有自己的技術思想。”何恩培強調,技術體系是帶有思想性的,如果所有的技術來源都依賴于外部的開源框架,就很難擺脫既有框架的思想束縛。而當企業在根技術層面擁有自主權時,它不僅能擺脫對外部技術的依賴,還能決定自身技術演進的方向,這才是最有創新價值的部分。

在商業層面,大模型競賽邁入第三年,關于大模型的商業模式、技術最終是不是應該是免費的,在行業內越來越被關注。過去,許多科技公司的商業模式都是先“燒錢做免費”,再通過其他方式盈利。例如,搜索引擎免費,但靠廣告賺錢;手游免費,但靠道具收費。

然而,大模型的情況似乎更為復雜。何恩培的核心觀點是:To B(企業級)市場的AI服務,不可能是免費的。“企業使用AI的核心目的是解決業務問題,而解決問題就一定會有成本。”他說,“只是說在競爭中把成本降到最低,一定不會免費。因為(一旦)免費,它就缺乏了這項技術持續運轉的能力,這由技術的稀缺性和商業模式共同決定。”

何恩培認為,今天的大模型遠遠沒有成熟,市場格局還未定型,現在討論最終格局為時尚早。

當前更像是1920年的電氣時代,電力技術已經成熟,但沒人能想到后面還有那么多家電、設備會被發明出來。一方面,今天的大模型很多問題尚未解決,不可能像一個成熟產品一樣占領所有領域;另一方面,當前市場競爭依舊集中在通用大模型方面,但垂直場景中的模型尚未爆發。“也許未來可能有一萬個AlphaFold在不同行業,這才(會)形成大模型的完整生態。”何恩培說。

如需轉載請與《每日經濟新聞》報社聯系。
未經《每日經濟新聞》報社授權,嚴禁轉載或鏡像,違者必究。

讀者熱線:4008890008

特別提醒:如果我們使用了您的圖片,請作者與本站聯系索取稿酬。如您不希望作品出現在本站,可聯系我們要求撤下您的作品。

模型 數據 Ai

歡迎關注每日經濟新聞APP

每經經濟新聞官方APP

0

0

免费阿v网站在线观看,九九国产精品视频久久,久热香蕉在线精品视频播放,欧美中文字幕乱码视频
中文字幕在线亚洲 | 午夜一区二区免费福利麻豆 | 亚洲日本中文字幕天堂网 | 在线播放中文有码国产 | 日本激情猛烈在线看免费观看 | 亚洲不卡在线精品视频 |