要聞

騰訊混元大模型亮相：全鏈路自研，聚焦應用死磕“幻覺”

每日經濟新聞 2023-09-07 22:37:13

每經編輯蒙錦濤

9月7日，在2023騰訊全球數字生態大會上，騰訊混元大語言模型正式亮相，并宣布通過騰訊云對外開放。這是騰訊首次披露的通用大語言模型，具備強大的中文創作能力，復雜語境下的邏輯推理能力，以及可靠的任務執行能力。

CFF20LXzkOyxQib9wbKDq0USqKtXPibgV6btNrkAA2CTiaTgaZN4ickuMQJmEr2ktON7w7aJ8Ijc9o4d39icbpyd7tg.jpg

此前的大半年，國內云廠商跟隨ChatGPT，掀起“百模大戰”。一時間，國內生成式大語言模型多得讓人眼花繚亂。騰訊在市場激流勇進之后再“秀肌肉”，也映射了“混元”這個取自典籍的名字中“元氣生于混沌之中”的含義，它撥清迷霧，迎接新天地。

騰訊為什么此前不著急發通用大模型？在蟄伏的日子里，騰訊做了什么？騰訊混元大模型值得期待嗎？

“不急于把半成品拿出來展示”

在“百模大戰”經歷喧囂，逐漸降噪之時，騰訊不緊不慢地揭開自己大語言模型的神秘面紗，這體現了騰訊一如既往的風格——不爭一時熱度、用產品實力說話。

在今年5月騰訊2023年股東大會上，騰訊董事會主席兼首席執行官馬化騰就如此評價大模型：“我們最開始以為這是互聯網十年不遇的機會，但是越想越覺得這是幾百年不遇的、類似發明電的工業革命一樣的機遇?；ヂ摼W企業都有很多的積累，都在做，我們也一樣在埋頭研發，但是并不急于早早做完，把半成品拿出來展示?！?/span>

馬化騰認為，對于工業革命來講，早一個月把電燈泡拿出來在長的時間跨度上來看是不那么重要的。大模型之于互聯網技術革命，就如電燈之于工業革命。騰訊在乎的是這個“電燈”的實用性和耐用性，而不是死盯著早一步投入市場激起的那簇虛無的水花。

“關鍵還是要把底層的算法、算力和數據扎扎實實做好，而且更關鍵的是場景落地?！瘪R化騰說道。

在市場看不見的日子里，騰訊已經在大模型底層能力上埋頭鉆研多年。從2021年開始，騰訊先后推出千億和萬億參數的NLP稀疏大模型，打破CLUE三大榜單紀錄，實現在中文理解能力上的新突破。

在去年年末ChatGPT掀起大模型浪潮后，騰訊的大模型路線也穩扎穩打，利用自身多元且豐富的產品、數據、場景的優勢，迭代了多個版本。騰訊的大模型在豐富的內部場景和應用上進行了反復錘煉，更清楚一個深入業務的大模型應該如何設計和研發。

CFF20LXzkOyxQib9wbKDq0USqKtXPibgV64462JC1t9GeX3Jwqxqg0XBZotbPGtUfSCNcPwldXxzw92sEHXMhvUg.jpg 騰訊集團副總裁蔣杰

相比于國內外已發布的大語言產品主要是通過聊天場景進行測試和訓練，騰訊選擇了用自家產品來測試。在騰訊集團副總裁蔣杰看來，測試大語言模型的途徑有很多?！耙环N是通過Chat來驗證，這會有比較好的體感。而騰訊有20多年的發展歷史，有海量的用戶和TO C的應用場景、TO B的驗證體系，用它們來測試或許會有更好的效果?！笔Y杰表示。

就這樣，騰訊強大的產品矩陣，成為了混元大模型語料訓練的“養料”，也是場景應用的“磨刀石”。至今，騰訊混元大模型擁有超千億參數規模，預訓練語料超2萬億tokens。

目前，混元大模型已經接入騰訊50多個業務并取得初步效果，包括騰訊云、騰訊廣告、騰訊游戲、騰訊金融科技、騰訊會議、騰訊文檔、微信搜一搜、QQ瀏覽器等業務和產品。這其中既包括了C端應用，也包括了B端場景，其應用和測試的體量足以比擬甚至超越國內一些先發的其他大模型。

在騰訊全球數字生態大會上，騰訊正式宣布，混元大模型將作為騰訊云MaaS服務的底座，客戶不僅可以直接通過API調用混元，也可以將混元作為基底模型，為不同產業場景構建專屬應用。

自研的底氣

慢即是快，這是騰訊長期遵循的產品哲學。少了倉促的趕場，多了扎實的自研技術和創新優勢。

全鏈路自研是騰訊混元大模型的亮點。據蔣杰介紹，騰訊混元大模型從第一個token開始從零訓練，掌握了從模型算法到機器學習框架，再到AI基礎設施的全鏈路自研技術。這其中包括大規模、高質量、多樣化的語料庫、創新的大模型算法和訓練方法、自研Angel機器學習框架、強大的算力基礎設施等。

全鏈路自研帶來的效果，是顯而易見的。舉個例子，目前生成式AI在實際場景的應用比較受限，大部分停留在高容錯、任務簡單的休閑場景，例如詩詞生成。用戶在初嘗大模型時，往往會因其炫技式的作詩或者回答腦筋急轉彎而感到驚艷，然而，對于容錯率更低或任務更復雜的工作、專業以及嚴肅場景，如客服助手、醫療診斷、調研統計等領域，往往容易出現張冠李戴、胡言亂語的問題（即大模型“幻覺”），導致用戶對準確性和可靠性的呼聲極高。

可以說，“幻覺”扼住了大模型大規模應用的“咽喉”，讓企業和個人面臨嚴肅的需求時，不敢放心使用。對此，業界往往通過知識圖譜或者搜索外掛的方式試圖解決，但效果并不理想。而騰訊混元大模型給出的方案是——不依賴外掛，在預訓練階段通過“探真”算法進行事實修正，讓混元大模型的幻覺相比主流開源大模型降低了30%至50%。

不僅是降低幻覺，騰訊混元大模型還通過強化學習的方法，讓模型學會識別陷阱問題；通過位置編碼優化，提高了超長文的處理效果和性能；提出思維鏈的新策略，讓大模型能夠像人一樣結合實際的應用場景進行推理和決策。它還能進行文學創作、文本摘要、角色扮演等內容創作，做到充分理解用戶意圖，并高效、準確地給出有時效性的答復。

CFF20LXzkOyxQib9wbKDq0USqKtXPibgV6MGfMkeOl4ibA4PXncthLtnNaKMzvjJXFctqmYfVcmEWq8m64x1WDATg.jpg

此外，騰訊還自研了機器學習框架Angel，使訓練速度相比業界主流框架提升1倍，推理速度較業界主流框架提升1.3倍。

放眼市場，有眾多的開源大模型可以提供給廠商進行疊加和使用。相反，全鏈路自研就顯得并不取巧。那么，騰訊為何堅持做自研？蔣杰有自己的答案：“首先，如果企業不從頭開始做自研的話，就缺乏對這個技術的完全掌握；第二，騰訊大模型的自研，能夠加速后續的迭代，加快與其他業務的深度結合和綁定。對于騰訊那么多海量高并發的業務來說，開源架構無法應對沖擊，對騰訊來說是并不合適的。所以我們一定要走出一條基于自主體系的研發道路?！?/span>

CFF20LXzkOyxQib9wbKDq0USqKtXPibgV64EkUkJUJvfuHAqkzBsicysEr0yScOTrhpiaO3uWgVzcSmI0YQiaQsEKEw.png

在大模型扎堆的當下，全鏈路自研給了騰訊底氣。在中國信通院《大規模預訓練模型技術和應用的評估方法》的標準符合性測試中，混元大模型共測評66個能力項，在“模型開發”和“模型能力”兩個重要領域的綜合評價均獲得了當前的最高分。在主流的評測集MMLU、CEval和AGI-eval上，混元大模型均有優異的表現，特別是在中文的理科、高考題和數學等子項上表現突出。

業務的倍增器

“我們研發大模型的目標不是在評測上獲得高分，而是將技術應用到實際場景中。騰訊將全面擁抱大模型。”蔣杰說道。這也反映了騰訊從實踐中來，到實踐中去的產品初心。

在大會上，蔣杰展示了騰訊會議、騰訊文檔、騰訊廣告等多個業務，在接入騰訊混元大模型后的實際應用情況。

其中，騰訊會議基于混元大模型打造了AI小助手，只需要簡單的自然語言指令，就能完成會議信息提取、內容分析等復雜任務，會后還能生成智能總結紀要。據實測，在指令理解、會中問答、會議摘要、會議待辦項等多個方面，混元大模型均獲得較高的用戶采納率。

例如在廣告場景，騰訊混元大模型支持智能化的廣告素材創作，能夠適應行業與地域特色，滿足千人千面的需求，實現文字、圖片、視頻的自然融合。此外，基于混元大模型的能力，廣告智能導購能夠幫助商家在企業微信等場景，提升服務質量和服務效率。

在8月的財報電話會中，騰訊總裁劉熾平表示：“就生成式AI技術，或廣泛地對于基礎模型而言，我們認為此類技術和機會并不僅局限于聊天機器人這樣的問答式體驗。從更廣泛來看，我們對AI了解越多，就越對它作為我們業務的倍增器感到期待。AI技術將有助于提高用戶交互服務的效率和質量，促進我們的廣告定位、數據定位能力，以及提升許多內容生產的效率。因此，通過持續發展生成式AI，我們將能從多個方面受益?！?/span>

在騰訊看來，混元大模型的想象空間遠不止目前呈現給公眾的效果。像人類一樣，它能持續訓練、終身學習，訓練數據集會持續更新，不斷學習更新最新知識，以改善其性能和準確性。同時，混元大模型也將為騰訊在6月發布的模型即服務（MaaS）解決方案釋放更多市場潛力。

蔣杰介紹道，騰訊9月7日發布的通用大語言模型，也將作為騰訊云MaaS服務的底座，進一步服務更多的行業客戶。不僅如此，最近，騰訊云也全面接入Llama 2、Bloom等20多個主流模型，和混元一樣，都支持直接部署調用?？蛻艨梢愿鶕嶋H需求，基于混元、基于開源模型，打造自己專屬的行業大模型。

現在，混元大模型已經不是半成品了，但按照騰訊的高標準，還達不到“成品”的程度。“我認為混元永遠在路上，現在推出的版本只是可用，但我們一直在演進我們的能力，例如從大語言模型演進到文生圖。今天只是一個開始，我希望我們每個月都會給大家驚喜。”蔣杰最后說道。

編輯|蒙錦濤