2025-10-11 22:33:13
生成式AI浪潮下,端側AI成智能手機技術競賽新焦點。vivo等廠商轉向開發體量更輕的端側模型,提升實用性能和功耗控制。端側模型小型化漸成行業共識,為手機消費帶來新增長契機。但安卓廠商落地端側大模型面臨兼容、內存占用和推理能力等挑戰。此外,智能體跨應用調度受限,破局關鍵在于推動行業標準建立。
每經記者|王晶 每經編輯|張益銘
在生成式AI(人工智能)席卷全球的浪潮中,智能手機正成為AI落地的關鍵陣地。從蘋果推出Apple Intelligence、三星發布Gauss(高斯)、榮耀帶來MagicGUI大模型,再到vivo的藍心大模型,端側AI正成為行業新一輪技術競賽的焦點。相比云側AI,端側AI既能保護用戶隱私、降低計算與能耗成本,還能提供類似個人助手的交互體驗。
然而,當AI從云端遷移到終端,技術與商業的難題也隨之而來。過去兩年,廠商們熱衷于將大模型直接嵌入手機操作系統,并將參數規模當成競逐的焦點。比如,vivo曾在2023年實現130億參數的“藍心大模型”在端側跑通,并讓70億參數模型在端側落地。
然而在今年10月10日舉辦的vivo開發者大會上,vivo副總裁、vivo AI全球研究院院長周圍給出了一個新的發展方向——放棄對“通用人工智能”的追逐,轉而推出體量更輕的3B端側多模態推理大模型,該模型僅占用手機2GB內存、功耗約750毫安,卻能在推理能力上超過此前的7B甚至10B模型,性能接近云端模型。“做千億級模型需要兩萬卡以上的集群,光設備投入就20多億元,這還不包括每年數億元的電費。‘卷’通用人工智能不太現實。”
vivo副總裁周圍 企業供圖
事實上,端側模型的小型化正逐漸成為行業共識。蘋果的Apple Intelligence同樣采用30億參數的設計,可以在設備上完成文本摘要、信息提取與跨應用操作等任務。這意味著,廠商們正在從“堆參數、拼算力”的競爭,轉向關注模型在端側實用性能、功耗控制的理性階段。
端側大模型落地后,越來越多消費者開始應用大模型,這也有望為手機消費帶來新的增長契機。華福證券在研報中稱,端側大模型將成為消費電子品牌廠商提升個性化用戶體驗,打造產品差異化競爭力的重要方向,具備更強AI能力的終端新品推出或將帶動消費電子見底復蘇。
在vivo AI產品總經理關巖冰看來,真正實現個人化智能的核心在于端側。“只有端側模型才能實時分析用戶的數據、洞察需求,感知屏幕內容、理解使用意圖等。”這也正是蘋果在“Apple Intelligence”中強調的方向,即在端側完成敏感數據處理,保障隱私,同時提供個性化服務。然而,與蘋果封閉的體系不同,安卓陣營的廠商在落地端側大模型時要面臨眾多挑戰。
“云端模型的CPU通常基于X86架構,而手機上是ARM的內核,此外還要兼容不同芯片廠的NPU指令集,如何把原來生態里指令集轉成手機上的指令集,這里最大的障礙是算子。”周圍說道。據他介紹,vivo早在2017年便在美國設立AI研究院,組建專門的算子團隊,目前該團隊已擴展至幾十人,聚焦把模型轉成端側化的過程。
算子之外,內存占用同樣是制約端側大模型落地的關鍵瓶頸。周圍舉例稱:“以往7B模型需要占用3.5G內存,而8G手機是中高端機型的主要配置,一個大模型就占掉4個G內存,一下讓高端機變成了低端機。”推理能力則是另一個挑戰。例如,執行一個查詢任務:“幫我找今天下午4點北京到深圳的機票哪一個最便宜”,實際會涉及幾個App比價、分析使用習慣等復雜問題。“去年的70億參數模型只能做簡單的任務拆解,不能做復雜的推理。”周圍說道。
過去一年vivo針對這些問題進行了優化。vivo推出的3B端側多模態推理大模型只占2G內存,不影響高端機的性能,其次增強了推理能力,可在手機中做意圖中控和任務拆解的中臺。“今年30億參數的模型已比去年100億參數的模型更強,甚至在部分任務中與云端模型差距僅在2%~3%之間。”周圍說道。這意味著,在文本摘要、多輪對話、意圖識別等場景中,端側模型已具備實用價值。
隨著端側算力提升和操作系統AI化,手機中原有的語音助手逐漸向具備執行能力的“智能體”演進——它不再局限于回答提問,而是被賦予更強的意圖理解與任務執行能力。廠商希望其能成為真正意義上的個人助理,完成諸如“幫我訂一杯拿鐵,少冰”這類需要調用外部服務、理解上下文并執行多步操作的實際任務。
目前AI手機智能助手調用第三方App,主要有兩條技術路線:一是通過意圖框架實現。通過API(應用程序編程接口)調用應用,實現跨應用功能。具體來說,就是手機廠商與App開發企業協商、以合法API的形式接入;二是“純視覺方案”,無需第三方App同意,直接調用安卓系統的無障礙等系統級權限。具體做法是,安卓手機廠商以多模態大模型技術配合無障礙權限,先讀取屏幕內容,再以模擬用戶點擊的方式代替用戶操作,實現手機智能助手代替用戶接管手機,以達到調用App功能的目的。
“用戶用手機,手機廠商只占了15%的時長,還有85%的時長是用于開發者提供服務,特別是頭部的互聯網廠商,又在這85%中占了70%~80%,他們的參與度非常高。”周圍說道。這也導致智能體在跨應用調度服務時處處受限,互聯網巨頭掌握著絕大多數用戶服務接口和數據,而手機廠商掌握著操作系統與硬件能力。雙方在安全授權、用戶隱私和收益分配上的界限尚未明晰。
周圍坦言:“當手機的智能體要做任務的時候,我們只能做自己的功能和應用,比如是否流暢、調亮度、連Wi-Fi等,如果想跨應用操作,還需要和對方(互聯網廠商)討論安全授權的標準。”
在他看來,破局的關鍵在于推動行業標準的建立。“我們無法避免地要做用戶習慣和服務的分發,接下來的策略是建好能力,其次,愿意跟我們握手、合作的,就坐下來商量。AI時代到來,是否需要一個新的江湖地位和影響力,就留給時間來回答。”
封面圖片來源:企業供圖
如需轉載請與《每日經濟新聞》報社聯系。
未經《每日經濟新聞》報社授權,嚴禁轉載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請作者與本站聯系索取稿酬。如您不希望作品出現在本站,可聯系我們要求撤下您的作品。
歡迎關注每日經濟新聞APP