每日經濟新聞 2025-06-06 23:25:27
6月6日,在“2025智源大會”上,銀河通用創始人兼CTO王鶴表示,具身智能的當下目標是推動產業化。他指出,人形機器人需在一般性貨架24小時服務,才標志具身智能真正服務人民。對于VLA(視覺-語言-動作模型,Vision-Language-Action),王鶴認為其意義在于端到端輸出動作,規避模塊化方案問題,最適合應用在移動、抓取和放置,VLA還只是一個起點。
每經記者|李宇彤 每經編輯|馬子卿
“我覺得今天我們談具身智能,它有一個當下的目標,就是我們一定要推動具身智能的產業化。”6月6日,在“2025智源大會”上,北京銀河通用機器人有限公司(以下簡稱“銀河通用”)的創始人兼CTO(首席技術官)王鶴在會上如是說道。
而銀河通用的輪式雙臂機器人GALBOT G1也亮相現場。演示環節中,GALBOT G1在聽到指令后,開始準確地從現場搭建的商品擺放密集的貨架上,抓取對應的物品。
2023年5月,銀河通用在北京海淀創立,公司專注研發人形機器人硬件和具身智能大模型。在過去一年多時間里就完成了超12億元融資,投資方既包括美團戰投、北汽產投、商湯國香基金等戰略及產業投資方,也包括啟明創投、藍馳創投、IDG資本等明星機構。
6月1日,銀河通用正式推出自主研發的產品級端到端導航大模型TrackVLA。這是一款具備純視覺環境感知、語言指令驅動、可自主推理、具備零樣本(Zero-Shot)泛化能力的具身大模型。
在銀河通用發布的演示短片中,機器狗在大模型的加持下能夠在超市、商場以及兒童游樂區等人員和路況都較為復雜的場所穩定地跟隨前進中的母子,并且還可以幫助攜帶重物。
今年以來,具身智能一直是社會關注的焦點之一。而在北京舉行的全球首場人形機器人半程馬拉松比賽,以及5月底才剛剛在杭州落幕的機器人格斗賽都再次刷新了大眾對于人形機器人的市場預期。
對于具身智能領域,通過觀眾喜聞樂見的比賽形式讓更多人看到人形機器人只是一方面,“如何落地”才是整個產業的“必答題”。
“我覺得今天我們談具身智能,它有一個當下的目標,就是我們一定要推動具身智能的產業化。”王鶴在今日會上表示。他指出,雖然在具身智能領域看到了很多炫酷的技能,但是也一定要反思這樣的技能,是否能在新的環境、新的物品和用戶對成功率的高要求下實現。
在王鶴看來,如果人形機器人能夠在一般性的貨架進行24小時的服務,才能構成具身智能真正走向產業化,真正服務人民,創造生產力的開始。“這也是我一直談的,我們要推動人形機器人生產力時刻的到來。”
目前,銀河通用的機器人GALBOT G1已經在現實生活場景中落地。
據王鶴介紹,銀河通用的機器人已經在北京開了7家無人藥店。這些機器人可以24小時在無人藥店里撿藥,對接騎手。王鶴表示,在今年年底,銀河通用預計在北京、上海、深圳一共開100家無人藥店。王鶴也表示,希望后續的賽事可以在一些操作級別上對接起來,用賽事去引領這些有價值的、可落地的技能形成,不斷地把生態下沉下來。
而今年8月15日至8月17日,人形機器人的下一場盛會——“世界人形機器人運動會”將在國家體育場和國家速滑館舉辦。
此外,王鶴也針對近期具身智能領域的熱點——VLA(視覺-語言-動作模型,Vision-Language-Action)給出了自己的觀點。在他看來,VLA的意義在于它可以直接視覺觀測,獲得位置信息,最終這個模型端到端的輸出動作,不經過任何的中間產物。
“所以從端到端的角度上來講,(VLA)能夠真正充分地吸收數據背后的知識,讓這些(知識)發揮出最大的性能,而不會受制于一些模塊化方案中間階段的一些錯誤,(規避)要寫無窮無盡的規則標準的這些問題。”王鶴說。
而對于VLA下一步的突破方向,王鶴表示,將人類一切能做的事情都囊括進來,形成一個基座模型還是為時過早。因為人類除了視覺的輸入,還有大量的信息來自嗅覺、味覺等一系列的感官。VLA還只是一個起點,想做到人類級別的具身智能,還需要不斷地融合新的模態。
而王鶴認為當前VLA現在最適合應用的方向還是移動、抓取和放置。“這幾個技能基本上靠視覺為主,末端再加一個觸覺和力學的傳感器就能夠很好地執行。而且它面對的很多任務,在工業、商業、服務等方面都有非常廣泛的應用。”在王鶴看來,如果把這樣的VLA先做好,將見證具身智能第一次真正高峰的到來。
如需轉載請與《每日經濟新聞》報社聯系。
未經《每日經濟新聞》報社授權,嚴禁轉載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請作者與本站聯系索取稿酬。如您不希望作品出現在本站,可聯系我們要求撤下您的作品。
歡迎關注每日經濟新聞APP