ChatGPT引領的大模型時代，小模型還有機會嗎？

每日經濟新聞 2023-05-19 17:13:44

◎行業大模型的價值其實不在于做這個模型，而在于怎么做數據。

每經記者蘭素英每經編輯高涵

圖片來源：主辦方供圖

隨著ChatGPT的問世，人工智能（AI）行業進入了全新的發展階段。大模型作為一種顛覆性技術，正在吸引越來越多的頭部廠商和創業者投入其中。

據花旗最新報告，保守估計生成式AI未來發展規模空間至少達100億美元，算上對云計算的加成和推動，市場增長潛力將進一步打開。

有數據顯示，今年只有1%的內容由AI生成，到2025年，這一數據將達到10%。這場狂歡背后，實際上是AI發展的一次重大飛躍，將帶來一場生產力的革命。

為何ChatGPT能成為AI發展的拐點？大模型后續的發展將呈現什么樣的趨勢？在大模型時代，中小模型將如何？

在5月17日由NVIDIA初創加速計劃和TGO鯤鵬會在成都主辦的“‘科技+資本’雙輪驅動的ChatGPT&LLM”閉門大咖會上，稀奇資本合伙人雷強生告訴《每日經濟新聞》記者，從目前來看，大模型的賽道已經擁擠不堪，機遇更傾向于頭部廠商以及有號召力的互聯網大佬，而對于更多的新入局者來說，應該在小模型和子模型層面尋找機會。

每個行業都需要大模型嗎？

以ChatGPT為代表的AI技術被視為未來十年最具顛覆性的技術。隨著ChatGPT的現象級爆紅，科技領域的創業DNA都動了。一時間，打造大模型和類ChatGPT產品成為最熱門的話題和趨勢。據統計，目前國內已有百度、阿里巴巴、華為等超過40家企業和機構發布了大模型產品或公布了大模型計劃。

為什么ChatGPT會觸發AI的拐點？

亞馬遜云科技資深解決方案架構師賀楊在會議上表示，計算能力增長、數據增長、模型復雜性是AI處于拐點的關鍵驅動因素。他解釋稱，“我們可以將ChatGPT理解為AI 2.0，與AI 1.0最本質的區別是用模型驅動任務，將海量的數據壓縮存儲到模型里面，用非監督的數據進行訓練。這樣的大模型可以支持很多重要任務，包括文本生成、歸納、提取、問答。”

毫無疑問，從GPT-3所需的參數量來看，訓練大模型需要極大的代價。單是計算和資本的投入對大多數企業來說都是難以承受之重。以OpenAI舉例來說，訓練ChatGPT除了上萬張GPU芯片的投入以外，一個月的用電量也相當于17萬家庭一年的用電量。此外，模型的性能調優也極其耗時，大概花了半年時間。

在這樣的背景下，是不是所有企業或者每個細分領域都需要大模型呢？

昆侖萬維CEO方漢認為，“所有行業現在都要干這個事兒，這是不得不干的，行業大模型的價值其實不在于做這個模型，而在于怎么做數據，這是特別苦的事情，但所有人、所有行業都應該重復這個過程。”

昆侖萬維CEO方漢圖片來源：主辦方供圖

多模態發展是共識，但不會帶來人類智慧的躍升

目前，AI正在從文本、語音、視覺等單模態智能，向著多種模態融合的通用人工智能方向發展。“基于多模態的預訓練大模型將成為人工智能基礎設施”，這一觀點已成為業內共識。建立統一的、跨場景、多任務的多模態基礎模型正在成為人工智能研究的一個關鍵課題。

總部位于硅谷的向量數據庫公司Zilliz的創始人兼CEO星爵解釋道，大模型作為一個語言模型，第一次把所有多模態、跨模態統一到一個框架，它精確描述所有意圖、所有知識，把所有模態跨模態串聯起來。他估計未來兩到三年所有的模塊都會打通。

阿里巴巴達摩院的一份報告提到，多模態預訓練模型的發展將重塑人工智能商業模式，并為人們的生產生活方式帶來積極影響。對個人而言，類似CLIP（對比語言-圖像預訓練）的多模態模型，將使更多非技術出身的人能夠表達自己的創造力，無需再借助工具和編程專業能力。

對于這點，成都普朗克科技創始人于芳表示無比贊同。她指出，對于喜歡畫畫和創造，而同時又屬于“手殘星人”的使用者來說，“多模態會賦予有創意、有想法的人‘手’和‘眼’，為其帶來無限的創作體驗，讓以前的不可能變為可能，這將是多模態給予這個時代的可能性。”

而對于企業來說，多模態預訓練模型將成為企業生產效率提升的關鍵。商業模式上，具備大數據、算力資源和模型開發能力的科技企業，將會成為模型服務的提供方，幫助企業將基礎模型的能力與生產流程融合起來，實現效率和成本最優。

雖然大模型能夠實現的很多，但昆侖萬維CEO方漢在會上提到一個有趣的觀點，即大模型并不會帶來人類智慧的提升。他表示，“人類所有的智慧都用文字記錄下來了，而現在所有的多模態圖像跟視頻的人類智慧含量特別少，高質量語料幾乎用完了。”不過，從工程角度來說，他認為，圖片跟視頻這種多模態大模型應用上就特別有價值。

大小模型未來幾年將“齊步走”

實際上，在2015年之前，小模型被認為是理解語言的“最先進的技術”。這些小模型擅長分析型任務，被用于從“預測送達時間”到“欺詐信息分類”等各類任務中。

在大模型攪動全球之后，小模型是不是就走到“末路”了？

圖片來源：主辦方供圖

星爵認為，大模型跟中小模型在未來幾年會并存。從技術層面來看，他以計算機為例來解釋，ChatGPT的通用大模型是超級計算機，而我們每個人攜帶的筆記本、手機等智能模型，是更小的模型，不需要很強的算力就能獲得很好的效果。而從業務層面分析，一定會出現資源配置更加高效的小模型，尤其細分領域的專用模型。

谷歌近日在一年一度的開發者大會上推出最新大模型PaLM 2。這款大模型有四種參數，從小到大分別為“壁虎” （Gecko），“水獺”（Otter）、“野牛”（Bison）、“獨角獸”（Unicorn）。AI產品經理、技術博客Orange's AI主理人Leo此前也對《每日經濟新聞》記者表示，這種模式非常靈活，最小模型的速度非常快，可以在手機本地運行，而GPT-4則是單一大模型，速度較慢。

站在投資人的角度，稀奇資本合伙人雷強生認為，更多的機會集中在小模型和子模型方面。

他在論壇后接受《每日經濟新聞》記者采訪時表示，“大模型賽道的主要玩家就是頭部廠商以及有號召力的互聯網大佬，例如前美團聯合創始人王慧文和創新工場董事長兼首席執行官李開復。”

在他看來，生成式AI的定位更多是一個工具，賦能其他行業降本增效，這正是小模型的機會。大模型就像是高速公路這類基礎設施，其修建需要資金實力更強的企業，但除了高速公路，社會還需要國道、省道等。

對于小模型領域的發展，他指出，“這主要集中在兩個方面：一是針對垂直類行業的小模型，二是重在提升效率等的偏工具類的小模型。”

當被問及如何選擇投資標的時，他告訴每經記者，主要分為兩類：聚焦場景化應用的老玩家以及初創企業。“老玩家擁有大量高質量的行業數據，加上新的技術方式，就會創造更豐富的應用場景以及更完善的客戶體驗，市場空間更大。”他同時強調了選擇優勢產業的重要性，“只有優勢的產業才能長出創新的機會。”

封面圖片來源：視覺中國-VCG41N1303990459

如需轉載請與《每日經濟新聞》報社聯系。
未經《每日經濟新聞》報社授權，嚴禁轉載或鏡像，違者必究。

讀者熱線：4008890008

特別提醒：如果我們使用了您的圖片，請作者與本站聯系索取稿酬。如您不希望作品出現在本站，可聯系我們要求撤下您的作品。

圖片來源：主辦方供圖隨著ChatGPT的問世，人工智能（AI）行業進入了全新的發展階段。大模型作為一種顛覆性技術，正在吸引越來越多的頭部廠商和創業者投入其中。據花旗最新報告，保守估計生成式AI未來發展規模空間至少達100億美元，算上對云計算的加成和推動，市場增長潛力將進一步打開。有數據顯示，今年只有1%的內容由AI生成，到2025年，這一數據將達到10%。這場狂歡背后，實際上是AI發展的一次重大飛躍，將帶來一場生產力的革命。為何ChatGPT能成為AI發展的拐點？大模型后續的發展將呈現什么樣的趨勢？在大模型時代，中小模型將如何？在5月17日由NVIDIA初創加速計劃和TGO鯤鵬會在成都主辦的“‘科技+資本’雙輪驅動的ChatGPT&LLM”閉門大咖會上，稀奇資本合伙人雷強生告訴《每日經濟新聞》記者，從目前來看，大模型的賽道已經擁擠不堪，機遇更傾向于頭部廠商以及有號召力的互聯網大佬，而對于更多的新入局者來說，應該在小模型和子模型層面尋找機會。每個行業都需要大模型嗎？以ChatGPT為代表的AI技術被視為未來十年最具顛覆性的技術。隨著ChatGPT的現象級爆紅，科技領域的創業DNA都動了。一時間，打造大模型和類ChatGPT產品成為最熱門的話題和趨勢。據統計，目前國內已有百度、阿里巴巴、華為等超過40家企業和機構發布了大模型產品或公布了大模型計劃。為什么ChatGPT會觸發AI的拐點？亞馬遜云科技資深解決方案架構師賀楊在會議上表示，計算能力增長、數據增長、模型復雜性是AI處于拐點的關鍵驅動因素。他解釋稱，“我們可以將ChatGPT理解為AI2.0，與AI1.0最本質的區別是用模型驅動任務，將海量的數據壓縮存儲到模型里面，用非監督的數據進行訓練。這樣的大模型可以支持很多重要任務，包括文本生成、歸納、提取、問答。” 毫無疑問，從GPT-3所需的參數量來看，訓練大模型需要極大的代價。單是計算和資本的投入對大多數企業來說都是難以承受之重。以OpenAI舉例來說，訓練ChatGPT除了上萬張GPU芯片的投入以外，一個月的用電量也相當于17萬家庭一年的用電量。此外，模型的性能調優也極其耗時，大概花了半年時間。在這樣的背景下，是不是所有企業或者每個細分領域都需要大模型呢？昆侖萬維CEO方漢認為，“所有行業現在都要干這個事兒，這是不得不干的，行業大模型的價值其實不在于做這個模型，而在于怎么做數據，這是特別苦的事情，但所有人、所有行業都應該重復這個過程。” 昆侖萬維CEO方漢圖片來源：主辦方供圖多模態發展是共識，但不會帶來人類智慧的躍升目前，AI正在從文本、語音、視覺等單模態智能，向著多種模態融合的通用人工智能方向發展。“基于多模態的預訓練大模型將成為人工智能基礎設施”，這一觀點已成為業內共識。建立統一的、跨場景、多任務的多模態基礎模型正在成為人工智能研究的一個關鍵課題。總部位于硅谷的向量數據庫公司Zilliz的創始人兼CEO星爵解釋道，大模型作為一個語言模型，第一次把所有多模態、跨模態統一到一個框架，它精確描述所有意圖、所有知識，把所有模態跨模態串聯起來。他估計未來兩到三年所有的模塊都會打通。阿里巴巴達摩院的一份報告提到，多模態預訓練模型的發展將重塑人工智能商業模式，并為人們的生產生活方式帶來積極影響。對個人而言，類似CLIP（對比語言-圖像預訓練）的多模態模型，將使更多非技術出身的人能夠表達自己的創造力，無需再借助工具和編程專業能力。對于這點，成都普朗克科技創始人于芳表示無比贊同。她指出，對于喜歡畫畫和創造，而同時又屬于“手殘星人”的使用者來說，“多模態會賦予有創意、有想法的人‘手’和‘眼’，為其帶來無限的創作體驗，讓以前的不可能變為可能，這將是多模態給予這個時代的可能性。” 而對于企業來說，多模態預訓練模型將成為企業生產效率提升的關鍵。商業模式上，具備大數據、算力資源和模型開發能力的科技企業，將會成為模型服務的提供方，幫助企業將基礎模型的能力與生產流程融合起來，實現效率和成本最優。雖然大模型能夠實現的很多，但昆侖萬維CEO方漢在會上提到一個有趣的觀點，即大模型并不會帶來人類智慧的提升。他表示，“人類所有的智慧都用文字記錄下來了，而現在所有的多模態圖像跟視頻的人類智慧含量特別少，高質量語料幾乎用完了。”不過，從工程角度來說，他認為，圖片跟視頻這種多模態大模型應用上就特別有價值。大小模型未來幾年將“齊步走” 實際上，在2015年之前，小模型被認為是理解語言的“最先進的技術”。這些小模型擅長分析型任務，被用于從“預測送達時間”到“欺詐信息分類”等各類任務中。在大模型攪動全球之后，小模型是不是就走到“末路”了？圖片來源：主辦方供圖星爵認為，大模型跟中小模型在未來幾年會并存。從技術層面來看，他以計算機為例來解釋，ChatGPT的通用大模型是超級計算機，而我們每個人攜帶的筆記本、手機等智能模型，是更小的模型，不需要很強的算力就能獲得很好的效果。而從業務層面分析，一定會出現資源配置更加高效的小模型，尤其細分領域的專用模型。谷歌近日在一年一度的開發者大會上推出最新大模型PaLM2。這款大模型有四種參數，從小到大分別為“壁虎”（Gecko），“水獺”（Otter）、“野牛”（Bison）、“獨角獸”（Unicorn）。AI產品經理、技術博客Orange'sAI主理人Leo此前也對《每日經濟新聞》記者表示，這種模式非常靈活，最小模型的速度非常快，可以在手機本地運行，而GPT-4則是單一大模型，速度較慢。站在投資人的角度，稀奇資本合伙人雷強生認為，更多的機會集中在小模型和子模型方面。他在論壇后接受《每日經濟新聞》記者采訪時表示，“大模型賽道的主要玩家就是頭部廠商以及有號召力的互聯網大佬，例如前美團聯合創始人王慧文和創新工場董事長兼首席執行官李開復。” 在他看來，生成式AI的定位更多是一個工具，賦能其他行業降本增效，這正是小模型的機會。大模型就像是高速公路這類基礎設施，其修建需要資金實力更強的企業，但除了高速公路，社會還需要國道、省道等。對于小模型領域的發展，他指出，“這主要集中在兩個方面：一是針對垂直類行業的小模型，二是重在提升效率等的偏工具類的小模型。” 當被問及如何選擇投資標的時，他告訴每經記者，主要分為兩類：聚焦場景化應用的老玩家以及初創企業。“老玩家擁有大量高質量的行業數據，加上新的技術方式，就會創造更豐富的應用場景以及更完善的客戶體驗，市場空間更大。”他同時強調了選擇優勢產業的重要性，“只有優勢的產業才能長出創新的機會。”

ChatGPT 大模型人工智能

上一篇文章

艾比森：接受長信基金等機構調研

返回每經網首頁

下一篇文章

貼心！哈工大為學生開通520領結婚證綠色通道