每日經濟新聞
要聞

每經網首頁 > 要聞 > 正文

海天瑞聲推千萬輪對話語料庫 7.9億定增募資擬投向AI大模型訓練數據集建設等項目

每日經濟新聞 2023-07-28 13:03:12

每經記者|可楊    每經編輯|文多    

7月27日,海天瑞聲宣布正式推出「中文千萬輪對話語料庫DOTS-NLP-216」。

海天瑞聲方面分析認為,當前在中文對話領域,公開的數據集往往量少、分布有偏、價格昂貴甚至不能商用。導致一些大模型在中文對話方面的能力,相比英文對話略遜一籌。尤其是在一些需要比較深的中文語言理解能力的對話場景,無論開源的還是閉源的大模型,都往往表現不佳。

海天瑞聲方面表示,真實場景采集,符合中文表達習慣的自然對話數據,將為中文大語言模型(LLM)帶來新動能。

據海天瑞聲方面介紹,此次發布的數據集,是一個符合中國人表達習慣的自然對話數據集,共計約1000萬輪,上億級token(標記)。

此前,海天瑞聲發布公告稱,擬定增募資不超過7.9億元,其中,3.83億元計劃用于“AI大模型訓練數據集建設項目”,4.07億元計劃投向“數據生產垂直大模型研發項目”。

海天瑞聲在公告中表示,在人工智能產業進入以大模型為代表的新的發展時期,通過本次募投項目的實施,公司將建設一批適用性較強的大模型訓練數據集,拓展潛在高增長價值的新型業務板塊,并藉此進一步擴大公司業務規模;同時,以研發海天瑞聲數據生產垂直大模型為核心,升級海天瑞聲一體化技術支撐平臺,研發并引入多項新興技術,促進公司科技創新水平的不斷提升,鞏固公司的核心技術壁壘,構建長期技術實力支撐,從而進一步增強公司核心競爭力。

如需轉載請與《每日經濟新聞》報社聯系。
未經《每日經濟新聞》報社授權,嚴禁轉載或鏡像,違者必究。

讀者熱線:4008890008

特別提醒:如果我們使用了您的圖片,請作者與本站聯系索取稿酬。如您不希望作品出現在本站,可聯系我們要求撤下您的作品。

海天瑞聲 IT服務 北京市 數據要素 人臉識別 數據

歡迎關注每日經濟新聞APP

每經經濟新聞官方APP

0

0

免费阿v网站在线观看,九九国产精品视频久久,久热香蕉在线精品视频播放,欧美中文字幕乱码视频
亚洲视频在线看 | 亚洲新福利92 | 亚洲天堂午夜影院中文字幕 | 日本v片免费一区二区三区 日韩美女黄大片在线观看 日韩AⅤ午夜在线观看 | 亚洲高清国产免费大片 | 亚洲精品在线免费 |