每日經濟新聞
新科技

每經網首頁 > 新科技 > 正文

人工智能黎明將至?繼谷歌后百度開放四項語音技術接口

每日經濟新聞 2016-11-23 12:02:52

作為人工智能的主要技術及應用之一,語音識別是國內外科技公司都在耕耘的方向。百度公司首席科學家吳恩達甚至形容稱,“我們已經站在人工智能的黎明?!?/p>

每經編輯|趙娜    

Graywatermark.thumb_head

每經記者 趙娜

日前,百度宣布在其語音開放平臺上線三周年之際,向公眾開放四項全新語音技術接口,分別是情感合成、遠場方案、喚醒二期技術和長語音。

《每日經濟新聞》記者注意到,作為人工智能的主要技術及應用之一,語音識別是國內外科技公司都在耕耘的方向。百度公司首席科學家吳恩達甚至形容稱,“我們已經站在人工智能的黎明。”

早些時候,谷歌于今年3月宣布開放其語音識別API(應用程序編程接口)。

據了解,百度語音開放平臺日前宣布對外開放的四項技術,也可以理解為輸出解決方案,包括情感合成、遠場方案、喚醒二期技術和長語音四種。

“這些技術有很大的潛力,去徹底改變人機交互的效率和辦法。未來語音技術在很多應用場景有很好的機會,將為人機交互帶來巨大的改變。”吳恩達表示,這些技術旨在解決用戶在使用語音交互的場合時,普遍感到困擾的一些關鍵問題。例如,百度情感合成技術主要聚焦在為合成語音“加入情感”,目前可達到接近真人發聲效果。類似地,開發者還可以利用新的接口,使語音識別距離增加到3米到5米,將設備的語音喚醒率提升到95%以上,同時更省電、誤報更少,或提升長時間語音識別的準確率問題。這將為語音技術帶來遠比現在更多的想象空間,而不只是遙控電視或解鎖手機。

公開資料顯示,百度語音識別準確率已達97%。百度語音開放平臺自2013年10月上線以來,開發者數量超過14萬。

斯坦福大學人工智能專家James Landay提到,“近兩年,受益于大數據和深度學習技術的不斷發展,語音識別技術突飛猛進,速度及準確性都有了長足進步。”

值得注意的是,作為人工智能的主要技術及應用之一,語音識別是國內外科技公司都在耕耘的方向,包括蘋果、微軟、谷歌、百度、騰訊、科大訊飛和搜狗等多家公司都在這一領域發力。

“我們已經站在人工智能的黎明。”11月22日下午,吳恩達在接受包括《每日經濟新聞》在內的媒體采訪時稱,語音識別的門檻很高,除了技術復雜,數據門檻也非常高?,F階段,最難的仍是核心技術研發,如識別率提升、大數據語音合成等。百度希望通過開放相關技術,讓智能應用更易被開發。

另一方面,今年3月,谷歌在其Next云計算大會上發布面向開發者的新機器學習平臺的同時,宣布開放語音識別API,即谷歌語音搜索和語音輸入的支持技術。

記者留意到,Google Cloud SPeech API包括了80多種語言,適用于各種實時語音識別與翻譯應用。9月下旬,外媒報道稱,谷歌宣布將收購智能語音識別工具開發商API.ai,預計會整合后者的自然語言理解技術。

而就在上周的第三屆世界互聯網大會上,王小川在演講中現場演示了實時語音識別和翻譯的能力,并提到,搜索的未來就是問答機器人,隨著技術的突破,搜索引擎會自然而然演化成為問答引擎。但他也直言,盡管人工智能最重要的突破領域是在語音和圖像領域,但在文字領域的進展仍較緩慢。比如,在安靜的環境下,搜狗的語音識別準確度已經到了95%甚至97%,但一旦有噪音,準確率會迅速下降。

 

如需轉載請與《每日經濟新聞》報社聯系。
未經《每日經濟新聞》報社授權,嚴禁轉載或鏡像,違者必究。

讀者熱線:4008890008

特別提醒:如果我們使用了您的圖片,請作者與本站聯系索取稿酬。如您不希望作品出現在本站,可聯系我們要求撤下您的作品。

人工智能 語音識別

歡迎關注每日經濟新聞APP

每經經濟新聞官方APP

0

0

免费阿v网站在线观看,九九国产精品视频久久,久热香蕉在线精品视频播放,欧美中文字幕乱码视频
中文字幕日韩精品第一页 | 日韩在线不卡免费视频 | 在线亚洲精品专区人妖系列 | 亚洲一区二区三区下卡精品 | 亚洲国产一区二区三区最新 | 中文字幕亚洲男人的天堂网络 |