-
訊飛劉慶峰:今天,中國的大模型底座能力到底怎么樣?
推動(dòng)萬物互聯(lián)時(shí)代人機(jī)交互革命
我們觀察到GPT-4o的發(fā)布,全世界都在進(jìn)一步關(guān)注語音,其實(shí)在去年11月份的時(shí)候,Whisper已經(jīng)發(fā)了他們OpenAI的整體語音技術(shù),并把語音做成一個(gè)非常重要的方向。最近蘋果的手機(jī)大家也看到了語音技術(shù)的進(jìn)步,手機(jī)廠商對(duì)語音技術(shù)進(jìn)一步產(chǎn)生了更大的關(guān)注,而且要用它來改變所有人機(jī)交互的方式。
人類社會(huì)進(jìn)入到了萬物智能互聯(lián)的時(shí)代,越來越多的設(shè)備沒有屏幕,離我們幾米之外,不方便用鍵盤,不方便觸摸。在越來越多的時(shí)候,我們需要更自然的人機(jī)對(duì)話,用戶才能夠得到更好地體驗(yàn),更迅速地學(xué)習(xí),獲得相關(guān)生活中的幫助,我們更需要語音。
星火語音大模型再次升級(jí),會(huì)使得萬物互聯(lián)時(shí)代下人機(jī)交互的革命進(jìn)一步落得更透,這也是科大訊飛在1999年創(chuàng)業(yè)時(shí)就提出來了要實(shí)現(xiàn)人機(jī)信息溝通的無障礙。過去10年,從深度神經(jīng)網(wǎng)絡(luò)出臺(tái)之后,科大訊飛一直引領(lǐng)著語音技術(shù)的發(fā)展。我們是全世界第一個(gè)讓語音識(shí)別超過了專業(yè)速記員水平的公司,像這種會(huì)議轉(zhuǎn)寫的情況,機(jī)器翻譯超過了99%的大學(xué)六級(jí)考生,通過了國家翻譯師資格考試;個(gè)性化語音合成也給央視的節(jié)目進(jìn)行配音;我們的多語種技術(shù)在2020年代表中國,在美國把訊飛列入實(shí)體清單之后,對(duì)中國極限施壓的背景下,多語種技術(shù)依然保持了全球領(lǐng)先,解決了我們的汽車、手機(jī)、智能家居等出海“卡脖子”問題。
我們非常榮幸在幾天前獲得了國家科技進(jìn)步獎(jiǎng)一等獎(jiǎng),這也是中國人工智能領(lǐng)域在深度神經(jīng)網(wǎng)絡(luò)之后的第一個(gè)國家科技進(jìn)步獎(jiǎng)一等獎(jiǎng),當(dāng)然也有中國科學(xué)技術(shù)大學(xué)、清華大學(xué)、華為、中國移動(dòng)等合作伙伴共同努力的結(jié)果。
技術(shù)進(jìn)一步發(fā)展使得我們?cè)谌f物互聯(lián)時(shí)代的人機(jī)交互標(biāo)準(zhǔn)被重新定義,它應(yīng)該要實(shí)現(xiàn)多語言多方言的交互,在遠(yuǎn)距離、高噪音場(chǎng)合下也能夠識(shí)別,能夠全雙工隨時(shí)隨地可以打斷,可以支持多模態(tài),語音、手勢(shì)、嘴型等結(jié)合。大家關(guān)注的Open AI發(fā)布的GPT-4o中最重要的一個(gè)全雙工功能,實(shí)際上使用的是科大訊飛2020年就在國際會(huì)議上提出來,在去年5月正式發(fā)布的國際標(biāo)準(zhǔn)。
目前,我們的語音識(shí)別在最主流的語種上已經(jīng)繼續(xù)保持了全球領(lǐng)先,這是多語種多方言免切換的演示,在相對(duì)安靜的手機(jī)等各種場(chǎng)景下,還有更極限的場(chǎng)合,例如強(qiáng)干擾情況下“雞尾酒會(huì)”的語音識(shí)別場(chǎng)景都能進(jìn)行識(shí)別。
伴隨著技術(shù)的最新進(jìn)步,我們也有個(gè)專門的訊飛同傳軟硬一體的翻譯系統(tǒng),這個(gè)系統(tǒng)戴上去,我在上面講話,你聽到的就是英語,當(dāng)然我們還有更多語種。同時(shí),這個(gè)翻譯系統(tǒng)是軟硬一體化的,我在后臺(tái)講話,通過語音識(shí)別、翻譯、語音合成,每個(gè)人戴著耳機(jī)就可以聽到,從而實(shí)現(xiàn)大會(huì)同傳、展廳同傳以及各種旅游同傳。一個(gè)人講話所有人聽,我們還會(huì)推出軟硬一體化的設(shè)備,讓各種語言混雜在一起可以隨意開會(huì),要把整個(gè)軟件和硬件結(jié)合在一起,來解決現(xiàn)在社會(huì)的剛需。
將來,我們?nèi)粘5臋C(jī)器人進(jìn)入到各種高噪音環(huán)境下,在各種各樣的服務(wù)場(chǎng)景下,有這樣的能力,我們就不怕機(jī)器聽不懂了。語音識(shí)別進(jìn)入到規(guī)模化使用,當(dāng)年我們?cè)谑謾C(jī)輸入法上,在全球率先提出手機(jī)語音聽寫時(shí)代開始到來,它的標(biāo)志是85%以上的準(zhǔn)確率,到89%就可以全面使用了,現(xiàn)在我們的識(shí)別中,兩個(gè)人混疊場(chǎng)景準(zhǔn)確率已經(jīng)到了91%,遠(yuǎn)超國際競(jìng)品,三混疊場(chǎng)景準(zhǔn)確率更是完全不一樣,我們準(zhǔn)確率已經(jīng)到了85%以上,但其他的只有20%多。在-5dB的高噪場(chǎng)景,噪音已經(jīng)比我們?nèi)酥v話還要高不少的情況下,我們依然能做到90%以上的準(zhǔn)確率。
因?yàn)檫@些技術(shù)進(jìn)步,我們從去年底到今年的國際連續(xù)最權(quán)威的語音識(shí)別比賽,一個(gè)是國際多通道語音分離和識(shí)別大賽CHiME-7,我們繼續(xù)拿了全球第一;另一個(gè)是今年的上半年國際聲學(xué)、語音和信號(hào)處理會(huì)議ICASSP 2024(International Conference on Acoustics, Speech, and Signal Processing)的旗艦賽事——國際車載多通道語音識(shí)別挑戰(zhàn)賽(In-Car Multi-Channel Automatic Speech Recognition Challenge,ICMC-ASR) ,科大訊飛是全球第一,這個(gè)不是中文的,是英文和多語種的比賽。
今天,我們的語音交互已經(jīng)搭載了5700多萬輛的汽車,去年中國500多萬輛汽車出海,成為中國出海的“新三樣”,其中的多語種智能語音技術(shù)幾乎全是科大訊飛提供的。不僅僅是語音,我們還將語音與大模型結(jié)合,與紅旗、奇瑞、廣汽合作,包括最近又和一汽簽訂了戰(zhàn)略合作協(xié)議,越來越多的車企開始用我們“能聽會(huì)說、能理解會(huì)思考”的汽車方案。
- 責(zé)任編輯: 沐梵 
-
專稿|任正非說的“鹽堿地”,中國光伏的希望田野
2024-06-28 09:50 -
OpenAI終止對(duì)中國提供API服務(wù),周鴻祎發(fā)聲
2024-06-26 13:53 人工智能 -
首次!我國科學(xué)家實(shí)現(xiàn)獼猴全腦尺度神經(jīng)活動(dòng)監(jiān)測(cè)
2024-06-25 18:20 科技前沿 -
習(xí)近平代表黨中央、國務(wù)院和中央軍委致電祝賀
2024-06-25 14:50 航空航天 -
專稿|不顧一切的脫鉤:美國國會(huì)為何瞄準(zhǔn)這家中國企業(yè)
2024-06-25 09:54 -
2023年度國家科學(xué)技術(shù)獎(jiǎng)勵(lì)名單公布
2024-06-24 17:46 -
“NASA和波音早就知道這個(gè)問題,但仍發(fā)射了火箭”
2024-06-24 16:23 -
李德仁、薛其坤獲2023國家最高科技獎(jiǎng)
2024-06-24 10:32 科技前沿 -
我國科研人員在月壤樣本中首次發(fā)現(xiàn)天然石墨烯
2024-06-24 09:19 嫦娥奔月 -
我國重復(fù)使用運(yùn)載火箭首次10公里級(jí)垂直起降飛行試驗(yàn)成功
2024-06-23 14:58 航空航天 -
純度達(dá)99.9%!中國團(tuán)隊(duì)實(shí)現(xiàn)海上風(fēng)電驅(qū)動(dòng)海水制氫
2024-06-23 08:07 觀察者頭條 -
全球首臺(tái)!這一重要裝備研制成功
2024-06-22 13:09 中國精造 -
專稿丨鴻蒙與安卓徹底切割,未來勝算幾何?
2024-06-21 19:35 華為 -
“加拿大決定跟,但也怕…”
2024-06-21 18:08 -
中國科學(xué)家發(fā)現(xiàn)治療免疫性血小板減少癥突破性新療法
2024-06-21 07:27 -
2024世界人工智能大會(huì)7月4日開幕,特色亮點(diǎn)搶先看!
2024-06-20 16:00 2024世界人工智能大會(huì) -
我國首個(gè)工業(yè)用途核能供汽項(xiàng)目正式建成投產(chǎn)
2024-06-19 15:17 能源戰(zhàn)略 -
“千里眼”最大“角膜”:相當(dāng)于把北京五環(huán)內(nèi)地面平整到高低差小于1毫米
2024-06-19 09:10 中國精造 -
全球首臺(tái)全高溫超導(dǎo)托卡馬克裝置在上海建成運(yùn)行
2024-06-19 08:15 -
“美國在核電技術(shù)上落后中國10-15年”
2024-06-18 16:42
相關(guān)推薦 -
“訓(xùn)練成本才這么點(diǎn)?美國同行陷入自我懷疑” 評(píng)論 23中美高層本月頻繁互動(dòng),什么信號(hào)? 評(píng)論 64“為跟中方談,特朗普拒批4億美元對(duì)臺(tái)軍援” 評(píng)論 113特朗普碰瓷:奪回阿富汗空軍基地,離中國太近 評(píng)論 272“歐洲‘失控’:從英國到波蘭,執(zhí)政無力已成常態(tài)” 評(píng)論 146最新聞 Hot
-
“訓(xùn)練成本才這么點(diǎn)?美國同行陷入自我懷疑”
-
主謀已落網(wǎng)
-
簽了!“中國發(fā)動(dòng)機(jī)替代德國產(chǎn)品”
-
“對(duì)農(nóng)民來說,無異于千刀萬剮!好好和中國談吧”
-
印媒越吹越離譜:陣風(fēng)領(lǐng)先殲-35A...
-
白宮AI顧問急了:這正中華為下懷,居心何在?
-
“為跟中方談,特朗普拒批4億美元對(duì)臺(tái)軍援”
-
針對(duì)個(gè)別“反華”集會(huì),韓總理緊急指令
-
日本空自一架搜救機(jī)降落時(shí)沖出跑道,暫無人員傷亡
-
獨(dú)山縣委書記李景寬任上被查
-
特朗普碰瓷:奪回阿富汗空軍基地,離中國太近
-
熱搶!部分民營(yíng)銀行大額存單,年化利率超2%
-
美財(cái)長(zhǎng):人民幣匯率對(duì)歐洲是個(gè)事,對(duì)我們不是
-
“嘎子哥”謝孟偉抖音、快手賬號(hào)均被封禁
-
柯克遭槍擊前去了日韓,挑唆“擺脫中國”
-
“索要千萬逼死前夫”,翟欣欣一審被判12年
-