當(dāng)前位置：首頁(yè) > 汽車 >

更快更聰明更懂你解讀長(zhǎng)城汽車全新一代Coffee OS智能座艙系統(tǒng)語(yǔ)音助手

2023-03-07 17:38:55 來(lái)源: 作者: 【大中小】瀏覽:5661次評(píng)論:0條

隨著智能時(shí)代的到來(lái)，語(yǔ)音已經(jīng)成為人機(jī)交互的主要途徑之一，手機(jī)語(yǔ)音助手、車載語(yǔ)音助手、智能音箱、語(yǔ)音搜索……在日常生活中語(yǔ)音交互無(wú)所不在。而語(yǔ)音交互對(duì)于智能汽車更是有著獨(dú)特的優(yōu)勢(shì)，隨著智能化的發(fā)展，車機(jī)功能越來(lái)越多，實(shí)體按鍵越來(lái)越少，交互邏輯更加復(fù)雜，找一個(gè)功能可能要通過(guò)多級(jí)菜單，不僅給用戶帶來(lái)很多不便，甚至還會(huì)嚴(yán)重威脅駕駛安全，而通過(guò)語(yǔ)音交互可以幫助駕駛者降低手動(dòng)操作頻率，有效提升駕駛安全性。目前語(yǔ)音交互已經(jīng)成為汽車座艙智能化的標(biāo)志性代表，與車內(nèi)多種應(yīng)用相結(jié)合，成為座艙生態(tài)構(gòu)建的核心功能。

那么語(yǔ)音交互到底是怎么實(shí)現(xiàn)的呢？

假設(shè)我們對(duì)語(yǔ)音助手說(shuō)“播放陳奕迅的《孤勇者》”。語(yǔ)音助手會(huì)說(shuō)“好的，馬上為你播放陳奕迅的《孤勇者》”，并且開始播放音樂。在這個(gè)過(guò)程中，語(yǔ)音助手首先把聽到的聲音轉(zhuǎn)化成文字，然后再理解文字所表達(dá)的內(nèi)容，最后做出相應(yīng)策略，并把相應(yīng)策略轉(zhuǎn)化成語(yǔ)音。因此語(yǔ)音交互主要分為三個(gè)模塊：

語(yǔ)音識(shí)別：簡(jiǎn)稱ASR，是將聲音轉(zhuǎn)化成文字的過(guò)程，相當(dāng)于耳朵。

自然語(yǔ)言處理：簡(jiǎn)稱NLP，是理解和處理文本的過(guò)程，相當(dāng)于大腦。

語(yǔ)音合成：簡(jiǎn)稱TTS，是把文本轉(zhuǎn)化成語(yǔ)音的過(guò)程，相當(dāng)于嘴巴。

長(zhǎng)城汽車以“自研+合作”的研發(fā)模式，圍繞ASR、NLP、TTS三個(gè)關(guān)鍵環(huán)節(jié)，開展云端和車端的全鏈路語(yǔ)音算法研發(fā)，搭建高度靈活的語(yǔ)音交互技術(shù)平臺(tái)，構(gòu)建行業(yè)突出的語(yǔ)音能力，讓語(yǔ)音識(shí)別更精準(zhǔn)、語(yǔ)境分析更合理、語(yǔ)義理解更自然。同時(shí)積極引入業(yè)界領(lǐng)先的專業(yè)伙伴深度共創(chuàng)語(yǔ)音生態(tài)，實(shí)現(xiàn)多服務(wù)融合，在多模交互、情感化溝通和場(chǎng)景化交互等方面持續(xù)突破。此外，近日長(zhǎng)城汽車官宣正式成為百度文心一言首批先行體驗(yàn)官。將通過(guò)百度Apollo融合文心一言的全面能力，攜手打造基于智能汽車場(chǎng)景的大模型人工智能交互，開啟人工智能時(shí)代的汽車全新體驗(yàn)。

近日最新上市的哈弗二代大狗可謂是長(zhǎng)城汽車語(yǔ)音能力的集大成者，搭載了長(zhǎng)城汽車全新一代Coffee OS智能座艙系統(tǒng)，具備比肩新勢(shì)力旗艦車型的語(yǔ)音交互能力，超極速、更便捷，讓對(duì)話0焦慮、更自然。

極致響應(yīng)：行業(yè)第一梯隊(duì)的語(yǔ)音交互速度，喚醒速度只有250ms，喚醒率成功率高達(dá)95%; 車控技能毫秒級(jí)響應(yīng)（900ms），其他在線技能響應(yīng)速度1300ms。

可見即可說(shuō)：可見即可說(shuō)、支持分詞、泛化，能夠靈活使用，簡(jiǎn)單的說(shuō)就是只需說(shuō)出屏幕的文字，就能夠?qū)崿F(xiàn)相關(guān)功能的控制，看到什么說(shuō)什么，簡(jiǎn)單易用。全新一代Coffee OS的語(yǔ)音助手，能夠支持940余條語(yǔ)音指令，覆蓋車控車設(shè)、系統(tǒng)設(shè)置、導(dǎo)航、多媒體等各種模塊。

3. 一句多意圖：指的是一句話可以發(fā)出多個(gè)連續(xù)指令，最多可以支持十個(gè)指令。例如可以說(shuō)：“你好小哈，關(guān)閉天窗、關(guān)閉左側(cè)車窗、打開空調(diào)、打開座椅加熱、打開座椅按摩……“

4. 口語(yǔ)化指令：不局限于傳統(tǒng)的固定指令，能夠識(shí)別豐富的指令內(nèi)容，即使是口語(yǔ)化的表達(dá)也能實(shí)現(xiàn)語(yǔ)音控制。例如說(shuō)“我好熱“，語(yǔ)音助手接受指令后，會(huì)主動(dòng)打開空調(diào)、降低空調(diào)溫度等。

5. 多人拒識(shí)：當(dāng)主駕/副駕喚醒語(yǔ)音助手后，其他乘客在車上閑聊、打電話甚至唱歌，都不會(huì)影響語(yǔ)音交互，語(yǔ)音助手只識(shí)別喚醒者的聲音和指令。

6. 信息查詢：支持二十余種信源查詢，包括查詢天氣、酒店、餐廳，股票，百科，火車票機(jī)票，垃圾分類等。

7. 聲音復(fù)刻：用戶在手機(jī)APP通過(guò)少量的錄音，訓(xùn)練得到音色和發(fā)音風(fēng)格與錄音非常相似的聲音模型，可以直接應(yīng)用到車機(jī)上進(jìn)行語(yǔ)音播報(bào)。例如可以讓孩子通過(guò)手機(jī)錄入聲音，然后將其應(yīng)用到車機(jī)，這樣孩子的聲音就可以全天候陪伴

另外長(zhǎng)城汽車語(yǔ)音助手更是富有情感的陪聊專家，可以跟乘客閑聊、講故事、說(shuō)笑話等，甚至還可以跟一起玩成語(yǔ)接龍、飛花令等游戲。