隨著智能時代的到來,語音已經(jīng)成為人機交互的主要途徑之一,手機語音助手、車載語音助手、智能音箱、語音搜索……在日常生活中語音交互無所不在。而語音交互對于智能汽車更是有著獨特的優(yōu)勢,隨著智能化的發(fā)展,車機功能越來越多,實體按鍵越來越少,交互邏輯更加復雜,找一個功能可能要通過多級菜單,不僅給用戶帶來很多不便,甚至還會嚴重威脅駕駛安全,而通過語音交互可以幫助駕駛者降低手動操作頻率,有效提升駕駛安全性。目前語音交互已經(jīng)成為汽車座艙智能化的標志性代表,與車內多種應用相結合,成為座艙生態(tài)構建的核心功能。
那么語音交互到底是怎么實現(xiàn)的呢?
假設我們對語音助手說“播放陳奕迅的《孤勇者》”。語音助手會說“好的,馬上為你播放陳奕迅的《孤勇者》”,并且開始播放音樂。在這個過程中,語音助手首先把聽到的聲音轉化成文字,然后再理解文字所表達的內容,最后做出相應策略,并把相應策略轉化成語音。因此語音交互主要分為三個模塊:
語音識別:簡稱ASR,是將聲音轉化成文字的過程,相當于耳朵。
自然語言處理:簡稱NLP,是理解和處理文本的過程,相當于大腦。
語音合成:簡稱TTS,是把文本轉化成語音的過程,相當于嘴巴。
長城汽車以“自研+合作”的研發(fā)模式,圍繞ASR、NLP、TTS三個關鍵環(huán)節(jié),開展云端和車端的全鏈路語音算法研發(fā),搭建高度靈活的語音交互技術平臺,構建行業(yè)突出的語音能力,讓語音識別更精準、語境分析更合理、語義理解更自然。同時積極引入業(yè)界領先的專業(yè)伙伴深度共創(chuàng)語音生態(tài),實現(xiàn)多服務融合,在多模交互、情感化溝通和場景化交互等方面持續(xù)突破。此外,近日長城汽車官宣正式成為百度文心一言首批先行體驗官。將通過百度Apollo融合文心一言的全面能力,攜手打造基于智能汽車場景的大模型人工智能交互,開啟人工智能時代的汽車全新體驗。
近日最新上市的哈弗二代大狗可謂是長城汽車語音能力的集大成者,搭載了長城汽車全新一代Coffee OS智能座艙系統(tǒng),具備比肩新勢力旗艦車型的語音交互能力,超極速、更便捷,讓對話0焦慮、更自然。
極致響應:行業(yè)第一梯隊的語音交互速度,喚醒速度只有250ms,喚醒率成功率高達95%; 車控技能毫秒級響應(900ms),其他在線技能響應速度1300ms。
可見即可說:可見即可說、支持分詞、泛化,能夠靈活使用,簡單的說就是只需說出屏幕的文字,就能夠實現(xiàn)相關功能的控制,看到什么說什么,簡單易用。全新一代Coffee OS的語音助手,能夠支持940余條語音指令,覆蓋車控車設、系統(tǒng)設置、導航、多媒體等各種模塊。
3. 一句多意圖:指的是一句話可以發(fā)出多個連續(xù)指令,最多可以支持十個指令。例如可以說:“你好小哈,關閉天窗、關閉左側車窗、打開空調、打開座椅加熱、打開座椅按摩……“
4. 口語化指令:不局限于傳統(tǒng)的固定指令,能夠識別豐富的指令內容,即使是口語化的表達也能實現(xiàn)語音控制。例如說“我好熱“,語音助手接受指令后,會主動打開空調、降低空調溫度等。
5. 多人拒識:當主駕/副駕喚醒語音助手后,其他乘客在車上閑聊、打電話甚至唱歌,都不會影響語音交互,語音助手只識別喚醒者的聲音和指令。
6. 信息查詢:支持二十余種信源查詢,包括查詢天氣、酒店、餐廳,股票,百科,火車票機票,垃圾分類等。
7. 聲音復刻:用戶在手機APP通過少量的錄音,訓練得到音色和發(fā)音風格與錄音非常相似的聲音模型,可以直接應用到車機上進行語音播報。例如可以讓孩子通過手機錄入聲音,然后將其應用到車機,這樣孩子的聲音就可以全天候陪伴
另外長城汽車語音助手更是富有情感的陪聊專家,可以跟乘客閑聊、講故事、說笑話等,甚至還可以跟一起玩成語接龍、飛花令等游戲。
Copyright@2010-2013 ALL Right Reserved 鄂ICP備10201977號
關于我們 招商合作 聯(lián)系我們 免責申明 網(wǎng)站地圖 意見反饋 友情鏈接 戰(zhàn)略聯(lián)盟
客服電話
4000-888-943
7*24小時客戶服務
15527575559