智能語(yǔ)音技術(shù)是人工智能應(yīng)用最廣泛的技術(shù)之一,在眾多的人工智能產(chǎn)品中應(yīng)用,此技術(shù)可以減少設(shè)備操作的學(xué)習(xí)成本,讓智能設(shè)備聽(tīng)懂人類(lèi)的自然語(yǔ)言從而更便捷地滿(mǎn)足用戶(hù)的需求。
智能聲學(xué)傳感器方案是一種邊緣計(jì)算的解決方案,可以解決傳統(tǒng)云計(jì)算模式下存在的高延遲、受限于網(wǎng)絡(luò)穩(wěn)定性等問(wèn)題,將語(yǔ)音處理程序放置在靠近用戶(hù)和語(yǔ)音數(shù)據(jù)收集點(diǎn)的位置,通過(guò)本地化語(yǔ)音處理,實(shí)現(xiàn)離線語(yǔ)音喚醒及控制。由于無(wú)需聯(lián)網(wǎng),語(yǔ)音處理和反饋的時(shí)間較短,因此語(yǔ)音交互時(shí)客戶(hù)感覺(jué)不到明顯的延遲,用戶(hù)體驗(yàn)較好。
歌爾微作為MEMS聲學(xué)傳感器行業(yè)龍頭企業(yè),深耕MEMS聲學(xué)傳感器新技術(shù)研究,在智能聲學(xué)傳感器技術(shù)方面取得突破,研發(fā)出了集成AI語(yǔ)音芯片的智能聲學(xué)傳感器產(chǎn)品。該產(chǎn)品是在傳統(tǒng)MEMS聲學(xué)傳感器基礎(chǔ)上引入AI語(yǔ)音芯片,將語(yǔ)音信號(hào)采集部分和語(yǔ)音信號(hào)處理單元集成在一起的新型聲學(xué)傳感器,借助于語(yǔ)音芯片強(qiáng)大的信號(hào)處理能力,在器件本體實(shí)現(xiàn)語(yǔ)音喚醒、語(yǔ)音識(shí)別、事件檢測(cè)等自主功能。該方案為應(yīng)用系統(tǒng)提供一種靈活的低功耗集成化語(yǔ)音解決方案。
歌爾微為客戶(hù)推出的智能聲學(xué)傳感器優(yōu)點(diǎn)十分突出。其采用優(yōu)化的專(zhuān)用AI語(yǔ)音處理芯片,達(dá)到超低的運(yùn)行功耗,其支持?jǐn)?shù)字信號(hào)輸出的智能聲學(xué)傳感器的總體監(jiān)聽(tīng)功耗小于0.5mW,達(dá)到與傳統(tǒng)數(shù)字式MEMS聲學(xué)傳感器相當(dāng)。同時(shí),通過(guò)疊片式集成封裝技術(shù),將AI語(yǔ)音處理芯片封裝進(jìn)了聲學(xué)傳感器的內(nèi)部,實(shí)現(xiàn)了小尺寸的效果,其集成尺寸可以達(dá)到與傳統(tǒng)MEMS聲學(xué)傳感器相當(dāng)。MEMS聲學(xué)傳感器收集到的音頻信號(hào)無(wú)需向外部網(wǎng)絡(luò)傳遞,直接在器件本體內(nèi)AI語(yǔ)音處理芯片中進(jìn)行信號(hào)處理,該本地化的處理方式使語(yǔ)音交互的延遲降低到0.5s之內(nèi),大大提升了用戶(hù)體驗(yàn)。
其采用了AI語(yǔ)料訓(xùn)練的技術(shù),語(yǔ)音命令的識(shí)別率高。
語(yǔ)音交互是人與人之間最自然的交互方式,其使用的門(mén)檻低,幾乎不需要額外學(xué)習(xí),也不需要設(shè)置額外的遙控器,可以解放雙手進(jìn)行遠(yuǎn)距離、無(wú)接觸式的控制,這在設(shè)備的控制應(yīng)用上具有天然的優(yōu)勢(shì)。尤其在全球疫情的背景之下,非接觸式的控制更是一種較為安全選擇。在智能設(shè)備的語(yǔ)音喚醒或命令的應(yīng)用中,命令詞可根據(jù)客戶(hù)的需求進(jìn)行訓(xùn)練,識(shí)別率可達(dá)到95%及以上,誤識(shí)別指標(biāo)可達(dá)到≤2次/24H。可以廣泛適用于燈具、空調(diào)、風(fēng)扇等智能家電設(shè)備,TWS、智能手表、VR/AR等穿戴設(shè)備,以及其它需要長(zhǎng)時(shí)間、低功耗待機(jī)等待喚醒或命令的設(shè)備。
除了實(shí)現(xiàn)語(yǔ)音喚醒、語(yǔ)音命令之外,智能聲學(xué)傳感器還可以通過(guò)語(yǔ)料的訓(xùn)練實(shí)現(xiàn)多種聲音事件的探測(cè)。比如,可識(shí)別嬰兒啼哭的聲音、玻璃破碎的聲音、特定呼救的聲音、警笛報(bào)警的聲音、以及其它具有特征的聲音。在此模式下,智能聲學(xué)傳感器可以很簡(jiǎn)單地讓用戶(hù)的設(shè)備具備兒童看護(hù)、危險(xiǎn)事件警報(bào)、聲音防盜、治安監(jiān)控等智能功能。