搜狗推出“唇語識別”技術(shù) 垂直場景下達到90%準(zhǔn)確率
鳳凰科技訊(作者/二維馬)12月14日消息,搜狗今日推出了一種人機交互新技術(shù)唇語識別,通過機器視覺識別說話人唇部動作,來解讀說話者所說的內(nèi)容。搜狗官方表示,通過復(fù)雜端到端深度神經(jīng)網(wǎng)絡(luò)技術(shù)進行中文唇語序列建模,經(jīng)過數(shù)千小時的真實唇語數(shù)據(jù)訓(xùn)練,終于取得了唇語識別效果。在非特定人開放口語測試集上,該系統(tǒng)達到60%以上的準(zhǔn)確率,超過google發(fā)布的英文唇語系統(tǒng)50%以上的準(zhǔn)確率,在垂直場景如車載、智能家
2017-12-15 07:59:46
來源:鳳凰科技??

鳳凰科技訊(作者/二維馬)12月14日消息,搜狗今日推出了一種人機交互新技術(shù)唇語識別,通過機器視覺識別說話人唇部動作,來解讀說話者所說的內(nèi)容。

搜狗官方表示,通過復(fù)雜端到端深度神經(jīng)網(wǎng)絡(luò)技術(shù)進行中文唇語序列建模,經(jīng)過數(shù)千小時的真實唇語數(shù)據(jù)訓(xùn)練,終于取得了唇語識別效果。在非特定人開放口語測試集上,該系統(tǒng)達到60%以上的準(zhǔn)確率,超過google發(fā)布的英文唇語系統(tǒng)50%以上的準(zhǔn)確率,在垂直場景如車載、智能家居等場景下甚至已經(jīng)達到90%的準(zhǔn)確率。

作為人機交互的形式之一,未來唇語識別技術(shù)可以輔助語音交互及圖像識別,在日常生活、安防、公益等各個領(lǐng)域?qū)崿F(xiàn)廣泛應(yīng)用。比如在車載場景下,周圍噪音過大時會對語音指令產(chǎn)生干擾,通過唇語識別技術(shù)則可以規(guī)避干擾,保證人車交互的準(zhǔn)確性和穩(wěn)定性,日常不便發(fā)聲的公共場所也可以保證說話內(nèi)容的私密性;在安防領(lǐng)域,由于目前多數(shù)監(jiān)控只有攝像頭沒有麥克風(fēng),往往只能看清嘴型卻不知道在說什么,給案情分析帶來很多難題,而唇語識別技術(shù)可以幫助公安人員獲取重要的講話信息,為公共安全提供有效支持。除此之外,唇語識別技術(shù)還能發(fā)揮巨大的公益價值,幫助先天性聽障人群或老年人,讓他們更好地理解和表達自己。

最新文章
1
從“讓畫更像畫”到“全民光伏” ,創(chuàng)維科技閃耀“未來之城”雄安
2
以水為形,漫入生活:凱度CEO柯漫的科技詩意突圍
3
倪虹潔領(lǐng)銜主演,快手星芒短劇《小美滿》呈現(xiàn)家的N種可能
4
《河北新藍領(lǐng)-直播帶崗發(fā)展全景報告》發(fā)布 河北就業(yè)數(shù)字化轉(zhuǎn)型全景圖譜
5
科龍空調(diào)靜省電Ultra:破局行業(yè)內(nèi)卷,以全能實力重塑用戶價值
6
德國美諾全新W2T2衣物護理系列 NOVA Edition重磅上市
7
三十載熱愛同行, vivo Vision發(fā)布會暨影像盛典盛大舉辦
8
2025冷年空調(diào)市場總結(jié):全球空調(diào)暴增12.9%,內(nèi)銷破億臺仍在卷?
9
碾壓GPT4!DeepSeek V3.1 用1/10 成本實現(xiàn)128K超長文
10
2025上半年中國智能投影市場銷量277.8萬臺,同比下降3.9%
11
康佳易主華潤,能否迎來新生?
12
博西家電與小米米家聯(lián)手,各自能得到什么?
13
iPhone 17 Pro官方TechWoven編織手機殼曝光:共五款配色
14
曝小米玄戒O2開發(fā)主動散熱機型:主打電競!明年見
15
全球首款支持防塵的折疊屏旗艦!谷歌Pixel 10 Pro Fold正式發(fā)布
16
鴻蒙智選MEIPONT智能空調(diào)“風(fēng)神之眼”破界登場,人感智能風(fēng)暴來襲
17
“好房子”政策引領(lǐng),廚電創(chuàng)新聚焦七大趨勢
18
“好房子”政策下中國廚電的價值重構(gòu)與市場突圍
19
彩電行業(yè)唯一 海信視像榮膺工信部“首批質(zhì)量管理能力高等級企業(yè)”
20
快手直播大舞臺空降千島湖,成為現(xiàn)象級文旅新爆款
關(guān)于我們

微信掃一掃,加關(guān)注

商務(wù)合作
  • QQ:61149512