AI“讀唇術(shù)”,靠什么讓“失語者”重新“開口”?
[釘科技編譯]不出聲,僅僅通過喉嚨和下顎的皮膚震動就能知道想說什么。說道這,首先想到的可能是“古老的讀唇術(shù)”?,F(xiàn)在,人工智能可能會讓這門顯得頗神秘的“技藝”被更多人掌握。之前,有科研人員研發(fā)AI唇語識別:運用機器視覺技術(shù)從視頻中識別出說話人的人臉,提取此人連續(xù)說話時口型變化的特征。通過機器視覺識別,不用聽聲音,僅靠識別說話人的唇部動作,解讀說話者所說的內(nèi)容。近日,不同于運用機器視覺技術(shù)識別說話人的
原創(chuàng)
2020-04-06 07:30:49
來源:釘科技??

[釘科技編譯]不出聲,僅僅通過喉嚨和下顎的皮膚震動就能知道想說什么。說道這,首先想到的可能是“古老的讀唇術(shù)”?,F(xiàn)在,人工智能可能會讓這門顯得頗神秘的“技藝”被更多人掌握。

之前,有科研人員研發(fā)AI唇語識別:運用機器視覺技術(shù)從視頻中識別出說話人的人臉,提取此人連續(xù)說話時口型變化的特征。通過機器視覺識別,不用聽聲音,僅靠識別說話人的唇部動作,解讀說話者所說的內(nèi)容。近日,不同于運用機器視覺技術(shù)識別說話人的唇部動作的的技術(shù),一種僅靠檢測喉嚨運動的“讀唇術(shù)”據(jù)說也被研發(fā)出來了。

圖片 1.png

據(jù)《itmedia》網(wǎng)站消息,近日,東京大學(xué)和索尼計算機科學(xué)研究所共同研發(fā)出的AI系統(tǒng)“Derma”,通過將傳感器貼合在喉嚨周圍的皮膚上,就能成功實現(xiàn)從口形(無聲說話)到語音的轉(zhuǎn)化。

研究靈感最初來源于視聽障礙者的觸診唇讀法,他們會用手指觸摸說話者的嘴唇和下巴周圍,以此讀取說話內(nèi)容。也就是說,他們通過觸摸障礙者嘴唇周圍的皮膚得知他們的說話內(nèi)容。

AI系統(tǒng)“Derma”應(yīng)用時,在下顎皮膚的兩個位置安裝加速度計和角速度傳感器,輔之機器學(xué)習,通過隨著說話發(fā)生的下顎運動和舌肌運動引起的從下顎到喉嚨的皮膚顫動,進行無聲“語音識別”。(釘科技編譯,消息來源: https://www.itmedia.co.jp/news/articles/2003/18/news046.html)

最新文章
1
創(chuàng)維集團發(fā)布2025中期業(yè)績:總營收穩(wěn)增逾兩成,新能源與全球化雙引擎動力十足
2
新石器無人車亮相百度云智大會,生態(tài)合作加速技術(shù)升級
3
科技賦能行業(yè)革新!長虹空調(diào)榮膺“數(shù)字生態(tài)大會”雙項標桿榮譽
4
國內(nèi)首個混合碳化硅產(chǎn)品實現(xiàn)量產(chǎn)
5
超級島登場!小米澎湃OS 3正式發(fā)布,跨生態(tài)互聯(lián)與隱私安全迎來提升
6
8月面板價格止跌持平,預(yù)計9月份將繼續(xù)持平
7
空調(diào)一片紅海 這些企業(yè)還在擴產(chǎn)能?
8
多家儲能相關(guān)企業(yè)半年報揭曉:誰最賺錢?誰虧最多?
9
家電雙雄半年報出爐:海爾智家營收凈利雙高增長,格力電器盈利微增現(xiàn)金流暴增
10
2025年全球智能手機出貨量將同比增長1% IDC:蘋果功不可沒
11
首超蘋果!華為全球智能手表出貨量第一
12
9秒!聯(lián)想開天筆記本刷新國產(chǎn)PC開機速度紀錄:搭載飛騰自研CPU
13
奧維云網(wǎng)2025數(shù)字生態(tài)大會引領(lǐng)家電產(chǎn)業(yè)革新突圍
14
再次聽勸迭代,Leader懶人三筒標尺三烘款打造“嵌入不局改”新標準
15
央視網(wǎng)首場AI晚會七夕“AI心動夜”即將開啟 聯(lián)合可靈AI打造視聽盛宴
16
快手x穿越火線傳奇杯9月開賽 總決賽將落地東北
17
在雄安,我看到了“價值”30萬的電視,更看到了創(chuàng)維的雄心
18
電視巨頭入局!閨蜜機賽道格局“生變”:曝有手機“大佬”有意涉足
19
空調(diào)競爭新戰(zhàn)線:海信如何用“新風”破局內(nèi)卷?
20
第三批國補已下達!智能燈、學(xué)習桌椅、學(xué)習機等首次納入補貼
關(guān)于我們

微信掃一掃,加關(guān)注

商務(wù)合作
  • QQ:61149512