可靈AI數(shù)字人來了 支持情緒與動(dòng)作控制、輕松打造“有靈魂”的數(shù)字角色
近日,可靈AI數(shù)字人正式亮相,憑借領(lǐng)先的口型精準(zhǔn)度、情緒動(dòng)作演繹和跨風(fēng)格泛化能力,重新定義了數(shù)字人技術(shù)的行業(yè)標(biāo)桿。
2025-09-19 19:42:15
來源:丁科技網(wǎng)??

近日,可靈AI數(shù)字人正式亮相,憑借領(lǐng)先的口型精準(zhǔn)度、情緒動(dòng)作演繹和跨風(fēng)格泛化能力,重新定義了數(shù)字人技術(shù)的行業(yè)標(biāo)桿。用戶僅需上傳一張角色圖片、輸入角色表達(dá)內(nèi)容或一段音頻,就能生成最長1分鐘、極具表現(xiàn)力的數(shù)字人視頻,而且支持多類角色及中英日韓多語種,最低價(jià)格僅0.12元每秒,廣泛適用于廣告、電商、娛樂、媒體、教育等眾多場景。目前產(chǎn)品公測陸續(xù)開放中。

極簡輸入、高質(zhì)輸出:一張圖實(shí)現(xiàn)分鐘級數(shù)字人生成

可靈AI數(shù)字人極大降低了行業(yè)的制作門檻,用戶只需提供一張角色圖(支持寫實(shí)人物、動(dòng)漫、動(dòng)物等多種角色),輸入一段文字或音頻,即可一鍵生成最高達(dá)1080p分辨率、48FPS高幀率的高質(zhì)量數(shù)字人視頻。

該功能可支持生成最長達(dá)1分鐘的數(shù)字人視頻,可輕松滿足產(chǎn)品講解、新聞播報(bào)、在線教育等多種場景需求,結(jié)合會(huì)員優(yōu)惠最低價(jià)僅0.12元/秒(標(biāo)準(zhǔn)價(jià)格:高品質(zhì)模式8靈感值/秒,標(biāo)準(zhǔn)模式4靈感值/秒),讓高品質(zhì)數(shù)字人技術(shù)不再是少數(shù)專業(yè)機(jī)構(gòu)的專利,真正賦能廣大內(nèi)容創(chuàng)作者與中小企業(yè)。

此外,為了實(shí)現(xiàn)“開箱即用”的便捷體驗(yàn),可靈AI還提供了一站式解決方案。既支持用戶上傳自有素材,也可以使用內(nèi)置的官方形象庫、AI生圖功能以及近百種TTS音色,輕松完成從角色創(chuàng)建到配音的全流程。

角色演繹“神形兼?zhèn)洹? 

在數(shù)字人的核心能力——“表現(xiàn)力”上,可靈AI展示了其深厚的技術(shù)功底,不再滿足于同類產(chǎn)品簡單的音畫同步,而是追求角色“神形兼?zhèn)洹钡纳鷦?dòng)演繹。

(可靈AI數(shù)字人視頻截圖)

在對口型這一基礎(chǔ)指標(biāo)上,可靈AI數(shù)字人展現(xiàn)出了業(yè)界領(lǐng)先的精準(zhǔn)度。實(shí)測案例中,一位女歌手正演唱英文歌曲,其唇形與快速變化的歌詞音節(jié)完美貼合,復(fù)雜口型也表現(xiàn)出色。而根據(jù)提示詞“眼神專注自信地唱歌”,數(shù)字角色更呈現(xiàn)出自信的眼神、持麥的自然姿態(tài),以及與觀眾互動(dòng)的微笑,生動(dòng)還原了歌手在舞臺(tái)上的表演狀態(tài)。

同時(shí),憑借可靈視頻模型的強(qiáng)大能力,可靈AI數(shù)字人展現(xiàn)出優(yōu)秀的泛化性能,無論是寫實(shí)人物、動(dòng)漫卡通、動(dòng)物形象,皆可生成高質(zhì)量數(shù)字人視頻。在卡通貓咪唱英文Rap的案例中,可靈AI精準(zhǔn)地捕捉音頻節(jié)奏,生成了一只一邊說唱、一邊隨節(jié)奏自然搖擺身體的“Rapper貓”,跨越不同角色風(fēng)格界限,賦予角色生命力。

提示詞驅(qū)動(dòng)角色表演 情緒與動(dòng)作精細(xì)可控  

區(qū)別于僅“動(dòng)嘴皮”的數(shù)字人,可靈AI數(shù)字人還帶來了對情緒的深刻理解與表達(dá),而且可通過提示詞精細(xì)化控制角色情緒與肢體語言,實(shí)現(xiàn)“有靈魂的表演”。

(可靈AI數(shù)字人視頻截圖)

在這個(gè)表現(xiàn)“憤怒”情緒的案例中,根據(jù)音頻內(nèi)容和提示詞“內(nèi)心全是氣憤,非常生氣”。模型精準(zhǔn)地將這種抽象情緒轉(zhuǎn)化為具體的面部微表情——緊鎖的眉頭、緊抿的嘴唇和充滿壓迫感的眼神,將角色的內(nèi)心怒火展現(xiàn)得淋漓盡致。

基于可靈AI視頻模型,依托多模態(tài)理解大模型與視頻生成模型的深度融合,可靈AI數(shù)字人突破傳統(tǒng)音畫同步的表淺擬合,首次實(shí)現(xiàn)從「聽聲音」到「懂意圖」的跨越。在口型準(zhǔn)確度已達(dá)行業(yè)領(lǐng)先的基礎(chǔ)上,可精準(zhǔn)解析輸入的語音、圖像和提示詞,對長視頻中數(shù)字人情緒、動(dòng)作與運(yùn)鏡作出精準(zhǔn)規(guī)劃,確保生成內(nèi)容緊密呼應(yīng)敘事意圖與情感脈絡(luò),真正完成從對口型到情節(jié)演繹的升級。

技術(shù)驅(qū)動(dòng) 打造數(shù)字人行業(yè)標(biāo)桿

可靈AI數(shù)字人的卓越表現(xiàn),得益于其背后多模態(tài)理解大模型與視頻生成模型的深度融合。通過音畫高度對齊的交叉注意力機(jī)制、強(qiáng)化口型的訓(xùn)練策略以及精細(xì)化的數(shù)據(jù)處理,實(shí)現(xiàn)了語音與唇形的精準(zhǔn)同步,即使面對多語種、歌唱或極快語速的臺(tái)詞,仍能保證唇形與發(fā)音嚴(yán)絲合縫。而采用關(guān)鍵幀控制的架構(gòu),模型先構(gòu)建高層次敘事骨架,再并行生成多個(gè)片段的數(shù)字人視頻,可在保持身份一致的前提下,實(shí)現(xiàn)無限長度視頻生成。

專業(yè)測試中,可靈AI數(shù)字人與行業(yè)知名產(chǎn)品Heygen及即夢數(shù)字人(Omnihuman-1方案)進(jìn)行了效果對比。結(jié)果顯示,可靈 AI 數(shù)字人在整體效果及多個(gè)細(xì)分維度上均表現(xiàn)優(yōu)異,與即夢數(shù)字人(Omnihuman-1 方案)對比的整體 GSB 得分達(dá)到 2.39,與 Heygen 對比的整體 GSB 得分達(dá)到 1.37,位居行業(yè)領(lǐng)先。

* GSB 指標(biāo)用于衡量群體意見的一致性和正負(fù)傾向,GSB 值越大,說明模型優(yōu)勢越大

* 評測時(shí)間:Heygen于2025.08.25評測;即夢于2025.07.22評測。

可靈AI作為全球領(lǐng)先的視頻生成大模型,自2024年6月發(fā)布以來已完成超30次迭代,用戶規(guī)模突破4500萬,生成視頻數(shù)量超2億,為超過2萬家企業(yè)提供API服務(wù),覆蓋廣告、影視、游戲等多個(gè)領(lǐng)域。隨著可靈AI數(shù)字人的推出,將進(jìn)一步降低行業(yè)創(chuàng)作門檻、提升制作標(biāo)準(zhǔn),推動(dòng)其在短視頻、電商直播、在線教育、企業(yè)服務(wù)等領(lǐng)域的規(guī)?;瘧?yīng)用。

原創(chuàng)文章
最新文章
1
熱雪正當(dāng)虹!長虹以AI連接國際雪聯(lián)賽事與萬億冰雪經(jīng)濟(jì)
2
亮相國際雪聯(lián)頂級賽事 美菱釋放冰雪營銷新勢能
3
熱雪正當(dāng)虹!長虹空調(diào)以硬核制熱科技點(diǎn)亮冰雪賽場
4
超長壽命硒鼓+大容量墨粉 漢印“超激鼓”激光打印機(jī)TE3200出手就是“王炸”
5
賦能公會(huì)、激活創(chuàng)作,快手直播推動(dòng)團(tuán)播向“健康化、精品化、價(jià)值化”轉(zhuǎn)型
6
可靈2.6模型上線!語音、音效與畫面一鍵直出 重構(gòu)AI視頻創(chuàng)作工作流
7
13.2億點(diǎn)贊!時(shí)代少年團(tuán)六周年演唱會(huì)快手獨(dú)家直播,共創(chuàng)青春記憶新高光
8
青少年健康用網(wǎng)公益行動(dòng)走進(jìn)吉林學(xué)校 特殊思政課科普網(wǎng)絡(luò)安全知識(shí)
9
人民日報(bào)為海信RGB-Mini LED電視打call:這創(chuàng)新很中國
10
舉國同慶!朱雀三號(hào)成功發(fā)射!新超合金制造的柵格舵成關(guān)鍵
11
舉國同慶!朱雀三號(hào)成功發(fā)射!新超合金制造的柵格舵成關(guān)鍵
12
豆包AI手機(jī)又出新聞?智能體時(shí)代“入口”之爭初現(xiàn)端倪
13
上半年Mini LED電視滲透率高達(dá)28.3%,是驅(qū)動(dòng)煥新的主動(dòng)力
14
銅價(jià)漲瘋了,也輪不到空調(diào)用鋼做!“全鋼空調(diào)論”為什么是最大偽命題?
15
被唱衰兩年后,空氣炸鍋悄悄回暖
16
影石發(fā)布全球首款全景無人機(jī) 劉靖康:即便沒笑到最后也無悔
17
餓了么官宣改名!全面更新為“淘寶閃購”
18
官方:新國標(biāo)電動(dòng)自行車車速超25km/h不會(huì)緊急制動(dòng)!
19
8.6代OLED面板產(chǎn)線量產(chǎn)競速:技術(shù)分野,誰先供貨?
20
50000頁“超激鼓”技術(shù),終結(jié)企業(yè)辦公的“打印焦慮”
關(guān)于我們

微信掃一掃,加關(guān)注

商務(wù)合作
  • QQ:61149512