12月6日,大數(shù)據(jù)&機器學(xué)習(xí)領(lǐng)袖峰會(Big Data & Machine Learning Leaders Summit Hong Kong 2018)在香港召開。作為全亞洲最受期待的大數(shù)據(jù)&機器學(xué)習(xí)會議之一,此次峰會吸引了包括OPPO AI專家在內(nèi)的全球頂尖科學(xué)家和技術(shù)領(lǐng)袖,聚焦探討數(shù)據(jù)、機器學(xué)習(xí)、人工智能與技術(shù)的商業(yè)化等前沿話題。
OPPO高級AI架構(gòu)師何朝文
來自O(shè)PPO美國研究所的高級AI架構(gòu)師何朝文出席此次峰會并發(fā)表主題演講,著重介紹了OPPO對計算機視覺技術(shù)未來應(yīng)用的思考。他表示:“AI能力的進一步發(fā)展,特別是與即將到來的5G時代深度融合,將推動視頻成為更普遍的交流媒介。用戶不僅可以更隨心所欲地觀看視頻,也能夠更低成本地創(chuàng)造視頻內(nèi)容。而計算機視覺技術(shù)向視頻理解領(lǐng)域的延伸,將是打造這一全新用戶體驗場景的關(guān)鍵?!?/span>
推動AI從感知到認知,打造智慧的視頻管理和創(chuàng)作
視頻已經(jīng)成為霸屏用戶時間的最主要內(nèi)容。根據(jù)QuestMobile發(fā)布的《2018年半年大報告》,在線視頻和短視頻是移動網(wǎng)民使用時間占比前三的應(yīng)用類型。而不遠的將來,5G超高速、低時延的全新特點也會讓視頻類應(yīng)用的數(shù)量提升到新的量級。
何朝文認為,視頻將成為未來移動互聯(lián)網(wǎng)主要內(nèi)容形式,這對終端設(shè)備也提出了更高的要求,為了讓用戶更便捷地管理視頻和創(chuàng)作視頻,手機需要具備視頻管理器和編輯器的功能。借助AI能力,手機可以智能地完成分類、搜索、片段搜索和推薦功能。比如用戶搜索“貓”或者“孩子”等關(guān)鍵詞,手機就可以主動呈現(xiàn)出來所有包含這些關(guān)鍵詞的片段。不僅如此,AI還能夠定位到相應(yīng)的時間點,更加精準地呈現(xiàn)結(jié)果。
同時,通過AI編輯功能,手機可以自動完成風(fēng)格轉(zhuǎn)換、解構(gòu)分割、效果增強、亮點摘要和視頻生成。例如用戶可以通過風(fēng)格轉(zhuǎn)移功能,可以讓一段普通視頻呈現(xiàn)出梵高《星空》的后印象派畫風(fēng)。AI也可以幫助用戶自動處理一系列原始視頻素材,剪輯出一段更加有節(jié)奏感和故事性的片段。
挑戰(zhàn)行業(yè)難題,OPPO AI視頻理解已達業(yè)界領(lǐng)先水平
視頻理解是整個業(yè)界公認的難題,而OPPO已經(jīng)在視頻分類和風(fēng)格轉(zhuǎn)移方面達到了業(yè)界領(lǐng)先水平。
據(jù)何朝文介紹,OPPO的最快的視頻分類AI模型已經(jīng)可以在公開數(shù)據(jù)集 Kinetics-600 實現(xiàn)69%的準確率,并且基于單個英偉達 V100 GPU 實現(xiàn)1秒10個視頻的處理速度。同時,OPPO表現(xiàn)最佳的模型則可以實現(xiàn)71%的Top-1準確率,速度是1秒2.7個視頻。從兩組數(shù)據(jù)表現(xiàn)來看,OPPO的AI模型性能已經(jīng)與谷歌類似,甚至在處理速度上更勝一籌。
而在編輯方面,何朝文表示OPPO美國研究所已經(jīng)可以對視頻進行風(fēng)格轉(zhuǎn)換,并且很好地解決了因為視頻前后幀的亮度不一致導(dǎo)致的閃爍問題。
完整的閉環(huán)能力,OPPO致力打造卓越的AI體驗
對前沿技術(shù)的探索和追求是為了給用戶帶來真正的價值。何朝文在演講中也強調(diào),在OPPO看來AI是一種能力,也是一種思維,要始終利用這種思維思考AI如何解決和滿足用戶的痛點與需求。
實際上,OPPO目前已經(jīng)將AI能力廣泛應(yīng)用在手機產(chǎn)品上,帶來拍照場景識別、智慧識物等智能體驗。例如OPPO R17系列已經(jīng)能夠識別21類獨立場景以及多達800個場景組合;同時也可以通過相機對條碼類、實體類、文字類的掃描識別,提供多語種翻譯、內(nèi)容提取、圖像優(yōu)化、場景服務(wù)、信息查詢等多方位萬物識別服務(wù)。
OPPO的閉環(huán)AI架構(gòu)是持續(xù)提升用戶體驗的關(guān)鍵。何朝文強調(diào),OPPO的AI架構(gòu)底層為硬件平臺,上面分別是大數(shù)據(jù)平臺、訓(xùn)練平臺、智能應(yīng)用和用戶體驗。硬件平臺提供算力支持,大數(shù)據(jù)平臺則保證數(shù)據(jù)的可靠性和安全性。同時通過訓(xùn)練平臺,OPPO可以利用AI算法來建立模型去支持計算機視覺、語音識別、自然語義處理和個性化推薦等智能應(yīng)用。當然,最終目的還是要用來提升用戶體驗。而用戶在具體使用中的反饋則會反哺到大數(shù)據(jù)平臺的訓(xùn)練中,進一步驅(qū)動用戶體驗的優(yōu)化。
在前不久的2018 OPPO科技展期間,OPPO創(chuàng)始人、總裁兼CEO陳明永也特別明確了AI的重要意義,他提到:“手機作為AI最好的載體之一,還有很大的改善空間。OPPO要積極擁抱人工智能,要密切關(guān)注AI前沿技術(shù)和應(yīng)用成果。”邁入5G時代,AI技術(shù)帶來的好處也將獲得真正的釋放。
- QQ:61149512