微軟的新圖像字幕算法,準確性或超人類
[釘科技編譯] 綜合《thesouthafrican》和《theverge》消息:微軟開發(fā)了一種新的圖像字幕算法,該算法在某些有限的測試中準確性超過了人類,據(jù)稱其將被合并到該公司用于視力障礙者的應(yīng)用程序“Seeing AI”及其更大的Office產(chǎn)品系列中。圖像字幕技術(shù)滿足了諸如為圖像創(chuàng)建替換文本的任務(wù),該功能對于增加可訪問性特別重要。微軟AI團隊的軟件工程經(jīng)理Saqib Shaikh在新聞發(fā)布會
原創(chuàng)
2020-10-18 09:46:38
來源:釘科技??

[釘科技編譯] 綜合《thesouthafrican》和《theverge》消息:微軟開發(fā)了一種新的圖像字幕算法,該算法在某些有限的測試中準確性超過了人類,據(jù)稱其將被合并到該公司用于視力障礙者的應(yīng)用程序“Seeing AI”及其更大的Office產(chǎn)品系列中。

image.png

圖像字幕技術(shù)滿足了諸如為圖像創(chuàng)建替換文本的任務(wù),該功能對于增加可訪問性特別重要。微軟AI團隊的軟件工程經(jīng)理Saqib Shaikh在新聞發(fā)布會上說:“理想情況下,每個人都將在文檔、網(wǎng)絡(luò)、社交媒體中為所有圖像添加替代文本,因為這使盲人可以訪問內(nèi)容并參與互動。但是,人們沒有。因此,有一些應(yīng)用程序使用圖像標題作為替代文本的方式”。

微軟表示,新算法效果是當(dāng)前算法的兩倍,對于使用諸如微軟 Seeing AI之類的應(yīng)用的用戶來說,這將意味著極大改善用戶體驗。

Seeing AI利用計算機視覺為視障人士描述通過智能手機攝像頭看到的世界。微軟算法不僅能夠識別人和物體,還能夠識別物體之間的關(guān)系,這意味著該算法能夠?qū)⒛橙嗣枋鰹椤白谝巫由匣蜃x書”。

在9月份的一篇論文中,新算法在一個被稱為 "nocaps "的圖像字幕基準測試上取得了有史以來最高的分數(shù)。nocaps基準測試由超過166000個人類生成的字幕組成,描述了從Open Images Dataset中提取的約15100張圖片,這些圖片涵蓋了從運動到假日抓拍,再到美食攝影等等的一系列場景。 (釘科技綜合《thesouthafrican》和《theverge》消息編譯)

最新文章
1
力推全棧聯(lián)動式大規(guī)模創(chuàng)新,亞馬遜云科技加速生成式AI價值釋放
2
達人探訪海信研發(fā)中心,親身體驗“開機3分鐘,滿屋是新風(fēng)”
3
業(yè)界唯一!科大訊飛發(fā)布首個基于全國產(chǎn)算力的深度推理大模型X1
4
斥資134億收購LGD工廠,TCL科技押注LCD市場勝算幾何?
5
12月中國電視整機出貨量378.5萬臺,同比增長9.7%
6
京東方拿下美國專利榜全球第12!顯示領(lǐng)域唯一中企
7
今起買電動自行車有重大變化:出廠鎖死25km/h 無法改裝
8
BBA全球銷量下滑:奧迪跌幅最大 唏噓
9
蘋果想做但沒做出來!OPPO Watch X2全球首發(fā)高血壓風(fēng)險評估功能
10
CES觀察:空調(diào)新年出海第一站,“中國風(fēng)”如何席卷全球?
11
我國新能源汽車產(chǎn)銷連續(xù)十年位居全球第一
12
英偉達:拜登政府監(jiān)管政策將削弱美國的全球競爭力
13
中國電信完成業(yè)界首個無線AI新型調(diào)度技術(shù)現(xiàn)網(wǎng)試驗
14
2025剛開年 家電行業(yè)產(chǎn)能再擴張
15
電視開機率斷崖式下跌,是什么讓人們不在看電視呢?
16
OPPO Find N5居然比鉛筆都要薄,“全球最薄折疊旗艦”官宣二月見!
17
消息稱藍廠大折疊手機vivo X Fold 4 Pro延期至Q3發(fā)布
18
余承東:華為手機在供應(yīng)嚴重短缺下 重回中國市場第一
19
空調(diào)2025迎重大利好,這三個品牌值得重點關(guān)注
20
頭部品牌海外集體發(fā)新,投影成2025家電出海生力軍?
關(guān)于我們

微信掃一掃,加關(guān)注

商務(wù)合作
  • QQ:61149512