3月24日消息,中科院聯(lián)合阿里安全團隊通過訓練AI模型,研究表情和聲音的關系,完成了給定一段聲音和僅有一張正確人臉的若干張圖片,AI為該聲音找到“主人”的實驗研究。
經(jīng)驗證,相較于人類67%的正確率,AI的準確率接近90%。在“1對N”的匹配實驗中,AI還能對聲音歸屬人臉的“可能性”進行排序。這種技術是一種自適應的學習框架,用來挖掘和學習人臉與聲音的潛在聯(lián)系,該論文研究成果隨即被CVPR 2021接收。
據(jù)阿里安全圖靈實驗室資深算法專家華棠介紹,該技術后續(xù)將在內(nèi)容安全和賬戶安全領域探索應用,對抗偽造類視頻攻擊,保護用戶財產(chǎn)和信息安全?!坝行┤死脗卧煲曨l試圖騙過認證系統(tǒng),AI的這項技能將進一步驗證聲音與相應真人是否匹配,防范欺詐,守護安全?!比A棠說,這也是讓AI在提升安全水位上有更多用武之地。