8 月 13 日消息 据财联社,国际权威机器视觉问答榜单 VQA Leaderboard 在近日出现关键突破,阿里巴巴达摩院的 AliceMind 以 81.26% 的准确率创造了新纪录,AI 在“读图会意”上首次超越人类

VQA 是 AI 领域难度最高的挑战之一,在该测试中,AI 需要根据给定的图片、自然语言问题生成正确的自然语言回答。也就是说,AI 需要同时具备计算机视觉和自然语言算法,先扫描图像,然后理解文本,最后再推理作答。解决该挑战,对研发通用人工智能具有重要意义

VQA 挑战自设立以来,吸引了包括微软、Facebook、斯坦福大学、阿里巴巴等众多机构和公司参与,形成了国际规模最大、认可度最高的 VQA 数据集,包括 20 万张真实图片、110 万道考题等。

了解到,除了本次“读图会意”挑战,阿里巴巴的达摩院还在 2018 年的斯坦福 SQuAD 挑战赛中,令机器阅读理解首次超越人类。