fbpx
研究

Ego-Exo4D项目让人工智能训练具有人情味

与Meta合作, 卡罗莱纳的计算机科学系正在改变人工智能.

作为人工智能项目的一部分,摄像机同时捕捉到一名男子投篮的四张照片拼贴图.
“人工智能在我们的日常生活中会变得更有帮助, 以我们想象不到的方式帮助我们,Gedas Bertasius说, 他是计算机科学系的助理教授,也是太阳城娱乐该项目的研究负责人.

北卡罗来纳大学文理学院计算机科学系参与了Ego-Exo4D项目, 这是一家寻求人工智能革命的创新企业.

太阳城娱乐与14所大学组成的国际联盟和元基础人工智能研究团队共同参与该项目. 这一合作将开创这一领域的先河, 大规模的, 多模态和多视图数据集,增强人工智能的感知, 对现实世界中人类技能的反应和理解.

想象一下,你是一名篮球运动员,戴着一台相机,可以记录下你所看到的一切, 从你的角度捕捉你的经历——一个“自我中心”的观点. 现在想象你周围放置了更多的相机,从不同的角度捕捉你的动作. 它们提供了“外中心”视角,就像在玩电子游戏中的角色一样.

Ego-Exo4D项目结合了这两种视角,教会人工智能系统更像人类一样感知世界. 另外, 它收集你的活动的专家分析, 由此产生的数据不仅包括对你如何投三分球的逐场观察, 但也包括如何改善你的身体姿势,以稳定地投进三分球.

“Ego-Exo4D不仅仅是收集数据. 它是关于改变人工智能理解、感知和学习的方式. 以人为中心的学习和视角, 人工智能可以在我们的日常生活中变得更有帮助, 以我们想象不到的方式帮助我们,Gedas Bertasius说, 他是计算机科学系的助理教授,也是太阳城娱乐该项目的研究负责人.

该项目的方法与传统的人工智能学习方法有很大的不同. 目前的人工智能系统主要是从静态中学习, 第三人称图像和视频——类似于旁观者的观点. 是什么让ego - exo4d的方法独特的是第一人称体验的多模式组合,从自我和外部的观点与反馈和来自熟练专家的见解. 该项目侧重于熟练的人类活动, 包括体育, 音乐, 舞蹈和更多, 来自全球13个城市的800多名独特参与者.

这种综合方法使人工智能能够以更接近我们自然感知和认知的方式处理和理解复杂的人类活动, 通过额外的能力来检测和理解技能掌握的细微差别.

“通过将数据视图与人类技能和专业知识相匹配, 人工智能不仅仅是学习复杂的任务, 但我们正在训练它如何训练其他人对技能水平的感知. 这有很多有趣的应用,从个性化AI指导到技能评估,贝尔塔修斯说.

Ego-Exo4D项目的核心是致力于道德诚信和协同创新. 所有的资源, 包括超过1,400小时的视频数据, 是开源, 邀请全球研究界对这项工作进行探索和扩展. 该项目遵守隐私和道德标准,确保这项研究不仅推进了人工智能,而且是负责任和包容的.

通过从多模态角度训练AI, 卡罗来纳州正在为更直观、反应更灵敏的人工智能系统铺平道路. “潜在的应用是巨大的,”Bertasius说. “我最希望的是增加接触渠道,这样那些对学习新技能感兴趣的人就可以, 或者提高技能, 在篮球, 舞蹈或音乐可以更有效地学习,而无需昂贵的个性化指导.”

除了贝尔塔修斯, 卡罗莱纳大学的团队包括博士生Mohaiminul Islam博士和Feng Cheng博士,以及计算机科学专业的本科生Wei Shan, Jeff Zhuo和Oluwatumininu Oguntola.

要了解有关该项目和Carolina贡献的更多信息,请访问 元 博客 或者是 Ego-Exo4D 网站.