AI已经在很多方面战胜人类,比如围棋、星际争霸游戏,人类已经打不过AI了。但是在面对真实的生存环境时,AI的表现有时还不如动物。
乌鸦在喝不到水的时候,会向瓶子中扔石头抬高水面。这就是生物智能的力量。
然而,有些动物也会“犯傻”,比如一只狗狗衔着木棍,就不知道怎么通过一道门了。
AI智能体做得就比狗狗好,可见好好训练AI还是很有潜力的。
现在,有这样一个舞台,可以让你的智能体在模拟的野生环境中学习生存,就像动物一样。这就是来自帝国理工学院的研究助理开发的动物AI奥运会(Animal-AI Olympics)。
开发本次赛事的Benjamin Beyret拉到了不少大公司的赞助,总奖金达到3.2万美元,部分获奖者将获得参加NeurIPS 2019的差旅费用,甚至有机会在NeurIPS上发表演讲。
挑战内容
这场比赛将人工智能方法与动物王国联系起来,以确定人工智能的巨大成功现在是否已准备好与他们自己游戏中的伟大成功进行竞争。
智能体将在下面的竞技场中接受生存挑战。
目前这个场地已经已经完成了300项测试,比赛举办者公布了10个类别的挑战。分别是:
1、食物:大多数动物都受到食物的驱动,食品是环境中唯一的积极奖励,每次测试的目标是在时间用完之前尽可能多地获取食物。
2、偏好:用于测试智能选择最有价值的行动方案的能力。几乎所有动物都会表现出对更多食物的偏好或寻找更容易获得食物,有些动物有能力对长期行动做出复杂的决定。
3、障碍:比赛中包含可能阻碍智能体导航的不可移动障碍。要在测试中取得成功,智能体可能必须学会探索环境。
4、回避:比赛中定义了热区和死亡区,如果被智能体触及这些区域将会给予负面奖励。生物有机体具有一项关键能力是避免有害刺激。
5、空间推理:测试智能体更复杂的导航能力,以及运行环境中的一些简单物理知识。
6、概括:此类别包括可能看起来与代理表面不同的环境变体,即使问题的属性和解决方案保持不变。这些仍由标准配置文件指定。
7、内部模型:测试存储存储内部环境模型的能力。在这些测试中,灯可能会在一段时间后关闭,并且代理必须记住环境的布局,在黑暗中导航。
8、对象持久性:许多动物都明白,当一个物体离开视线时,它仍然存在。
9、高级偏好:此类别测试代理执行更复杂决策的能力,以确保其获得尽可能高的回报。
10、因果推理:包括提前计划的能力,以便在采取行动之前考虑行动的后果。一些非人类动物已经通过了这一类别的所有测试。
奖励内容
赞助本次比赛的7家厂商提供了以下丰厚奖励:
- 19000美元现金奖励
- 3000美元旅行奖励:有机会受邀参加2019年NeurIPS
- 10000美元的AWS信用额度
前三名的奖励是这样的:
- 第一名:7500美元,包含6500美元和1000美元出席NeurIPS的差旅费用
- 第二名:6000美元,包含5000美元和1000美元出席NeurIPS的差旅费用
- 第三名:1500美元
还有WBA奖:
总价值5000美元,其中包括1000美元出席NeurIPS的差旅费用
分类奖金:
9月1日前20名参赛作品将获得500美元的AWS奖励,供比赛下半程使用。
比赛时间
比赛作品上传时间从7月1日晚11:59开始,到7月8日晚11点59分结束(均为格林尼治时间)。
第一轮测试将于9月1日晚11:59进行。
第二轮也是最后一轮测试阶段将于11月1日晚11:59进行。
大赛组委会
本次大赛的组委会有来自帝国理工、剑桥大学、DeepMind的多位学者。
传送门
GitHub页面有本次大会的详细介绍:
https://github.com/beyretb/AnimalAI-Olympics
另外,参赛请戳链接:
http://www.animalaiolympics.com/
“