这年头,算法工程师/准算法工程师们的“课余生活”可真是越来越丰富了。
那边顶会Challenge,这厢企业黑客松,往往奖励丰厚,面试直达,还能五湖四海呼朋引伴,岂不快哉?
不过说实在话,如今的技术岗位都非常重视你的项目经验,通过参与赛事,一方面有利于在实践中巩固学业知识,另一方面也可以在应聘的时候,作为简历中的加分项。但如今赛事多如牛毛,如何在其中选择到更有价值、含金量高、全行业认可的算法比赛?
如下几个标准供大家参考:
- 国际影响力如何,是否有国际顶会加持;
- 奖金池的大小,这也可以侧面反应主办方的投入程度;
- 赛事规模以及是否提供免费的计算资源;
- 赛题是否具有前瞻性以及产业应用的价值。
综上所述,已成功举办五年的腾讯广告算法大赛就是一个完美的选择:奖金池超百万人民币,具有前瞻性和实用性的赛题,以及免费的计算资源加持,在资源的投入上,这场算法大赛也可以说是逐年加码。
这不,单从奖金规模上看,此次第五届比赛就又创新高。
去年有三个人BERT一番,拿走7万美元(近50万人民币)奖金。今年,最高冠军奖金直接再加3万,达到10万美元。
至于算力等资源方面的投入,说是调动腾讯全公司之力亦不为过。
一方面,有归属CSIG云与智慧产业事业群的腾讯云智能钛机器学习平台(TI-One),提供AI算法平台支持,从数据预处理、模型构建、模型训练、模型评估到模型服务,给予选手全流程的开发部署帮助。
还有来自TEG技术工程事业群的腾讯大数据团队,提供自研、开源的高性能分布式机器学习框架Angel,帮助选手进行算法开发测试,在算法资源方面给予支援。
另一方面,腾讯高校资源、腾讯招聘也为比赛加码。
不过,能吸引到海内外如此多程序员的关注,百万奖金池还只是一方面。
更重要的是,每一届腾讯广告算法大赛,都是基于真实的业务场景来设计赛题,并且能提供海量真实脱敏数据作为训练集。
这样背靠腾讯广告业务的实景挑战,机会确实难得。
并且今年,在视频广告秒级语义解析赛道排名前三的队伍,还有机会参与ACM MULTIMEDIA 2021 GRAND CHALLENGE SESSION,站上国际赛场施展拳脚。
那么重点来了,今年,腾讯广告又从实际业务里挖出了什么样的难题,摆在了选手们面前?
众所周知,视频已成为当下最流行的内容载体。对于广告业务来说,视频广告也凭借更丰富的内容、更有冲击力的展示形式,迎来了爆发式的增长。
在这个时间节点上,无论是想要依靠AI来精细化捕捉大众感兴趣的创意,还是让广告能在最合适的时间点推送给最感兴趣的人、最大化传播效果,都离不开对视频广告内容的深度理解。
因此,2021腾讯广告算法大赛设置了两大赛道:视频广告秒级语义解析和多模态视频广告标签。
不妨一起来研究研究这回到底应该怎么玩~
总体来说,这次的两个赛道都是要求选手给出能够理解视频内容的AI模型,并对视频进行时序解构,添加语义标签。
具体详情,先来看难度等级更高一些的视频广告秒级语义解析赛道。
赛题要求,对于给定测试视频样本,通过算法将视频在时序上进行精细到秒级别的场景分段。也就是说,搞清楚视频的镜头语言,但同时不能把片段切得过于稀碎,干扰视频叙事结构的表达。
同时,赛题要求预测出每一段在“呈现形式”、“场景”、“视觉风格”等三个维度上的标签,最后使用Mean Average Precision(mAP)进行评分。
也就是说,AI要在秒级别解析出视频的情节段落,对视频内容进行更精准的把控。
另一道赛题多模态视频广告标签,同样是对于视频语义标签的预测。
不过相较赛道一,它的难度更小一些,对于给定的输入视频,在时序上不要求模型精准到每一个情节段落,只要预测出视频在“呈现形式”,“场景”,“视觉风格”等三个维度上的标签即可。最后会使用GAP来进行评分。
两个赛道的任务输入都包括视频、音频、文本三种模态。
在数据集方面,腾讯广告此次会在比赛数据集中提供上万条带标签的真实视频广告,以帮助选手训练出更加精准高效、具有应用价值的算法。
这样的赛题,在技术上充满挑战,同时也再次延续了腾讯广告算法大赛一直以来“务实”的风格——快节奏但又需要包含丰富信息的视频广告,无论是在节奏把控还是在内容串联上,都对广告主提出了更高的要求。
而对于在这种把控力上有所欠缺的广告主,深度视频内容理解能挖掘出用户在视频广告播放时序上产生的行为数据,进而让广告主能有的放矢去优化视频内容,提升广告投放效果。
其实在广告行业,长久以来一直存在一个痛点:
随着5G时代的到来,以视频为载体的内容越来越受到用户欢迎,而视频广告也乘风而起,以多视角拍摄、情景真实感、语音BGM等元素成为最能吸引用户、展现创意的广告形式。
说起来是简简单单一句话,但事实上,系统是否能深入理解视频广告的内容及其中多维度的信息,对最终达成的广告效果有至关重要的影响。
因此能够深度理解视频广告内容,挖掘其潜在价值,无疑成了当下广告业发展的一个杀手锏。
而从此次腾讯广告算法大赛所设置的两大赛题来看,迎合的正是当下广告行业这样的迫切诉求。
具体而言,在创意分析中,将秒级别的用户行为数据与视频内容关联,一方面能提供、展现清晰的内容分析脉络;另一方面,也有利于准确地定位用户转化及流失的原因。
在视频创作中,细粒度理解视频时序内容,能够帮助AI训练出批量生产广告创意的技能,大幅降低广告创作投放成本。
而在广告推荐环节,个性化的标签则能让系统更加高效地匹配上“对的人”,提升广告推荐效果。
这是此次大赛对广告行业能够产生的影响。
但通过大赛的名字,不难看出,除了“广告”这个关键词之外,“算法”也是另外一个重点词。
腾讯广告算法大赛历来的一大特色便是,真实场景数据。
讲真,这与在高校等环境中研究算法,可不太一样。
真实场景之下,数据的量之大、维度之多,以及还存在着各种错综复杂的细节因素。
这就要求算法需要具备更强的泛化能力和稳定性。
而要达到这种效果,算法本身还不能是old-fashion的那种,需是紧随最前沿的技术。
例如在去年的大赛中,斩获冠军的队伍,便是凭借当时最流行的预训练模型BERT,将真实场景业务性能提高到了一定高度。
由此可见,腾讯广告算法大赛也是与时俱进地在推动产学交流融合、前沿算法技术的现实应用。
但其实,一手抓广告,一手抓算法,并不是腾讯广告第一次这么做。
从以往的大赛成果来看,便已然是如此:
- 利用数字平台推广中最重要的技术能力之一的相似人群拓展技术,为社交营销行业带来创新活力与新鲜血液。
- 以“广告受众基础属性预估”为赛题,从广告行业的经典假设出发,逆向验证这一命题的科学性;并综合运用机器学习领域的各种技术,实现了更准确的预估。
- ……
但今年除了延伸往届大赛在广告、算法界的优势之外,还有一大亮点:
这不仅仅是对赛题本身的一种认可,更长远的,是对腾讯广告算法大赛多年来,于广告行业、于算法界影响力的一种认可。
……
给你资源,给你数据,还给你钱,做出的结果还能在业界发光发热,这样的算法大赛当真不一般。
“