随着高考成绩张榜,人工智能再度引发热议,各路AI数字人大显身手。
从写高考作文,到轻松拿下各类文综理综考题,数字人在高考试卷上大杀四方。
不过,外行看热闹,试题并不是今年衡量AI市场的主战场。
不久前,沙利文和IDC分别发布了国内数字人领域的行业报告,对数字人市场的主流企业按综合竞争实力做了量化评估。
两份报告均显示,小冰、百度、商汤三家位列第一梯队。
那么问题来了,为何是这三家全面领先?
沙利⽂所发布的年度报告是《2022年中国数字⼈市场观测报告-里程碑》。
报告从起步、探索、发展、成熟四大阶段对七家主流数字⼈企业进行评估。
小冰、百度、商汤成为闯入成熟阶段的三家头部企业。
成熟阶段的产品意味着已经具备当前行业标杆意义,且在情感表达、性格培养等核心技术方面具有领先优势。
同期,IDC也对11家主流AI数字人企业从六大维度进行综合评估,认为当前数字人市场可以划分为2-3个梯队,第一梯队是小冰、百度和商汤。
可以看出,无论是AI能力和用户体验,还是市场能力及商业化程度,第一梯队基本都是六维品牌,没有明显短板。
小冰在2014年进入虚拟人领域,是最早提出虚拟人AI框架并实现产品广泛落地的玩家。
小冰框架则是全球承载交互量最大的完备人工智能框架之一,在开放域对话、多模态交互、超级自然语音、神经网络渲染及内容生成领域居于全球领先。
与此同时,小冰也是业界数字人落地案例最多的企业之一,包括交付中的案例数量共计超过400个,如果算上虚拟男友、虚拟女友等产品,小冰虚拟人总数超过数千万。
小冰数字人可以分为四类:
- AI Employee(虚拟员工),比如万科崔筱盼;
- AI Expert(虚拟专家),比如国家队教练观君、每日经济新闻主播N小黑;
- AI Companion(虚拟陪伴),比如虚拟男友、女友等;
- AI Entertainment(虚拟偶像),比如夏语冰、何畅等。
高度拟人化、多模态交互和内容生成能力,以及低成本快速创建虚拟人生产线是小冰的优势。
作为中国头部AI公司,百度自2019年布局数字人领域以来,百度智能云曦灵平台上线部署的数字人已达数十个,支持服务型和演艺型两类数字人。
其中,服务型数字人是百度的优势所在,产品类型丰富,从最早的企业服务场景已经延伸到营销、办公等领域。
百度推出的央视手语主播,高考数字人助理度晓晓等数字人引发了行业关注。
近年来重点投入资源的商汤,在数字人技术上有两大方向:“拟人化”和“自动化”。
底层AI能力、全行业覆盖是商汤布局数字人的优势。
基于这些优势,商汤构建了智能化生成、智能化驱动和智能化交互三大引擎,打造出“一站式”AI数字人生产流水线。
可以看出,第一梯队企业有一些相同点,不仅底层技术实力全面、强大,而且围绕当前数字人行业几大痛点,比如交互性、内容生成、生产成本、产能等问题,都提出了自己的解决方案,因而在核心技术和商业落地上走得更远。
值得注意的是,两份报告在数字人的分类上不尽相同,但都是从应用层面出发的。
比如沙利文的报告将数字人分为服务型和身份型,而IDC则分为泛娱乐数字人、企业级服务数字人两大类。
此前在业内也有不同的提法,比如小冰、百度、商汤都有自己的定义和分类标准,行业的概念共识目前还未形成。
“人机难辨”或“更像人”,是数字人整体的发展趋势。
从两份报告看,未来数字人相关技术将以打造三维全景、五感真实、超级自然/数字孪生形态的数字人为目标,以动作及情感交互、情绪感知推理为关键突破⼝,不断向沉浸感、交互性、开放性强的方向发展——虚拟人新三板组合,也暂时领跑商业落地和应用拓展。
2019年,小冰开始为国家体育总局冬季运动管理中心研发AI裁判与教练系统“观君”。
2022年冬奥会中,“观君”助力中国代表团夺得两金一银,成为人工智能在全球顶级赛事中全程参与训练,并辅助赢得金牌战绩的首个案例。
2019年起,百度与浦发银行打造了多个场景的数字员工。
其中对客交互和销售领域的AI数字员工,目前月活已经达到46万人,也就是每月有46万用户通过AI数字员工的推荐选购理财产品。
2021年软银大会上,商汤仅用时20天就为软银副总裁今井康之生成专属超写实数字人。
CVPR 2022上,商汤提出了一种新框架 Bailando,可以驱动数字人配合音乐跳舞,未来有望成为驱动虚拟主播的底层技术。
小冰CEO李笛曾预言,未来,AI being的数量也许会超过人类。
这一观点已逐渐成为行业共识,但在这之前,还有一段路要走。
根据IDC提出的人工智能自动化五级演进框架,数字人发展历程分为5个阶段。
L5阶段数字人可以实现自主决策、自主执行任务,完全实现智能化交互。当前的数字人大多处于L1-L3的阶段,而未来的AI数字人将是L4-L5的水平。
IDC预测数字人市场在未来将呈现高速增长趋势,到2026年,中国市场规模可达102.4亿元人民币,这一数字并不算太大。
更大的机会或许在于,数字人产业还处在发展早期,市场需要的不仅是“高考做题家”、“车载语音遥控器”、“厅局级虚拟人“和“带货主播”,更需要同时满足消费市场用户和企业市场客户多个场景需求的全能玩家。
这场考验AI落地能力的创新马拉松,才刚刚开始。
本文系量子位获授权刊载,观点仅为作者所有。
“