导语:今天(4月26日),是世界知识产权日。据清华AI研究院等统计,我国AI专利申请量登顶全球第一,其中相当一部分已经落地应用。
我朋友,知春路“高圆圆”,最近怀疑AI是一场营销骗局。
“AI过去两年一度热得发烫,万事万物皆可AI,比如手机的第一卖点也都是AI……然后呢?”
她举着自己的手机,说很少有铺天盖地的AI标榜和宣传,但从大学以来,就是换机首选。
我一看,是OPPO。
我回答她,你错了,OPPO只是说得不多。
当然不是。
根据公开资料,OPPO的成名绝技——自拍、摄影等功能,背后都有AI技术的影子。
很多OPPO的忠实用户,可能很享受OPPO的影像系统带来的效用。
却往往会忽略,背后发挥作用的“感知人像”和“画质增强”两个引擎,都是AI驱动。
感知人像引擎,负责对拍摄时的人像区域进行优化,包括AI人脸关键点检测、AI超清人像(暗景/长焦拍摄)、OFL肤质优化、人脸畸变矫正四大项技术。
画质增强引擎,则包含多帧HDR等算法,保证用户在各种场景下拍出满意的视频及照片。
而且,像人脸关键点检测、超分辨率、语义分割、自动补帧这些基础AI技术,OPPO的自研算法已经都在CVPR等AI顶会、以及各种AI视觉榜单中崭露头角。
而且其中的不少AI技术,是有据可查的专利——
例如,“人脸识别方法、装置、电子设备及可读存储介质”中,基于参数化人脸模型的实时3D稠密关键点检测与3D人脸网格重建。
针对手机端使用,OPPO自研了轻量型的人脸关键点检测AI模型。除了关键点信息以外,这一AI模型训练时,还加入了关键点可见性、人脸角度判断等辅助信息。
在WFLW人脸关键点检测数据集上,NME(Normalized Mean Error)为实现了4.74%的检测精度误差,且能以100+fps的帧率在移动平台上运行,解锁手机安全又毫不费力。再例如,针对由摄像头硬件引起的人脸拍照变形,OPPO研发的“一种局部畸变的校正方法及移动终端和相关介质产品”专利。
随着硬件技术的提升,目前的主流手机摄像头,视场角(fov,field of view)已经达到了80°,超广角摄像头更是达到了120°,这意味着在拍摄人像时,不可避免会出现人脸畸变(50°以内才能避免)。
为了让你的脸不被摄像机“拽扁”,在拍照时,AI会自动生成透视投影和球极平面投影两种照片,并“抠出”球极平面投影中正常的人脸,放进照片中。
听起来很简单,但实际上,球极平面投影出来的图像,会比正常图像偏小。为了让抠出来的人脸和画面保持一致性,“P得无痕无迹”,还得在模型中加上补偿算法。
除此之外,这一算法模型还包括人脸降噪、锐度优化和细节提升几个子模块,目的就是能在暗光、变焦场景下也能拍出清晰的人脸效果。
上面这些,都是“感知人像引擎”中的技术专利。而在“画质增强引擎”中,用到的AI技术只多不少。
例如,超级防抖算法。
AI通过抓取陀螺仪、加速器和传感器的数据,自动对运动轨迹、姿态和曝光进行判断,来区分不同的场景,为图像拍摄匹配不同的防抖策略。
而对视频拍摄来说,这一防抖算法还具有运动趋势判断的功能,可以自动选取振幅相近的画面组成相邻帧,极大地降低成片的抖动感。
又例如,将夜景和HDR算法融成“组合拳”,用于亮度调节。
亮度值(lux)低的时候,AI自动启用夜景算法,提升亮度;亮度值高的话,就启用HDR自动调节算法,提升局部亮度、抑制高光。
光是实现这一项技术,就涉及3个环节,包括画面整体、局部优化,以及多帧融合,以减少提高亮度带来的时域噪声。
没错,OPPO是对AI技术最重视的手机厂商——就专利数量而言,甚至没有之一。
根据清华大学人工智能研究院、清华-中国工程院知识智能联合研究中心联合发布的《人工智能发展报告2020》,2011-2020十年间,OPPO在国内AI专利申请数量统计中排名全国第三。
截至2021年3月31日,OPPO在AI领域的全球专利申请超过2450件,主要布局在计算机视觉、语音技术、自然语言处理、机器学习等方面。
而且对于AI等前沿技术的重视,还有进一步加强之势,体现在公司级战略上。
比如2020年11月,OPPO正式发布“3+N+X”科技跃迁战略,明确将AI作为能力中心之一:
- 3大基础技术能力:硬件、软件、服务
- N个能力中心:AI、安全隐私、多媒体等
- 差(X)异化技术:AR、闪充、影像、新形态等
而近年来,领军人才接连加盟、高精尖技术人员相继引进,也是OPPO重视AI等技术的风向标之一。
所以OPPO没有AI、不重视AI吗?
自然不是。
但知春路“高圆圆”的感觉也并非完全不对,因为OPPO对AI的宣传,确实相对声势小很多。
这与OPPO自身的风格和选择有关。
我们把问题抛向OPPO副总裁、研究院院长刘畅,他给出这样的回答:
“科技公司真正的实力,不一定需要通过营销和宣传才能体现。”
刘畅认为,OPPO内部的技术理念,也不提倡把技术挂在嘴边,或者成为用户认知上的负担。
用户选择你的科技产品,享受科技带来的便利,但不必知晓背后复杂的原理,不必增加认知上的负担,真正有科技力的产品,用户不必“感知到”科技的存在。
OPPO把这个理念称为“科技为人”。
比如在AI成像在业内宣传热闹之前,OPPO用户其实就已经有实际体验,他们的手机在逆光环境下也能清晰成像,他们的手机夜间拍视频也明亮饱满,画质有保障。
但这些用户只需要感知到效果好,而不必被告知和灌输繁琐的技术原理。
再比如,OPPO用户发现,自己的手机放置于桌面,目光所至屏幕点亮,目光移开屏幕又熄。颇有王阳明“你未看此花时,此花与汝心同归于寂”的哲学意味……在日常场景中也非常实用。
但这些用户不必知道,背后涉及的AI感知和眼球追踪等技术。
其实对于手机行业来说,新技术很多,可以加强自身黑科技形象的技术也有很多。
那么,评判、选择的标准是什么?
刘畅透露,对于OPPO内部而言,从应用场景来看,技术通常会被划分优先级。
如相机、相册、语音助手(如小布Breeno)、视频软件(如即录)这些用户经常使用的功能,属于头部应用场景;而对于图片优化、证件照拍摄等关注度略少的功能,则属于尾部场景。
而从技术研究本身来看,一项AI技术是否值得钻研,同样有“前沿”或是“有用”的评判标准。
在OPPO研究院,则有着3:5:2的说法,其中30%的投入,用来做产品和业务的技术转化,将一些AI算法与场景结合;50%做前瞻性布局,如AR技术驱动;20%则靠天才或“疯子”驱动研究。
然而,无论场景优先级,还是“前沿”和“有用”,都并非OPPO评判技术的核心标准。
在OPPO内部,选择前沿技术展开创新和突破,最关键的标准在于——给用户带来的价值。
而对用户和使用效果的关注,甚至从技术立项和研发之初,就会成为标准。
背后的核心理念,也是CEO陈明永所强调的“致善式”创新,不做关注竞争和友商的创新,关注用户和用户需求本身,遵循本分。
在OPPO研究院,新技术立项和选择,会有“终极使用设想”——会大致以怎样的方式给用户带来怎样的体验提升?
这种标准下,有些功能很小,但用户刚需时很爽,就做。
比如OPPO手机中,有一个叫“AI证件照”的功能,使用频次不高,但当技术人员描绘使用设想,并论证对用户实实在在的价值后,OPPO选择了开发它。
又例如,已在OPPO商店上线的《表情包大作战》小游戏,能用AI算法同时识别多个人的表情,一起参与游戏,迅速拉近亲友同事伴侣间的关系(手动狗头)。
所以如此理念和机制下,OPPO的用户时有惊喜,而且忠诚度很高。
对于科学家和技术工程师而言,这样的理念和机制,也让他们不断被用户的由衷称赞所激励,动力和成就感十足。
视频防抖、眼球追踪、125W快充“饼干充电器”,可变色手机……一茬接一茬的创新能力和体验,就这样被驱动产生。
当然,OPPO的这种理念也并非全无劣势。
如果技术的应用和创新,总是以用户体验、感知效果为导向,就会导致一个悖论:
不去使用的话,就没有机会去感知。
更直白来说,这是为什么也有玩家,把技术和科技创新,喊得响亮的原因。声势越大,用户直观受影响的可能性越强,接触并使用产品的可能性也就越高。反之亦然。
所以OPPO就从没有过纠结吗?
刘畅说,没有。
这位OPPO副总裁、研究院院长说,因为OPPO的理念就是如此,如果公司上上下下都是这样,就不会有纠结。
所以OPPO研究院虽然成立不算早,但理念和思路格外清晰——
依然要以用户价值为导向、以人为本。
与贝尔、施乐等侧重于理论、基础的研究院不同的是,OPPO从成立伊始,聚焦点就是应用性研究。
相比于施乐所发明的图形界面、手机、Pad、电池等产品本身,OPPO看中的是这些产品背后的技术价值,即如何才能更好地应用它。
也就是说,OPPO研究的并不止是算法本身,而是算法的体验度,包括优化应用时的响应时间、与硬件结合、数据选取、精确度等等指标。
这样在迭代、加速一项AI技术的同时,也能反过来证明一些理论研究、从而加速技术创新。
并且因为身处大众消费电子产业,用户的反馈实际也会快速而直接,对于科研和技术人员而言,堪称立竿见影。
这让科研和技术容易获得成就感。
而且作为一家创办于2004年的公司,OPPO其实经历过不少新技术驱动的新产品创新周期,整个市场声量会变得很大,多音复义,众声喧哗……希望最快速影响更多的用户。
但跨过最初的“风口”之后,留存的本质,依旧是产品体验。
所以目光拉长、时间维度拉长,产品的竞争力依然在于体验,而不是时髦技术的营销和宣传。
刘畅说,做时间的朋友就不会慌。
当然,这或许还跟AI等技术的内在特性息息相关。
从AI的发展来看,作为基础性技术,AI正在被应用到更加基础的领域中,如声光水电,不知不觉中渗透进我们的生活。
我们现在无时不刻离不开电,但我们不再强调“电”本身如何如何神奇。
AI也是,甚至一切技术皆如是,最终还是指向于人,服务于人。
所以OPPO基于“AI为人”展开的一切,看起来是一条更难的路,实际是更为本质的路:
当智能产品最终趋于同质化时,技术终将为解决刚需而服务。
参考链接:
[1]http://www.cdtc.org.cn/a/tongzhigonggao_hongseziti_/2020/1225/1156.html
[2]https://www.aminer.cn/research_report/6008402fe8a87f775ad224d8
“