国内玩家打造中国ChatGPT的劲头,甚至都有点谷歌微软争先恐后那味了。
最具代表性的玩家有两位,一个是有着互联网基因优势的百度,一个是人工智能领域A股龙头企业科大讯飞,都率先做出了产品跟进和规划。
百度方面,正式宣布推出类似产品,“文心一言”一而再地宣布提前上线时间,生态加盟者也如火如荼地推进;科大讯飞那边,则很快明确了具体发布时间。
大厂都这么做,背后究竟有什么考量?为何非得要抢占这个热点风口?
最新消息,科大讯飞首次正面给出了回应,核心归结就两点:
第一,确实在搞。
第二,确实有大机会,而且有信心实现ChatGPT类似的技术阶跃进步。
在新华网访谈中,关于外界争议和对ChatGPT的疑问,科大讯飞副总裁、研究院执行院长刘聪回答了一切。
访谈中,刘聪主要回答了三大问题:
- ChatGPT的突出优势是什么?
- ChatGPT对产业具备什么价值?
- 科大讯飞为什么有信心做出ChatGPT?
首先是ChatGPT的突出优势。
从技术突破来看,ChatGPT已经进入认知智能发展的下一阶段。
ChatGPT认为,认知智能的发展可以分为五个阶段,即知觉和感知阶段、表示和推理阶段、自主学习阶段、创造性思维阶段、自然交互和社会化阶段。
对于落地应用而言,发展到第二阶段的AI已能较好完成特定领域中的指定任务。但ChatGPT更进一步具备了自主学习新知识的能力,进入认知智能的第三阶段。
这一阶段,ChatGPT掌握了高价值信息记忆、多轮对话理解、复杂逻辑推理、多角色风格文本生成、新知识学习应用进化、代码理解生成等能力。
正如刘聪所言,ChatGPT最突出的优势,是它展现出的交互式学习“类人”能力:
它能在多轮交互中以“类人”的方式交流、学习和进步,可以自主、快速、不间断地学习各领域专业知识并达到人类专家水平。
概括来说,相比传统认知智能,ChatGPT不仅在技术上拥有了“类人”自主学习特征,而且进一步展现出快速适应多领域、多场景的能力。
值得一提的是,在斯坦福前不久的一项研究中,ChatGPT背后的AI模型GPT3.5,已经被认为可能具有人类心智能力。
而直到2022年以前,GPT系列的所有大语言模型都还没有表现出类似能力。
事实上,“ChatGPT是AI技术的一次飞跃”这一观点,已为学术界所公认,近期不少谷歌大牛纷纷涌向OpenAI追逐最新技术,也是这一观点的有力证明。
但若只是单纯技术上的突破,尚不足以引起产业界的重视。
刘聪直接承认“科大讯飞确实在做类ChatGPT产品,因为有大机会”,足以说明这一技术给产业界带来的价值:
类ChatGPT模型的持续发展,以NLP为代表的AI算法可能重构互联网和移动互联网产品形态,最终推动商业模式的变革与创新。
所以,ChatGPT究竟对产业界具有什么样的价值?访谈中刘聪提到的“科大讯飞有信心实现技术阶跃进步”,又究竟哪里来的信心?
从产业价值来看,无论是在教育、医疗这类能实现社会价值的领域,还是汽车、办公、机器人和工业这类依托AI实现“智造”的领域,都有ChatGPT的用武之地。
以汽车这一场景为例,智能汽车就对交互系统提出了更高的要求。
尤其是智能座舱中的虚拟数字助手,需要同时具备多角色风格文本生成、自然语言理解和多任务处理等能力,才能进一步提升用户交互舒适性。
ChatGPT的自主学习能力,让系统能很好地学习并适应不同车主的风格和说话方式,迅速理解自然语言状态下提出的需求,并以车主想要的人设风格与其进行交流,相比现在车载AI“任务问答”的模式更加自然。
以科大讯飞为例,刘聪就透露了未来大模型在行业中的应用方式:
大模型在细分行业的实用性,将以“1+N”的架构呈现。
其中,“1”是通用认知智能大模型算法研发及高效训练底座平台,也就是类ChatGPT模型;“N”则是应用于教育、医疗、人机交互、办公、翻译、汽车、工业等多个行业领域的专用大模型。
又以医学场景为例,基于大量医学教材、论文和病例,类ChatGPT通用认知智能结合医疗领域对话式AI系统,就能打造出“每个医生的专业AI诊疗助理、或是每个人的个性化AI健康助手”。
在此之前,科大讯飞在上述产业中,已完成了不少认知智能相关技术的落地。
如教育领域的“因材施教”解决方案,已经用在5万多所学校、1.3亿多师生上;至于语音合成、机器翻译等技术,也已经在汽车、智能家电等领域参与应用。
不止产业。刘聪强调,科大讯飞的信心来源于“技术上的优势积累”:
多年来,我们在深度学习算法、大模型技术、行业大数据、知识图谱、多模态感知、系统工程技术方面有不少优势积累。
通过最近两个多月的系统分析和快速验证,我们非常有信心实现ChatGPT类似的技术阶跃进步,并在中文认知智能领域达到国际领先水平。
一方面是资金投入和研究团队的组建。科大讯飞与中科大合作,早在2017年就承建了认知智能全国重点实验室。
另一方面则是核心算法、数据和算力三方面的长期积累。
算法上,科大讯飞提出了知识与大模型融合统一的理解框架X-Reasoner,致力于弥补大模型模糊记忆技术短板;光是去年,就在认知领域取得了常识阅读理解挑战赛OpenBookQA等13项世界第一的成绩。
数据上,科大讯飞积累了超过50TB的行业语料数据,目前活跃应用每天超10亿人次用户交互。
算力上,除了近几年稳定营收提供的资金保障外,算力上的国产替代也是一大考量因素。据官方数据,目前研发训练服务器已经开始进入国产化, 切换之后效率有的是原来平台的70~80%,有的效率更超过原平台的100%以上。
最新消息,科大讯飞人工智能研发生产基地一期即将完工。这里面包含国家级人工智能开放创新平台、认知智能国家重点实验室等多个建设项目,自然也包括提供算力支撑的数据中心。
话虽如此,刘聪认为,在ChatGPT赛道上,国内外玩家确实存在技术与产业上的差异。
但他表示,中国就是有必要做自己的ChatGPT。
此般言论如何看待,又当如何解读?
首先,必须得承认的是,中美之间存在一定的技术和产业差距。
从技术来看,ChatGPT诞生于OpenAI多年技术积累之中,其背后的GPT系列模型自2018年起就开始反复迭代。更底层的技术支撑,更是源于谷歌2017年就提出Transformer架构,这一层面上我国仍存在技术代差。
更进一步具体到认知智能技术来看,中国信通院发布的《2021认知智能发展报告》中显示:
认知智能领域相关论文发表数量排名前10的机构中,有6所位于美国。
相关领域论文数量上,中国虽仅次于美国,但在质量上仍有差距。专利方面,我国相关专利申请数量于2017年超过美日韩。
而在产业生态上,OpenAI自GPT-3开始就以开放接口的形式,与产业上的生态伙伴合作,养活了一大波AIGC玩家,其中18个月估值15亿美元的独角兽Jasper,就是典型案例。据gpt3demo网站统计,目前已有634个调用GPT-3系列模型开发的应用程序。
但在产业方面,我国却具有先天的场景和数据优势。
正如前述文章所说,中美之间AI应用落地存在行业路线差异。ChatGPT作为通用人工智能的代表,本身不是一项好生意。OpenAI背后如果没有稳定的“现金奶牛”支持,往往也难以存续。因此身处于国内市场大环境下的企业,通用路线往往不是一个最佳选择。
相比之下,垂直AI应用路线更受众人青睐,并已有深厚产业积累,如科大讯飞的认知智能技术已经在教育、医疗、金融、汽车、服务等多个领域落地,并构筑起了深厚的行业壁垒。
一旦实现类ChatGPT技术跃迁,就有先发优势快速落地,甚至有望实现ChatGPT应用落地的弯道超车。
但仍然有一个问题尚未解答:为什么中国非得有自己的ChatGPT?又或是必须跟上ChatGPT热度不可?
这就关系到ChatGPT给企业乃至产业带来的变革性价值。
对企业而言,ChatGPT提供了一种可行的技术路径。它所展现的初步的“智慧”,对于尤其是场景优势玩家来说,是一种全新的技术路径选择。
以前,基于场景探索的玩家,对于AI的探索可能处于“看山是山、看山不是山”的懵懂状态,现在出现了一座“更小,而且明知会有路的山”。
他们有场景有数据,可以率先吃掉ChatGPT红利。
而从更为宏观的角度来看,ChatGPT带来的是一整个产业模式的变革和创新。
刘聪在访谈中,就谈到了ChatGPT给人机交互、信息分发、内容生产、AI for Science这四大模式带来的革新。
比如人机交互方面,未来通过自然语言与智能产品交互,ChatGPT可以精准了解用户意图,调用系统各种软件和服务来满足需求,提高交互效率和成功率。
刘聪认为,有可能改变当前APP的使用方式,比如多个功能软件被整合,甚至出现“大一统”能力的超级通用APP。
还有像已处于变革之中的AI for Science,ChatGPT会进一步加速其发展脚步,比如辅助生成论文摘要和文献综述,甚至还可能提出专业的研究建议、提供新的研究思路。
也正因为蕴含的这种变革与价值,ChatGPT也被认作是AlphaGo之后又一场关于AI的启蒙运动——
通过参与的方式,让全世界感知到超大语言模型的前景。
事实上,从我国的技术和产业储备来看,我国不缺ChatGPT相关技术,而且有的是场景和数据。
至少在上一次大浪淘沙留存下来的AI玩家,都有各自垂直场景的商业落地。
所以对于国内ChatGPT未来的发展进程,刘聪在访谈中再三强调:应该理性看待,毕竟存在一定差距,但也要对技术驱动的玩家有信心。
“成长的路上更应踏实前行,远离捧杀。”
“