0分!数字人直播挑战上海高考英语作文“翻车”了

AI资讯1年前 (2023)发布 AI工具箱
420 0 0

考完语文考英语,但这一次,AI数字人却“大翻车”

这不前脚上海高考英语作文题目公布了嘛。

后脚AI数字人就又双叒叕要去开直播挑战了。

然鹅……专家现场给出的分数,简直令人大跌眼镜——0分!!!

直播间的弹幕瞬间“炸”了,画风是这样的:

好奇的友友们就要问了,之前高考语文作文都能hold住的AI数字人,为啥英语作文就搞不定呢?

其实,这只是AI数字人在直播过程中的一个小插曲

是TA在看了上海高考英语卷子之后,根据题目在作文中画了张插画

因为写作过程中若是出现插画,就会被认为做了标记,固然得分为0。

那言归正传,AI数字人写出来的英语作文内容本身,结果又如何呢?

曾多次担任上海地区高考英语阅卷组组长梅德明教授给出的结论的是:

不仅如此,这个AI数字人是在10秒钟时间完成了40篇

还在现场一口气写了韩语法语等多个语种的作文。

基于此,甚至北京外国语大学教授王馥芳都提了更高的期望——希望去挑战一下专八。

而这个AI数字人的“庐山真面目”,正是来自百度的度晓晓

上个月因为挑战高考语文全国卷的作文还上过热搜,引来不少网友的围观。

接下来,让我们一起看看度晓晓在这次挑战中的具体表现如何。

先来看下今年上海英语高考作文的题目:

梅德明教授对题目点评道,一定要紧扣“走进历史”的主题,以及形式上是一封信,在字数方面也要控制在150字左右。

并且还需要做到内容详略得当、层次分明,“难度系数对比中文写作更大”。

度晓晓在短暂的思考之后,便拿出了40篇中的一篇做了展示:

不难看出,从作文内容结构上是较为完整的,并且像“Most importantly”、“Moreover”等词汇的应用,也让逻辑变得非常清晰。

正如梅教授点评的那样:

并且梅教授还强调,如此点评,不是因为作文是出自数字人之手,而是把它看做是正常考生的答卷来看待的。

但着实可惜的是,度晓晓还是需要更了解考试规则,不应生成那张插图。

不过有一说一,度晓晓能拿下英语作文高分,也算是在情理之中。

因为在上个月挑战题为《本手、妙手、俗手》语文高考作文时,她便已经展露出锋芒。

当时度晓晓平均1秒钟所生成的作文,让北京语文专家打出48分(满分60),并被点评为:

据了解,这样的成绩已经是超过将近75%的考生了。

更是让网友发出这样的感慨:

那么紧接着需要回答的一个问题便是:

正所谓台上一分钟,台下十年功。

度晓晓背后的这一套“功夫”,正是得益于百度文心大模型的能力。

文心大模型一个非常突出的标签和特点,便是“知识增强”。

简单来说,它是一个能从大规模知识和海量数据中进行融合学习的大模型,并且具备效率高、效果好,以及通用性强等特点。

是有一种“读破万卷书”后“无师自通”的味道了。

若是把文心大模型扒开来看,可以明显看到它可以分为三大类,分别是“基础通用大模型”、“任务大模型”和“行业大模型”。

这三类大模型之下,还会有更多细致的分支。

而此次度晓晓完胜上海高考英语作文,所依靠的大模型主要包括两个。

首先是文心最新推出的ERNIE 3.0 Zeus这个千亿级的大模型。

它是一个任务知识增强的大模型,除了可以对无标注数据和知识图谱的学习之外,还可以通过持续学习,对百余种不同形式的任务数据学习。

在原理方面,ERNIE 3.0 Zeus在学习过程中主要使用的统一范式的多任务学习。

这种方法便可以轻松对数据中不同粒度的语义信息进行建模。

除此之外,ERNIE 3.0 Zeus层次化提示(Prompt)学习技术,通过层次化的Text Prompt库将百余种不同的任务统一组织成自然语言的形式,和海量无监督文本以及百度知识图谱联合学习。

而且还引入了层次化的Soft Prompt,如此一来便可以对不同任务之间的共性与特性进行建模。

也正是基于这样的能力,度晓晓便可以先去精准地理解英语作文的题目,然后根据体裁要求,构思和组织材料,完成英语作文的输出。

与此同时,还可以做到结构紧凑、清晰地阐述自己的观点。

而度晓晓背后的第二个大模型,便是多语言模型ERNIE-M。

这是一种可以理解超过100多种语言的多语言模型。

据了解,ERNIE-M构建了大小为25万的多语言词表,约1.5万亿字符。

它的学习过程可以大致分为两个阶段:

第一阶段:从少量的双语语料中学习跨语言理解能力,使模型学到初步的语言对齐关系;

第二阶段:使用回译的思想,通过大量的单语语料学习,增强模型的跨语言理解能力。

这也就是度晓晓能够在完成英语作文的同时,还可以用韩语和法语等多个语言去写作的原因了。

……

那么在看完度晓晓挑战上海高考英语作文和其背后的能力之后,还有一个问题值得探讨:

首先,在内容生产的方式上,像度晓晓这种数字人的能力加持之下,正在向一种新的趋势发展——AIGC。

这是继UGC(用户生产内容)、PGC(专业生产内容)和OGC(职业生产内容)等内容生产方式之后的“新生代”。

而AIGC,顾名思义,就是通过AI技术来生产内容。

至于这种内容生产方式背后所具备有的意义和价值,从百度研究院在今年年初所发布的科技趋势预测中便可窥见一二:

而早在度晓晓上个月挑战完语文作文之际,便有媒体感慨道:“AIGC元年已至”。

但除此之外,随着数字人背后的能力逐步披露,其所具备的更深层意义和价值也在渐渐浮现。

正如沙利文和IDC此前针对中国数字人发布的报告中所述:

这句看似“数字人已落地”的背后,更是在揭示其背后文心大模型的大规模落地。

而若是把百度近年来在大模型上的各种动作铺开来看,这种信号便可一目了然。

早在2019年,百度CTO王海峰便提出了一个观点:

王海峰当时认为,正因深度学习具备通用性,以及深度学习平台在不断发展,所以它们正在推动AI步入一种新的模式。

到了2020年,“企业版平台”被纳入到了飞桨的全景图之中,并且还发布了预训练模型的开发模式。

这也就迈出了通过预训练大模型来降低AI门槛的重要一步。

而在去年,百度集团副总裁吴甜则是提出企业AI应用三阶段:AI先行者探路、AI工作坊应用、AI工业大生产。

并且针对每一个阶段分别阐述了企业将面临的困难和挑战,以及相应的解决方案。

与此同时,在同年的12月份,文心大模型也随之正式亮相。

“降低使用门槛”,成为了百度在大模型上的努力方向之一。

这一切的目标显然正是百度希望能够让大模型更快、更高效地在产业中铺开来用。

值得一提的是,此前百度“前无古人”地提出的行业大模型,并不是否定其它大模型厂商的分类模式。

这更像是站在传统大模型的基础上,为了让它更好地能被产业用起来,而提出的一种新范式。

而像度晓晓近来两次挑战高考语文和英语作文,可以说只是一种展现大模型已经能够很好地被用起来的一隅。

据了解,文心大模型目前已经在诸如保险、银行、农业、生物医药、工业、搜索,甚至是智能音箱等领域和场景中实现落地应用,在提高垂直业务效率的道路上不断探索前行。

这也正应了吴甜的那句话:

那么接下来,在大模型逐渐与实际场景深入交织融合之下,还会产生怎样的效果,值得拭目以待了。

© 版权声明

相关文章

暂无评论

暂无评论...