AIGC爆火,ChatGPT一枝独秀,想要追逐、赶超,从什么角度切入比较好?
澜舟科技创始人兼CEO、AI大拿周明的想法是“在垂直领域的应用”。
也就是说,不学ChatGPT的“AGI”梦想,先在一个具体领域做好,等形成产业链后,再把这套成熟的技术铺向更多领域。
不单单是他一个人这么想,还有人跟他一拍即合,这人是中文在线集团董事长兼总裁童之磊。
就在昨天,两家公司宣布了合作,要一起部署类ChatGPT技术,在内容创作中有效发挥AIGC的作用。
实际上,中文在线和澜舟科技要联手的消息,去年9月就已传出。
具体而言,就是开发一套预训练模型技术的文学创作辅助算法,并进行商业化尝试。
双方各司什么职?采取什么样的落地方案?目前进展如何?
澜舟科技祭出的是大模型“孟子”,走的是轻量化、高效训练的路线。
基于Transformer架构,仅包含10亿参数量,可处理多语言、多模态数据,同时支持多种文本理解和文本生成任务。
在此前的中文语言理解权威评测基准CLUE榜单上,“孟子”以10亿参数完成了此前百亿、千亿参数模型刷新的纪录,仅次于人类基准,打破腾讯、搜狗、华为、阿里达摩院轮番霸榜的格局。获得这项成绩,意味着“孟子”对中文数据的理解分析能力目前已处在第一梯队。
而中文在线这边,拿出的是23年里积攒下的数字内容能力,以及能够继续发挥创造力的创作者资源。
这就涉及到一个众所周知的版权归属难问题。童之磊表示,训模型的数据、AI创作出的新内容、对AI创作内容的修改使用,这三个层面“都是有版权的”。
根据这个合作路线,可以看到,二者在AIGC方面的布局,不同于ChatGPT想走的AGI之路,而是要在垂直领域打造一款专用大模型。
通用大模型能够服务更多行业和领域,专用大模型也有自己的刚需和市场,一方面是降低训练成本,一方面是提高针对性——
用中文网文作为训练数据,再用AI对写手写作进行辅助,这样一来帮助写手完成文章中的基本陈述,继而人类能把精力重点放在创作情节和设定上。
童之磊举了一个例子来帮助理解:
提及一座高山,作者通常会用高耸入云、奇峰峻岭之类的词语对山峰形貌进行描述。这样的描述不可或缺,但很少成为挑动读者阅读兴奋程度的关键点,读者更关心的是以“山”为环境背景,人物会有哪些遭遇。
AI辅助创作的功能,就是在你输入“高山”后生成数个描摹高山的语句段落,作为备选答案。
目前,这个功能已向中文在线旗下17K文学平台全部作者开放,他们可针对人物、物品等进行AI辅助创作,并针对不同的作品类别如古风、都市等进行语言调整。
接下来,还将对写作渲染、语法检查、错字排查、文本翻译等既有技术做进一步完善。
同时,要让模型更加理解用户意图,便于AI基于操作系统的形式调动不同的引擎。
调动在这里与“可控”画等号,如功能可控,即根据作者需求加减可调用的具体功能;再如结果可控,保证AI输出的内容是健康、良性的。
中文在线是一家数字出版机构,培养一个AI写手,不会搬起石头,把平台聚集的作者的饭碗砸个稀巴烂?
这样的争论存在不是一天两天了,AI可以写作的第一天起,有网友就觉得它在内容创作者的脖子上比着一把无形的利刃。随着写作AI能够要啥给啥,新闻、评论、摘要、小说都能写,题材风格随便选,更多人慌了起来。
针对此种情况,有悲观者表示过“创造力即将消亡”。
双方的合作暗示着中文在线和澜舟科技对此持积极态度,并表示推出的功能是“AI辅助技术”,而非一个可以完全替代写手的AI写作大手子。
关于“辅助”,双方给出的定义是,作者对于AI生成的推荐内容可以进行选择,作为撰写一般描述性内容时的参考,但在使用时,作者还需要进行自己的加工。
中文在线表示AI辅助介入后不会网文内容遣词造句千篇一律,单调重复,作者选择和调整后,平台和作者都会对内容进行“筛选”和把关。平台方会继续执行内容防抄袭机制,保护知识产权;挑选和阅读过程中,读者也会抛弃雷同的作品。
“AI的训练数据是已经存在的东西,我们用它来替代低成本、低附加值的活动。”童之磊阐述道,真正关键是被读者们看中的创造力,这还得靠真人作者。
读者喜爱刘慈欣创作的《流浪地球》,吸睛点之一就是大刘的想象力与众不同。地球不再宜居,所选择的不是人类迁居外星球,而是让地球背井离乡去流浪。
童之磊说:
不可否认,AI学习过后,会写出《流浪月球》《流浪土星》。但同样不可否认的是,这种创造性的想象力是AI无法具备的。
周明对这个观点表示认同,合作推出的大模型只是帮助中文内容创作站在转型升级的十字路口:
AI辅助技术可以帮助作者完成繁复文章的初稿,提升写作效率。
但它无法达到和取代顶尖业务水平。
想来了解AI辅助写作功能的网络写手们,大概会经历“紧张——放松——紧张”的心理变化:
我的饭碗要砸了???
哦,还好还好,只是帮我提高效率了,不错子。
等等,那我岂不是要被催更了?!
……
“