今天,尽管人人都在谈论大数据,但数据实际价值和现有价值有巨大落差。
尽管企业采集和储存、计算数据的能力越来越强,但数据分析能力始终增长缓慢。据Forrester调研,约70%的企业数据从未被分析和使用过,成为数据释放价值过程中的卡脖子难题。
过去二十年,世界从PC时代走进移动时代又走到AI时代,生产力工具越来越简单易用,但数据分析的方式始终没有本质区别,高使用门槛将企业中的大量数据消费者(非技术背景的业务人员)拒之门外。
站在AIGC时代的门口,下一个十年,人们应该如何与数据对话?以ChatGPT大语言模型为代表的自然语言人机交互方式,将如何改变我们的工作方式?企业又如何把握这场技术变革浪潮,充分释放数据的价值,驱动业务增长?
围绕AIGC将如何影响数据分析,从而为企业带来价值,北极九章创始人兼CEO刘沂鑫在「量子位·视点」直播中分享了他的从业经验和观点。
以下根据分享内容进行整理:
数据分析或商业智能是件非常古老的事情,跟AI差不多,都是1960年代开始在美国兴起。我今天分享的主题是,这个非常具有时代感的事情,怎么在一个新的AIGC时代,通过新技术焕发出不一样的生机。
先问大家三个很简单的问题:
第一,在你的企业当中,你觉得数据驱动这件事情到底重不重要?
第二,我的公司或者我的工作,是不是靠数据驱动决策?
如果前两个问题的答案都是yes的话,最后一个问题更直击人心:我们投入了这么多的资源,看了这么多的数据,它创造了多少价值?有多少产出?ROI是多少?
这三个问题的核心在于,我们说了这么多年要靠数据来驱动业务发展,那到底数据真正能为我们的企业带来多大的价值?
哈佛商业评论在2022年对全球最领先企业的采访中发现,只有26.5%的企业认为自己实现了数据驱动。MIT的调研发现,只有8%的企业真正利用数据提升了利润。
我们发现,过去50年的时间,即使是全球最领先的企业,数字化转型带来的利润只有这么少。在国内,大家做了很多数据中台、数据治理和数据准备工作,但没有通过数据让企业赚到钱。为什么?
我在美国工作的时候,服务世界顶级的银行,发现美国企业从上世纪90年开始应用数据的方式方法已经发生了变化,原因在于美国经济从90年开始年增长率就在大约3%,当经济增长放缓,企业更看重的是精细运营带来的数据驱动,从而迅速响应市场的变化。
麦肯锡在2022年1月份发布的报告《2025年做一个数据驱动的企业》指出,在2025年,企业里的每一个员工都会习惯于使用数据来支撑自己的工作,他们会使用创新的数据工具,在短时间内通过数据来解决工作当中的问题。基于此,领先的企业在2025年通过全新的数据使用方式,CIO以及数据团队将会从成本部门转变成为利润部门。
但一个实际情况是,在疫情之前,中国的经济以每年约10%的速度增长,企业只要产品可以生产出来,一定可以卖得出去。所以企业经营只要靠经验来判断就可以了,数据分析只起到统计作用。企业有平均70%数据从未被分析和使用过。我在跟一个中国领先的汽车企业客户交流时,他们给我们反馈是大概80%~90%的数据只是存储,从来没有被使用过。所以我们也一直在思考,怎么样可以更好地使用和分析数据,把70%到甚至80%的潜在价值发挥出来。
我们现在在企业里面怎么分析数据呢?
我要从100张看板当中找到某一张看看关心的数据,发现这个数看起来有点问题,就得去提交个工单,数据分析师或IT拉个看板或者导出个Excel表,再对 Excel表进行加工分析。可能到下个月我才知道这个数据的问题在哪里。如果我是卖服装的,一个月后服装就已经过季了,数据没了时效性就已经失去了它的价值。
数据价值的鸿沟是怎么造成的?很大的原因是工具门槛过高。
2002年我们想获取信息,我会去上新浪、搜狐、雅虎在满屏的新闻里找我需要的内容;到了今天我们会去Google、百度直接搜索,甚至抖音会自动推荐我感兴趣的。20年前我们用笔和纸素描,学摄影和P图;但今天通过MidJourney、Stable Diffusion,我用一两句话的描述,就可以生成非常专业的图片。20年过去,这些工具变得极为简单。
回到数据分析,我们使用的工具和交互方式和20年前几乎是一模一样,我们可能花半年的时间学习一个复杂软件,学会怎么样分析数据、怎么样配图、怎么样制作看板。
大家可以想一想,我们工作后会把多长时间花在学习一个新技能上?数据分析本应是很简单的事情,我每一天只需要看那么几个数支持做决策就行了,但是我为了每一天看5分钟,却需要去花几个月的时间学习非常复杂的工具。这造成一个很现实的问题,据埃森哲调查,75%的人人不愿意和数据打交道,36%的人在决策的时候会故意绕过数据。
在一个对话式AI时代,只要你能说,你就能做。我们可以大大降低数据门槛,提升大家的数据能力。
大家都知道GPT可以写代码,那么数据分析加大语言模型自动写SQL,作为我的Copilot,变成人和数据之间的翻译器,可以吗?
我们做了大量尝试,发现GPT现阶段还不能解决我们刚才提到的问题。我们首先要编写一段prompt,虽然用的是自然语言,但你依然要按照计算机的方式去跟它交流,prompt越准确,计算机才可以把它翻译得越好。这导致的几个问题在于:
第一是门槛高,用户需要懂数据,并且有分析思路;第二在于容错率低,需要一个足够准确、足够完整的prompt,才能生成一个足够精确的回答;第三它的套路固定,我们必须要让每个用户有结构化的思维,才能有效引导机器来去理解人的意图。所以这个prompt是有门槛的。
另外我们发现大模型生成的SQL语句,我问它同样的问题每次代码不一致,需要人工检查,我如果不会写SQL、不知道数据架构,这个代码我是没有办法相信的。如果问题复杂了,它的错误率会大大提高。另外,大语言模型没有办法去根据用户的权限自动生成代码,而且它一次只能回答一个问题,新问题需要再去想另外一个新的prompt,一点一点构造出我的SQL语句。
我们打开思路,是不是可以往前多走几步,通过自然语言一步直接进行数据洞察?北极九章给出了我们自己的解法。北极九章自研的核心技术生成稳定可解释的代码、理解业务需求、保障企业级安全,并且结合了大语言模型的优势,帮助我们做数据的解读和决策建议。
我们可以通过自然语言进行提问,用户不需要了解数据是什么样子,比如“谁卖的最好”,北极九章DataGPT的语义解析引擎可以理解各种各样的嵌套问题、模糊问题、补全问题。有了北极九章DataGPT,在整个的数据分析的流程当中,可能打字或语音问问题变成了最长的环节,每个问题都可以在毫秒级时间内获得答案。
基于我们的Auto Insight自动分析引擎,机器不仅回答你的问题,还主动告诉你这个数据怎么样、为什么、有什么风险,相当于复制了一个3~5年数据分析师的能力,快速帮你定位问题。如果你不知道该问什么,或者没找到想要的答案,我们基于推荐算法加人工校准,不断学习和迭代,让它越用越好用。
在工作中,我们更习惯在即时通讯工具或在手机上和人沟通。北极九章也可以成为IM的一部分,在企业微信、钉钉、飞书中通过与机器人对话分析数据。我们甚至可以作为WPS插件,在你的任何一个文档中搜索分析,把图表插入文档。我们还有另一个黑科技,如果我周三就把报告写完了,在周五的时候直接点击一下更新数据,就能直接更新文档里的图表,让你的报告数据永远最新最实时。
我们还发现,大语言模型可以解放IT团队的生产力。原来IT团队配置数据分析模型是非常耗时和繁琐的。通过AI的能力,我们可以在一分钟以内自动化地解析和配置数据。
我们认为,当一个产品足够简单、足够强大的时候,数据可以给每一个人使用。传统的数据分析软件使用者太少,数据价值的变现只能是空中楼阁和遥不可及的存在。
我们服务了国内最大的保险经纪公司之一,这个公司有上千号人,投入了大量精力建设数据中台,但是他们发现,业务人员在上中台之前大概需要一到两个月的时间获得一个数据看板,上中台之后还是需要一两个月的时间,数据中台的建设成果,其实并没有被业务人员感受到。
使用了北极九章之后,业务人员直接使用搜索的方式,立刻就可以通过数据定位到哪些保险产品在哪些子公司理赔周期过长或者过短,相当于为整个团队带来了超过40个人的额外分析能力,每年节约超过1000多万元的机会成本。让我们感到非常欣喜的是,这个公司之前很多的决策都是靠拍脑门,现在业务人员会主动想决策之前是不是可以先搜索问问数据。
不久前Gartner发布了2023年数据分析的十大关键技术。2023年,企业会部署的新兴技术包括增强数据和分析、自然语言处理和决策智能;会话式用户界面、自然语言生成、Transformer模型和大规模预训练语言模型预计也将会全面应用于企业。可以看到,全世界最领先的企业都在寻求通过数据和分析带来可量化的价值,构建信任培养数据和分析文化。
过去的几十年,我们在数据建设方面虽然有了长足的进步,但是我们的数据其实大而不强,相比于欧美领先国家,仍有至少十年的差距。当AIGC趋势到来的时候,我们的企业如何去布局未来十年?如何在激烈的竞争中赢得优势?
可以确定的是,我们没有时间像过去一样慢慢培养专业人才、组建团队。未来的十年,人和机器直接对话会成为趋势,我们的工作将不会是不停操作Excel和看板,而是通过我们最习惯、最自然的沟通方式,在AI的帮助下随时问出问题。
量子位发起的CEO/CTO系列分享活动,不定期邀请前沿科技领域创业公司CEO/CTO,分享企业最新战略、最新技术、最新产品,与广大从业者、爱好者探讨前沿技术理论与产业实践。欢迎大家多多关注 ~
需要观看直播回放的小伙伴,可以戳链接噢:
https://www.bilibili.com/video/BV1VM4y1t7SK
“