量子位 报道 | 公众号 QbitAI
张亚勤是1998年决定回国的,距今已过20年。
这20年中,技术变革天翻地覆,中国发展也日新月异。他见证了互联网在中国的从弱到强,也看到了中国AI正在生发出的全球影响力。
但张亚勤坦言,这一切都是10年、20年前难以预料的,最近这一年来,新技术、新趋势和新变革令他着迷,也令他兴奋不已,他甚至最近都在“闭关”读论文,以求第一时间了解最新的技术进展。
他如何看待当前趋势?又有哪些思考、提醒和最新判断?
在与量子位的独家对话中,这位百度总裁分享了他最新的所见、所闻和所感。
(为便于完整了解亚勤所思所想,我们将对话在不改变原意的基础上,进行了第一人称改写,小标题均为后添加。)
△ 百度总裁张亚勤
深度学习有大缺陷
终极算法赖于类脑突破
我最近两个月把自己的社交网络都停了,朋友圈关了、微博也不看了,现在每天晚上有时间就看论文,比如算法相关的、量子计算等,读书、看论文,发现认知又有提升。
我也在建议我小孩,可以试着把社交网络暂停3个月,然后多读读论文和书,会有增益而不是损失。
当前蓬勃发展的新技术让我兴奋,十年前决计想不到会有今天这样的爆发。
AI的再次火热因深度学习而起,但从算法复杂度、逻辑和计算机科学的角度,深度学习其实并不复杂,终极算法是什么?一切还只是小荷才露尖尖角。
我正在读的一本书,来自多明戈斯(Pedro Domingos)——《终极算法》,其中介绍了5个人工智能学派:符号学派、进化学派、联结学派、统计学派和类脑学派,他认为决定未来走向的终极算法,可能就在这5大学派中。
目前,占主流的是联结学派,通过大量数据做深度学习,建多层网络,就已经展现出了巨大的影响力。
但其实它对人的大脑基本不懂,只是用可监督学习,有输入、输出,然后就靠调参数,用反向传播来优化,优化好之后模拟一个大函数,进而来了新数据之后做新预测——并没有真正用到了人脑学习原理。
联结学派的深度学习模式,在数据量很大、数据有规则、模型有相对规律的情况下,这一套能运行得很漂亮,所以在围棋、语音和翻译等领域,都取得了大突破。
然而它跟人脑学习一比,差距就显而易见。比如小孩学习新事物,并没有那么多数据,小孩学习也不靠语音交互,基本都是看了就记住了,并且马上就能判断及决策。这都是当前AI和深度学习不能相提并论的。
而且当前这种主流算法消耗的计算资源和能量也很高,深度学习依赖海量数据,需要很强的计算资源,有点像大力士,孔武有力,但无法四两拨千斤,不够聪明。
那如果参照大脑,走类脑科学的模式,不仅可以低功耗,而且能有更多决策、记忆系统和突触结构。我们大脑有1000亿神经元,中间通过突触连接,突触本身还能存储信息、参与计算,实现决策,整体结构之精妙复杂,令人惊叹,而且功耗还非常低,运算速度很快,如果我们真能在类脑结构方面实现突破,将大大改变现有的冯·诺依曼架构。
可以看到的是,当前AI芯片层出不穷,都希望在类脑计算方面取得突破,可以学习大脑、学习交互、学习人脑学习系统,然后用低功耗、高效率、有意识的模式进行发展。所以越思考、越往后看,就越能感受到目前深度学习在理论上的大缺陷。
比较起来,我很关注类脑理论,AI要发展得更好,就必须要了解人是怎么学习的,刚才谈到人类小孩的学习能力,如果原理上能让机器学会,都会带来新的跃迁和突破。
于是计算机和生物学跨界交叉研究也越来越受到关注。一方面是从生物学的角度给计算机带来启发,另一方面则是计算机赋能生物研究。之前大脑emotion相关的病症,比如癫痫、老年痴呆、小儿自闭症等可能都是大脑信息传递流程中出现了问题。
拿癫痫来说,病理是神经元一直很活跃,电流就很容易激活,然后毫无征兆就能把人搞晕。那是不是可以通过调节synapse(突触)来降低其活跃度,技能治疗癫痫?此前生物学上难以解决,但现在计算机可以模拟神经元了,能够运用算法可以建立模拟模型,等到进一步知晓如何模拟连接,或许就能治愈癫痫。
我始终觉得,类脑算法中除了研究人脑工作原理——有记忆能力、低功耗,可以做决定,也有待于突触研究的突破,这些连接神经元的部分本身就能存储、计算信息,是一个复杂但令人称奇的系统,这个领域一旦有新突破,或许就能弥补深度学习的不足,进而推动AI实现新的跃迁。
量子计算加速AI
5G带来基础设施大变革
终极算法之外,量子计算的发展也让我兴奋不已。百度前段时间已经成立了量子计算研究所,接下来还有多位世界级科学家加盟。
怎么看量子计算呢?我们从两方面思考。一方面是硬件,另一方面是软件。
硬件方面有量子计算机——有超导方式、半导体方式、光子方式等,我不知道最终哪一个会胜出,但百度会在硬件方面保持合作心态。
我们会更看重软件生态的部分,从三个A的角度看待,也将是百度布局的重点:一个是Algorithms算法,一个是Architecture架构,一个是Application应用,这三个缺一不可,不过算法和架构,我认为还会沿着AI的方式继续向前。
但量子计算带来的变化,将是颠覆性的。这不需要十年二十年,很可能五年左右就会发生。如今机器学习所需要的几个部分,比如大量优化算法、现行方程式、大矩阵计算,以及其中的多项式、大函数,都是量子计算所擅长的,量子计算可以把整个复杂度降低,我们称之为指数型加速。
同样能够带来基础设施革新的是5G。跟2G、3G、4G一样,这又将是一次带宽和信息传输的大革新,会推动AI相关应用更快发展,比如自动驾驶、智能制造和智能家居,其中都有高流量、逼真、交互等相关需求,5G会带来更大带宽,流量也会进一步便宜,新的基础设施+新的技术趋势,就会推动整个产业有大变革,所以这次5G会和AI密切相关。
AI很重要的一部分是万物有灵,5G会让IoT变得更加可能,计算在边缘终端就能实时完成,加之网络虚拟化可以跟现在互联网IP无缝衔接,技术的融合会带来更大的想象。
但越是一片欣欣向荣,越有一些隐患就要留心注意。
警惕AI寒冬
我认为可能有2点需要注意。
第一,要有更长远的心态,其实目前AI在产业有一些泡沫,大家追求短平快,真正研究类脑科学,做算法、深层研究的人还是少,包括量子计算、AI基础算法的人还是少一些,这东西可能要几年后才能出成果,需要一些在安安静静的、长远的心态去进行。
第二,不要犯“短期内高估、长期内低估”的错误,每一个新技术带来,大家往往短期内看得很高,长期又低估了影响,所以我现在很害怕出现所谓的“第三次AI冬天”,因为产业很热,创投很热,可能就会有一些公司亏钱甚至消失,AI不会像很多人预想的那样短期内马上就颠覆所有行业,所以这个时候更需要有耐心,因为这会是一个长期投入的过程,AI对整个社会的影响会是春风化雨的。
或许可以拿千禧年前后的互联网泡沫举例,那时泡沫刚刚破裂,很多人不再相信互联网的价值,但后来事实证明,真正有能力的互联网企业,都是在那个时候成长壮大的,而且我也觉得,现在整个中国科技发展很健康。
而且AI商业化也正在各行各业展开,我可以分享下百度的思路。
AI商业化
百度AI商业化战略也非常清楚。一是通过AI提升现有业务,搜索和信息流,这是双引擎。另外就是进入新的领域,一个是家,一个是车。
AI+云计算方面,关键在于如何到垂直行业中去,比如说金融、医疗、教育、物联网、媒体,就是所谓的落地。
我们现在在几个行业里做得都不错,一个是金融,银联商务、广发银行、浦发银行、百信银行、百度金融的业务落地也相当快。这里面主要依靠的是大数据,数据建立一些风控的模型,建立反欺诈的模型,包括对人的行为的分析。
另外在多媒体方面,包括视频的编码、转码、视频播放,比如像直播、长视频、短视频怎么样去切割视频,我们探索的是怎样对视频内容进行更好的管理。百度信息流里有很多视频,还有爱奇艺,本身就有这个需求。
此外还有物联网相关的落地,包括智慧城市大生态。目前的合作主要是在平台和技术,同时我们会继续寻找每一个场景落地的合作伙伴,最终共同把这个行业打造成一个大生态。我们现在有四、五个行业靠云去实现AI商业化落地。
OMT:区块链技术漂亮,但应用需要观望
也有人问我关于区块链的事情,我觉得技术本身很漂亮,都是经典的分布式计算技术,但具体经营和应用模式,目前还不算明朗,现在只有加密货币是主要应用,但货币的意义很不简单,稍有不慎就会出现别的问题。
所以我想区块链的经营和应用,可能还需要一点时间,我对区块链持开放态度,但在没有想清楚应用场景之前,不希望作过多评论。
当然,我认为区块链确实是一个创新,技术很漂亮,产业也需要大家去尝试,只是切忌在没有想清楚之前就大面积炒作,这一点跟AI、机器学习还不同,后者早已在好几个领域开始发挥价值了。
“