做机器学习研究,少不了紧跟学界前沿动态,但你知道需要留多长时间才能跟完新研究么?
Google AI大牛、谷歌大脑负责人Jeff Dean,在经过精密计算后得出了一个数据:
平均每一天全世界都会产生100篇机器学习新论文。
如果保守估计,按照扫一篇要3分钟保守估算,跟进每天新论文需要5个小时。
而这只是一天的更新量,无论你在过寒暑假还是在周末休息,每一天都会有这么多新论文产生。
Jeff Dean推特发出一天多,就有数百人点赞转发,引发了网友热烈讨论。
速度超越摩尔定律
事情的起因是这样的,生命科学预印本发表网站bioRxiv的联合创始人Richard Sever发现,bioRxiv上的语音版论文连年攀升,到2018年,平均每个月有2500篇生物类新论文被生产出来。
△ 图片来自Richard Sever的Twitter
AI大牛Jeff Dean看到后坐不住了,他跑到另一个论文预印本网站arXiv上,抓取了历年机器学习子分类下的更新论文也进行了统计。
结果发现,单单计算机科学领域里机器学习这一子分类的论文产量,就已经超过Richard Sever统计的生物论文了。
具体数量走势图如下:
上图蓝线表示arXiv上每年机器学习分类的论文的数量,红线表示摩尔定律的趋势走向。
(所谓摩尔定律,原本是指集成电路上可容纳的晶体管数目,约每隔两年便会增加一倍)
可以看出,机器学习论文数量的增长幅度,已经大大超出了半导体界的衡量标准摩尔定律。
并且在2018年,机器学习论文产量达到了峰值,每天有100篇论文产生。
这让网友有点震惊。
网友热评
网友对于此事的看法,方向角度各不一样。
Twitter网红博主@Amit Patel调侃说,论文奇点即将来临,论文数量太多以至于只有机器才能全部读完。
@gepasi认为,论文数量虽多,但质量参差不齐,提供的价值也需要辨别。他认为,这些论文中很多都没有提供任何增量。
gepasi还说,当你10年后回顾今天,就会发现这些论文中的大部分都将变得无关紧要。
@SamRNolen调侃说,到2060年,世界上每个人都可以每天写一篇ML论文……
网友@jamesdouma也说出了自己的真实感受,他表示直到2015年底,都可以自己浏览所有更新。但从那以后,不得不回到使用社交网络进行第一次筛选。
所有……网友们集思广益,还推荐了一些筛选工具的利器。
比如会根据热度自动给论文排行的Paper with code:
https://paperswithcode.com/
比如Arxiv-Sanity论文搜索工具:
https://github.com/Santosh-Gupta/Arxiv-Manatee
比如自动带提取重点功能的应用Research Paper Summarizer。
你怎么看?
— 完 —
诚挚招聘
量子位正在招募编辑/记者,工作地点在北京中关村。期待有才气、有热情的同学加入我们!相关细节,请在量子位公众号(QbitAI)对话界面,回复“招聘”两个字。
量子位 QbitAI · 头条号签约作者
վ’ᴗ’ ի 追踪AI技术和产品新动态
“