最近,五位哈佛的在读博士生集体来到著名社区reddit,展开一场围绕人工智能和认知科学的AMA(Ask Me Anything)。
简单介绍一下这几位博士生:Rockwell Anyoha来自分子生物学系;Dana Boebinger、Kevin Sitek来自哈佛-麻省理工语音和听力项目;Adam Riesselman、William Yuan来自医学院,他们使用机器学习等展开相关研究。
这次总时长两个小时的在线交流,得到了reddit网友的热情参与,量子位从中节选了一些精彩的问答进行了编译摘录。如下。
提问:我们需要担心人工智能和自动化发展速度过快么?
回答:我们应该为生活在充满AI和自动化的世界做好准备。许多工作在不久的将来会变得过时。既然我们知道这天一定会到来,整个社会就应该制定有效的政策。
伊隆·马斯克的“AI末世论”遭到很多人反对,特别是AI从业者。正如吴恩达所说:“我认为工作岗位流失是一个巨大的问题,但我希望大家可以专注于解决这个问题,而不是关心那些科幻小说一样的东西”。
提问:AI会在哪个领域(医疗、金融等)率先立足,为什么?
回答:AI已经在医学图像处理领域得到了长足的进步。例如,在通过图片识别皮肤癌这件事上,人工智能机器已经达到了人类医生的水平。
金融和银行部门也会更快的实现自动化。通常股票的购买是一个复杂的决策过程,最终这些交易将由各种数据决定,算法正在取代人的决策。
但我们仍然不知道人工智能会如何影响我们的经济和工作,只有时间会说明一切。
提问:机器学习是当前的热门话题。AI的下一个大事件会是什么?
回答:从纯机器学习的角度来说,无监督学习会是下一个大事。研究人员现在给机器“喂”数据的方式被称为监督学习,这些数据不但知道类型(例如图片),而且还打了标签(例如图中是一只猫)。监督学习领域,有很多伟大的成功。
如何让机器自学成才?这就是无监督学习要干的事情。一个婴儿出生后,父母不必教授每一件事情,婴儿会自己学习。当然无监督学习是一个棘手的事情,AI研究者正在为此而努力。比方Yann LeCun最近就一直在讲无监督学习。
提问:你们可能低估了无监督学习,在这个AI问题上已经研究了几十年,但没有任何进展。这不是一个新的研究焦点。
回答:感谢回复。我们这里想说的是无监督学习的具体算法框架。生成模型被用来解决这个问题,因为它可以某种方式探测数据中潜在的变量,而且可以生成新的数据。
以前曾经使用Wake-Sleep算法解决这个问题,但是并没有获得太大的成功。然后是限制玻尔兹曼机以及深度信念网络。但是这些技术在应用到现实世界时,都遇到了极大的挑战。
最近,变分自编码器和生成对抗网络等模型已经取得突破。使用这些模型可以快速、简单的对非结构化数据执行复杂的任务,包括创建人物素描、生成句子以及自动为图片着色等。
没错,人们在这个领域已经努力很久了。而通过上述新技术,我想我们正在接近一个新的领域——让机器自己了解我们的世界。
提问:你们觉得政府应该为AI制定什么具体的法律法规么?
回答:有个阿西莫夫机器人三定律。
第一定律:机器人不得伤害人类个体,或者目睹人类个体将遭受危险而袖手不管。
第二定律:机器人必须服从人给予它的命令,当该命令与第一定律冲突时例外。
第三定律:机器人在不违反第一、第二定律的情况下要尽可能保护自己的生存。
认真的说,应该有一些法律规范人工智能的应用,也许还需要一些机构进行代码评估,已确定人工智能是否会被用于不道德的领域。我脑子里想到那个无人车需要面对的“电车难题”:是否应该为了拯救10个人牺牲掉另外的1个人。
在这方面我们不是专家。
提问:最近Facebook的工程师关掉了机器学习的翻译程序,据说是因为这些AI创造了自己的语言。你们怎么看待这件事?(查看相关报道点击这里)
回答:我觉得这没有什么可怕的。
机器学习中的一个大问题,就是生成与人类相似的反应或者反馈。一个解决之道是让机器生成人类的句子,然后你告诉机器它干得好不好。这个方式非常困难,因为耗时费力。即便是能够自学的算法,也需要上百万的语料才有可能正确工作。另一条道路是让一台机器生成语句,另一台来判断是否符合人类的语言。
Facebook的工作是想制造一台能够谈判协商的机器,但结果显示他们的方式不会奏效,所以关闭了这项研究。
提问:我对AI和机器学习感兴趣已经两年了。希望未来能有机会从事AI安全相关的工作。能给我一些建议么?我应该做什么活着学点什么?多谢!
回答:Google的人写过一篇非常有趣的文章,来说明AI安全问题。他们给出了五个要点:
1、避免有害副作用:机器人如何才能在追求效率的同时避免造成连带损伤?
2、避免激励机制漏洞:如何才能防止机器人投机取巧?
3、弹性监督:如何让机器人能自主验证目标,正确完成任务,而不需要让用户花极高的时间成本与机器人反复核实?
4、安全探索:如何避免机器人在探索陌生环境、学习新技能时对人类造成损害?
5、切换环境后的可靠性:我们如何能保证机器人在切换环境后,能将已经习得的技能无缝迁移到新环境中,避免造成不必要的麻烦?
另外,建议你更多的熟悉算法,知道机器如何工作。
提问:未来想要从事AI,现在最佳路线是什么?我现在就读于社区大学,正在攻读一个计算机科学的学士学位。
回答:坦白讲,我认为想要搞好机器学习,需要有很强的数据背景。机器学习的本质上是统计学,只不过披上了花哨的算法外衣。这个领域迅速演变,就像狂野的西部,所以也有人形容机器学习是:牛仔统计学。但我认为机器学习被夸大了,基本的统计学就能解决很多问题。
我觉得你也应该在其他自己喜欢的领域继续研究。如果你不理解手上数据的意思,你也不可能进行很好的建模。我们这些人都会研究一个具体的问题,在他们感兴趣的领域,应用机器学习的方法。当然,你也可以选择搞纯粹的机器学习研究。
总之,数学和你感兴趣的领域,都很重要。
更多问答内容,可以访问这个网址:
https://www.reddit.com/r/IAmA/comments/6qbw5f/we_are_phd_students_from_harvard_university_here/
△ 参与答问的William Yuan
最后,他们还给出一些建议:
- 编程入门可以借助这个网站CodeAcademy
- 进阶学习需要Python编程语言
地址:https://www.edx.org/course/introduction-computer-science-mitx-6-00-1x-10
- 以及计算机科学入门课程(CS50)
地址:https://www.edx.org/course/introduction-computer-science-harvardx-cs50x
- 概率入门课程(Stat110)
- 机器学习入门课程
- 不知道如何着手使用数据进行预测?以及想跟别人比试比试机器学习水平?可以试试参加Kaggle竞赛。
- 推荐一本最棒的机器学习教科书:《Machine Learning: A Probabilistic Perspective》
- Sklearn:真正伟大的机器学习算法,开箱即用
- TensorFlow:先进的机器学习工具包,可以用来构建自己的算法
【完】
“