博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
【转帖】MIT人工智能实验室:如何做研究?
阅读量:6479 次
发布时间:2019-06-23

本文共 5534 字,大约阅读时间需要 18 分钟。

来自MIT人工智能实验室:如何做研究?

作者:人工智能实验室全体研究生

编辑:David Chapman

版本:1.3

时间:19889

译者:柳泉波 北京师范大学信息学院2000级博士生

Copyright 1987, 1988 作者版权所有

 

摘要 本文的主旨是解释如何做研究。我们提供的这些建议,对做研究本身(阅读、写作和程序设计),理解研究过程以及开始热爱研究(方法论、选题、选导师和情感因素),都是极具价值的。

 

备注:人工智能实验室的Working Papers用于内部交流,包含的信息由于过于初步或者过于详细而无法发表。不像正式论文那样,会列出所有的参考文献。

1. 简介

这是什么?

并没有什么神丹妙药可以保证在研究中取得成功,本文只是列举了一些可能会有所帮助的非正式意见。

目标读者是谁?

本文档主要是为MIT人工智能实验室新入学的研究生而写,但对于其他机构的人工智能研究者也很有价值。即使不是人工智能领域的研究者,也可以从中发现对自己有价值的部分。

如何使用?

要精读完本文,太长了一些,最好是采用浏览的方式。很多人觉得下面的方法很有效:先快速通读一遍,然后选取其中与自己当前研究项目有关的部分仔细研究。

本文档被粗略地分为两部分。第一部分涉及研究者所需具备的各种技能:阅读,写作和程序设计,等等。第二部分讨论研究过程本身:研究究竟是怎么回事,如何做研究,如何选题和选导师,如何考虑研究中的情感因素。很多读者反映,从长远看,第二部分比第一部分更有价值,也更让人感兴趣。

小节2  如何通过阅读打好AI研究的基础。列举了重要的AI期刊,并给出了一些阅读的诀窍。

小节3  如何成为AI研究领域的一员:与相关人员保持联系,他们可以使你保持对研究前沿的跟踪,知道应该读什么材料。

小节4  学习AI相关领域的知识。对几个领域都有基本的理解,对于一个或者两个领域要精通。

小节5  如何做研究笔记。

小节6  如何写期刊论文和毕业论文。如何为草稿写评审意见,如何利用别人的评审意见。如何发表论文。

小节7  如何做研究报告。

小节8  是有关程序设计的。AI程序设计与平常大家习惯的程序设计有所不同。

小节9  有关研究生涯最重要的问题,如何选导师。不同的导师具有不同的风格,本节的意见有助于你找到合适的导师。导师是你必须了解如何利用的资源。

小节10  关于毕业论文。毕业论文将占据研究生生涯的大部分时间,本部分涉及如何选题,

以及如何避免浪费时间。

小节11  有关研究方法论,尚未完成。

小节12  或许是最重要的一节:涉及研究过程中的情感因素,包括如何面对失败,如何设定

目标,如何避免不安全感,保持自信,享受快乐。

 

2. 阅读

 

很多研究人员花一半的时间阅读文献。从别人的工作中可以很快地学到很多东西。本节讨论的是AI中的阅读,在第四小节将论述其他主题相关的阅读。

阅读文献,始于今日。一旦你开始写作论文,就没有多少时间了,那时的阅读主要集中于论文主题相关的文献。在研究生的头两年,大部分的时间要用于做课程作业和打基础。此时,阅读课本和出版的期刊文章就可以了。(以后,你将主要阅读文章的草稿,参看小节三)。

在本领域打下坚实的基础所需要的阅读量,是令人望而却步的。但既然AI只是一个很小的研究领域,因此你仍然可以花几年的时间阅读本领域已出版的数量众多论文中最本质的那部分。一个有用的小技巧是首先找出那些最本质的论文。此时可以参考一些有用的书目:例如研究生课程表,其他学校(主要是斯坦福大学)研究生录取程序的建议阅读列表,这些可以让你有一些初步的印象。如果你对AI的某个子领域感兴趣,向该领域的高年级研究生请教本领域最重要的十篇论文是什么,如果可以,借过来复印。最近,出现了很多精心编辑的有关某个子领域的论文集,尤其是Morgan-Kauffman出版的。

AI实验室有三种内部出版物系列:Working PapersMemosTechnical Reports,正式的程度依次增加,在八层的架子上可以找到。回顾最近几年的出版物,将那些非常感兴趣的复制下来。这不仅是由于其中很多都是意义重大的论文,对于了解实验室成员的工作进展也是很重要的。

有关AI的期刊有很多,幸运的是,只有一部分是值得看的。最核心的期刊是Artificial Int

elligence,也有写作"the Journal of Artificial Intelligence"或者"AIJ"的。AI领域真正具备价值的论文最终都会投往AIJ,因此值得浏览每一年每一期的AIJ;但是该期刊也有很多论文让人心烦。Computational Intelligence是另外一本值得一看的期刊。Cognitive Science也出版很多意义重大的AI论文。Machine Learning是机器学习领域最重要的资源。IEEE PAMIPattern Analysis and Machine Intelligence)是最好的有关视觉的期刊,每期都有两三篇有价值的论文。International Journal of Computer VisionIJCV)是最新创办的,到目前为止还是有价值的。Robotics Research的文章主要是关于动力学的,有时候也有划时代的智能机器人论文。IEEE Robotics and Automation偶尔有好文章。

每年都应该去所在学校的计算机科学图书馆(在MITTech Square的一层),翻阅其他院校出版的AI技术报告,并选出自己感兴趣的仔细加以阅读。

阅读论文是需要练习的技能。不可能完整地阅读所有的论文。阅读论文可分为三个阶段:第一阶段是看论文中是否有感兴趣的东西。AI论文含有摘要,其中可能有内容的介绍,但是也有可能没有或者总结得不好,因此需要你跳读,这看一点那看一点,了解作者究竟做了些什么。内容目录(the table of contents)、结论部分(conclusion)和简介(introduction)是三个重点。如果这些方法都不行,就只好顺序快速浏览了。

一旦搞清楚了论文的大概和创新点,就可以决定是否需要进行第二阶段了。在第二阶段,要找出论文真正具有内容的部分。很多15页的论文可以重写为一页左右的篇幅;因此需要你寻找那些真正激动人心的地方,这经常隐藏于某个地方。论文作者从其工作中所发现的感兴趣的地方,未必是你感兴趣的,反之亦然。最后,如果觉得该论文确实有价值,返回去通篇精读。

读论文时要牢记一个问题,“我应该如何利用该论文?”“真的像作者宣称的那样么?”“如果..会发生什么?”。理解论文得到了什么结论并不等同于理解了该论文。理解论文,就

要了解论文的目的,作者所作的选择(很多都是隐含的)假设和形式化是否可行,论文指出

了怎样的方向,论文所涉及领域都有哪些问题,作者的研究中持续出现的难点模式是什么,

论文所表达的策略观点是什么,诸如此类。

将阅读与程序设计联系在一起是很有帮助的。如果你对某个领域感兴趣,在阅读了一些论文后,试试实现论文中所描述的程序的“玩具”版本。这无疑会加深理解。

可悲的是,很多AI实验室天生就是孤僻的,里面的成员主要阅读和引用自己学校实验室的工作。要知道,其他的机构具有不同的思考问题的方式,值得去阅读,严肃对待,并引用它们的工作,即使你认为自己明晓他们的错误所在。

经常会有人递给你一本书或者一篇论文并告诉你应该读读,因为其中有很闪光的地方且/或可以应用到你的研究工作中。但等你阅读完了,你发现没什么特别闪光的地方,仅仅是勉强可用而已。于是,困惑就来了,“我哪不对啊?我漏掉什么了吗?”。实际上,这是因为你的朋友在阅读书或论文时,在头脑中早已形成的一些想法的催化下,看出了其中对你的研究课题有价值的地方。

 

3. 建立关系

 

一两年后,对自己准备从事的子领域已经有了一些想法。此时——或者再早一点——加入Secret Paper Passing Network是很重要的。这个非正式的组织是人工智能真正在做什么的反映。引导潮流的工作最终会变成正式发表的论文,但是至少在牛人完全明白一年之后,也就是说,牛人对新思想的工作至少领先一年。

牛人如何发现新思路的?可能是听自于某次会议,但是最可能来自于Secret Paper Passing Network。下面是该网络工作的大致情况。Jo Cool有了一个好想法。她将尚不完整的实现与其他一些工作融合在一起,写了一份草稿论文。她想知道这个想法究竟怎么样,因此她将论文的拷贝发送给十位朋友并请他们进行评论。朋友们觉得这个想法很棒,同时也指出了其中的错误之处,然后这些朋友又把论文拷贝给他们各自的一些朋友,如此继续。几个月后,Jo对之进行了大量修订,并送交给AAAI。六个月后,该论文以五页的篇幅正式发表(这是AAAI会议录允许的篇幅)。最后Jo开始整理相关的程序,并写了一个更长的论文(基于在AAAI发表论文得到的反馈)。然后送交给AI期刊。AI期刊要花大约两年的时间,对论文评审,包括作者对论文修改所花费的时间,以及相应的出版延迟。因此,理想情况下,Jo的思想最终发表在期刊上需要大约三年时间。所以牛人很少能从本领域出版的期刊文章中学到什么东西,来得太迟了。

你,也可以成为一个牛人。下面是建立学术关系网的一些诀窍:有很多讨论某个AI子领域(如连接主义或者视觉)的邮件列表,选择自己感兴趣的列表加入。当与很熟悉本领域的人讨论自己的思想时,他们很可能不直接评价你的想法,而是说:“你读过某某吗?”这并不是一个设问,而是建议你去阅读某份文献,它很可能与你的想法有关系。如果你还没有读过该文献,从跟你交谈的高手那里得到该文献的详细信息,或者直接从他那里借一份拷贝下来。

当你读到某份让你感到很兴奋的论文,复印五份送交给对之感兴趣的其他五个人。他们可能会反馈回来很好的建议。

本实验室有很多针对不同子领域的非正式(持续发展的)论文讨论组,他们每星期或每两星期聚会一次,对大家阅读完的论文进行讨论。

有些人并不介意别人去翻看他们的书桌,也就是说,去翻阅他们堆在书桌上的不久要阅读或者经常翻阅的论文。你可以去翻翻看,有没有自己感兴趣的。当然了,首先要得到主人的许可,要知道有些人确实反感别人翻自己的东西。去试试那些平易近人的人。

同样,有些人也并不介意你翻看他们的文件柜。实验室中可是有很多学问精深的人,他们的文件柜里也是有好多宝贝。与利用学校图书馆相比,这通常是更快更可靠的寻找论文的方式。

只要自己写下了些东西,将草稿的拷贝分发给那些可能感兴趣的人。(这也有一个潜在的问题:虽然AI领域的剽窃很少,但也确实有。你可以在第一页写上“请不要影印或者引用”的字样以做部分防范。)大部分人并不会阅读自己收到的大部分论文,因此如果只有少数人返回评论给你,也不用太在意。你可以如此反复几次——这是期刊论文所必需的。注意,除了自己的导师,一般很少将两次以上的草稿送给同一个人。

当你写完一篇论文后,将论文的拷贝送给那些可能感兴趣的人。别以为人家自然而然地就会去阅读发表论文的期刊或者会议录。如果是内部的出版物(备忘录和技术报告)就更不容易读到了。

你保持联系的人越是各式各样,效果就越好。尝试与不同研究组,AI实验室,不同学术领域的人交换论文。使自己成为没有联系的两个科研组交流的桥梁,这样,很快的,你的桌子上就会冒出一大摞相关的论文。

如果某篇论文引用了自己感兴趣的某些东西,做好笔记。维护一份自己感兴趣参考文献的日志。到图书馆去看看能不能找到这些论文。如果要了解某个主题的发展轨迹,可以有意地去做一张引用的“参考文献”图。所谓的参考文献图,是指引用组成的网:论文A引用BCB引用CDC引用D,等等。注意那些被经常引用的论文,这通常是值得阅读的。参考文献图有奇妙的性质。一个是经常有研究同一主题的研究组相互不了解。你搜索该图,突然发现了进入另一部分的方式,这通常出现于不同学校或者不同方法存在的地方。尽可能了解多种方法是很有价值的,这总比非常深入的了解某一种方法更好。

暂时搁置。跟别人交谈。告诉他们你在做什么,并询问人家在做什么。(如果你对与别的学生讨论自己的想法感到害羞,也要坚持交谈,即使自己没有什么想法,与他们讨论自己认为确实优秀的论文。这将很自然地引导到下一步做什么的讨论。)每天中午在活动楼七层有一个非正式的午餐讨论会。在我们实验室,人们都习惯于晚上工作,所以午餐的时候可以跟别人组成松散的小组进行讨论。

如果你与外界的交流很多——做演示或者参加会议——去印张事务名片,主要要使自己的名字容易记住。

从某个时间开始,你将会开始参加学术会议。如果你确实参加了,你会发现一个事实,几乎所有的会议论文都令人生厌或者愚蠢透顶。(这其中的理由很有意思,但与本文无关,不做讨论)。那还去参加会议干吗?主要是为了结识实验室之外的人。外面的人会传播有关你的工作的新闻,邀请你作报告,告知你某地的学术风气和研究者的特点,把你介绍给其他人,帮助你找到一份暑期工作,诸如此类。如何与别人结识呢?如果觉得某人的论文有价值,跑上去,说:“我非常欣赏您的论文”,并提问一个问题。

获得到别的实验室进行暑期工作的机会。这样你会结识另外一群人,或许还会学到另外一种看待事物的方式。可以去问高年级同学如何获取这样的机会,他们或许已经在你想去的地方工作过了,能帮你联系。

转载于:https://www.cnblogs.com/daleloogn/p/4163845.html

你可能感兴趣的文章
First blood
查看>>
kernel笔记——网络收发包流程
查看>>
java 冒泡排序和快速排序 实现
查看>>
搭建Windows下的Go开发环境
查看>>
浪潮服务器自动重启
查看>>
阿里逾亿美元投资魅力惠 打造奢侈品闪购平台
查看>>
亲历互联网泡沫,我从中为区块链发展汲取了这些经验
查看>>
游标遍历所有数据库循环执行修改数据库的sql命令
查看>>
C# 中获取CPU序列号/网卡mac地址等
查看>>
分析Linux 文件系统访问控制列表
查看>>
spring中的设计模式(二)
查看>>
shell 中简单的运算
查看>>
VMware内存不足解决方案
查看>>
Nginx基础
查看>>
python列表解析和生成表达式浅要说明
查看>>
Java注解Annotation详解
查看>>
C++文件操作 判断文件是否存在和文件大小
查看>>
揭开AS程序的外纱(八) -- 容易被忽视的数组实用功能
查看>>
物理内存低于896M各个区到底是怎么映射的
查看>>
linux下的缓存机制及清理buffer/cache/swap的方法梳理
查看>>