vincentff7 - IT博客

2010年3月14日

posted @ 2010-03-14 13:53 vincentsim 阅读(961) | 评论 (0) | 编辑收藏

2009年10月13日

来自MIT人工智能实验室:如何做研究

作者:人工智能实验室全体研究生
编辑:David Chapman
版本:1.3
时间:1988年9月
译者:柳泉波北京师范大学信息学院2000级博士生
摘要本文的主旨是解释如何做研究.我们提供的这些建议,对做研究本身(阅读,写作和程序设计),理解研究过程以及开始热爱研究(方法论,选题,选导师和情感因素),都是极具价值的.
Copyright 1987, 1988 作者版权所有
备注:人工智能实验室的Working Papers用于内部交流,包含的信息由于过于初步或者过于详细而无法发表.不像正式论文那样,会列出所有的参考文献.
1. 简介
并没有什么神丹妙药可以保证在研究中取得成功,本文只是列举了一些可能会有所帮助的非正式意见.
目标读者是谁
本文档主要是为MIT人工智能实验室新入学的研究生而写,但对于其他机构的人工智能研究者也很有价值.即使不是人工智能领域的研究者,也可以从中发现对自己有价值的部分.
如何使用
要精读完本文,太长了一些,最好是采用浏览的方式.很多人觉得下面的方法很有效:先快速通读一遍,然后选取其中与自己当前研究项目有关的部分仔细研究.

本文档被粗略地分为两部分.第一部分涉及研究者所需具备的各种技能:阅读, 写作和程序设计,等等.第二部分讨论研究过程本身:研究究竟是怎么回事,如何做研究,如何选题和选导师,如何考虑研究中的情感因素.很多读者反映,从长远看,第二部分比第一部分更有价值,也更让人感兴趣.
如何通过阅读打好AI研究的基础.列举了重要的AI期刊,并给出了一些阅读的诀窍.
如何成为AI研究领域的一员:与相关人员保持联系,他们可以使你保持对研究前沿的跟踪,知道应该读什么材料.
如何学习AI相关领域的知识.对几个领域都有基本的理解,对于一个或者两个领域要精通.
如何做研究笔记.
如何写期刊论文和毕业论文.如何为草稿写评审意见,如何利用别人的评审意见.如何发表论文.
如何做研究报告.
有关程序设计的.AI程序设计与平常大家习惯的程序设计有所不同.
有关研究生涯最重要的问题,如何选导师.不同的导师具有不同的风格,本节的意见有助于你找到合适的导师.导师是你必须了解如何利用的资源.
关于毕业论文.毕业论文将占据研究生生涯的大部分时间,本部分涉及如何选题,以及如何避免浪费时间.
有关研究方法论,尚未完成.
或许是最重要的一节:涉及研究过程中的情感因素,包括如何面对失败,如何设定目标,如何避免不安全感,保持自信,享受快乐.
2. 阅读
很多研究人员花一半的时间阅读文献.从别人的工作中可以很快地学到很多东西.本节讨论的是AI中的阅读,在第四小节将论述其他主题相关的阅读.
阅读文献,始于今日.一旦你开始写作论文,就没有多少时间了,那时的阅读主要集中于论文主题相关的文献.在研究生的头两年,大部分的时间要用于做课程作业和打基础.此时,阅读课本和出版的期刊文章就可以了.(以后,你将主要阅读文章的草稿,参看小节三).
在本领域打下坚实的基础所需要的阅读量,是令人望而却步的.但既然AI只是一个很小的研究领域,因此你仍然可以花几年的时间阅读本领域已出版的数量众多论文中最本质的那部分.一个有用的小技巧是首先找出那些最本质的论文.此时可以参考一些有用的书目:例如研究生课程表,其他学校(主要是斯坦福大学)研究生录取程序的建议阅读列表,这些可以让你有一些初步的印象.如果你对AI的某个子领域感兴趣,向该领域的高年级研究生请教本领域最重要的十篇论文是什么,如果可以,借过来复印.最近,出现了很多精心编辑的有关某个子领域的论文集,尤其是 Morgan-Kauffman出版的.
AI实验室有三种内部出版物系列:Working Papers,Memos和Technical Reports,正式的程度依次增加,在八层的架子上可以找到.回顾最近几年的出版物,将那些非常感兴趣的复制下来.这不仅是由于其中很多都是意义重大的论文,对于了解实验室成员的工作进展也是很重要.
有关AI的期刊有很多,幸运的是,只有一部分是值得看的.最核心的期刊是 Artificial Intelligence,也有写作"the Journal of Artificial Intelligence "或者"AIJ"的.AI领域真正具备价值的论文最终都会投往AIJ,因此值得浏览每一年每一期的AIJ;但是该期刊也有很多论文让人心烦. Computational Intelligence是另外一本值得一看的期刊.Cognitive Science也出版很多意义重大的AI论文.Machine Learning是机器学习领域最重要的资源.IEEE PAMI(Pattern Analysis and Machine Intelligence)是最好的有关视觉的期刊,每期都有两三篇有价值的论文.International Journal of Computer Vision(IJCV)是最新创办的,到目前为止还是有价值的.Robotics Research的文章主要是关于动力学的,有时候也有划时代的智能机器人论文.IEEE Robotics and Automation偶尔有好文章.
每年都应该去所在学校的计算机科学图书馆(在MIT的Tech Square的一层),翻阅其他院校出版的AI技术报告,并选出自己感兴趣的仔细加以阅读.
阅读论文是需要练习的技能.不可能完整地阅读所有的论文.阅读论文可分为三个阶段:第一阶段是看论文中是否有感兴趣的东西.AI论文含有摘要,其中可能有内容的介绍,但是也有可能没有或者总结得不好,因此需要你跳读,这看一点那看一点,了解作者究竟做了些什么.内容目录(the table of contents),结论部分(conclusion)和简介(introduction)是三个重点.如果这些方法都不行,就只好顺序快速浏览了.一旦搞清楚了论文的大概和创新点,就可以决定是否需要进行第二阶段了.在第二阶段,要找出论文真正具有内容的部分.很多15页的论文可以重写为一页左右的篇幅;因此需要你寻找那些真正激动人心的地方,这经常隐藏于某个地方.论文作者从其工作中所发现的感兴趣的地方,未必是你感兴趣的,反之亦然.最后,如果觉得该论文确实有价值,返回去通篇精读.
读论文时要牢记一个问题,"我应该如何利用该论文 ""真的像作者宣称的那样么 ""如果……会发生什么 ".理解论文得到了什么结论并不等同于理解了该论文.理解论文,就要了解论文的目的,作者所作的选择(很多都是隐含的),假设和形式化是否可行,论文指出了怎样的方向,论文所涉及领域都有哪些问题,作者的研究中持续出现的难点模式是什么,论文所表达的策略观点是什么,诸如此类.
将阅读与程序设计联系在一起是很有帮助的.如果你对某个领域感兴趣,在阅读了一些论文后,试试实现论文中所描述的程序的"玩具"版本.这无疑会加深理解. 可悲的是,很多AI实验室天生就是孤僻的,里面的成员主要阅读和引用自己学校实验室的工作.要知道,其他的机构具有不同的思考问题的方式,值得去阅读,严肃对待,并引用它们的工作,即使你认为自己明晓他们的错误所在.
经常会有人递给你一本书或者一篇论文并告诉你应该读读,因为其中有很闪光的地方且/或可以应用到你的研究工作中.但等你阅读完了,你发现没什么特别闪光的地方,仅仅是勉强可用而已.于是,困惑就来了,"我哪不对啊我漏掉什么了吗 ".
实际上,这是因为你的朋友在阅读书或论文时,在头脑中早已形成的一些想法的催化下,看出了其中对你的研究课题有价值的地方.
3. 建立关系
一两年后,对自己准备从事的子领域已经有了一些想法.此时——或者再早一点——加入Secret Paper Passing Network是很重要的.这个非正式的组织是人工智能真正在做什么的反映.引导潮流的工作最终会变成正式发表的论文,但是至少在牛人完全明白一年之后, 也就是说,牛人对新思想的工作至少领先一年.
牛人如何发现新思路的可能是听自于某次会议,但是最可能来自于Secret Paper Passing Network.下面是该网络工作的大致情况.Jo Cool有了一个好想法.她将尚不完整的实现与其他一些工作融合在一起,写了一份草稿论文.她想知道这个想法究竟怎么样,因此她将论文的拷贝发送给十位朋友并请他们进行评论.朋友们觉得这个想法很棒,同时也指出了其中的错误之处,然后这些朋友又把论文拷贝给他们各自的一些朋友,如此继续.几个月后,Jo对之进行了大量修订,并送交给AAAI.六个月后,该论文以五页的篇幅正式发表(这是AAAI会议录允许的篇幅).最后Jo开始整理相关的程序,并写了一个更长的论文(基于在AAAI发表论文得到的反馈).然后送交给AI期刊.AI期刊要花大约两年的时间,对论文评审,包括作者对论文修改所花费的时间,以及相应的出版延迟.因此,理想情况下,Jo的思想最终发表在期刊上需要大约三年时间.所以牛人很少能从本领域出版的期刊文章中学到什么东西,来得太迟了. 你,也可以成为一个牛人.下面是建立学术关系网的一些诀窍: 有很多讨论某个AI子领域(如连接主义或者视觉)的邮件列表,选择自己感兴趣的列表加入.
当与很熟悉本领域的人讨论自己的思想时,他们很可能不直接评价你的想法,而是说:"你读过某某吗 "这并不是一个设问,而是建议你去阅读某份文献, 它很可能与你的想法有关系.如果你还没有读过该文献,从跟你交谈的高手那里得到该文献的详细信息,或者直接从他那里借一份拷贝下来.
当你读到某份让你感到很兴奋的论文,复印五份送交给对之感兴趣的其他五个人.他们可能会反馈回来很好的建议.
本实验室有很多针对不同子领域的非正式(持续发展的)论文讨论组,他们每星期或每两星期聚会一次,对大家阅读完的论文进行讨论.
有些人并不介意别人去翻看他们的书桌,也就是说,去翻阅他们堆在书桌上的不久要阅读或者经常翻阅的论文.你可以去翻翻看,有没有自己感兴趣的.当然了,首先要得到主人的许可,要知道有些人确实反感别人翻自己的东西.去试试那些平易近人的人.
同样,有些人也并不介意你翻看他们的文件柜.实验室中可是有很多学问精深的人,他们的文件柜里也是有好多宝贝.与利用学校图书馆相比,这通常是更快更可靠的寻找论文的方式.
只要自己写下了些东西,将草稿的拷贝分发给那些可能感兴趣的人.(这也有一个潜在的问题:虽然AI领域的剽窃很少,但也确实有.你可以在第一页写上" 请不要影印或者引用"的字样以做部分防范.)大部分人并不会阅读自己收到的大部分论文,因此如果只有少数人返回评论给你,也不用太在意.你可以如此反复几次——这是期刊论文所必需的.注意,除了自己的导师,一般很少将两次以上的草稿送给同一个人.
当你写完一篇论文后,将论文的拷贝送给那些可能感兴趣的人.别以为人家自然而然地就会去阅读发表论文的期刊或者会议录.如果是内部的出版物(备忘录和技术报告)就更不容易读到了.
你保持联系的人越是各式各样,效果就越好.尝试与不同研究组,AI实验室,不同学术领域的人交换论文.使自己成为没有联系的两个科研组交流的桥梁,这样,很快的,你的桌子上就会冒出一大摞相关的论文.
如果某篇论文引用了自己感兴趣的某些东西,做好笔记.维护一份自己感兴趣参考文献的日志.到图书馆去看看能不能找到这些论文.如果要了解某个主题的发展轨迹,可以有意地去做一张引用的"参考文献"图.所谓的参考文献图,是指引用组成的网:论文A引用B和C,B引用C和D,C引用D,等等.注意那些被经常引用的论文,这通常是值得阅读的.参考文献图有奇妙的性质.一个是经常有研究同一主题的研究组相互不了解.你搜索该图,突然发现了进入另一部分的方式,这通常出现于不同学校或者不同方法存在的地方.尽可能了解多种方法是很有价值的,这总比非常深入的了解某一种方法更好.
暂时搁置.跟别人交谈.告诉他们你在做什么,并询问人家在做什么.(如果你对与别的学生讨论自己的想法感到害羞,也要坚持交谈,即使自己没有什么想法,与他们讨论自己认为确实优秀的论文.这将很自然地引导到下一步做什么的讨论.)每天中午在活动楼七层有一个非正式的午餐讨论会.在我们实验室,人们都习惯于晚上工作,所以午餐的时候可以跟别人组成松散的小组进行讨论. 如果你与外界的交流很多——做演示或者参加会议——去印张事务名片,
主要要使自己的名字容易记住.从某个时间开始,你将会开始参加学术会议.如果你确实参加了,你会发现一个事实,几乎所有的会议论文都令人生厌或者愚蠢透顶.(这其中的理由很有意思,但与本文无关,不做讨论).那还去参加会议干吗主要是为了结识实验室之外的人.外面的人会传播有关你的工作的新闻,邀请你作报告,告知你某地的学术风气和研究者的特点,把你介绍给其他人,帮助你找到一份暑期工作,诸如此类.如何与别人结识呢如果觉得某人的论文有价值,跑上去,说:"我非常欣赏您的论文",并提问一个问题.
获得到别的实验室进行暑期工作的机会.这样你会结识另外一群人,或许还会学到另外一种看待事物的方式.可以去问高年级同学如何获取这样的机会,他们或许已经在你想去的地方工作过了,能帮你联系.
通常的情况,你只能做AI领域的事情,对AI领域之外的事情一无所知,好像有些人现在也仍然这么认为.但是,现在要求好的研究者对几个相关的领域都了解颇深.
计算的可行性本身并没有对什么是智能提供足够的约束,其他的领域给出了其他形式的约束,例如心理学获得的经验数据.更重要的是,其他的研究领域给了你思考的新工具,看待智能的新方法.学习其他领域的另外一个原因是AI本身并没有评价研究价值的标准,全是借自于其他领域.数学将定理作为进展;工程会问某个对象是否工作可靠;心理学要求可重复的试验;哲学有严格的思辨;等等.所有这些标准有时都在AI中起作用,熟悉这些标准有助于你评价他人的工作,深入自己的工作以及保护自己的工作.
经过六年左右的课程方可获得MIT的PhD,你可以在一到两个非AI领域里打下坚实的基础,在更多的领域内具有阅读水平,并且必须对大部分内容具有一定程度的理解.下面是如何学习自己所知甚少领域的一些方法:
选修一门研究生课程,这很牢靠,但通常不是最有效的方法.
阅读课本.这方法还算不错,不过课本的知识经常是过时的,一般还有很高比例的与内容无关的修辞.
找出该领域最棒的期刊是什么,向该领域的高人请教.然后找出最近几年值得阅读的文章,并跟踪相关参考文献.这是最快的感受该领域的方法,但有时候你也许会有错误的理解.
找出该领域最著名的学者,阅读他们所著的书籍.
跟该领域的研究生泡在一起. 参看外校研究该领域的系的课程表.拜访那里的研究院办公室,挑选有用的的文献数学可能是接下来需要了解的最重要的学科.对于工作在视觉或者机器人学的人来说更关键.对于以系统为中心的工作,表面上看,并不相关,但数学会教你有用的思维方式.你需要能阅读定理,如果具有证明定理的能力将会给本领域的大多数人留下深刻的印象.很少有人能自学数学,光做个听众是不够的,还得做习题集.尽可能早地选修尽可能多的数学课,其他领域的课程以后选也很容易.
计算机科学是以离散数学为基础的:代数,图论,等等.如果你要从事推理方面的工作,逻辑是很重要的.逻辑在MIT用得不多,但是在斯坦福以及其他地方,这是认识思维的主流方法.所以你必须具备足够的逻辑知识,这样你才能保护自己的观点.在MIT数学系选修一两门课程就足够了.要是研究兴趣在感知和机器人,那么不仅需要离散数学,还需要连续数学.在分析,微分几何和拓扑学具有扎实的基础将会给你提供最常使用的技巧.统计和概率只是一般有用.
认知心理学与AI共享几乎完全相同的观点,但是实践者确实具有不同的目标,他们主要是做实验而不是写程序.每一个人都需要知道认知心理学的某些知识. 在MIT,Molly Potter开了一门很好的有关认知心理学的初级研究生课程.
如果你想做有关学习的工作,那么发展心理学是很重要的.发展心理学从一般意义上讲也是很有用的,它能告诉你对于人类智能来说,哪些事情难哪些容易. 它还给出了有关认知体系结构的认知模型.例如,有关儿童语言习得的工作就对语言处理理论施加了坚实的约束.在MIT,Susan Carey开了一门很好的有关发展心理学的初级研究生课程.
心理学中更"软"的部分,例如心理分析和社会心理学,对AI的影响看似很小,但具有潜在的重大意义.它们会给你非常不同的理解人是什么的方式.象社会学和人类学这样的社会科学可以起相似的作用.具有多种观点是很有用的.上述学科你需要自学.不幸的是,很难区分出这些领域哪些是优秀的成果哪些是垃圾.到哈佛去学习:对于MIT的学生来说,很容易交叉注册哈佛的课程.
神经科学告诉我们有关人体可计算硬件的知识.随着最近可计算神经科学和联结主义的兴起,对AI具有非常大的影响.MIT的脑和行为科学系提供了非常好的课程,视觉 (Hildreth, Poggio, Richards, Ullman),移动控制(Hollerbach, Bizzi)和普通神经科学(9.015,由专家组讲授).
如果你想研究自然语言处理,语言学是很重要的.不仅如此,它还包含了很多有关人类认知的约束.在MIT,语言学主要由Chomsky学院负责.你可以去看看是不是符合自己的兴趣.George Lakoff最近出版的书《Women, Fire, and Dangerous Things》可作为另外一种研究程序的例子.
工程,特别是电机工程,已经被很多AI研究机构作为一个研究领域.我们实验室在培养程序中加入了很多需要确实做一些东西的要求,例如分析电路.了解EE也有助于建造定制的芯片或者调试自己的Lisp机器上的电源.
物理学对于那些对感知和机器人感兴趣的人具有强大的影响.
哲学是所有AI领域看不见的框架.很多AI工作都有蕴含着哲学的影响.学习哲学也能帮助你运用或者读懂很多AI论文中用到的观点.哲学可沿着至少两个正交的轴分解.哲学通常是某种东西的哲学;有关思维和语言的哲学与AI更相关.然后存在着多种哲学学派,从比较大的范围来分,哲学可分为分析哲学和大陆哲学.分析哲学有关思维的观点与AI领域大多数研究者一致.大陆哲学则对我们习以为常的很多东西有非常不同的看待方式.它曾经被Dreyfus用于证明AI是不可能的.就在不久前, 有几位研究者认为大陆哲学与AI是相容的,提供了另外一种解决问题的方法.MIT的哲学属于分析哲学,哲学学院深深地受到Chomsky在语言学方面工作的影响.
看起来要学习太多的东西,是不是确实如此.要小心一个陷阱:认为对于所有的X,"只有我对X了解的更多,这个问题才会变得容易".要知道,与之相关需要进一步了解的东西是永远没完的,但最终你还是要坐下来,解决问题的.
5. 笔记
很多科学家都有做科研笔记的习惯,你也应该这样.可能你曾被告知从五年级开始,对于每一门科学课都应该记笔记,确实如此.不同的记笔记方式适用于不同的人,可以做在线笔记,记在笔记本或者便笺簿上.可能需要在实验室有一个,家里还有一个.
在笔记本上记录下自己的想法.只有你自己才会去读它,因此可以记得比较随意.记录下自己的思索,当前工作中遇到的问题,可能的解决方案.对将来可能用到的参考文献作小结.
定期翻阅你自己的笔记本.有些人会做月度总结,方便将来的引用. 笔记中记录中的东西经常可以作为一篇论文的骨干.这会使生活变得轻松些.相反,你会发现写粗略的论文——标题,摘要,分标题,以及正文的片段——是一种记录自己当前工作的有效方式,即使你并不准备把它变成一篇真正的论文.(过一段时间你或许会改变想法).
你或许会发现Vera Johnson-Steiner的书《Notebooks of the Mind》很有用, 该书并不是描写如何做笔记的文献,它描述了随着思想片断的积累,创新思想是如何出现的.
6. 写作
写作的理由有很多. 在整个读研的过程中,你需要写一到两篇(这取决于你所在系的规定)毕业论文,以获得PhD或者MS.
勤于写作不仅仅给你练习的机会.
学术的规则就是要么发表,要么腐烂.在很多领域和学校,这通常开始于你成为一名教授时,但是我们实验室的很多研究生毕业之前就已经开始发表论文了.
鼓励发表和分发论文是很好的政策.
写下自己的想法是很好的调整思路的方式.你会经常地发现自以为很完美的想法一旦写下来就显得语无伦次.
如果你工作的目的是不仅为自己还要为他人服务,就必须把它发表.这也是研究的基本责任.如果你写得精彩,会有更多的人来了解你的工作.
AI但凭单打独斗是很难做的,你需要经常地从他人那里获得反馈.对你的论文作评论就是最重要的一种形式.任何事情,要做就要做到最好.
阅读有关如何写作的书籍.Strunk和White的《Elements of Style》对基本的应该如何不应该如何做了介绍.Claire的《The MLA's Line By Line》(Houghton Mifflin)是有关在句子级别如何编辑的书籍.Jacques Barzun的《Simple and Direct : A Rhetoric for Writers》(Harper and Row, 1985)是有关如何作文的.
写论文时,读读那些写作高超的书,并思考作者的句法运用.你会发现不知不觉地,你已经吸收了作者的风格.
要成为写作高手,需要付出颇多,历经数年,期间还要忍受和认真对待他人的批评.除此之外,并无捷径可走.
写作有时候是很痛苦的,看起来好像是从"实际的"工作中分心了.但如果你已经掌握了写作技巧,写起来会很快.而且如果你把写作当作一门艺术的话,你能从中得到很多乐趣.
你肯定会遇到思路阻塞的情况,这有很多的可能原因,没有一定可以避免的方法.追求完美可能导致思路阻塞:无论开始写什么,总觉得不够好.要理解写作是一个调试的过程.先写一个草稿,然后返回修订.写草稿有助于理顺思路,如果写不出来正文,那就写个大纲.逐步对之细化,直到已经很容易写出子部分的内容.如果连草稿也写不出来,隐藏掉正在写作的所有窗口,然后随便输入自己脑袋里想到的东西,即使看起来好像是垃圾.当你已经写出了很多文本后,重新打开窗口,将刚才写的东西编辑进去.
另外一个错误是以为可以将所有的内容依次写出.通常你应该将论文的核心内容写出来,最后才是介绍部分.引起作者思路阻塞的另一个原因是不切实际的以为写作是很容易的事情.写作是耗时耗力的,如果发现自己每天只能写一页,也不要放弃.
完美主义可能会导致对本来已经足够好的论文还在不停地打磨.这是浪费时间.(这也是一种有意无意之间逃避做研究的表现).将论文看作你与本领域其他人交谈时的一句话.在交谈中,并不是每一句话都是完美的.很少有人会期待自己的某次谈话就是全部的故事,是与对方的最后一次交流.
写信是一种很好的练习.很多技术论文,如果其风格更类似于给朋友的信,那么会有很大的提高.坚持记日记也是练习写作的方法(也会使你试验更多的文体,不仅仅是技术论文).这两种方法还有其它的实质作用.
一个常见的陷阱是花很多时间去追求修辞而不是内容.要避免这样.LaTeX并非完美,但是它有很多你所需的修饰语.如果这还不够,还可从其他从事这一研究的人那里借用一些词语用法.很多站点(例如MIT)维护了一个写作修辞的库.
清楚自己要表达什么.这是清楚的写作中最难最重要的因素.如果你写了拙劣的东西,且不知道如何修改,这很有可能是因为你不知道自己要说什么.一旦搞清楚了自己要说什么,说就行了.
论文的写作要有利于读者查找到你所做的工作.无论是段落的组织还是通篇的组织,都要将最核心的部分放在前面.要精心写作摘要.确保摘要已经反映出你的好思路是什么.确保自己明白自己的创新点是什么,然后用几句话表达出来.太多的论文摘要只是一般性地介绍论文,说是有一个好思路,却不说是什么.
不要用大话来贩卖你的工作.你的读者都是很优秀的人,正直且自尊.与之相反,也不要为自己的工作道歉或者进行消减.
有时候你意识到某个子句,句子或者段落不够好,却不知道如何修改.这是因为你钻到死胡同里出不来了.你需要返回重写这一部分.现实中这种情况很少发生.
确保自己的论文中有中心思想.如果你的程序在10毫秒内解决了问题X,告诉读者你是如何办到的.不要只是解释呢的系统是如何构建的,是做什么的,还要解释其工作原理和价值所在.
写作是给人看的,而不是机器.因此光观点正确是不行的,还要易懂.不要靠读者自己去推理,除非是最明显的推论.如果你在第七页的脚注上解释了某个小玩意的工作原理,接着在第二十三页没有进一步解释就引用了它,此时如果读者感到困惑一点都不值得奇怪.正式的论文要写清楚是很难的.不要模仿数学领域的文献,它们的标准是尽可能少的解释,使读者感到越困难越好.这并不适用于AI.
写完一篇论文后,删掉第一段或者头几句话.你会发现那是与内容无关的一般性话语,更好的介绍语句在第一段最后或者第二段的开头.
如果你等做完所有的工作后才开始写作,会失去很多.一旦开始了某个科研项目,要养成这样的习惯:写作解释当前工作进展或者每几个月学习所得的非正式论文.
从你的研究笔记中的记载开始.花两天的时间写下来——如果你花的时间更长,说明你是一个完美主义者.将论文与你的朋友分享.写的是草稿——不是为了被引用的那种.将论文复制数十份,送给那些感兴趣的人(包括你的导师).与写正式论文相比,这样做具有很多相同的好处(评论,理清思路,写作练习等等),而且从某种意义上讲,付出无需那么多.经常地,如果你做得不错,这些非正式论文以后可以作为正式论文的骨干内容,也就是从AI实验室的Working Paper成为一篇期刊文章.
一旦你成为Secret Paper Passing Network的成员,会有很多人给你寄论文拷贝要求评论.获得他人对自己的论文的评论是很有价值的.因此你评论的论文越多,你获得支持就越多,也会收到更多人对你论文的评论.不仅如此,学习评价别人的论文有助你的选择.
为论文写有用的评论是一门艺术.
要写出有用的评论,需要读两遍论文.第一遍了解其思想,第二遍开始作评论.
如果某人在论文中屡次犯同一错误,不要每次都标记出来.而是要弄清楚模式是什么,他为什么这样做,对此还可以做什么,然后在第一页清晰地指出或者私下交流.
论文的作者在合并你的评论时,将会遵循最小修改的原则.如果可以,就只修改一个词,不行再修改一个词组,再不行才修改整个句子.如果他的论文中某些拙劣之处使得他必须修改整个段落,整个小节甚至整篇论文的组织,要用大字体的字母指出来,这样他才不会忽视.
不要在论文写毁灭性的批评如"垃圾".这对于作者毫无帮助.花时间提出建设性的建议.要设身处地地为作者着想. 评论有很多种.有对表达的评论,有对内容的评论.对表达的评论也可以很不同,可以是校对打字稿,标点,拼写错误,字词丢失等.应该学一些标准的编辑符号. 还可以是校正语法,修辞,以及混乱不清楚的段落.通常人们会持续地犯同一语法错误,因此需要花时间明确地指出.接下来是对组织结构的评论:不同程度(子句,句子,段落,小节乃至一章)的次序混乱,冗余,无关的内容,以及丢失论点.
很难描述对内容进行评论的特征.你可能建议作者扩展自己的想法,考虑某个问题,错误,潜在的问题,表达赞美等."因为Y,你应该读X"是一种总是有用的评论
你无须接受所有的意见,但是必须都认真对待.将论文的部分内容裁掉是挺令人痛心的,但往往也提高了论文的水平.你经常会发现某个意见确实指出了问题,但是解决方法你觉得不可接受,那么就去寻找第三条道路.
要多发表论文,这其实比想象中的容易.基本上,AI出版物评审者评审论文的标准是:(a)有新意;(b)在某些方面,符合标准.看看IJCAI的会议录,你会发现论文录取的标准相当低.这种情况由于评审过程本身固有的随机性而变得更糟糕了.所以一个发表论文的诀窍是不停地试.
确保论文可读性比较好.论文被拒绝的原因,除了没有意义之外,就是无法理解或者组织糟糕. 论文在投往期刊之前,应该交流一段时间,并根据反馈的评论进行适当的修订.要抵制那种急匆匆地把结果投往期刊的做法.在AI领域,没有竞赛,而且不管怎么说,出版周期的延迟要大大超过对草稿进行评论的时间. 读一读你想投稿的期刊或者会议的过刊,确保自己论文的风格和内容是适合的.
很多出版物都有一页左右的"作者投稿须知",仔细看看.
主要的会议都会在被接收的论文中评出内容和表达俱佳的获奖论文,仔细研究研究.
通常是向会议投交一篇篇幅比较短的有关部分工作内容的早期报告,然后再往期刊投交一份篇幅长的最终的正式论文.
论文被决绝了——千万不要沮丧灰心.
期刊和会议的论文评审过程存在很大的不同.为了节省时间,会议论文的评审必须迅速,没有时间细究或者交流.如果你被拒绝了,你就失败了.但期刊论文则不同,你可以经常地与编辑争辩,通过编辑与评审人争辩.
评审人一般都会对你有帮助的.如果你收到了令人生厌的评审报告,应该向大会的程序主席或者编辑投诉.不能期望可以从会议论文评审人的报告那里得到多少反馈. 但对于期刊论文,往往可以得到非常棒的建议.你不必完全按照评审报告的建议去做,但是,如果你不按照报告去做,那么就必须解释原因,并且要意识到这可能会导致进一步的负面评价.不管怎么样,无论是哪种的评审,作为评审者都要有礼貌.因为在余下的职业生涯中,你将会与被评审者在一个学术圈子里.
MIT AI Lab Memos大体上是或者接近发表的水平.实际上,Technical Reports基本上都是这些Memos的修订版本.Working Papers则更不正式,这是很好的将自己的论文分发给同事们的方法.要出版这些内部文件,只需到Publications Office(在活动楼八层)领一份表格,并有两位教员签字即可就像其它的科研活动一样,论文写作所花的时间总是比期望的要高.论文的发表在耗费时间这个问题上则更严重.当你完成了一篇论文,投出去,等待发表.数月后,论文以及评论被返回来.你不得不对论文进行修改.然后又是几个月,才返回对你的修改的确认.如果你同时发表了该论文的不同形式,如有一篇短的投会议, 一篇长的投期刊,这样的过程将反复数个回合.结果有可能是当你已经厌倦了,研究主题也已经令人生厌后数年,你仍然在修改那篇论文.这启示我们:不要去做那些需要热情投入但是很难发表论文的研究——苦不堪言.
7. 讲演
与同行交流的另外一种方式就是讲演,上面提到的有关论文写作的问题,同样适用于讲演.站在听众面前从容讲演而不会使听众恹恹欲睡的能力,对于你成功地获得别人的承认,尊敬乃至最终的求职都是很关键的.讲演的能力不是天生的,下面是一些学习和练习讲演的方法:
Patrick Winston有一篇很好的有关如何作讲演的小论文.每年的一月,他都会就此作讲演,演示和描述它的演讲技巧.
如果你觉得自己是一个糟糕的演讲者,或者想成为一名优秀的演讲者,选一门公共演讲课.初级的表演课也很有用.
如果你的导师有定期的研究讨论会,自愿去作演讲.
MIT AI实验室有一系列的半正式座谈会,叫做Revolving Seminar.如果你觉自己的某些观点值得写进AI Memo或者会议论文中,自告奋勇去作一场报告. 深入了解实验室的不同机器人项目,当你外地的亲朋好友来的时候,你可以领着他们逛一圈,并就机器人做60分钟的报告.
由于修改演讲远比修改论文容易,有些人会觉得这是很好的寻找如何表达思想的方式.(Nike Brady有一次曾说,他所有最好的论文都来自于演讲).
在一间空屋子里练习,最好就是你马上要做的报告.这有助于调整报告的技巧:每一张幻灯讲些什么;转换的延迟以及保持平滑;保持解释和幻灯的同步;估计报告的时间长度.你花在调整设备上的时间越少,留下来的与人交流的时间就越长用镜子,录音机或者录像机练习是另外一种方法.实验室有这三种设备. 这也有助于调整自己的发音和肢体语言.
对于比较正式的报告——特别是你的答辩——应该在几个朋友面前练习一遍,请他们批评指正. 观察别人是如何做报告的.有很多访问MIT的人会做报告.参加这样的报告会能够感受自己不熟悉的领域,并且如果报告令人提不起兴趣,你可以暗中分析报告者错在哪里.
找一位朋友,将你最近的想法说给他听.这既可以提高的交际技巧,又能调试自己的思路.

8. 程序设计
并不是所有的AI论文都包含代码,而且本领域的很多重量级人物从来没有写过一个重要的程序.但是为了初步的近似AI工作原理,你必须会程序设计.不仅仅是很多AI研究工作需要编写代码,而且学会程序设计能给你什么是可计算的什么是不可计算的直觉,这是AI对认知科学贡献的主要来源. 在MIT,本质上所有的AI程序设计都使用Common Lisp.如果还不知道,赶快学吧.当然,学习一门语言并不能等同于学习程序设计;AI程序设计包含的一些技术与那些在系统程序设计或者应用程序设计中用到的大不相同.开始学的时候,可以先看看Abelson和Sussman的《Structure and Interpretation of Computer Programs》,并做一些练习.这本书与AI程序设计本质上并不相干,但是包含了一些相同的技术. 然后读Winston和Horn写的Lisp书第三版,书里有很多优雅的AI程序.最后,进行实际的程序设计,而不是阅读,才是最好的学习程序的方法.
学习Lisp程序设计有很多传统.有些人习惯一起写代码,这取决于个性.还有的人寻找机
会直接向有经验的程序员学习,或者请他对你的代码进行评价.阅读别人的代码也是很有
效的方法.如果可以向高年级同学要他们的源代码.他们可能会有些抱怨,说自己的编程
风格差极了,程序实际上并不能工作云云.不管怎么样,最后你获得了源代码.然后你要
仔细地通篇阅读,这很费时间.通常阅读并完全理解别人代码所花的时间与你自己编程完
成的时间是一样多的,因此要计划好在你的头一个或者头两个学期用数周的时间去阅读别
人的代码.你将从中学到很多以前不曾想到在课本中也没有的技巧.如果你读到了大段大
段不可理解没有注释的程序,你就会明白不应该如何写代码了.
在软件工程课里学习到的那些知识在AI程序设计中依然有用.要给代码加注释.使用正确
的数据抽象.将图和你的代码隔离开,由于你使用的语言基本上是Common Lisp,因此可移植性很好.诸如此类.
经过头几年的学习后,应该写一些自己的标准AI模块,如:
真值维护系统
规划器
规则系统
不同风格的解释器
具有流程分析的优化编译器
具有继承特性的框架系统
几种搜索方法
基于解释的学习器
任何你感兴趣的东西都可以尝试用程序实现.你可以抓住问题的实质,在几天之
内完成一个功能版本.修改已有的程序是另外一种有效的方法,前崾悄阋丫垂样的东西,并且确实了解其工作原理,优缺点以及效率等问题.
不象其他通常的程序员,AI程序员之间很少相互借阅代码.(演示代码例外). 这部分由于AI程序很少有真正起作用的.(很多著名的AI程序只在作者论文所提到的那三个例子上起作用,虽然最近这种情况已经有所改善).另外一个原因是AI程序通常是匆忙凑成,并没有考虑一般化的问题.使用Foobar的"标准"规则解释器,开始时很有效,不久就会发现缺少一些你需要的功能,或者不够有效率.虽然可以对代码
进行修改满足自己的需要,但记住理解别人的代码是很耗时的,有时候还不如自己写一个.有时候构建一个标准包的工作本身就可以成为一篇论文.
像论文一样,程序也有可能过于追求完美了.不停重写代码以求完美,最大化的抽象所有的东西,编写宏和库,与操作系统内核打交道,这都使得很多人偏离了自己的论文,偏离了自己的领域.(从另外一方面,或许这正是你需要将来谋生的手段)
9. 导师
在MIT,有两种类型的导师,教学导师和论文导师.
教学导师的工作比较简单.每一位研究生都被分配了系里的一位老师作为教学导师.教学导师的作用是作为系方代表,告诉你对你的正式要求是什么,如果你的进度慢了敦促你,批准你的课程计划等.如果一切顺利的话,你每年只需要见教学导师两次,在注册日那天.从另一方面讲,如果你遇到了困难,教学导师替你向系里反映或者提供指导.

论文导师是监督你研究的人.选择论文导师是你读研期间最重要的选择,比选题都重要得多.从更广的意义上讲,AI是通过师傅带徒弟的方式学习的.有很多领域的技术方面或者研究过程方面的非正式知识,只能从导师那里学到,在任何教科书上都找不到.

很多AI教员都是行为古怪的人,毕业生也如此.导师与研究生的关系是非常个性化的,你的个人特点必须与导师的配合得很好,这样你们才能合作成功.

不同的导师具有不同的风格.下面是一些需要值得考虑的因素:

你需要多大程度的指导有些导师会给你一个定义良好的适合做论文的问题,对解决方法进行解释,并告诉你如何开展工作.如果你陷在某个地方了,他们会告诉你如何开展下去.其他的导师属于甩手型,他们可能对你的选题毫无帮助,但是一旦你选好题目,他们对于引导你的思路具有非常大的作用.你需要考虑清楚自己适合独立工作还是需要指导.
你需要多大程度的联系有的导师要求每周与你见面,听取你工作进展的汇报.他们会告诉你应该读的论文,并给你实际的练习和项目做.其他的导师每学期与你的谈话不会超过两次.
你能承受的压力有多大有些导师施加的压力是很大的.
需要多少情感支持
听取导师意见的认真程度如何大多数导师会相当正式的建议你的论文题目.有些导师是值得信赖的,他们给出的建议,如果按照执行,几乎肯定会做出一篇可接受程度的论文,如果不是令人兴奋的论文的话.其他的则一下子抛出很多思路,大部分是不切实际的,但是有一些,或许会导致重大突破.如果选了这样的一位导师,你首先得把自己当作一个过滤器.
导师提供了什么类型的研究组有些教授会创造环境,把所有的学生聚集在一起,即使他们做的不是同一个项目.很多教授每周或者每两周与自己的学生们会面.这对你有用么你能与教授的学生和睦相处么有些学生发现他们更能与其他教研组的学生建立良好的工作关系.
你想参与大的项目么有些教授将大系统分解,每个学生负责一部分.这给了你与一组人讨论问题的机会.
你想被共同监督么有些论文项目包含了多个AI领域,需要你与两个以上的教授建立密切的工作关系.虽然你正式的论文导师只有一位,但是有时候这并不反映实际情况.
导师愿意指导其研究领域之外的论文题目么你是否能与导师一起工作,比你做什么本身更重要.MIT的机器人系就曾指导过量子物理学和认知建模方面的论文;推理方面的教员指导过视觉方面的论文.但是有些教员只愿意指导自己研究兴趣领域内的论文.这对于那些欲获得终身职位的年轻教员来说尤其如此.
导师会为了你跟体制作斗争吗有些导师会为了你跟系里或者某些有敌意的实体作斗争.有时候体制对某些类型的学生不利(特别是对于女学生和怪癖的学生),因此这一点很重要.
导师愿意并且能够在会议上推荐你的工作吗这是导师工作的一部分,对你将来工作意义重大.
上述这些因素,不同学校的情况很不相同.与大部分学校相比,MIT提供了多得多的自由.
找论文导师是你研究生一年级最主要的任务.研一结束时,或者研二学年开始阶段,你必须有一个论文导师.下面是一些诀窍:
查阅实验室的研究总结.其中有一页左右的篇幅描述了每个教师以及很多研究生目前在做什么.
如果你对某些教师的研究工作感兴趣,查阅其最近的论文.
在第一学期,与尽可能多的教师交谈.去感受他们喜欢做什么,他们的研究和指导风格是什么.
与预期导师的研究生交谈.要保证与导师的多个学生交流,因为每位导师在与不同的学生交流时有不同的工作方式和交流效果.不能被一个学生的看法所左右.
很多教师所在研究组的会议对新同学都是公开的.这是非常好的了解导师工作方式的途径.

作为一门学科,AI不同寻常的一点是很多有用的工作是由研究生完成的,而不是博士——他们忙着做管理去了.这有几个后果.一是某个教师的声望,是否会获得终身聘用,在很大程度上取决于学生的工作.这意味着教授有很强烈的动机吸引最好的学生为自己工作,并给与有效的指导和足够的支持.另外一个后果是,由于大部分学生的论文方向是由导师形成的,因此整个领域的方向和发展很大程度上取决于导师选择什么样的研究生.当选定了导师,决定了自己对导师的要求后,要确保导师知道.不要由于交流不好,浪费时间于自己并不想做的项目上.
不要完全依赖你的导师,要建立自己的网络.找一些能定期评审你的工作的人是很重要的,因为研究时很容易走火入魔.网络中的人可以包括自己实验室或者外单位的研究生和老师.
在与其他学生,老师甚至自己的导师的关系中,很可能会碰到种族主义者,性别歧视,同性恋或者其他令人尴尬的事情.如果你不幸碰到了,去寻求帮助.MIT的 ODSA出版了一本叫做"STOP Harrassment"的小册子,里面有很多建议.《Computer Science Women's Report》,可在LCS文档室找到,也与之相关.
实验室中有些同学只是名义上由导师指导.这对于那些独立性很强的人来说很好.但是如果你已经完成了某项导师指导的工作,除非你确保没有导师也行且自己有牢靠的支持网络,否则就不要这么干.
10. 论文
做毕业论文将占据研究生生活的大部分时间,主要是去做研究,包括选题,这比实际的写作耗时更多.硕士论文的目的是为做博士论文练兵.博士水平的研究如果没有准备好的话,是很难进行的.硕士论文最本质的要求是展示自己的掌握程度:你已经完全理解了本领域最新进展,并具备相应的操作水平.并不需要你对本领域的最新知识有所拓展,也不要求发表你的论文.然而我们实验室的论文总是比较大气的,因此很多硕士论文实际上都对本领域的发展作出了显著的贡献,大约有一半都出版了.这并不一定是好事情.
很多人精力都集中于硕士的工作,所以MIT有这样的名声:硕士论文的质量往往比博士论文高.这有悖于硕士工作本来是为博士研究作准备的原有目的.另外一个因素是所做研究要对领域有所贡献,至少需要两年,这使得研究生学习时间之长令人难以忍受.现在或许你感受不到匆忙,但当你已经在实验室呆了七年后,你肯定迫不及待地想逃出去.硕士从入学到毕业平均时间是两年半,但是,计算机系强烈鼓励学生提前毕业.如果某个硕士生的题目过于庞大,可将之分解,一部分来做硕士论文,另一部分给博士生作博士论文.
想要了解硕士论文研究是什么样的,读几本最新的硕士论文.记住比较好的论文是那些出版的或者成为技术报告的,因为这标志着该论文被认为是扩展了领域的最新知识——换句话说,他们的论文远远超出了硕士论文的水平.还要读一些通过的但是没有出版的论文,所有通过的论文都可以在MIT图书馆中找到.博士论文必须对最新知识有所拓展,博士论文的研究必须具备可出版的质量.MIT 的泱泱气质又表现出来了,很多博士论文在几年内都是某个子领域的权威工作.对于MIT的博士论文来说,开创一个新领域,或者提出并解决一个新问题,并不是什么了不起的事情.虽然,这并不是必需的.
一般来说,需要两到三年的时间来做博士论文.很多人花一到两年的时间跟硕士生活说再见,以及选题.这段时间可以去尝试一些别的事情,例如做助教或者在某个非AI领域打下坚实的基础或者组织个乐队.博士论文的实际写作时间大约是一年.
选题是论文工作中最重要最困难的部分:
好的论文题目不仅能够表达个人观点,而且可与同行交流.
选择题目必须是自己愿意倾注热情的.个人远景观点是你作为一个科学家的理由,是你最为关切的意象,原则,思路或者目标.有多种形式.或许你想造一台可与之交谈的计算机,或许你想把人类从计算机的愚蠢使用中拯救出来,或许你想展示万物都是统一的,或许你想在太空发现新生命.远景观点总是比较大的,你的论文并不能实现你的远景,但是可以朝着那个方向努力.
做论文时,最困难的就是如何将问题消减至可解决的水平,同时规模又足以做一篇论文."解决AI的宽度优先"是常见毛病的一个例子,题目太大太虚了.你会发现需要不断的缩小题目的范围.选题是一个渐进的过程,不是一个离散的事件,会持续到你宣布论文已经完成那一刻为止.实际上,解决问题通常比精确地描述问题要容易得多.如果你的目标是一个五十年的工程,那么合理的十年工程是什么,一年的呢如果目标的结构庞大,那么最核心的部件是什么,如何最大程度的了解核心部件

一个重要的因素是你可以忍受多大程度的风险.在最终的成功和风险之间需要权衡.这也并不总是对的,AI中有很多研究者尚未涉及的想法.
好的论文选题有一个中心部分,你确信肯定可以完成,并且你和你的导师都同意这已经满足毕业要求了.除此之外,论文中还有多种扩展,有失败的可能,但如果成功了,会增加论文的精彩程度.虽然不是每一个论文选题都符合这个模式,但值得一试.
有些人觉得同时在多个项目中工作可以在选题的时候选择可以完成的那个.这确实降低了风险.另外一些人则愿意在做任何工作之前,选一个单独的题目.
可能你只对某个领域感兴趣,这样你的选题范围就狭窄得多.有时候,你会发现系里的老师没有一个人能够指导你选择的领域.可能还会发现好像那个领域没什么很自然的选题,反而对别的领域有好想法.
硕士选题比博士选题更难,因为硕士论文必须在你所知不多没有足够自信时就完成.
博士选题需要考虑的一个因素是是否继续硕士阶段所研究的领域,可能拓展或者作为基础,或者干脆转到另外一个领域.待在同一个领域事情就简单了,可能只需要一到两年就毕业了,特别是如果在硕士阶段的工作中已经发现了适合做博士论文的题目.不足之处在于容易定型,改换领域则能增加知识的宽度.
有的论文题目很新奇,有的则很普通.前者开创了新领域,探索了以前未曾研究过的现象,或者为很难描述的问题提供了有效的解决方法;后者则完美地解决了定义良好的问题.两种论文都是有价值的.选择哪一种论文,取决于个人风格.
论文的"将来的工作"部分,是很好的论文题目来源.
无论选什么样的题目,必须是前人未曾做过的.即使是同时有人做的工作,也不好.有很多东西可作,根本无需竞争.还有一种常见的情况,读了别人的论文后感觉很惊慌,好像它已经把你的问题解决了.这通常发生在确定论文题目过程中.实际上往往只是表面类似,因此将论文送给某个了解你的工作的高人看看,看他怎么说.

MIT AI实验室的论文并非全是有关人工智能的;有些是有关硬件或者程序设计语言的,也行.
选好题后,即使有点虚,你必须能够回答下列问题:论文的论点是什么你想说明什么你必须有一句,一段,五分钟的答案.如果你不知道自己在干什么,别人也不会严肃对待你的选题,更糟糕的是,你会陷在选题——再选题的圈子里而不能自拔.
开始作论文研究后,一定要能够用简单的语言解释每一部分的理论和实现是如何为目标服务的.
记住,一旦选好了题目,你必须与导师就论文完成的标准达成清晰的一致.如果你和他对论文具有不同的期望,最后你肯定死得很惨.必须定义好"完成测试"的标准, 像一系列的能够证明你的理论和程序的例子.这是必须做的,即是你的导师并不这么要求.如果环境发生了根本的变化,测试也要随之改变.
首先尝试论文问题的简化版本.用实例检验.在形成理论抽象之前,要完整的探究具有代表性的例子.
做论文的过程中,有很多浪费时间的方式.要避免下列活动(除非确实跟论文相关):语言表达的设计;用户接口或者图形接口上过分讲究;发明新的形式化方法;过分优化代码;创建工具;官僚作风.任何与你的论文不是很相关的工作要尽量减少.
一种众所周知的现象"论文逃避",就是你突然发现改正某个操作系统的BUG是非常吸引人也很重要的工作.此时你总是自觉不自觉的偏离了论文的工作.要记住自己应该做些什么.(本文对于部分作者来说就属于论文逃避现象).
11. 研究方法论
本部分内容比较少,请添加
研究方法学定义了什么是科研活动,如何开展研究,如何衡量研究的进展,以及什么叫做成功.AI的研究方法学是个大杂烩.不同的方法论定义了不同的研究学派.
方法是工具.使用即可,不要让他们来使用你.不要把自己陷于口号之中:"AI研究需要牢靠的基础","哲学家只会高谈阔论,人工智能则需要拼搏","在问为什么之前,先搞清楚计算的是什么".实际上,要在人工智能领域取得成功,你必须擅长各种技术方法,还必须具备怀疑的态度.例如,你必须能够证明定理,同时你还必须思考该定理是否说明了什么.
很多优秀的AI篇章都是巧妙地在几种方法论中取得平衡.例如,你必须选择一条在太多理论(可能与任何实际问题都无关)和繁琐的实现(把实际的解决方法表达得语无伦次)之间的最佳路线.你经常会面临区分"干净"和"肮脏"的研究决策.你应该花时间将问题在某种程度上形式化吗还是保持问题的原始状态,此时虽然结构不良但更接近实际采用前一种方法(如果可行的话)会得到清晰确定的结果,但这一过程往往是繁琐的,或者至少不会直接解决问题.后者则有陷入各种处理的漩涡之中的危险.任何工作,任何人,必须作出明智的平衡.
有些工作象科学.你观察人们是怎样学习算术的,大脑是如何工作的,袋鼠是如何跳的,然后搞清楚原理,形成可检验的理论.有些工作象工程:努力创建一个更好的问题解决器或者算法.有些工作象数学:跟形式化打交道,要理解属性,给出证明.有些工作是实例驱动的, 目标是解释特定的现象.最好的工作是以上几种的结合.
方法具有社会性,看看别人是如何攻克类似难题的,向别人请教他们是如何处理某种特殊情况的.
12. 情感因素
研究是艰苦的工作,很容易对之失去兴趣.一个令人尴尬的事实是在本实验室读博的学生只有很少比例最后获得学位.有些人离开是因为可以在产业界赚到更多的钱,或者由于个人的原因;最主要的原因则是由于论文.本节的目标是解释这种情况发生的原因,并给出一些有益的建议.
所有的研究都包含风险.如果你的项目不可能失败,那是开发,不是研究.面对项目失败时是多么艰难啊,很容易将你负责的项目失败解释为你自己的失败.虽然,这实际上也证明了你有勇气向困难挑战. 在人工智能领域很少有人总是一直成功,一年年地出论文.实际上,失败是经常的.
你会发现他们经常是同时做几个项目,只有一些是成功的.最终成功的项目也许反复失败过多次.经历过很多由于方法错误的失败之后,才取得最终的成功.
在你以后的工作生涯中,会经历很多失败.但是每一个失败的项目都代表了你的工作,很多思想,思考方式,甚至编写的代码,在若干年后你发现可用于另外一个完全不同的项目.这种效果只有在你积累了相当程度的失败之后才会显现出来.因此要有最初的失败以后将会起作用的信念.
研究所花费的实际时间往往比计划的要多得多.一个小技巧是给每个子任务分配三倍于预期的时间(有些人加了一句:"……,即使考虑了这条原则").
成功的关键在于使得研究成为你日常生活的一部分.很多突破和灵感都发生在你散步时.如果无时无刻地都潜意识的思考研究,就会发现思如泉涌.成功的AI研究者,坚持的作用一般大于天资."尝试"也是很重要的,也就是区分浅薄的和重要的思路的能力.
你会发现自己成功的比例是很随机的.有时候,一个星期就做完了以前需要三个月才能完成的工作.这是令人欣喜的,使得你更愿意在本领域工作下去.其他一些时候,你完全陷在那里,感觉什么也做不了.这种情况很难处理.你会觉得自己永远不会做出任何有价值的东西了,或者觉得自己不再具备研究者的素质了.这些感觉几乎肯定是错误的.如果你是MIT录取的学生,你就是绝对合格的.你需要的是暂停一下,对糟糕的结果保持高度的容忍.
通过定期设置中短期的目标,例如每周的或者每月的,你有很多工作要做.增加达到这些目标的可能性有两种方法,你可以把目标记在笔记本中,并告诉另外一个人.你可以与某个朋友商定交换每周的目标并看谁最终实现了自己的目标.或者告诉你的导师.
有时你会完全陷在那里,类似于写作过程的思路阻塞,这有很多可能的原因,却并无一定的解决方法.
范围过于宽泛了,可尝试去解决流程中的子问题.
有时候对你研究能力的怀疑会消磨掉你所有的热情而使得你一事无成.要牢记研究能力是学习而得的技能,而不是天生的.
如果发现自己陷入严重的困境,一个多星期都毫无进展,尝试每天只工作一小时.几天后,你可能就会发现一切又回到了正轨.
害怕失败会使得研究工作更加困难.如果发现自己无法完成工作,问问自己是否是由于在逃避用实验检验自己的思路.发现自己最近几个月的工作完全是白费的这种可能,会阻止你进一步开展工作.没有办法避免这种情况,只要认识到失败和浪费也是研究过程的一部分.
看看Alan Lakien的书《How to Get Control of Your Time and Your Life》,其中包含很多能使你进入充满创造力的状态的无价方法.
很多人发现自己的个人生活和做研究的能力是相互影响的.对于有些人来说,当生活中一切都不如意时,工作是避难所.其他的人如果生活陷入混乱时就无法工作了. 如果你觉得自己确实悲痛得难以自拔,去看看心理医生.一份非正式的调查表明,我们实验室大约有一半的学生在读研期间看过一次心理医生.
使得人工智能那么难的一个原因是没有被普遍接受的成功标准.在数学中,如果你证明了某个定理,你就确实做了某些事情;如果该定理别人都证不出来,那么你的工作是令人兴奋的.人工智能从相关的学科中借来了一些标准,还有自己的一些标准.不同的实践者,子领域和学校会强调不同的标准.MIT比其他的学校更强调实现的质量,但是实验室内部也存在很大的不同.这样的一个后果就是你不可能令所有的人都满意.另外一个后果就是你无法确定自己是否取得了进展,这会让你觉得很不安全.对你工作的评价从"我所见过最伟大的"到"空虚,多余,不明所以"不一而足,这都是很正常的,根据别人的反馈修订自己的工作.
有几种方法有助于克服研究过程中的不安全感.被承认的感觉:包括毕业论文的接受,发表论文等.更重要的是,与尽可能多的人交流你的思路,并听取反馈.首先,他们能贡献有用的思路;其次,肯定有一些人会喜欢你的工作,这会使得你感觉不错.

posted @ 2009-10-13 17:15 vincentsim 阅读(195) | 评论 (0) | 编辑收藏

2009年10月3日

怎样为人处事的方法原则学问

为人处事是每个人终生必修课，尤其年轻人在当今交往频繁人际关系复杂的社会里更是如此。为朋友们综合提供“怎样为人处事的方法原则学问”，权作抛砖引玉。真诚祝朋友们人际交往得心应手左右逢源！

1、关于麻烦别人的问题：不是麻烦自己那就是肯定要麻烦别人。

2、关于有益自己的问题：不是有益自己那就是有益于别人。所以既要尽量不太麻烦别人又不要太麻烦自己。既要有益于自己又要有益于别人。处事的秘密，大概就在于如何调节好这个平衡度。

3、保留意见：过分争执无益自己且又有失涵养。通常，应不急于表明自己的态度或发表意见，让人们捉摸不定。谨慎的沉默就是精明的回避。

4、认识自己：促进自己最突出的天赋，并培养其它方面。只要了解自己的优势，并把握住它，则所有的人都会在某事显赫。

5、决不夸张：夸张有损真实，并容易使人对你的看法产生怀疑。精明者克制自己，表现出小心谨慎的态度，说话简明扼要，决不夸张抬高自己。过高地估价自己是说谎的一种形式。它能损坏你的声誉，对你的人际关系产生十分不好影响环境。有损你的和风雅和才智。

6、适应环境：适者生存，不要花太多精力在杂事上，要维护好同事间的关系。不要每天炫耀自己，否则别人将会对你感到乏味。必须使人们总是感到某些新奇。每天展示一点的人会使人保持期望，不会埋没你的天资。

7、取长补短：学习别人的长处，弥补自己的不足。在同朋友的交流中，要用谦虚、友好的态度对待每一个人。把朋友当作教师，将有用的学识和幽默的言语融合在一起，你所说的话定会受到赞扬，你听到的定是学问。

8、言简意赅：简洁能使人愉快，使人喜欢，使人易于接受。说话冗长累赘，会使人茫然，使人厌烦，而你则会达不到目的。简洁明了的清晰的声调，一定会使你半事功倍。

9、决不自高自大：把自己的长外常挂在嘴边，常在别人面前炫耀自己的优点。这无形贬低了别人而抬高了自己，其结果则是使别人更看轻你。

10、决不抱怨：抱怨会使你丧失信誉。自己做的事没成功时，要勇于承认自己的不足，并努力使事情昼圆满。适度的检讨自己，并不会使人看轻你，相反总强调客观原因，报怨这，报怨那，只会使别人轻视你。

11、不要说谎、失信：对朋友同事说谎会失去朋友同事的信任，使朋友、同事从再相信你，这是你最大的损失。要避免说大话，要说到做到，做不到的宁可不说。

12.说话要谨慎，多想少说。说话要令人高兴，循循善诱，“怎么说”比“说什么”更重要。

13.不要批评别人，批评没有任何的好处，只会增加别人的怨恨。

14.切勿错过赞扬他人的机会。无论是谁做的工作，只要出色，就不要吝惜赞扬。

15.给人以真诚的关注，让每个遇到你的人都感到他（她）是重要的。

16.要尽量满足别人的要求。世界上如果有什么成功的要决的话，就是你可以捕捉对方观点的能力，学会从对方的角度考虑问题，就像从你自己的角度出发一样，学会换位思考。激起对方的需求欲望，然后告诉他怎么样才能做到。

17.精神饱满，嘴角上翘。将痛苦、忧愁与失望藏于微笑后面。

18.对有争议的事不存偏见。讨论而不争吵，意见不同归不同，朋友还是朋友。

19.不听不传小道消息。订一条规矩，不背后说人，除非说好话。

20.体贴他人的感情。嘲笑，必得不偿失，还可能造成意料不到的伤害。

21.不要在意别人对你的尖刻评论，学会超脱。

22.不急于求回报，把帮助他人而得到的欣慰作为最好的回报。

23.信守承诺:说到就要做到,做不到就不要说,既然说了就一定要做到,一言既出,驷马难追.此是君子也,要记住一句话:"诺言是要用行动来兑现的支票".

24.学会待人:你想别人怎么待你,你就要先学会怎么去待别人,以心比心,可以得到整个世界,为别人点亮一盏灯,别人将为你点起一把火.

25.尊重他人:尊重别人,别人也会尊重你,没有高尚的人格,便没有高尚的事业,没有高尚有人格,便没有高尚的命运.,人要脸,树要皮,打人不打脸,骂人不揭短,旧事重提惹你烦.

26.学会宽容:心胸开阔如海洋,涵养深广如潭水,宽容可以融化一切坚冰,宽容可以让你拥有一片广阔的天空,宽容别人就是宽容自己."海纳百川,有容为大".要学会宽厚待人,君子忍人所不能忍,容人所不能容,处人所不能处".

27.学会赞美:对自己多批评,对别人多赞美,谦虚的人会得到别人的尊重和赞美.

28.知错就改:犯了错误,知错就改,不要要面子,对就是对,错就是错,要敢于面对,敢于承认,加以改正.亡羊补牢,尤为晚也.

29.不做小人

30.知恩图报:要学会知恩图报,滴水之恩当涌泉相报,这是为人处事的原则,不要忘恩负义.

31.圆通刚毅:为人处事要处理好圆通和刚毅的关系,

32.做人不要太绝:人情世态,可谓错综复杂,瞬息万变,所以,对待任何人和事,都江堰市要留出一线,该放一马则放一马,不要过分计较,也不要不留半点人情,"山不转水转","人情留一线,日后好见面".也就是这个道理.

33、目光远大：当财运亨通时要想到贫穷，这很容易做到。聪明人为冬天准备。一定要多交朋友。维护好朋友同事之间的关系，总有一天你会看重现在看来似乎并不重要的人或事。

ps:
说话时清楚自己和谁说，在说谁，自己说话的动机和目的。
说话时不要一口气说太多的观点，说一两个观点的时候停顿注意对方的反应。
说话后多用发问的形式了解对方的想法，比如说完自己的观点可以问问对方的想法
如果是聊天交流方式，注意自己说话不要多于对方
谦虚聆听对方，以学习的心态交流
不要让知道你才能的限度
让别人永远抱有希望
隐藏你的意图
你的美食别人的毒药
了解工作所需的环境
不要惹人讨厌
不要沉迷于幻觉和欺骗67.不要炫耀高绝地位身份
不要露出自满自得的神色
达成理想的捷径交往
不要苛克
四头无路勇往直前
明慎树立权威
遇良师益友
保持一贯性
浅尝辄止深藏不露
让依赖你的人经历困境
行事太过则是恶
温言软语方能服人
蠢人迟做的事聪明人先做

posted @ 2009-10-03 12:11 vincentsim 阅读(766) | 评论 (0) | 编辑收藏

让你受用终身的28条为人处事之道

1.长相不令人讨厌，如果长得不好，就让自己有才气；如果才气也没有，那就总是微笑。

2.气质是关键。如果时尚学不好，宁愿纯朴。

3.与人握手时，可多握一会儿。真诚是宝。

4.不必什么都用“我”做主语。

5.不要向朋友借钱。

6.不要“逼”客人看你的家庭相册。

7.与人打“的”时，请抢先坐在司机旁。

8.坚持在背后说别人好话，别担心这好话传不到当事人耳朵里。

9.有人在你面前说某人坏话时，你只微笑。

10.自己开小车，不要特地停下来和一个骑自行车的同事打招呼。人家会以为你在炫耀。

11.同事生病时，去探望他。很自然地坐在他病床上，回家再认真洗手。

12.不要把过去的事全让人知道。

13.尊敬不喜欢你的人。

14.对事不对人；或对事无情，对人要有情；或做人第一，做事其次。

15.自我批评总能让人相信，自我表扬则不然。

16.没有什么东西比围观者们更能提高你的保龄球的成绩了。所以，平常不要吝惜你的喝彩声。

17.不要把别人的好，视为理所当然。要知道感恩。

18.榕树上的“八哥”在讲，只讲不听，结果乱成一团。学会聆听。

19.尊重传达室里的师傅及搞卫生的阿姨。

20.说话的时候记得常用“我们”开头。

21.为每一位上台唱歌的人鼓掌。

22.有时要明知故问：你的钻戒很贵吧！有时，即使想问也不能问，比如：你多大了？

23.话多必失，人多的场合少说话。

24.把未出口的“不”改成：“这需要时间”、“我尽力”、“我不确定”、“当我决定后，会给你打电话”……

25.不要期望所有人都喜欢你，那是不可能的，让大多数人喜欢就是成功的表现。

26.当然，自己要喜欢自己。

27。如果你在表演或者是讲演的时候，如果只要有一个人在听也要用心的继续下去，即使没有人喝采也要演，因为这是你成功的道路，是你成功的摇篮，你不要看的人成功，而是要你成功。

28。如果你看到一个贴子还值得一看的话，那么你一定要回复，因为你的回复会给人继续前进的勇气，会给人很大的激励。同时也会让人感激你。

posted @ 2009-10-03 12:08 vincentsim 阅读(167) | 评论 (0) | 编辑收藏

2009年9月28日

计算视觉一些常用中英对照和常用技术2

                                   10.广义逆矩阵是对逆矩阵的推广
        若A为非奇异矩阵,则线性方程组Ax=b的解为x=A^(-1)b，其中A的A的逆矩阵A^(-1)满足A^(-1)A=AA^(-1)=I(I为单位矩阵)。若A是奇异阵或长方阵,Ax=b可能无解或有很多解。若有解,则解为x=Xb+(I-XA)у,其中у是维数与A的列数相同的任意向量,X是满足AXA=A的任何一个矩阵，通常称X为A的广义逆矩阵,用A^g、A^-或A^(1)等符号表示,有时简称广义逆。当A非奇异时,A^(-1)也满足AA^(-1)A=A,且x=A^(-1)b+(I-A^(-1)A)у=A^(-1)b。故非异阵的广义逆矩阵就是它的逆矩阵，说明广义逆矩阵确是通常逆矩阵概念的推广。
　　1955年R.彭罗斯证明了对每个m×n阶矩阵A,都存在惟一的n×m阶矩阵X，满足：①AXA=A；②XAX=X；③(AX)*＝AX；④(XA)*＝XA。通常称X为A的穆尔-彭罗斯广义逆矩阵,简称M-P逆，记作A^+。当A非奇异时，A^(-1)也满足①～④,因此M-P逆也是通常逆矩阵的推广。在矛盾线性方程组Ax＝b的最小二乘解中,x＝A^(-1)b是范数最小的一个解。
　　广义逆的计算方法大致可分为三类：以满秩分解和奇异值分解为基础的直接法，迭代法和其他一些常用于低阶矩阵的非凡方法。

                                   11.湍流　　湍流是流体的一种流动状态。当流速很小时，流体分层流动，互不混合，称为层流，也称为稳流或片流；逐渐增加流速，流体的流线开始出现波浪状的摆动，摆动的频率及振幅随流速的增加而增加，此种流况称为过渡流；当流速增加到很大时，流线不再清楚可辨，流场中有许多小漩涡，层流被破坏，相邻流层间不但有滑动，还有混合。这时的流体作不规则运动，有垂直于流管轴线方向的分速度产生，这种运动称为湍流，又称为乱流、扰流或紊流。

                                   12.刚体变换：只有物体的位置（平移变换）和朝向（旋转变换）发生改变，而形状不变，得到的变换称为刚体变换
特点：保持长度和角度。

posted @ 2009-09-28 23:53 vincentsim 阅读(174) | 评论 (0) | 编辑收藏

计算视觉一些常用中英对照和常用技术1

计算视觉常用中英对照：
    boundary following   边界跟踪
    B-spline B样条
    corners 角点
    derivation 偏差
    fitting 拟合
    lableling of components 成分标记
   correspondence   对应（立体成像中，同一点在不同角度图像成像中对应）
   epipolar 外极（立体成像中）

计算视觉常用技术和相关技术：
                     1.图形的相似变换：由一个图形到另一个图形，在改变的过程中保持形状不变（大小可变），这样的图形改变叫做图形的相似变换（similarty transformation）。图形相似变换的性质：图形的相似变换不改变图形中每一个角的大小；图形中的每条线段都扩大（或缩小）相同的倍数。相似变换：设M是方阵， P是一个同阶可逆矩阵（即行列式不为零，也称非奇异矩阵）， N=P^(-1)MP 称为M的相似变换。相似变换面积：相似变换的实质就是图形形状不变，图形上的任意两点之间的距离都放大或缩小相同的倍数，因此，经相似变换的像与原图对应的线段和周长比等于相比，经相似变换的像与原图的面积等于相似比的平方。

                        2 .SIFT特征是图像的局部特征，其对旋转、尺度缩放、亮度变化保持不变性，对视角变化、仿射变换、噪声也保持一定程度的稳定性。Sift特征匹配算法可以处理两幅图像之间发生平移、旋转、仿射变换情况下的匹配问题，具有很强的匹配能力。
    SURF算法是SIFT算法的加速版，opencv的SURF算法在适中的条件下完成两幅图像中物体的匹配基本实现了实时处理，其快速的基础实际上只有一个——积分图像haar求导，对于它们其他方面的不同可以参考本blog的另外一篇关于SIFT的文章。不论科研还是应用上都希望可以和人类的视觉一样通过程序自动找出两幅图像里面相同的景物，并且建立它们之间的对应，前几年才被提出的SIFT（尺度不变特征）算法提供了一种解决方法，通过这个算法可以使得满足一定条件下两幅图像中相同景物的某些点（后面提到的关键点）可以匹配起来，为什么不是每一点都匹配呢？下面的论述将会提到。 SIFT算法实现物体识别主要有三大工序，1、提取关键点；2、对关键点附加详细的信息（局部特征）也就是所谓的描述器；3、通过两方特征点（附带上特征向量的关键点）的两两比较找出相互匹配的若干对特征点，也就建立了景物间的对应关系。日常的应用中，多数情况是给出一幅包含物体的参考图像，然后在另外一幅同样含有该物体的图像中实现它们的匹配。两幅图像中的物体一般只是旋转和缩放的关系，加上图像的亮度及对比度的不同，这些就是最常见的情形。基于这些条件下要实现物体之间的匹配，SIFT算法的先驱及其发明者想到只要找到多于三对物体间的匹配点就可以通过射影几何的理论建立它们的一一对应。首先在形状上物体既有旋转又有缩小放大的变化，如何找到这样的对应点呢？于是他们的想法是首先找到图像中的一些“稳定点”，这些点是一些十分突出的点不会因光照条件的改变而消失，比如角点、边缘点、暗区域的亮点以及亮区域的暗点，既然两幅图像中有相同的景物，那么使用某种方法分别提取各自的稳定点，这些点之间会有相互对应的匹配点，正是基于这样合理的假设，SIFT算法的基础是稳定点。SIFT算法找稳定点的方法是找灰度图的局部最值，由于数字图像是离散的，想求导和求最值这些操作都是使用滤波器，而滤波器是有尺寸大小的，使用同一尺寸的滤波器对两幅包含有不同尺寸的同一物体的图像求局部最值将有可能出现一方求得最值而另一方却没有的情况，但是容易知道假如物体的尺寸都一致的话它们的局部最值将会相同。SIFT的精妙之处在于采用图像金字塔的方法解决这一问题，我们可以把两幅图像想象成是连续的，分别以它们作为底面作四棱锥，就像金字塔，那么每一个截面与原图像相似，那么两个金字塔中必然会有包含大小一致的物体的无穷个截面，但应用只能是离散的，所以我们只能构造有限层，层数越多当然越好，但处理时间会相应增加，层数太少不行，因为向下采样的截面中可能找不到尺寸大小一致的两个物体的图像。有了图像金字塔就可以对每一层求出局部最值，但是这样的稳定点数目将会十分可观，所以需要使用某种方法抑制去除一部分点，但又使得同一尺度下的稳定点得以保存。有了稳定点之后如何去让程序明白它们之间是物体的同一位置？研究者想到以该点为中心挖出一小块区域，然后找出区域内的某些特征，让这些特征附件在稳定点上，SIFT的又一个精妙之处在于稳定点附加上特征向量之后就像一个根系发达的树根一样牢牢的抓住它的“土地”，使之成为更稳固的特征点，但是问题又来了，遇到旋转的情况怎么办？发明者的解决方法是找一个“主方向”然后以它看齐，就可以知道两个物体的旋转夹角了。下面就讨论一下SIFT算法的缺陷。
       SIFT/SURT采用henssian矩阵获取图像局部最值还是十分稳定的，但是在求主方向阶段太过于依赖局部区域像素的梯度方向，有可能使得找到的主方向不准确，后面的特征向量提取以及匹配都严重依赖于主方向，即使不大偏差角度也可以造成后面特征匹配的放大误差，从而匹配不成功；另外图像金字塔的层取得不足够紧密也会使得尺度有误差，后面的特征向量提取同样依赖相应的尺度，发明者在这个问题上的折中解决方法是取适量的层然后进行插值。SIFT是一种只利用到灰度性质的算法，忽略了色彩信息，后面又出现了几种据说比SIFT更稳定的描述器其中一些利用到了色彩信息，让我们拭目以待。
       最后要提一下，我们知道同样的景物在不同的照片中可能出现不同的形状、大小、角度、亮度，甚至扭曲；计算机视觉的知识表明通过光学镜头获取的图像，对于平面形状的两个物体它们之间可以建立射影对应，对于像人脸这种曲面物体在不同角度距离不同相机参数下获取的两幅图像，它们之间不是一个线性对应关系，就是说我们即使获得两张图像中的脸上若干匹配好的点对，还是无法从中推导出其他点的对应。

                                3.仿射变换：几何上，两个向量空间之间的一个仿射变换或者仿射映射（来自拉丁语，affinis，“和...相关”）由一个线性变换接上一个平移组成。在有限维的情况，每个仿射变换可以由一个矩阵A和一个向量b给出，它可以写作A和一个附加的列b。一个仿射变换对应于一个矩阵和一个向量的乘法，而仿射变换的复合对应于普通的矩阵乘法，只要加入一个额外的行到矩阵的底下，这一行全部是0除了最右边是一个1，而列向量的底下要加上一个1。

                                4.霍夫变换(Hough Transform)
霍夫变换是图像处理中从图像中识别几何形状的基本方法之一，应用很广泛，也有很多改
进算法。最基本的霍夫变换是从黑白图像中检测直线(线段)。我们先看这样一个问题：设已知一黑白图像上画了一条直线，要求出这条直线所在的位置。我们知道，直线的方程可以用y=k*x+b 来表示，其中k和b是参数，分别是斜率和截距。过某一点(x0,y0)的所有直线的参数都会满足方程y0=kx0+b。即点(x0,y0)确定了一族直线。方程y0=kx0+b在参数k--b平面上是一条直线，(你也可以是方程b=-x0*k+y0对应的直线)。这样，图像x--y平面上的一个前景像素点就对应到参数平面上的一条直线。我们举个例子说明解决前面那个问题的原理。设图像上的直线是y=x, 我们先取上面的三个点：A(0,0), B(1,1), C(22)。可以求出，过A点的直线的参数要满足方程b=0, 过B点的直线的参数要满足方程1=k+b, 过C点的直线的参数要满足方程
2=2k+b, 这三个方程就对应着参数平面上的三条直线，而这三条直线会相交于一点(k=1,b=0)。　同理，原图像上直线y=x上的其它点(如(3,3),(4,4)等)　对应参数平面上的直线也会通过点(k=1,b=0)。这个性质就为我们解决问题提供了方法：首先，我们初始化一块缓冲区，对应于参数平面，将其所有数据置为0.对于图像上每一前景点，求出参数平面对应的直线，把这直线上的所有点的值都加１。最后，找到参数平面上最大点的位置，这个位置就是原图像上直线的参数。
          上面就是霍夫变换的基本思想。就是把图像平面上的点对应到参数平面上的线，最后通过统计特性来解决问题。假如图像平面上有两条直线，那么最终在参数平面上就会看到两个峰值点，依此类推。在实际应用中，y=k*x+b形式的直线方程没有办法表示x=c形式的直线(这时候，直线的斜率为无穷大)。所以实际应用中，是采用参数方程p=x*cos(theta)+y*sin(theta)。这样，图像平面上的一个点就对应到参数p---theta平面上的一条曲线上。其它的还是一样。在看下面一个问题：我们要从一副图像中检测出半径以知的圆形来。这个问题比前一个还要直观。我们可以取和图像平面一样的参数平面，以图像上每一个前景点为圆心，以已知的半径在参数平面上画圆，并把结果进行累加。最后找出参数平面上的峰值点，这个位置就对应了图像上的圆心。在这个问题里，图像平面上的每一点对应到参数平面上的一个圆。把上面的问题改一下，假如我们不知道半径的值，而要找出图像上的圆来。这样，一个办法是把参数平面扩大称为三维空间。就是说，参数空间变为x--y--R三维，对应圆的圆心和半径。
图像平面上的每一点就对应于参数空间中每个半径下的一个圆，这实际上是一个圆锥。最后当然还是找参数空间中的峰值点。不过，这个方法显然需要大量的内存，运行速度也会是很大问题。有什么更好的方法么?我们前面假定的图像都是黑白图像(2值图像)，实际上这些2值图像多是彩色或灰度图像通过边缘提取来的。我们前面提到过，图像边缘除了位置信息，还有方向信息也很重要，这里就用上了。根据圆的性质，圆的半径一定在垂直于圆的切线的直线上，也就是说，在圆上任意一点的法线上。这样，解决上面的问题，我们仍采用2维的参数空间，对于图像上的每
一前景点，加上它的方向信息，都可以确定出一条直线，圆的圆心就在这条直线上。这样一来，问题就会简单了许多。接下来还有许多类似的问题，如检测出椭圆，正方形，长方形，圆弧等等。这些方法大都类似，关键就是需要熟悉这些几何形状的数学性质。霍夫变换的应用是很广泛的，比如我们要做一个支票识别的任务，假设支票上肯定有一个红颜色的方形印章，我们可以通过霍夫变换来对这个印章进行快速定位，在配合其它手段进行其它处理。霍夫变换由于不受图像旋转的影响，所以很容易的可以用来进行定位。霍夫变换有许多改进方法，一个比较重要的概念是广义霍夫变换，它是针对所有曲线的，用处也很大。就是针对直线的霍夫变换也有很多改进算法，比如前面的方法我们没有考虑图像上的
这一直线上的点是否连续的问题，这些都要随着应用的不同而有优化的方法。

                        5.消失点：两条平行的铁轨活两排树木连线交与很远很远的某一点，这点在透视图中叫做消失点。凡是平行的直线都消失于无穷远处的同一个点，消失于视平线上的点的直线都是水平直线。

                        6.GMSAC——一种鲁棒的基于高斯混合模型的基础矩阵估计算法
【摘要】：基础矩阵的鲁棒性估计是计算机视觉领域的一个基本问题。为了提高基础矩阵的估计精度,首先指出了现有的鲁棒性算法——RANSAC和MLESAC理论上的缺陷和实际应用中的问题;然后通过详细分析局外点复杂的成因,同时运用混合高斯分布代替均匀分布分别对不同成因的局外点进行了有针对性的建模,并提出了一种鲁棒性更强的算法——GMSAC。实验结果表明,相比于MLESAC算法,GMSAC算法提供了更高的模型似然度和计算精度。

                       7.AAM的思想最早可以追溯到1987年kass等人提出的snake方法，主要用于边界检定与图像分割。该方法用一条由n个控制点组成的连续闭合曲线作为snake模型，再用一个能量函数作为匹配度的评价函数，首先将模型设定在目标对象预估位置的周围，再通过不断迭代使能量函数最小化，当内外能量达到平衡时即得到目标对象的边界与特征。 1989年yuille等人此提出使用参数化的可变形模板来代替snake模型，可变形模板概念的提出为aam的产生奠定了理论基础。 1995年cootes等人提出的asm算法是aam的直接前身，asm采用参数化的采样形状来构成对象形状模型，并利用pca方法建立描述形状的控制点的运动模型，最后利用一组参数租来控制形状控制点的位置变化从而逼近当前对象的形状，该方法只单纯利用对象的形状，因此准确率不高. 1998年，cootes等人在asm算法的基础上首先提出aam，与asm的不同之处是他不仅利用了对象的形状信息而且利用了对象的纹理信息。

                       8.奇异值分解是线性代数中一种重要的矩阵分解，在信号处理、统计学等领域有重要应用。奇异值分解在某些方面与对称矩阵或Hermite矩阵基于特征向量的对角化类似。然而这两种矩阵分解尽管有其相关性，但还是有明显的不同。对称阵特征向量分解的基础是谱分析，而奇异值分解则是谱分析理论在任意矩阵上的推广。说明：1、奇异值分解非常有用，对于矩阵A(m*n)，存在U(m*m)，V(n*n)，S(m*n)，满足A = U*S*V’。U和V中分别是A的奇异向量，而S是A的奇异值。AA'的正交单位特征向量组成U，特征值组成S'S，A'A的正交单位特征向量组成V，特征值（与AA'相同）组成SS'。因此，奇异值分解和特征值问题紧密联系。2、奇异值分解提供了一些关于A的信息，例如非零奇异值的数目（S的阶数）和A的秩相同，一旦秩r确定，那么U的前r列构成了A的列向量空间的正交基。
          关于奇异值分解中当考虑的对象是实矩阵时: S对角元的平方恰为A'A特征值的说明. (对复矩阵类似可得)从上面我们知道矩阵的奇异值分解为: A=USV, 其中U,V是正交阵(所谓B为正交阵是指B'=B-1, 即B'B=I), S为对角阵.A'A=V'S'U'USV=V'S'SV=V-1S2V上式中, 一方面因为S是对角阵, S'S=S2, 且S2对角元就是S的对角元的平方. 另一方面注意到A'A是相似与S2的, 因此与S2有相同特征值.综上即得命题.。

                        9.最小二乘法
　　测量工作和科学实验中常用的一种数据处理方法，由A.-M.勒让德和C.F.高斯于19世纪初分别独立提出。例如，根据实验观测得到的自变量x和因变量y之间的一组对应关系(x1，y1)，(x2，y2)，…，(xm，ym)，找出一个给定类型的函数y＝?(x)（如线性函数y=αx+b)或二次函数y=αx2+b)x+с等），使它在观测点x1，x2，…，xm处所取的值?(x1)，?(x2)，…，?(xm)与观测值y1，y2，…，ym在某种尺度下最接近。常用的一种尺度和处理方法是：确定函数?(x)中的参数(如前述例子中的参数α和b)或α、b)和с)，使在各点处偏差的平方和达到最小。如果?(x)是所有待定参数的线性函数（譬如?(x)是多项式或其他已知函数的线性组合），相应的问题称为线性最小二乘问题。工程技术和科学实验中有大量利用最小二乘法建立的经验公式。
        从几何意义上讲，上述问题等价于确定一平面曲线（类型先给定），使它和实验数据点“最接近”，故又称为曲线拟合问题。它和插值法不同，并不要求曲线严格通过已知点。由于实验数据常带有观测误差和其他随机因素，所以与实验数据保持一致的插值法往往反倒不如最小二乘法得到的曲线更符合客观实际。

posted @ 2009-09-28 23:51 vincentsim 阅读(490) | 评论 (0) | 编辑收藏

2009年9月23日

论文生涯第二期

1.张量空间
        张量：一个物理量如果必须用n阶方阵描述，且满足某几种特定的运算规则（也就是说，这方阵通过这几种运算后得到的结果是规则指出的），则这个方阵描述的物理量称为张量。举例：矢量就是一个2阶张量，它可以用2阶方阵描述，且满足特定的运算规则（2阶情况下简化为平行四边形定则）。此外如函数和其梯度（场）、向量场、外微分形势、黎曼度量等都是张量。
        注释：
                张量在物理上用的多，但是是一个数学的概念，是微分几何研究的一个方向
                概念的核心：张量的分量在坐标变换下满足适当的变换律。

2.近红外

近红外光（Near Infrared，NIR）是介于可见光（VIS）和中红外光（MIR）之间的电磁波，按ASTM（美国试验和材料检测协会）定义是指波长在780～2526nm范围内的电磁波，习惯上又将近红外区划分为近红外短波（780~1100nm）和近红外长波（1100~2526nm）两个区域。

3.典型相关分析

典型相关分析是主成分分析和因子分析的进一步发展, 是研究两组变量间的相互依赖关系, 把两组变量之间的相互关系变为研究两个新的变量之间的相关, 而且又不抛弃原来变量的信息, 这两个新的变量分别由第一组变量和第二组变量的线性组合构成, 并且两组变量的个数可以是不同的, 两组变量所代表的内容也可以是不同的。典型相关分析的实质就是在两组随机变量中选取若干个有代表性的综合指标, 用这些指标的相关关系来表示原来的两组变量的相关关系。

4.阴影三维重建（SSF）主要步骤：计算物体方向图；根据方向图重建深度图。

5.Marr视觉计算理论框架：图像；基元图；2.5维图；3维模型表示。

6.透视投影（perspective projection），正交投影，像素坐标，图像平面坐标，摄像机坐标，场景坐标，色觉三变量性，感受野，同心圆，图像中的分割--》二值分割，尺寸和位置，方向（长轴方向被定义为物体的方向，通常二维平面上与最小惯量轴同方向的最小二阶钜轴被定为长轴，如物体上的全部点到该直线的距离平方和最小），密度集和形态比，投影（给定一条直线，用垂直该直线的一簇等间距直线将一幅二值图像分割成若干条，每一条内像素值为1的像素数量为该条二值图像在给定直线上的投影值），游程长度编码（游程长度编码是栅格数据压缩的重要编码方法，它的基本思路是：对于一幅栅格图像，常常有行(或列)方向上相邻的若干点具有相同的属性代码，因而可采取某种方法压缩那些重复的记录内容。其编码方案是，只在各行(或列)数据的代码发生变化时依次记录该代码以及相同代码重复的个数，从而实现数据的压缩。）

posted @ 2009-09-23 22:22 vincentsim 阅读(146) | 评论 (0) | 编辑收藏

2009年9月22日

论文生涯第一期

          二十多天没有写博客了，主要是老板给了太多的杂货.................keeping 打杂.............................现在有点时间，又有点感悟，又做了写有正事，所以特此写下博客。这几天抽空又看了下论文。记录几个新知识以便备忘：
      1.散焦图片：物体所处位置如果偏离摄像机聚焦平面就会在像检测器上形成模糊的散焦图像，且偏离距离越大，图像的散焦模糊程度也越强.
      2.插值：插值法又称“内插法”。利用函数f 白）在某区间中若干点的函数值，作出适当的特定函数，在这些点上取已知值，在区间的其他点上用这特定函数的值作为函数f 余）的近似值，这力一法称为插值法。如果这特定函数是多项式，就称它为插值多项式。
      3.有限孔径相机是什么东东？
      4.点扩散函数（PSF）：理想成象要求物面与象面之间做到点点对应。象质变坏都是因为原稿上的点物不能在底片上形成点象引起的。系统对点的响应用点扩散函数描述。所谓系统点扩散函数，就是原槁上的一个点源经电子制版系统后在底片上的光强度，可以记为PSF，即P。
      5.投影算子：映射PΩ:Rn→Ω称为投影算子。
      6.模糊半径：模糊半径的含义和输入编辑模块中的结点平差的含义类似。做矢量叠加分析时，为了拓扑处理的需要，也为了生成的结果文件中拓扑关系的严格性，需要将矢量文件交叉处的端点捏合起来，成为一个真正的结点（您可以在输入编辑模块中参照“结点平差”的含义来理解）。模糊半径的取值原则没有一个特定的答案，不能简单的说取值是越大越好还是越小越好，因为它是一个经验值，它和数据的坐标系，坐标单位（如经纬度时可能会小一些，而公里值时又可能会偏大），以及矢量化后的数据精度都有关系，因此要根据具体的数据环境和要求来设置。

            --------------->还是不懂

       7.渐晕，又称虚光，是将照片限定在特定形状而不是普通矩形中的一种放大技术。以前的光像经常渐晕在椭圆形中，也常常把一对新婚夫妇的照片渐晕在一个心形当中。实际上，可能的形状只局限于我们的想象力。通常，渐晕形状的边界柔和，影像逐渐消失，并没有明星的边界线。渐晕的方法很简单，步骤如下：1．在一张纸板上剪出我们所期望形状的孔洞作为渐晕遮片，尺寸大约是影像的一半（预先剪好的渐晕遮片在摄影器材商店也可以买到）。2．将遮片放置于镜头和相纸之间。3．让光线通过遮片上的孔洞对相纸进行曝光，保持遮片距相纸足够远以使光线只覆盖我们需要的画面部分。在曝光过程中，不断轻微移动遮片，以柔化影像的外形轮廓。
       8.渐晕处理需要区分渐晕造成的全局强度变化和局部纹理和光线造成的变化。

posted @ 2009-09-22 22:54 vincentsim 阅读(165) | 评论 (0) | 编辑收藏

2009年9月8日

需要改变

今天被老板骂了，老板和我布置任务时用了you，我错误理解为了我，而不是我们。被训了。后来仔细一想，可能是过去的思考模式错误造成的，过去常常过多的考虑了自己，以自己为中心。其实，在工作中，过多的考虑自己只会使自己更差，只会让自己变得更加封闭。我们要知道：我为人人，人人为我的观念，尤其是IT行业。今天虽然被训了，但是老板教会了一些东西..............早日暴露问题，总比以后暴露来的好。不过！！！以后必须注意了！！！这个坏习惯一定要改掉，否则今天挨训就没有意义了。

posted @ 2009-09-08 23:57 vincentsim 阅读(96) | 评论 (0) | 编辑收藏

2009年9月7日

为了公司而奋斗

今天得到了一个令人担忧的消息：如果我们这批员工干的不好，老板那边的投资者随时有可能撤资！也就是说，现在安逸的工作环境随时都可能一觉醒来后什么都没有了。生活就是这么残酷.......................今天什么都不想说了，因为得到这个消息后心情很沉重，需要消化，突然发现我们肩上的责任很重，很重。这是否就是小公司的无赖了？所以，我们今后更加努力为了公司而奋斗了！！这是我们的公司，是我们展示自己能力的天地，如果失去了，失去的将比失去的更多.........

posted @ 2009-09-07 21:41 vincentsim 阅读(104) | 评论 (0) | 编辑收藏

仅列出标题下一页

3dmax sdk的一些比较好的中文资料网址

来自MIT人工智能实验室:如何做研究

怎样为人处事的方法原则学问

让你受用终身的28条为人处事之道

计算视觉一些常用中英对照和常用技术2

计算视觉一些常用中英对照和常用技术1

论文生涯第二期

论文生涯第一期

需要改变

为了公司而奋斗

导航

统计

常用链接

留言簿

随笔档案

搜索

最新评论

阅读排行榜

评论排行榜