周卫华老师:How to Research

来源:百度文库 编辑:偶看新闻 时间:2024/05/07 08:50:16
参考文献:2003_刘挺_怎样做研究.pdf2006_Duane_Letter-to-research-student.pdf  

2006_Duane_Letter-to-research-student.pdf

Reading是基本:

1、  寻找和阅读相关基础是研究的起点,要清楚相关工作的参考文献、书目,及未来读物

2、  保持阅读。每个月花时间跟踪阅读本领域中重要的期刊。会议能够及时反映最新研究进展和结论

3、  带着目的阅读,思考回答以下问题

a)         该研究的贡献是什么?

b)        该成果是如何解决前人研究中遇到的问题的?

c)         论文中有哪些重要的引用文献?

4、  为与自己研究有关系的每篇论文写小结,为本人和他人的研究持续的总结,是经常工作,有助于步步为营找到相关资料

5、  优秀论文阅读完成后,花心思学习它的表达方式

a)         什么使得文章易于阅读?

b)        论文提供了何种层次的细节?

c)         证明重要概念时,引用了哪些例子?

d)        还有哪些问题没有回答?

e)         文章的结论可否一般化?

6、  为哪些真正优秀的论文,做标示,从实例中学习,效果更好

7、  与感兴趣的同事一起阅读,有助于加深理解,特别是难懂的技术文献

Writing是基本:

1、  良好的写作是科学过程的最终保存形式。

2、  要尽可能早得撰写自己的研究结论。

3、  简单朴实的写作,往往是成功的。

4、  学习本领域优秀论文的写作,模仿,并努力提高自己的写作能力

5、  科研人员撰写研究日志非常重要,内容应该包括,参考文献、思考的疑问、描述问题及解决方案,试验的数据和研究结论。

6、  相关文献阅读后,撰写总结。

7、  必须每天保留固定的时间进行写作,这个过程是“考虑问题”的过程

 

与他人一起工作:

1、  许多成功来自于合作,与他人分享思想,并在团体的氛围中继续扩展。

2、  定期会议、讨论。让自己在学术组织中沉浸,即使仿佛没有什么可讨论的。

3、  会议可以同步大家的关注,重新调整问题的重要焦点。

4、  认真对待批评。

 

讨论不“廉价”:

1、  结构良好的讨论,练习好好准备,有利于发现“意想不到的问题”

 

项目:

1、  计算机科学的研究中往往涉及项目和编程,记住,编程不是计算机科学研究,往往只是完成试验的一种机制,既然是实验,就需要精心设计并提前计划:

a)         确立目标

b)        想简单些:大项目未必产生大的成果

c)         创建原型:多数项目会从原型构建中获益

d)        利用工具:程序员的成绩会通过使用简单工具而得到显著提升

e)         合作:与别人分享成果,自己考虑的问题或许别人已经解决了;但要注意版本控制

f)         文档化结论:

 

 

20060508 刘挺谈怎样做研究

如何选题

1)  真实课题

2)  相关扩展(NLP->IRNLP->生物计算)

3)  未知空间不能太小(如手写输入)

4)  不能太难,毕竟有时间限制(如机器翻译、自动校对)

5)  竞争对手不能太多(如语音识别)

课题的价值:

1)意义

影响面(影响的领域、语言、人数)

影响的持续时间

2)创新

新领域、新方向、新理论、新方法、新应用、新语言 (影响力递减 )

识别课题的性质:

研究项目,还是开发项目

基础研究课题,还是应用研究课题

单一学科课题,还是交叉学科课题

长期课题,还是短期课题

课题必须具备的特征:

有足够的兴趣

能成为世界第一

能赚钱

研究的程序:

对于资历较浅的学者可以:预测可能成为热点一个题目,提前研究

Reading

了解背景

多读,注重量的积累

有选择地读

理解文章的动机

找到文章的关键之处

批判性阅读,找出文章中的不足

学习怎样写好文章

Thinking

1)创新至上,“不创新,毋宁死”

重复别人的工作,不如不做

独立思维,表现独特的自我

2)发散思维

创新源于结合(嫁接、类比

(如,仿生学、网格计算(Grid Computing)-网格概念从电力系统引入、功夫在诗外-张旭的草书从公孙大娘的剑舞中悟出)

弄清问题

初始状态是什么

目标状态是什么

如果初始状态和目标状态模糊则不构成一个课题

(如,受限领域语音翻译(订票) ——  特定场景+功能性)

抽象

* 选择数学模型

(如,从BigramDependency Tree

* 设计参数训练的方法

分析与综合:

分析=分类+考察每一类的特性

分析帮助我们看清问题的每一个细节

综合是尽可能地找出统一的模型概括各类现象

分析决定深度,综合决定高度

深入分析:

Programming

1)知止

先做数据,人工标注(可以用机器辅助)

再将数据拆分成训练集和测试集两部分

做评测程序

2)亲自动手

观察数据,积累直觉经验

熟练的编程,只有想不到的,没有做不到的

发现问题

3)积累工具

Writing

中国学者最不重视的环节

心中要有读者模型

* 不是日记,不是内心独白

销售你的研究成果

我有一个发现,想要告诉你

Do you like to hear the story?

在写作中提高

永载史册

好论文什么样:

最重要的是逻辑,要丝丝入扣

以最快的速度抓住读者的注意力

你解决了什么问题

为什么这个问题很重要

你的方法如何,和别人的方法有什么区别

为什么你的方法有效

完整的论文

给出你的假设条件

对错误进行分析

说出你的方法的局限性

如何评价研究结果:

可重复性

规律:放之四海而皆准

方法:屡试不爽

大规模测试

真实数据测试

研究与工程的统一

在国际标准测试集上运行你的算法