周卫华老师:How to Research
来源:百度文库 编辑:偶看新闻 时间:2024/05/07 08:50:16
2006_Duane_Letter-to-research-student.pdf
Reading是基本:
1、 寻找和阅读相关基础是研究的起点,要清楚相关工作的参考文献、书目,及未来读物
2、 保持阅读。每个月花时间跟踪阅读本领域中重要的期刊。会议能够及时反映最新研究进展和结论
3、 带着目的阅读,思考回答以下问题
a) 该研究的贡献是什么?
b) 该成果是如何解决前人研究中遇到的问题的?
c) 论文中有哪些重要的引用文献?
4、 为与自己研究有关系的每篇论文写小结,为本人和他人的研究持续的总结,是经常工作,有助于步步为营找到相关资料
5、 优秀论文阅读完成后,花心思学习它的表达方式
a) 什么使得文章易于阅读?
b) 论文提供了何种层次的细节?
c) 证明重要概念时,引用了哪些例子?
d) 还有哪些问题没有回答?
e) 文章的结论可否一般化?
6、 为哪些真正优秀的论文,做标示,从实例中学习,效果更好
7、 与感兴趣的同事一起阅读,有助于加深理解,特别是难懂的技术文献
Writing是基本:
1、 良好的写作是科学过程的最终保存形式。
2、 要尽可能早得撰写自己的研究结论。
3、 简单朴实的写作,往往是成功的。
4、 学习本领域优秀论文的写作,模仿,并努力提高自己的写作能力
5、 科研人员撰写研究日志非常重要,内容应该包括,参考文献、思考的疑问、描述问题及解决方案,试验的数据和研究结论。
6、 相关文献阅读后,撰写总结。
7、 必须每天保留固定的时间进行写作,这个过程是“考虑问题”的过程
与他人一起工作:
1、 许多成功来自于合作,与他人分享思想,并在团体的氛围中继续扩展。
2、 定期会议、讨论。让自己在学术组织中沉浸,即使仿佛没有什么可讨论的。
3、 会议可以同步大家的关注,重新调整问题的重要焦点。
4、 认真对待批评。
讨论不“廉价”:
1、 结构良好的讨论,练习好好准备,有利于发现“意想不到的问题”
项目:
1、 计算机科学的研究中往往涉及项目和编程,记住,编程不是计算机科学研究,往往只是完成试验的一种机制,既然是实验,就需要精心设计并提前计划:
a) 确立目标
b) 想简单些:大项目未必产生大的成果
c) 创建原型:多数项目会从原型构建中获益
d) 利用工具:程序员的成绩会通过使用简单工具而得到显著提升
e) 合作:与别人分享成果,自己考虑的问题或许别人已经解决了;但要注意版本控制
f) 文档化结论:
如何选题:
1) 真实课题
2) 相关扩展(NLP->IR,NLP->生物计算)
3) 未知空间不能太小(如手写输入)
4) 不能太难,毕竟有时间限制(如机器翻译、自动校对)
5) 竞争对手不能太多(如语音识别)
课题的价值:
1)意义
影响面(影响的领域、语言、人数)
影响的持续时间
2)创新
新领域、新方向、新理论、新方法、新应用、新语言 (影响力递减 )
识别课题的性质:
研究项目,还是开发项目
基础研究课题,还是应用研究课题
单一学科课题,还是交叉学科课题
长期课题,还是短期课题
课题必须具备的特征:
有足够的兴趣
能成为世界第一
能赚钱
研究的程序:
对于资历较浅的学者可以:预测可能成为热点一个题目,提前研究
了解背景
多读,注重量的积累
有选择地读
理解文章的动机
找到文章的关键之处
批判性阅读,找出文章中的不足
学习怎样写好文章
Thinking
1)创新至上,“不创新,毋宁死”
重复别人的工作,不如不做
独立思维,表现独特的自我
2)发散思维
创新源于结合(嫁接、类比)
(如,仿生学、网格计算(Grid Computing)-网格概念从电力系统引入、功夫在诗外-张旭的草书从公孙大娘的剑舞中悟出)
弄清问题
初始状态是什么
目标状态是什么
如果初始状态和目标状态模糊则不构成一个课题
(如,受限领域语音翻译(订票) —— 特定场景+功能性)
抽象
* 选择数学模型
(如,从Bigram到Dependency Tree)
* 设计参数训练的方法
分析与综合:
分析=分类+考察每一类的特性
分析帮助我们看清问题的每一个细节
综合是尽可能地找出统一的模型概括各类现象
分析决定深度,综合决定高度
深入分析:
Programming
1)知止
先做数据,人工标注(可以用机器辅助)
再将数据拆分成训练集和测试集两部分
做评测程序
2)亲自动手
观察数据,积累直觉经验
熟练的编程,只有想不到的,没有做不到的
发现问题
3)积累工具
Writing
中国学者最不重视的环节
心中要有读者模型
* 不是日记,不是内心独白
销售你的研究成果
* 我有一个发现,想要告诉你
* Do you like to hear the story?
在写作中提高
永载史册
好论文什么样:
最重要的是逻辑,要丝丝入扣
以最快的速度抓住读者的注意力
* 你解决了什么问题
* 为什么这个问题很重要
* 你的方法如何,和别人的方法有什么区别
* 为什么你的方法有效
完整的论文
* 给出你的假设条件
* 对错误进行分析
* 说出你的方法的局限性
如何评价研究结果:
可重复性
* 规律:放之四海而皆准
* 方法:屡试不爽
大规模测试
真实数据测试
研究与工程的统一
在国际标准测试集上运行你的算法