北河以北

关于统计学和科学的一些观点

文/宋春林

在北京上了差不多三个月的课,接触了一些新的观点,忍不住要写下来。

统计学的精华在于设计的无可挑剔。在此之前,我所以为的统计学就是处理数据,这个想法是很有问题的。因为面对任何一堆数据,在分析之前都必须弄清楚:数据是否真实可靠,不真实的数据分析出的结果自然是靠不住的,这个和我以前学习水文统计时检查数据可靠性类似;科研设计是否有硬伤,不合理的科研设计得出的数据或许可以分析出所谓“成果”,但这种“成果”毫无意义,不过是浪费纳税人的钱罢了;质量控制必须严格,不能有过多缺失的数据,且数据的整理方法必须正确,这个类似于水文统计中的一致性和代表性。如果是调查问卷,还要注意调查的代表性和问卷回收率。在这几项中,其他的还比较好控制,科研设计这一步是最难的。要得到一个完美的科研设计方案既需要专业知识,也需要常识。现实中要考虑各种因素,任何遗漏的因素都可能影响实验。完美的科研设计方案要经过反复推敲斟酌才能达到。对于我自己的专业而言,还要在会所后的实践中体会。

科学的本质在于不确定性。这个确实有点颠覆我以往的认识,我以前以为科学就是1+1=2,是确定性的东西,但仔细想想这是不对的,科研问题要复杂得多。科学研究是为了know why,但是我们所知的,永远不会是完美无缺的。就像最近在Nature上发的一篇文章,说全球陆地上的河流向大气释放的二氧化碳五倍于湖泊和水库所释放的。文章里得出这个结论的数据并不是来自于全球所有河流和湖泊水库的,而仅仅是一些地区的数据。而且,他的数据不一定是准确的;处理方法也并不一定是正确的;很多其他因素如植被、土壤、温度的影响没有完全考虑进去;这个结论也并不是亘古不变的,因为全球变化背景下陆地上的水体也一直在发生变化。但是,这并不否定这是一篇好文章,作者把积累了十年的数据,用目前普遍认可的方法处理,最后得出相对结论,逻辑上完美无缺。即使很多年以后可能又有一篇文章会得出与此相反的结论,也并不能说现在的结论就是没有价值的。科学允许犯错,科学并不是要得出一个确定性的结论,而是在一次次探索和犯错中完成对已有知识体系的构建。

科学是为了抵达人性的自由。这个有些理想主义,特别是在没用科学传统的中国。很多年前的新文化运动在中国提倡“德先生”和“赛先生”,“德先生”目前看来实现无望,更令人伤感的是“赛先生”也远没有实现。真正的科学应该是为了科学而科学,不应该为了科研之外的东西去做科研。西方追求自由,我认为对自由的追求不应该分东西方。在对人性自由的追求过程中,总有无穷的未知在前,未知阻碍了自由,为了探索这无穷的未知世界,科学成了一种途径。我第一次听到这种观点的时候真有种顿悟的感觉。有了这样的追求,科学精神也就自然而然成为大家的内在意识,容不得虚假、无知,更容不得剽窃他人成果。

中国传统的知识分子或者说读书人,读书做研究都带有强烈的实用主义。“书中自有黄金屋,书中自有颜如玉”,读书不是为了追求真理,而是钱和美女,太猥琐了。这种实用主义与科学精神是背道而驰的,也是很多学术腐败发生的根本原因。现在很多科研工作者,做科研只是为了拿项目、捞钱,这种人无疑是学术界的蛀虫,他们不配做科研。国内现在的学术环境比较差,根本原因就在于缺乏科学精神。很简单的一个例子,国内的学术会议上,恐怕没用几个人会把自己想到的ideas与他人分享。因为担心自己的ideas被他人拿去做成果、拿项目去了。对于一个真正的科研工作者,剽窃他人想法是非常恶劣的行为,目前这点在中国还不是共识。还有一个老师上课讲的,说他参加一个学术会议,看到讲座的一个人有明显错误,但是没有人提出来,因为那个人是学术前辈。我们问他说出来会有什么后果,他无奈的一笑,说那要看这个人是否大度。中国的人情社会属性,到了学术界也是,讲情不讲理。这样的现状显然不利于学术交流。我很是讨厌这点,希望未来会有所改变。

Comments

王磊之: 自己的idea不能无偿分享,不过话说,也许那么理想的分享机制可以到共产主义讨论一下。现在,能做到不剽窃就能算做正派。不过话说回来,大部分的idea也是不值钱的,执行力才值钱~我还是老老实实的打基础吧。现在学的东西很杂,都是为了以后怎么做事而服务,完全不是为了科研啊。

宋春林: ideas不值钱,这个我很认同,只有把idea牛逼地实现了才有价值。 做事也好,做科研也好,我觉得只要是提升了自我的价值,都是好的~

Racheeeel: 我最近也在看统计学的东西,还是希望先把之前学的概率统计再夯牢实一点,再多看些案例。 这篇文章让我想到了一本叫《研究的艺术》的书,有兴趣找来翻翻吧~ 感谢分享IDEAs~

宋春林: 你说的是贝弗里奇的《科学研究的艺术》?如果是这本的话,我已经在看了~

Racheeeel: 是三个人合著的叫做,研究是一门艺术。你说的那本我也去找找呢。我的那本也是同学推荐的。

发表于
分类 学无止境  标签 统计学  科研文化