北河以北

R是什么

文/宋春林

在过去的十年里,无论学术界还是工业界都有一种势头,那就是视R编程语言为最重要的一个计算统计、可视化和数据科学领域的工具。在世界范围内,数以百万计的统计学家和数据科学家用R来解决他们最具挑战性的问题,其领域从计算生物学到量化营销都有。R已经成为最流行的用于数据科学的编程语言,也是谷歌、Facebook和LinkedIn等财务与分析驱动的公司的必备工具。 这里有一个介绍R的短片,点击此处可以下载观看。

每一种数据分析技巧都在你指尖

R包括几乎所有现代数据科学家需要的数据处理,统计模型和图表。 您可以轻松地查找、下载和使用统计学领域基于同行评议的新锐方法,也可以从数据科学领域研究人员那里获得预测模型。这一切都是免费的。

创造美丽和独特的数据可视化效果

用图表表示复杂的数据是数据分析过程中的一个重要组成部分,而R远远超出了传统的条形图和折线图。由于受到数据可视化的思想领袖比尔·克利夫兰和爱德华·塔夫特的极大影响,R可以很容易地通过多面板图、三维曲面等图形来解析多维数据的含义。R的自定义图表功能已经出现在纽约时报,经济学人,和FlowingData博客上很多令人惊叹的信息图表中。

更快更好的结果

R不是使用菜单点击或不灵活的“黑盒子”程序,而是一种专门为数据分析设计的编程语言。中级水平的R程序员做数据分析比使用传统统计软件的用户更快,R可以灵活地混合和匹配模型,从而达到最佳结果。 并且R脚本很容易实现自动化,既有助于促进可重复性研究,也利于生产部署。

集中全世界数据科学家的才智

作为一个蓬勃发展的开源项目,R由全球超过两百万用户和数千名开发者社区所支持。无论您是使用R进行优化组合、分析基因组序列或者预测组件故障,各个领域的专家们都在线上提供了相关的资源、应用程序和免费代码。

本文译自:What is R?

发表于
分类 学无止境  标签 R  译文