首先,R开源、免费,扩展包丰富,但是语言本身特性比较匮乏,可读性不高,处理数据量不大的研究比较方便,处理数据量很大的就得借助数据库。R语言相比于SAS更偏向与编程,就是要把你的统计研究的问题转化成编程问题,把数据用R对象(Vector, List, Data Frame等等)存储起来,然后用特定的函数操作这些R对象,把数据整理成可以进行统计分析的形式,然后用统计分析的函数来执行分析,如果不熟悉这些对象的操作方式,很容易发生细节或者操作思路上的问题。例如:数据类型不匹配(读入的数据明明是股票代码字符串,读进来变成数字),不知道如何批量转化数据(根据某个变量合并数据,如果合并中发现缺失就用线性插值来填补)等等,需要不断地积累经验才行。R相比与SAS的一个最大优势就是扩展包相当多,相当全面,对于大部分研究问题而言都不需要自己去实现底层的计算方法,在CRAN上的扩展包已经能够基本满足各种统计检验、数据挖掘、数据可视化等方面的需求,但是扩展包比较零散,很多时候需要自己去「淘金」。