公卫人

 找回密码
 立即注册

QQ登录

只需一步,快速开始

公卫人 首页 临床试验 查看内容

SAS, 一个华丽时代的结束

2011-5-24 15:34| 发布者: epiman| 查看: 8676| 评论: 31|原作者: dapangmao|来自: mysas

摘要: 虽然属于SAS的华丽时代不会再有,但我仍会纪念开创那个时代的伟大的SAS程序员。Old SAS programmers never die, they just fade away.
我是从2000年左右开始接触SAS的。当时还是本科生,带我的师兄要发表英文文章,杂志要求用SAS,所以需要用SAS做几个ANOVA和t-test。那时候用的SAS是存在十几张软盘上的一个dos程序,还请了高手帮我们破解,很是花了一番功夫。印象深刻的是,第一SAS的data step有一个内循环,初学者不需要基本的循环知识就可以上手,第二可以把数据直接考到程序里面,不需要像其他软件那样需要指定路径,读取硬盘上的文件。所以SAS尤其适合像大胖猫这样不是出身计算机相关领域,但是又想要做一些统计分析的业余选手。后来认真学SAS是05年以后的事情了,来到美国可以用正版的SAS,学习SAS也方便很多了。这时候的SAS是8.2版本了,该有的都有了,Proc SQL也变得很流行。再以后,变化就不大了,9.1有了hash object,9.2有了画图的SG procedures,SAS的老本行,广义线性模式,也升级到了Proc GLIMMIX。今年下半年,9.3也应该面世了。

一直在SAS-L潜水,觉得最近几年邮件组里人气掉的厉害,讨论的话题也一直没有什么变化,倒是跟oloolo这样的新生代大侠学到了一些新的编程风格。Oloolo大侠把一些新的算法和数据挖掘方法整合进SAS,让人耳目一新。还有经常出没SAS-L的 Liu Wensui大侠,也是华人中间的SAS高手。刘大侠的Blog也是学习SAS的好地方,他用macro封装输入-计算-输出的模式是我们规范SAS编程的好榜样,而且他很早就开始使用SAS和R的混合编程(可惜他的blog最近关门了,无缘瞻仰了)。

SAS的疲软,一部分原因是因为SAS自身的因素。SAS开发过SAS/AF和SCL,后来都失败了。一个有经验的SAS Programmer没法转变成为一个SAS Developer。 把所有的模块(Base/STAT/ETS/IML 等等)和系统(PC,UNIX,z/OS)弄过一遍就没有什么好学的了。想自己在SAS里面开发自定义模块,困难重重。另外有很大一部分原因是因为R的挑战。R最近几年的发展让人目不暇接,已经成为定量金融,生物信息学和网络分析领域的行业标准。而这三个领域恰恰是发展最快的三个领域。学习R,很快就能开发自己的package,放到CRAN上面就可以扬名立万。所以从职业生涯考虑。有能力的新人不愿意学习SAS,造成了好的SAS Programmer青黄不接。

R的突飞猛进,一个方面因为它是开源的,学习起来很方便,不像SAS要考虑买许可证或者满世界找盗版。想用什么package,敲几个指令就行了。另外一个方面是因为原来制约R发展的内存瓶颈消失了。像Matlab和R这样的矩阵语言,里面的garbage collector不能像通用型编程语言(Java,Python等等)那样快的清空物件,所以内存很容易不够用。现在是64位时代了,买个4G以上的内存不贵。流行的分布式计算(Map/Reduce, Hadoop, Hive)和云计算也帮助解决了这个矛盾。在Amazon,Facebook,Google的数据中心里面,很容易从几千台机器里面集中几T的内存,跑跑R没有问题。大胖猫用过Amazon的EC2服务,价格很公道,也不用掏钱买另外的机器。而SAS对于比较大的数据,则只有望洋兴叹了。

SAS每年的营业额大概是20亿美元,人数只有它1/3的Teradata的营业额也是这么多。要想提高营业额和利润,把注意力集中在电信,银行,保险,医药这些高端客户,是SAS必然的选择。SAS和Teradata都是历史悠久的老公司,SAS从60年代一个做田间统计的小软件发展到现在横跨各个领域的大家伙,的确不易;Teradata是关系型数据库的开创者,Oracle和Sun都是 这个领域的后起之秀。SAS和Teradata的确也有互补之处;也许未来两者合并,更加符合股东的利益。SAS正在开发的并行procedure就是为Teradata专门设计的。SAS的老板,Dr. Goodnight或者不愿意失去对SAS的控制权,但现实上现在的市场恐怕容不下专门的分析软件公司了。统计软件界另一个和Goodnight齐名的传奇人物,Dr. Nie,果断卖掉SPSS是一个正确的选择,借助IBM的国际影响力,SPSS在世界其他国家卖的还不错。将近七十岁的老聂看到R的潜力,重新创业,现在他的Revolution R看上去发展势头不错。如果他还呆在SPSS,现在的情况就很难说了。

由于SAS是行读入的,所以特别适合整数据,我经常没事到各个论坛找些题换几种做法做做,其实跟电脑游戏一样好玩。感谢SAS帮我学会了统计和编程,伴我度过异国他乡的漫漫长夜。虽然属于SAS的华丽时代不会再有,但我仍会纪念开创那个时代的伟大的SAS程序员。Old SAS programmers never die, they just fade away. 

本文内容由 alian 提供

相关阅读

发表评论

最新评论

引用 丸子白菜 2011-5-24 17:45
你写的?~~~~~~~~~~
引用 iavjssssmqee 2011-5-24 19:09
个人感觉非常遗憾啊.
引用 follow_lzheart 2011-5-25 17:50
只会spss的小辈飘过~~~
引用 nty975538 2011-5-25 18:04
一声叹息,唉~~~~~~~~~~~~~~~~~~~~
引用 xjwangfeng 2011-5-26 08:46
学习一下



引用 nokia6100 2011-5-26 21:32
spss都不全会的表示汗~~
引用 345292272 2011-5-27 08:56
spss我们以酱油的形式学过~
引用 limingchuan 2011-5-27 14:23
R软件确实不错,公卫人是不是也应该搞个R板块了呢
引用 howard7738 2011-5-28 08:08
看得出来,作者写的这些是用心声在说话,受益匪浅。
引用 wuhaibin 2011-5-29 10:05
牛人啊,我就浅浅学了SAS和R,仰慕中~~~~~~~~~~~~~~
引用 afeiii 2011-6-3 09:48
仁者见仁,很多专业在美搞统计的人,还是觉得SAS是最强大的,付费和不开放确实限制了他的发展,但是也是它系统稳定的一个保障。应该说SAS还是最强大的。但是楼主确实是深刻的爱着SAS,因为知道,所以懂得!
引用 5158990 2011-6-8 11:48
仰慕啊 软件历程这么了解
引用 d279051809 2011-7-13 15:08
只会SPSS的我飘过,实习有时间要勇敢地向R和SAS冲击~
引用 huangminghui 2011-7-16 09:27
初学统计的时候,学的是stata,学了一个学期,统计入门,不过stata确实学的很汗,后来因为生物信息学,学了段时间的perl,再后来装了spss软件琢磨了段时间,因为前女朋友是统计的,所以matlab和R语言也糊涂的学习了时间,再后来因为在医药公司,所以学习SAS,可以说华丽的SAS确实很震撼,虽然学习的都是皮毛,但也受益颇多。
引用 shxiaopeng112 2011-7-18 08:37
sas蛮好,了解点皮毛就觉得很有潜力的,希望能继续深挖学习!
引用 cllucky 2011-8-3 09:52
学习了,感觉说的很不错……
引用 bigeye919 2011-8-10 13:24
膜拜啊                              
引用 epssbb 2011-8-25 10:45
哦。。。。。原来如此哇。。。。
引用 fyfeng 2011-8-29 20:49
虽然不是很明白,还是可以看出作者和sas一样在不停地前进!!!

查看全部评论(31)

公卫论坛

手机版|会员|至尊|接种|公卫人 ( 沪ICP备06060850号-3 )

GMT+8, 2024-6-22 18:46 , Processed in 0.060249 second(s), 13 queries , Gzip On, MemCached On.

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

返回顶部