余晖落尽暮晚霞,黄昏迟暮远山寻
本站
当前位置:网站首页 > 编程知识 > 正文

SAS入门指南(SAS入门)

xiyangw 2022-11-25 12:02 36 浏览 0 评论

吵着放弃SAS已经两年了,结果每天打开电脑outlook,lync之后,打开的软件仍然是SAS(排在统计大杀器Excel前面)。所以还是想用SAS做专栏技术类文章的头一篇。

文章基本基于我在知乎的SAS第一次回答:考虑从事 SAS 程序员工作,有哪些需要注意的点? - 畅斌的回答 - 知乎 。稍微加了一些我最新的体会。

首先说,SAS并不是一个user friendly的软件。但是其最主要优势体现在处理大量甚至海量的数据的时候。Excel实现简单且结果立刻可见,是做数据和统计的永恒神器,关于Excel做分析尤其是做可视化的结果的各种方法,在知乎上有许多经典的帖子,不妨搜搜看看。但是当日常处理数据最小的几十万行,几十上百列,这样的文件是Excel没有办法处理的。

SAS有两种基础的step:1. data step偏重于数据的处理和生成(manipulation);2.proc step则提供了SAS各种功能强大的统计分析工具。SAS不同版本的演进主要集中在interface和各种工具的开发。现在的SAS既可以满足programmer在简单的环境中纯粹用scripts实现从底层到reporting的各种功能。也可以在开发工具中用简单地拖拽和设计来实现一个复杂的流程。但是,所有过程的本质还是两种最基础的step,所以:无论最后是在什么样的SAS环境中,对于基本的scripts的理解仍然非常重要。

关于SAS对于统计知识的要求不同的人的看法是不一样的,我想主要原因是大多数的SAS重度使用者还是统计学的背景为主(包括生物统计这一主力军),无形中增大了隐形的门槛。但是很多人用SAS的工作其实对统计的要求并不是特别的深,可以做到理解SAS相关proc的原理即可。而且许多实际的工作中最常用的统计方法其实很简单。如果阅读和理解SAS相关的procedures没有问题,统计知识就不会成为做学好SAS的困难。如果参加过SAS官方的各级培训,会发现即使到了中高级的statistics的SAS Training,需要的统计知识仍然没有离开最最基础的一些统计概念。当然,毫无统计背景的人无论如何也应该理解基本的统计知识, 包括各类假设检验,以及能够读懂一个标准的procedure (reg,logistic,univariable等)的结果的大部分内容。

我想SAS最大的一个缺点就是价格,高昂的价格基本上决定了大多数创业公司或者中小企业没有办法承担每年不菲的开销。SAS的主要客户还是大型的公司,但是其实行业上面倒是并不局限于银行或者healthcare,因为只要是需要处理分析大量数据的工作,SAS都是选择。具体说,我在参加SAS培训时,遇到的同学背景很广泛,商业银行,投资银行,餐饮行业,政府部门,大学等等。而我自己的经历也是因为熟练掌握了SAS,才从energy demand forecasting跳到了credit risk modelling这样一个全新的领域。

关于SAS的certificate和官方的training,我的体会是相关的note和考核的内容对于熟练掌握SAS还是很不错的材料。如果在时间精力和财力允许的情况下,通过培训或者认证可以让自己在短时间里有一定的收获。至于在找工作里面,能够熟练掌握SAS的人的确具有非常大的优势:但是实际的工作经验的价值远远高于certificate。另外,如果不是去商业银行或者healthcare大型企业这些非常非常传统的SAS客户,Python,SQL,Hive,R的技能都比SAS要抢手了。尤其是现在热门的fintech公司,几乎没有哪个还在用SAS作为主要工具了。这些变化显然值得注意。大家关注的最多的还是用工具解决问题的能力,而不仅仅是一个工具熟练度的问题。

End.

作者:畅斌

来源:知乎

相关推荐

前后端分离 Vue + NodeJS(Koa) + MongoDB实践

作者:前端藏经阁转发链接:https://www.yuque.com/xwifrr/gr8qaw/vr51p4写在前面闲来无事,试了一下Koa,第一次搞感觉还不错,这个项目比较基础但还是比较完整了,...

MongoDB 集群如何工作?

一、什么是“MongoDB”?“MongoDB”是一个开源文档数据库,也是领先的“NoSQL”数据库,分别用“C++”“编程语言”编写,使用带有“Schema”的各种类似JSON的文档,是也分别被认为...

三部搭建mongo,和mongo UI界面

三步搭建mongo,和mongoUI界面安装首先你需要先有一个docker的环境检查你的到docker版本docker--versionDockerversion18.03.1-ce,b...

Mongodb 高可用落地方案

此落地方案,用于实现高可用。复制集这里部署相关的复制集,用于实现MongoDB的高可用。介绍MongoDB复制集用于提供相关的数据副本,当发生硬件或者服务中断的时候,将会从副本中恢复数据,并进行自动...

一次线上事故,我顿悟了MongoDB的精髓

大家好,我是哪吒,最近项目在使用MongoDB作为图片和文档的存储数据库,为啥不直接存MySQL里,还要搭个MongoDB集群,麻不麻烦?让我们一起,一探究竟,继续学习MongoDB分片的理论与实践,...

IDEA中安装MongoDB插件-再也无要nosql manager for mongodb

大家都知道MongoDB数据库作为典型的非关系型数据库被广泛使用,但基于MongoDB的可视化管理工具-nosqlmanagerformongodb也被用的较多,但此软件收费,所以国内的破解一般...

数据库监控软件Lepus安装部署详解

Lepus安装部署一、软件介绍Lepus是一套开源的数据库监控平台,目前已经支持MySQL、Oracle、SQLServer、MongoDB、Redis等数据库的基本监控和告警(MySQL已经支持复...

YAPI:从0搭建API文档管理工具

背景最近在找一款API文档管理工具,之前有用过Swagger、APIManager、Confluence,现在用的还是Confluence。我个人一直不喜欢用Swagger,感觉“代码即文档”,让代...

Mac安装使用MongoDB

下载MongoDB包:https://www.mongodb.com/download-center解压mongodb包手动解压到/usr/local/mongodb文件夹配置Mac环境变量打开环境...

保证数据安全,不可不知道的MongoDB备份与恢复

大家在项目中如果使用MongoDB作为NOsql数据库进行存储,那一定涉及到数据的备份与恢复,下面给大家介绍下:MongoDB数据备份方法在MongoDB中我们使用mongodump命令来备...

MongoDB数据备份、还原脚本和定时任务脚本

备注:mongodump和mongorestore命令需要在MongoDB的安装目录bin下备份脚本备份格式/usr/local/mongodb/bin/mongodump -h ...

等保2.0测评:mongoDB数据库

一、MongoDB介绍MongoDB是一个基于分布式文件存储的数据库。由C++语言编写。旨在为WEB应用提供可扩展的高性能数据存储解决方案。MongoDB是一个介于关系数据库和非关系数据库之间的产...

MongoDB入门实操《一》

什么是MongoDBMongoDB是一个基于分布式文件存储的数据库。由C++语言编写。旨在为WEB应用提供可扩展的高性能数据存储解决方案。MongoDB是一个介于关系数据库和非关系数据库之...

Python安装PyMongo的方法详细介绍

欢迎点击右上角关注小编,除了分享技术文章之外还有很多福利,私信学习资料可以领取包括不限于Python实战演练、PDF电子文档、面试集锦、学习资料等。前言本文主要给大家介绍的是关于安装PyMongo的...

第四篇:linux系统中mongodb的配置

建议使用普通用户进行以下操作。1、切换到普通用户odysee。2、准备mongodb安装包,自行去官网下载。3、解压安装包并重命名为mongodb4.04、配置mongodbcdmongod...

取消回复欢迎 发表评论: