ITPub博客

首页 > Linux操作系统 > Linux操作系统 > 【原创】SAS 9.3 专题技术精粹(图文并茂版)可下载

【原创】SAS 9.3 专题技术精粹(图文并茂版)可下载

原创 Linux操作系统 作者:leonarding 时间:2013-10-10 11:19:52 0 删除 编辑

更多精彩内容尽在www.leonarding.com

SAS 9.3 专题技术精粹【图文并茂版】



版本info

Userleonarding

Date2013.10.10

OS Versionwindows 7 64bit

SAS Version9.3


引言:SAS可以作为一种ETL工具整理数据,例如 日志文件 -> SAS -> Oracle,它可以把杂乱无章的字符串整理成行列模式的二维表,有了标准的数据集我们就可以进一步的进行详细数据分析,还可以把这种二维表单导入到关系型数据库中保存,下面我们就用几个实例来演示SAS整理数据功能。


我们设计了三个专题,如下所示


 日志文件ip_pv_log,这是某网站每天的点击记录日志,包括计算时间,ip数,pv数。要求将此文本数据用SAS程序读入到数据集,数据集属性包括:日期(不用记录时间),ip数,pv数。


 解出Excel电子表格demo.xls,这是记录发垃圾广告的id的数据表单,包括用户id,发帖次数和ip。请用图形界面和SAS编程两种方法将此表单导为数据集。


下载dataguru论坛的访问日志片段(文本文件TXT),每行记录的含义如下(【】内的部分为注释,并非日志本身的内容): 121.33.190.166ip地址】 - -[31/Mar/2012:00:00:07 +0800]【点击时间】 "GET /static/js/jquery-1.6.js【访问链接】 HTTP/1.1" 404 299【返回页面大小字节数】"http://f.dataguru.cn/thread-1427-2-1.html"【参照页链接】"Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/534.54.16 (KHTML, likeGecko) Version/5.1.4 Safari/534.54.16"【使用的浏览器】 使用SAS软件把该日志文件读取为数据集,要求数据集记录ip、点击时间、点击链接、页面大小、浏览器等信息,然后把数据集中的ip、时间和点击链接信息回写到硬盘的一个文本文件中,要求提交程序和运行抓图。


我们使用图文并茂的手段来给大家讲解SAS 9.3的使用方法,请下载PDF
 SAS 9.3 专题技术精粹.pdf        请点击下载


SAS编程  导入数据  导入文件   导出数据  解析文本


Leonarding

2013.10.10

北京&autumn

分享技术~成就梦想

Blog:www.leonarding.com

来自 “ ITPUB博客 ” ,链接:http://blog.itpub.net/26686207/viewspace-774060/,如需转载,请注明出处,否则将追究法律责任。

请登录后发表评论 登录
全部评论
刘盛,网名leonarding,the first ACEA in china, Oracle OCM10g&11g RHCE, ACOUG Core Member Blogger, DATAGURU Oracle数据库版主, ITPUB HADOOP版版主, DB2中国专家组成员, 专注于&Oracle&Hadoop&Nosql&SAS, 提倡“分享技术~成就梦想”, 新浪微博:@itpub_leonarding QQ:40354446

注册时间:2012-02-10

  • 博文量
    238
  • 访问量
    3245385