ITPub博客

首页 > Linux操作系统 > Linux操作系统 > Spss 学习笔记(二)

Spss 学习笔记(二)

原创 Linux操作系统 作者:orchidllh 时间:2004-12-13 00:00:00 0 删除 编辑

spss中,数据文件的管理功能基本上都集中在datatransform菜单上,其中transform主要实现变量级别的数据管理,如计算新变量、变量取值重新编码等,data的功能主要是实现文件级别的数据管理,如变量排序,文件合并、拆分等。


Transform菜单说明:

计算新变量:compute

变量转换:recode,visual bander,count,rank cases,automatic recode五个过程,可以看成是compute再某一方面的强化和打包。

专用过程:建立时间序列、缺失值代替和设定随机种子三个过程,前两个专用于时间序列模型。设定随机种子的功能主要影响伪随机函数的使用。

数据分析中,将连续变量转换为等级变量,或将分类变量不同的变量等级进行合并是常见的工作。而recode可以很好的完成这个任务。

Recode提供了精确的分组功能,但是如果希望进行的分组是有规律的,比如等距分组或者等样本量分组,使用recode过程进行操作就显得非常麻烦,而且可视化程度不高,可以使用visual bander过程进行可视化分段。

在数据分析中,将字符变量转换为数值变量是非常实用的一个功能,除了使用recode过程手工设定转换规则外,还可以使用automatic recode过程自动按照原变量的大小或者字母排序生成新变量,而变量值就是原值的大小次序。

Automatic recode的排序功能和rank cases类似,不同在于,automatic recode可以用于字符型变量。

所谓变量的秩序,就是对记录按照某个变量值得大小来排序。Rank cases就是用来排序的专用过程。

Count:该过程用来表示某个变量的取值中是否出现某个值,可以使单个数值,也可以指定区间,并且可以仅给出条件,而不必对整个数据集进行操作。该过程可以直接使用recode过程来实现。

Random number seed:默认情况下,随机种子随时间不停改变,这样计算出的随机数值无法重复,可以用该过程人为指定一个种子,以后所有的伪随机函数在计算时都会以该种子开始计算,即结果可以重现。

Data菜单说明:

简单命令:包括插入变量、插入记录和到达某条记录,这些功能都可以用鼠标在数据界面上直接完成,很少会使用菜单调用。

常用的简单过程:包括排序、拆分文件、选择记录和加权记录。

变量与数据文件属性向导:用于定义数据字典,或者将预定义的数据字典直接引入当前数据文件,对于大型或者连续性的数据分析项目而言,这是一个非常有用的功能。

数据重构向导:用于进行数据转制,或者对重复测量数据进行长型、宽型记录格式间的转换。

文件合并过程:用于生成实施联合分析所需的设计。

其他过程:包括定义日期变量过程、数据汇总过程和查找重复记录向导。

Sort cases:记录排序。

Split file:记录拆分。

Select cases:不需要分析全部的数据,而是按照要求分析其中的一部分。

Weight cases:记录加权。默认情况下,每行就是一条记录,但是有时非常麻烦。这时候可以使用频数格式录入数据,即相同取值的观测只录入一次,另加一个频数变量用于记录该数据出现了多少次。

Aggregate数据汇总:分类汇总就是按照指定的分类变量对观测值进行分组。分类汇总的分类变量可以指定多个,称为多重分类汇总。

Define variable properties:变量属性定义向导,用于对数据集中已存在的变量进一步定义其属性。

Copy Data Properties:用于将定义好的数据字典直接应用到当前文件中。

Identifying Duplicate cases:查找个别变量值重复,或者所有数值完全重复的记录。

Restructure:根据用户的要求改变数据的排列格式。

Transpose:用于对数据进行行列转置。主要用于编成,进行矩阵运算时的矩阵转置操作。

数据文件的合并有两种:纵向连接和横向合并。纵向连接是几个数据集中的数据纵向相加,组成一个新的数据集,新数据集中的记录是原来几个数据集中记录数的总和。横向合并是按照记录的次序,或者某个关键变量的数值,将不同数据集中的不同变量合并为一个数据集,新数据集中的变量数十所有原数据集中不重名变量的总和。

 

 

 

 

 

 

 

 

 

 

 

来自 “ ITPUB博客 ” ,链接:http://blog.itpub.net/51862/viewspace-180556/,如需转载,请注明出处,否则将追究法律责任。

请登录后发表评论 登录
全部评论

注册时间:2008-02-21

  • 博文量
    180
  • 访问量
    842229