ITPub博客

首页 > 大数据 > 数据挖掘 > 【Excel数据挖掘】分割数据的方法

【Excel数据挖掘】分割数据的方法

数据挖掘 作者:新头发 时间:2013-03-28 17:22:00 0 删除 编辑

分割数据就是将数据一分为二,比如一个工作表有200行数据,我们要将其中70%的行分割出去用于其他的目的,那么我们可以使用这个功能。通常我们在建立模型的训练数据集和测试数据集的时候会用到改方法:

  1. 打开要分割的数据,在菜单栏上执行:数据挖掘--示例数据

  2. 打开了示例数据向导对话框,点击下一步

  3. 设置数据源,也就是我们要分割什么数据,这里选择默认的表格,点击下一步,如果你的数据在数据库中,可以选择外部数据,然后写上查询语句

  4. 选择抽象类型,如图所示,有两种类型,一种是随机抽样,这个大家都理解,管就是过渡抽样,也就是第二个选项大家不容易理解,举一个例子,假如教师和学生的理论比例是1:30,但是我们的数据不满足这个比例,这可能是抽样误差造成的,为了满足1:30的比例,我们选择过渡抽样,一般我们都是选择第一个,点击下一步

  5. 设置分割的百分比,一般我们使用70%的数据作为训练数据集,点击下一步

  6. 设置这70%和30%的数据表名称,我们默认系统给出的名称,然后点击完成

  7. 我们看到在Excel中多出来了两个表格,这就是上一步我们填写的两个名称


来自 “ ITPUB博客 ” ,链接:http://blog.itpub.net/24058665/viewspace-1110351/,如需转载,请注明出处,否则将追究法律责任。

上一篇: 没有了~
下一篇: 没有了~
请登录后发表评论 登录
全部评论

注册时间:2010-06-08