ITPub博客

首页 > 大数据 > 数据挖掘 > Mathematica数据可视化:[4]经验实战

Mathematica数据可视化:[4]经验实战

数据挖掘 作者:jerome007 时间:2013-08-22 16:56:00 0 删除 编辑

        为了阐明上个经验之中所列出7个步骤, 下面我们来动手, 做一个案例, 来对其加以讨论, 这个例子中, 他展示了数据可视化所涉及到的基本流程.  我们以全球国家的一些信息为例, 来说明整个流程工作的大体框架. 

        首先, 问题是什么? 每一个可视化项目都要源自于一个问题.  这里我比较好奇, 对于全球不同的国家人均寿命是多少? 想以地图的可视化方式将区别呈现出来. 

  1. 第一步, 收集数据那么首先第一步, 数据的获取, 这个步骤可能相当的复杂和枯燥, 亦或非常简单, 就像在 Mathematica下, 可以直接访问的到相关的数据. 

  2. 第二部, 转换格式.我们的数据要不要转换成 Mathematica 直接能用的格式呢? CountryData 是内置的函数, 并且可以保证返回给我们的数据是正确的, 不过我们还要检查一下究竟每一组的列表之中元素是什么类型. 我们有字符串. 实数. 当这一步完成后, 所有的数据被成功标识出来了. 

  3. 第三步, 过滤.考虑检查或者删掉数据中的无效或者脏数据. 为了简单起见, 我们先检查一下所有的数据是不是都是这样格式来, 判断整个数据集. 

    返回的结果为 False, 我们应该检查一下为什么. 因为有些很小的国家, 限于国家的发展水平统计方面还很落后, 因此对于某一项而言暂时还没有相关的数据. 可以随手查看一下都有那些国家是这样的情况. 这样当缺失的数据被挑选出来了之后, 我们的做法是直接删除掉. 就可以了(或者我们也有其他的处理方式, 比如查找其他方面的资料看看能够弥补上, 或者根据周边地区求出一个均值等等). 

  4. 第四部, 挖掘.这个步骤涉及到数学. 统计和数据挖掘方面的内容. 这个例子中我们只做一种简单处理:  通过遍历整个数据集合来确定最大和最小值, 这样可以通过线性的映射到0到1范围之内. 

  5. 第五步, 表示这个步骤将我们的数据以图形的方式展示出来. 当然这是最关键的一个环节. 

  6. 第六步. 修饰. 

    以后, 当我们学过替换操作之后(见我以前的经验), 上面的代码其实可以更简短一些, 这是后话了. 现在我们已经有了一幅作品了. 但是仅仅这样还是不够的, 我们还需要在下一步处理, 比如修饰, 加上必要的说明文字. 

  7. 第七步, 交互

    这个环节可以为这个例子再增加交互的部分, 使得观众能够控制, 探索数据. 通过这样的方式能够数据信息更有意义, 也使得静态的图表变得更加有趣. 比如当鼠标移动到图形中的某个特殊位置的时候, 能够透露出这个国家的额外的信息. 总之, 随着我们系列经验的展开, 将会逐步加深此类的话题. 好了, 让我们先停到这里, 休息一下, 各位朋友, 再会!

来自 “ ITPUB博客 ” ,链接:http://blog.itpub.net/7261202/viewspace-1110765/,如需转载,请注明出处,否则将追究法律责任。

上一篇: 没有了~
下一篇: 没有了~
请登录后发表评论 登录
全部评论