ITPub博客

首页 > 大数据 > 可视化 > 数据分析师与 数据分析软件

数据分析师与 数据分析软件

可视化 作者:乌雅氏德馨 时间:2011-11-04 22:24:56 0 删除 编辑
数据分析师的作用  越来越多的企业将选择拥有项目数据分析师资质的专业人士为他们的项目做出科学、合理的分析,以便正确决策项目;越来越多的风险投资机构把项目数据分析师所出具的项目数据分析报告作为其判断项目是否可行及是否值得投资的重要依据;越来越多的企业把项目数据分析师课程作为其中高管理层及决策层培训计划的重要内容;越来越多的有志之士把项目数据分析师培训内容作为其职业生涯发展中必备的知识体系。

数据分析师的工作职责

  数据分析师指的是不同行业中,专门从事行业数据搜集、整理、分析,并依据数据做出行业研究、评估和预测的专业人员。
  互联网本身具有数字化和互动性的特征,这种属性特征给数据搜集、整理、研究带来了革命性的突破。以往“原子世界”中数据分析师要花较高的成本(资金、资源和时间)获取支撑研究、分析的数据,数据的丰富性、全面性、连续性和及时性都比互联网时代差很多。在“原子世界”中,抽样调查是最经常采用的数据获取方式,主要原因就是大范围普查的成本太高——最典型的应用就是电视收视率。而在互联网时代,针对互联网行业的研究,在局部(例如某个网站或同类网站的集群)做到低成本、高效率的全样本数据采集是有可能实现的。同样,“原子世界”中的很多数据不具备连续性,而互联网世界中的数据却有可能做到连续更新,甚至实时——最典型的应用就是网站全样本、全天候数据统计和分析研究。
  与传统的数据分析师相比,互联网时代的数据分析师面临的不是数据匮乏,而是数据过剩。因此,互联网时代的数据分析师必须学会借助技术手段进行高效的数据处理。更为重要的是,互联网时代的数据分析师要不断在数据研究的方法论方面进行创新和突破。例如,结合传统的消费心理学理论,构建丰富的互联网信息消费行为模型。
  就行业而言,数据分析师的价值与此类似。就新闻出版行业而言,无论在任何时代,媒体运营者能否准确、详细和及时地了解受众状况和变化趋势,都是媒体成败的关键。数据分析师在这方面大有可为。
  此外,对于新闻出版等内容产业来说,更为关键的是,数据分析师可以发挥内容消费者数据分析的职能,这是支撑新闻出版机构改善客户服务的关键职能。例如,收集内容消费者信息、形成内容消费者信息数据库、根据数据库的信息与内容消费者保持即时联系、传递产品和服务的信息、数据库的更新和维护。由此,数据分析师提供的数据还将成为定制产品、个性化服务的重要依据:借助先进的数据库技术,对内容资源进行深入挖掘和多次利用,提供个人偏好的内容服务,或借助数字印刷和出版技术,实现按需生产产品并交付出版印刷。

数据分析师的要求

技能要求

  1、大学本科以上,数理统计或数据挖掘专业方向
  2、熟悉数据分析与数据挖掘理论
  3、熟练使用各种数理统计、数据分析、数据挖掘工具软件
  4、有电子邮件方面工作经验者优先
  5、熟悉互联网应用技术知识、网络知识,了解互联网和邮件

其他要求

  良好的沟通交流能力,文字语言表达能力,较好的逻辑分析能力;
  具有独立的产品策划开发能力,项目管理,商务沟通能力;
  强烈责任心,开放的性格,良好的沟通能力; 擅于协作,具备良好的团队合作精神;
  能够在压力下开展工作;善于学习

数据分析师的培养

  目前全国的数据分析行业的认证有项目数据分析师,2003年由信息产业部也就是现在的工业与信息化部在全国开展推广,2008年主管协会是数据分析专业委员会,目前全国获得项目数据分析师认证的人员接近万人

 

数据分析软件

统计分析的软件有很多,统计软件-数据处理-简明统计分析(CS)(为非专业人士设计)、Ed数据统计分析软件、SAS、SPSS(统计产品与服务解决方案软件)、R语言等
如果你只是想快捷应用 推荐用SPSS

 

分为专业挖掘工具 与通用挖掘工具

用数据挖掘工具是针对某个特定领域的问题提供解决方案,在涉及算法的时候充分考虑了数据、需求的特殊性,并作了优化。对任何领域,都可以开发特定的数据挖掘工具。

通用数据挖掘工具不区分具体数据的含义,采用通用的挖掘算法,处理常见的数据类型。通用的数据挖掘工具不区分具体数据的含义,采用通用的挖掘算法,处理常见的数据类型。

 

常见的工具

1.QUEST
2.MineSet
3.DBMiner
4.Intelligent Miner
5.SAS Enterprise Miner

  这是一种在我国的企业中得到采用的数据挖掘工具,比较典型的包括上海宝钢配矿系统应用和铁路部门在春运客运研究中的应用。SAS Enterprise Miner是一种通用的数据挖掘工具,按照"抽样--探索--转换--建模--评估"的方法进行数据挖掘。可以与SAS数据仓库和OLAP集成,实现从提出数据、抓住数据到得到解答的"端到端"知识发现。

6.SPSS Clementine

7.数据库厂商集成的挖掘工具

    SQL Server 2000包含由Microsoft研究院开发的两种数据挖掘算法:Microsoft决策树和Microsoft聚集。此外,SQL Server 2000中的数据挖掘支持由第三方开发的算法。 Microsoft决策树算法:该算法基于分类。算法建立一个决策树,用于按照事实数据表中的一些列来预测其他列的值。该算法可以用于判断最倾向于单击特定标题(banner)或从某电子商务网站购买特定商品的个人。 Microsoft聚集算法:该算法将记录组合到可以表示类似的、可预测的特征的聚集中。通常这些特征可能是隐含或非直观的。例如,聚集算法可以用于将潜在汽车买主分组,并创建对应于每个汽车购买群体的营销活动。,SQL Server 2005在数据挖掘方面提供了更为丰富的模型、工具以及扩展空间。包括:可视化的数据挖掘工具与导航、8种数据挖掘算法集成、DMX 、XML/A、第三方算法嵌入支持等等。
    Oracle Data Mining (ODM) 是 Oracle 数据库 10g 企业版的一个选件,它使公司能够从最大的数据库中高效地提取信息并创建集成的商务智能应用程序。数据分析人员能够发现那些隐藏在数据中的模式和内涵。应用程序开发人员能够在整个机构范围内快速自动提取和分发新的商务智能 ― 预测、模式和发现。ODM 针对以下数据挖掘问题为 Oracle 数据库 10g 提供支持:分类、预测、回归、聚类、关联、属性重要性、特性提取以及序列相似性搜索与分析 (BLAST)。所有的建模、评分和元数据管理操作都是通过 Oracle Data Mining 客户端以及 PL/SQL 或基于 Java 的 API 来访问的,并且完全在关系数据库内部进行。
   IBM Intelligent Miner 通过其世界领先的独有技术,例如典型数据集自动生成、关联发现、序列规律发现、概念性分类和可视化呈现,它可以自动实现数据选择、数据转换、数据发掘和结果呈现这一整套数据发掘操作。若有必要,对结果数据集还可以重复这一过程,直至得到满意结果为止。现在,IBM的 Intelligent Miner已形成系列,它帮助用户从企业数据资产中识别和提炼有价值的信息。它包括分析软件工具 ----Intelligent Miner for Data和IBM Intelligent Miner forText ,帮助企业选取以前未知的、有效的、可行的业务知识---- 如客户购买行为,隐藏的关系和新的趋势,数据来源可以是大型数据库和企业内部或Internet 上的文本数据源。然后公司可以应用这些信息进行更好、更准确的决策,获得竞争优势。

<!-- 正文结束 -->

来自 “ ITPUB博客 ” ,链接:http://blog.itpub.net/26108436/viewspace-1121716/,如需转载,请注明出处,否则将追究法律责任。

上一篇: 没有了~
下一篇: 没有了~
请登录后发表评论 登录
全部评论

注册时间:2011-07-29