赵钰莹 | 2018-06-22 09:20:41 | 阅读(2640) | 评论(0)
 猎聘网业务规模的高速发展,线上产品与线下销售、客服业务的高度融合,猎头、企业、经理人多角色的招聘生态闭环,多元化与多组织层次的数据统计与运营分析需求......在这...【阅读全文】
赵钰莹 | 2018-06-21 11:02:40 | 阅读(2850) | 评论(0)
 Apache Spark是处理和使用大数据最广泛的框架之一,Python是数据分析、机器学习等领域最广泛使用的编程语言之一。如果想要获得更棒的机器学习能力,为什么不将Spark和Pyt...【阅读全文】
赵钰莹 | 2018-06-20 17:58:11 | 阅读(1860) | 评论(0)
随着“Hadoop是否已失宠”的选题调研进程过半,国内外企业以及厂商的观点确实存在很大分歧,有人认为是国外Hadoop厂商所提供的服务以及架构不如国内厂商完善,也有观点表明...【阅读全文】
格伯纳 | 2018-06-16 22:05:46 | 阅读(90) | 评论(0)
6月15日,由成都山河空间信息技术有限公司(SUNVO)举办的“空间大数据+移动互联”峰会——山河空间·掌图专场在WGDC2018年舞台上首次惊艳亮相。【阅读全文】
赵钰莹 | 2018-06-15 17:37:05 | 阅读(2280) | 评论(0)
在“Hadoop是否已失宠?”的选题调研中,笔者调查了银行、Hadoop发行商、Hadoop企业用户以及部分工程师的意见,所处环境、业务需求以及看问题角度的不同让这些组织或个人有...【阅读全文】
赵钰莹 | 2018-06-14 17:43:32 | 阅读(6330) | 评论(0)
数十年来,由于可从数据库提取信息、重新格式化转换数据,并将数据加载到数据仓库,ETL一直是企业基础架构的关键组件。随着云、SaaS和大数据的出现,新数据源和数据流的急...【阅读全文】
赵钰莹 | 2018-06-14 16:57:55 | 阅读(2430) | 评论(0)
 在银行业中使用数据科学不仅仅是一种趋势,它已成为保持竞争的必要条件。 银行必须认识到,大数据技术可以帮助他们有效地集中资源,做出更明智的决策并提高绩效。【阅读全文】
赵钰莹 | 2018-06-14 16:22:58 | 阅读(2760) | 评论(0)
开源ETL工具俨然成为商用解决方案的低成本替代品。就像商业解决方案一样,它们也有其优点和缺点。如果没有时间或资源自定义ETL解决方案或者不能接受商用方案的购买成本,开...【阅读全文】
赵钰莹 | 2018-06-13 16:43:03 | 阅读(4710) | 评论(0)
在笔者持续调研国内Hadoop生态系统生存现状的同时,KDnuggets发布的2018年数据科学和机器学习工具调查报告再次将“Hadoop失宠”言论复活。报告一出,“Hadoop被抛弃”几个...【阅读全文】
赵钰莹 | 2018-06-12 18:08:24 | 阅读(4200) | 评论(0)
 这是HBase入门系列的第1篇文章,介绍HBase的数据模型、适用场景、集群关键角色、建表流程以及所涉及的HBase基础概念,本文内容基于HBase 2.0 beta2版本。本文既适用于HBa...【阅读全文】
赵钰莹 | 2018-06-11 18:06:58 | 阅读(360) | 评论(0)
近日,著名数据科学网站 KDnuggets 发布了 2018 年数据科学和机器学习工具调查结果。超过 2000 人对自己「过去 12 个月内在项目开发中使用过的数据挖掘/机器学习工具和编程...【阅读全文】
赵钰莹 | 2018-06-11 17:46:08 | 阅读(420) | 评论(0)
 不同于以往的授课式课堂风格,这次斯坦福大学的教授Hadley Wickham开设了一门论文讨论课。课程名为:Readings in Applied Data Science。要求学生每周阅读3~4篇论文,并...【阅读全文】
superjack2 | 2018-06-09 10:52:25 | 阅读(0) | 评论(0)
1. 两者分别是什么?   Apache Hive是一个构建在Hadoop基础设施之上的数据仓库。通过Hive可以使用HQL语言查询存放在HDFS上的数据。HQL是一种类SQL语言,这种语言最终被...【阅读全文】
赵钰莹 | 2018-06-08 09:02:39 | 阅读(3450) | 评论(0)
数据分析老鸟都知道,相比于自己作出好的数据分析报告,“教别人如何入门数据分析”这事情简单多了。什么for循环,def函数,print输出,自变量a赋值,字符串和数字转换,相...【阅读全文】
赵钰莹 | 2018-06-08 09:01:00 | 阅读(3270) | 评论(0)
Hadoop是由Apache基金会开发的一个大数据分布式系统基础架构,最早版本是2003年原Yahoo!DougCutting根据Google发布的学术论文研究而来。用户可以在不了解分布式底层细节的...【阅读全文】
共4页