ITPub博客

关于 “数据分析” 的内容如下:

  • 全民狂热的世界杯背后都有哪些科技公司在鼎力支持?

    7月16日凌晨,法国队以4比2战胜克罗地亚队,时隔20年再获世界杯冠军。众所周知,本届世界杯为了贡献更精彩的比赛引入了众多科技元素,例如5G、VAR、智能设备、AI等,但你不知道的是,为了争夺冠军,各个球队背后也都有科技公司的鼎力支持。

    tianxiaoxu 数据分析 2581 2018-07-19 09:48:57
  • 满成见:猎聘网数据治理实践全流程经验分享

     猎聘网业务规模的高速发展,线上产品与线下销售、客服业务的高度融合,猎头、企业、经理人多角色的招聘生态闭环,多元化与多组织层次的数据统计与运营分析需求......在这些复杂业务环境下如何做好数据治理实践的?猎聘DIG数据平台中MySql、GreenPlum、Hive多源数据库共存,整合了结构化和半结构化的数据,为实时统计、T+N的企业管理报表、机器学习提供更适合的基础设施,同时以数据生命周期和数据血缘的管理作为数据治理的两大核心脉络。线上、线下不同业务形态的数据,在时间、地域、组织等不同维度上,在数据产生、成长、下线、归档不同的生命阶段,设置不同的数据监测和管理策略,保证数据仓库中数据的及时性和有效性。通过制定数据标准、规范协作流程、自研监测与预警工具,保证业务数据、数仓明细数据,核心指标等各个数据加工链条节点上的数据一致性和质量可靠性。

    赵钰莹 数据分析 2899 2018-06-22 09:20:41
  • 部署ETL工具的三种方式,企业应该怎么选?

    数十年来,由于可从数据库提取信息、重新格式化转换数据,并将数据加载到数据仓库,ETL一直是企业基础架构的关键组件。随着云、SaaS和大数据的出现,新数据源和数据流的急剧增加,迫切需要更强大和更复杂的数据集成工具出现。新一代ETL工具可以实时获取数据,处理数十亿交易以及支持任何来源的结构化或非结构化数据(无论是内部部署还是云中);同时,这些工具还具备可扩展性、灵活性、容错性和安全性,具备传统内部部署解决方案无法实现的所有功能。

    赵钰莹 数据分析 6445 2018-06-14 17:43:32
  • 学完68个Python函数,为啥还做不好数据分析?

    数据分析老鸟都知道,相比于自己作出好的数据分析报告,“教别人如何入门数据分析”这事情简单多了。什么for循环,def函数,print输出,自变量a赋值,字符串和数字转换,相关分析,回归分析,方差分析,聚类分析,判别分析,决策树分析等。函数太多,方法太多,套路太多,技巧太多……可现实是,大多数人听了无数道理依旧庸碌一生,学完68个Python常见函数却依旧做不好数据分析。

    赵钰莹 数据分析 3463 2018-06-08 09:02:39
  • 大数据存储平台之异构存储实践深度解读

    经常做数据处理的伙伴们肯定会有这样一种体会:最近一周内的数据会被经常使用到,而比如最近几周的数据使用率会有下降,每周仅仅被访问几次;在比如3月以前的数据使用率会大幅下滑,存储的数据可能一个月才被访问几次。这就产生了一种热和冷数据,对需要频繁访问的数据我们称之为“热”数据,反之我们称之为”冷”数据,而处于中间的数据我们称之为”温”数据。

    赵钰莹 数据分析 2371 2018-06-06 20:16:58
  • 做了40多年数据分析,Teradata这次的关键字是“任意”?

    如果一家企业经历了信息化时代、互联网时代到数字化时代的变迁,那么这家企业很可能被打上“传统”的标签,如果这家企业几十年一直在做一件事情,那么被贴标签的概率就可能翻倍。越是几十年专注某一领域的大企业,其努力和创新越容易被忽略,就好比当Teradata天睿公司连续16年入选Gartner分析型数据管理解决方案魔力象限领导者象限的消息公布后,不少人的第一反应是“嗯!老样子!”,却没有观察到Teradata早已旧貌换新颜。

    赵钰莹 数据分析 244 2018-05-24 17:55:22
  • 现代ETL工具与传统解决方案清单附对比

    通常,企业在知晓编写代码和构建内部解决方案所需的成本和复杂性之后,首先会意识到对ETL工具的需求。提取,转换和加载(ETL)工具使企业能够在不同的数据系统中访问有意义且可用的数据。

    赵钰莹 数据分析 577 2018-05-23 09:20:00
  • 神策数据获4400万美元C轮融资 自爆性能指标

    华平投资董事总经理丁毅表示:“我们调查发现,神策的客户黏性非常高,超过40%的客户多个部门每天都会使用神策分析。神策数据,是我们评估过的团队里面,最懂中国企业数据化现状与建设的团队,他们在中国的大数据分析领域沉淀了十年,尤其是在数据安全、技术创新和行业应用方面积累了丰富的实践经验。”

    老鱼笔记 数据分析 273 2018-05-07 15:51:33
  • 如何做PB级大数据在线分析?看阿里实践

    企业数据每年以PB级甚至上百PB爆炸式增长,越来越大的数据量正为扩大分析策略在企业应用软件领域的拓展提供了数据基础,但数据的价值是有时效性的,越早分析越能得到更快的问题反馈或响应,而离线分析缺点显然是不能及时地利用数据中所蕴含的深层价值,因此,如何针对海量数据进行毫秒级在线分析,就成为挑战和新兴话题。

    老鱼笔记 数据分析 247 2018-05-07 11:24:32
  • solr6.2.1的备份和恢复介绍以及联机故障恢复一例

    solr6.2.1的备份和恢复介绍以及联机故障恢复一例

    chenfeng 数据分析 2499 2018-01-29 15:05:00
  • 小结:《笨办法学python》

    学习python

    water_chou 数据分析 492 2018-07-19 18:23:11
  • 通过抓包实现Python模拟登陆各网站原理分析

    通过分析登陆流程并使用 Python 实现模拟登陆到一个实验提供的网站,在实验过程中将学习并实践 Python 的网络编程,Python 实现模拟登陆的方法,使用 Firefox 抓包分析插件分析网络数据包等知识。

    陶然陶然 数据分析 485 2018-07-17 10:05:39
  • 客户倒逼!F-One如何2C和2B双模式齐下?

    相比于根基深厚的大型企业,创业公司往往更急于做市场和PR,这也不难理解,大型企业已经具备成熟的商业模式,具备较高的盈利能力,而创业公司刚刚起步,只能自己卖力吆喝客户。但是,也有一些创业公司喜欢在产品打磨相对成熟之后再对外发声,每次看到这类公司,笔者都会惊讶于其不短的创业时长和低调的过往。

    赵钰莹 数据分析 654 2018-07-12 14:10:52
  • YARN and MapReduce的【内存】优化配置详解

    在Hadoop2.0中, YARN负责管理MapReduce中的资源(内存, CPU等)并且将其打包成Container. 这样可以精简MapReduce, 使之专注于其擅长的数据处理任务, 将无需考虑资源调度. 如下图所示?????????????YARN会管理集群中所有机器的可用计算资源. 基于这些资...

    烙痕 数据分析 167 2018-07-09 02:17:49
  • 动态格报表的制作

    接触过很多客户,在没有数据系统以前,很多报表都是用excel画的。这些excel表,大部分都是业务人员为了方便记录数据直接画的,在这样画出来的表样中,分组合并单元格相当自由不受约束。而当业务人员把这些excel交给程序猿哥哥用报表工具制作时候,很自然地也会希望报表能像excel一样随心所欲的去合并单元格。但是,这就令...

    嘟嘟是只喵 数据分析 166 2018-07-04 16:51:35
  • 多值模糊查询报表的制作

    在数据查询系统中,经常会涉及到模糊查询和多值查询。对于模糊查询,我们可能都有所了解。就是根据用户在参数框中输入的关键字进行模糊匹配,这在SQL中是通过like条件实现的。而多值查询则大多是一次在参数框中输入2个以上关键词,以字符串组,整数组等形式进行参数传递,这在SQL中是通过in条件完成多值匹配的。但是...

    嘟嘟是只喵 数据分析 166 2018-07-04 16:47:39
  • tab页形式展现多张报表

    业务系统中,很多报表都是沿用之前EXCEL的报表样式,原来以sheet格式显示的表,客户在web端展现的时候也希望也有同样的格式,润乾在实现这种效果和EXCEL一样简单灵活,轻松将数据报表以多个TAB页的形式展现在页面中,达到了一同展现,同时进行查询、打印、导出EXCEL结果文件等操作。在润乾报表中如何实现这样多个...

    嘟嘟是只喵 数据分析 165 2018-07-01 16:33:33
  • 报表实时显示时间

    报表,除了相对静态地展现汇总统计数据以及分布、趋势等数据内容外,也可以用于显示和时间相关的即时信息,包括实时显示时间。例如,下面这个设备监控应用统系中,首页除了显示实时监控数据外,还需要在右上角显示实时时间:这种形式的“动态报表”其实在我们生活中也随处可见,最常见的就是火车站大屏幕上的列车...

    嘟嘟是只喵 数据分析 0 2018-06-28 22:31:02
  • 模糊查询专题

            在银行、销售、仓库管理等的数据查询系统中,我们经常会用到精确查询来准确获取想要的数据,但是很多时候我们并不记得确切的检索条件是什么,这样的话,必然会对我们获取数据造成一定的影响,而此时模糊查询的出现很好的解决了这个难题,因其可以根据用户输入的部分关键...

    嘟嘟是只喵 数据分析 0 2018-06-27 17:04:45
  • 纺织行业节能方案与应用案例

    本文介绍了智能优化节能系统在湖北某纺织厂实际运行及应用情况,通过智能优化节能系统对全厂用电的监测和分析,提出采用调整电费收费方式、合理安排错峰用电、优化配电线路等节能降耗的措施,结合该纺织厂实际情况,在保证正常生产的情况下,根据工况调查制定的节能方案,对系统提出的措施进行实施,达到了预期节能目的。

    xfwanzhou 数据分析 0 2018-06-23 16:08:28
  • 科普文:银行业9大数据科学应用案例解析!

     在银行业中使用数据科学不仅仅是一种趋势,它已成为保持竞争的必要条件。 银行必须认识到,大数据技术可以帮助他们有效地集中资源,做出更明智的决策并提高绩效。

    赵钰莹 数据分析 2490 2018-06-14 16:57:55
  • 主流的开源ETL工具清单及优劣说明!

    开源ETL工具俨然成为商用解决方案的低成本替代品。就像商业解决方案一样,它们也有其优点和缺点。如果没有时间或资源自定义ETL解决方案或者不能接受商用方案的购买成本,开源解决方案将是一个实用选择。

    赵钰莹 数据分析 2800 2018-06-14 16:22:58
  • 企业财务分析体

    目前,企业财务分析体系构建主要从盈利能力、营运能力、偿债能力和发展能力四个方面入手。  1.盈利能力分析  盈利能力指企业在一定时期内赚取利润的能力。盈利能力分析是企业财务分析的重点,主要是对利润率的分析,包括资产盈利能力分析和经营盈利能力分析。主要指标有净资产收益率、总资产报酬率、营业利润率...

    ceo_lxy 数据分析 1 2018-06-12 10:45:23
  • 2018数据科学和机器学习调查:Hadoop被抛弃!

    近日,著名数据科学网站 KDnuggets 发布了 2018 年数据科学和机器学习工具调查结果。超过 2000 人对自己「过去 12 个月内在项目开发中使用过的数据挖掘/机器学习工具和编程语言」进行了投票。该统计还对过去三年来的排名进行了对比分析。

    赵钰莹 数据分析 393 2018-06-11 18:06:58
  • 阿里巴巴资深大数据工程师:大数据处理实践

     不同于以往的授课式课堂风格,这次斯坦福大学的教授Hadley Wickham开设了一门论文讨论课。课程名为:Readings in Applied Data Science。要求学生每周阅读3~4篇论文,并给出反馈。

    赵钰莹 数据分析 481 2018-06-11 17:46:08
  • HBase vs Hive

    1. 两者分别是什么?   Apache Hive是一个构建在Hadoop基础设施之上的数据仓库。通过Hive可以使用HQL语言查询存放在HDFS上的数据。HQL是一种类SQL语言,这种语言最终被转化为Map/Reduce. 虽然Hive提供了SQL查询功能,但是Hive不能够进行交互查询--因为它只能够在Haoop上批量的执行Hadoop。 &...

    superjack2 数据分析 1 2018-06-09 10:52:25
点击加载更多

成为大咖

联系我们
itpub
help@itpub.net
010-59127154
扫描二维码联系客服
关于 广告服务 使用条款
京ICP备16024965号
经营性网站备案信息
网络110报警服务
中国互联网举报中心
北京互联网违法和不良信息举报中心