发布时间:2018-06-08 09:01:00

Hadoop是由Apache基金会开发的一个大数据分布式系统基础架构,最早版本是2003年原Yahoo!DougCutting根据Google发布的学术论文研究而来。用户可以在不了解分布式底层细节的情况下,轻松地在Hadoop上开发和运行处理海量数据的应用程序。低成本、高可靠、高扩展、高有效、高容错等特性让Hadoop成为最流行的大数据分析系统,然而其赖以生存的HDFS和MapReduce组件却让其一度陷入困境——批处理的工作方式让其只适用于离线数据处理,在要求实时性的场景下毫无用武之地。......【阅读全文】

阅读(3193) | 评论(0) | 转发(0)

发布时间:2018-06-08 08:41:18

降价、AI养猪、冬奥会、ET大脑、新品、开源、公测......这些关键词同时出现在了阿里云2018云栖大会·上海峰会的现场。在国人的惯性思维中,越大的企业所需承载的社会责任和期望越大。随着互联网新兴技术的发展,中国有机会重新定义城市,阿里云ET大脑则承担了部分重任,但阿里云显然并未止步于智慧城市建设,这次又抓住了哪个行业呢?手握大量实战经验和技术能力,阿里云打算如何输出这些实力呢?现场迁移2TB数据,连线语音智能买票、开源中国首个云厂商产品文档,阿里云到底有多少面?......【阅读全文】

阅读(3324) | 评论(0) | 转发(0)

发布时间:2018-06-08 00:53:13

自动化运维时代,最先受到影响的就是DBA。传统意义上,这类工程师是一个要求较高但在整个IT体系中所获认可度不高的角色。在大多数人的认知中,DBA的工作基本相当于消防员,哪里有火就灭哪里,每天的大部分时间都用在基础运维和系统修复上,没有精力关注更有价值的事情,DBA应该如何成长呢?AI时代,DBA的生存模式应该如何转变呢?......【阅读全文】

阅读(2527) | 评论(0) | 转发(0)

发布时间:2018-06-06 20:18:06

随着应对大规模交易的Web应用程序、SOA和其他服务器应用程序的爆炸式增长,数据存储无法跟上应用增长速度,因为数据存储无法继续添加更多服务器以扩展,这与可扩展性极高的应用架构不同。......【阅读全文】

阅读(2233) | 评论(0) | 转发(0)

发布时间:2018-06-06 20:16:58

经常做数据处理的伙伴们肯定会有这样一种体会:最近一周内的数据会被经常使用到,而比如最近几周的数据使用率会有下降,每周仅仅被访问几次;在比如3月以前的数据使用率会大幅下滑,存储的数据可能一个月才被访问几次。这就产生了一种热和冷数据,对需要频繁访问的数据我们称之为“热”数据,反之我们称之为”冷”数据,而处于中间的数据我们称之为”温”数据。......【阅读全文】

阅读(2331) | 评论(0) | 转发(0)
给主人留下些什么吧!~~
留言热议
请登录后留言。

登录 注册