ITPub博客

首页 > 大数据 > Hadoop

关于 “Hadoop” 的内容如下:

  • 频频刷屏朋友圈,白酒如何越来越年轻化?来聊聊白酒企业数字化

    最近,某白酒品牌频频吸引大众眼球,白酒与咖啡、巧克力等联名衍生品一经推出便掀起热潮。某商品由于太过火爆,甚至一度售罄下架。不得不说,我国拥有超大规模内需市场,消费潜力巨大。当前,创新消费场景加上数字化融合转型,成为酒企品牌开疆扩土、逆势增长的重要途径。如今越来越多的酒企开始拥抱数字化,建立涵盖白酒品系开发、酒体设计、基地建设、白酒生产运营、营销等环节的数字化体系,实现全链路数字化,提高产品质量及市

    数栈DTinsight Hadoop 595 2023-09-22 14:02
  • 袋鼠云产品功能更新报告07期|智能、高效、安全,一个都不能少!

    欢迎来到袋鼠云07期产品功能更新报告!在瞬息万变的市场环境中,袋鼠云始终将客户需求和反馈置于优化工作的核心位置,本期也针对性地推出了一系列实用性强的功能优化,以满足客户日益增长的业务需求。以下为袋鼠云产品功能更新报告07期内容,更多探索,请继续阅读。离线开发平台新增功能更新1.数据源引入支持对接审批中心背景:数据源的使用让用户走审批流程,而非只是由管理员分配,方便进行审计记录。新增功能说明:项目管

    数栈DTinsight Hadoop 579 2023-09-21 15:09
  • Affinity Publisher for Mac(设计排版工具)2.2.0激活版

    想要自己的排版与众不同,在众多排版设计中脱颖而出吗?Affinity Publisher for Mac是一款非常专业的排版软件,可以用于创建各种印刷品,如杂志、书籍、海报、传单等。Affinity Publisher具有直观的界面和丰富的排版工具,可以满足各种类型的排版需求。Affinity Publisher支持多种文件格式,包括PDF、EPS、SVG、TIFF、PNG等。它提供了多种排版功能

    Niy九月 Hadoop 568 2023-09-20 11:38
  • Flink cdc 2.2.0版本不能配置指定时间戳或者binlog位置采集

    介绍源码可以看到!!这个是Flink cdc 2.2.0版本的,这里只有两种Mode,想要指定时间戳或者是binlog文件位置,则需要升级cdc版本,我选择了2.3.0解决了问题!注意Flink cdc的包和Flink的包非常容易出现包的版本冲突,可以根据报错信息进行相关包的排除,如果需要用cdc,则最好优先使用Flink cdc里面的包

    元亨利贞 Hadoop 93 2023-09-16 15:59
  • 揭秘 ChunJun:如何实现 e2e&session 日志隔离

    本文将从 e2e 的基本介绍,e2e 的使用与扩展,session 日志隔离三个维度为大家带来 ChunJun e2e & session 日志隔离的分享。大量具体代码和演示请看视频教程⬇️视频课程:https://www.bilibili.com/video/BV1ru411P7oZ/?spm_id_from=333.999.0.0课件获取:https://www.dtstack.com

    数栈DTinsight Hadoop 554 2023-09-15 14:40
  • 一文了解袋鼠云在实时数据湖上的探索与实践

    近日,袋鼠云大数据引擎专家郝卫亮,为大家带来了《袋鼠云在实时数据湖上的探索与实践》主题分享,帮助大家能了解到什么是实时数据湖、如何进行数据湖选型及数据平台建设数据湖的经验。如今,大规模、高时效、智能化数据处理已是“刚需”,企业需要更强大的数据处理能力,来应对数据查询、数据处理、数据挖掘、数据展示以及多种计算模型并行的挑战。因此,袋鼠云基于自研的一站式大数据基础软件——数栈提出相应的实时数据湖解决方

    数栈DTinsight Hadoop 611 2023-09-14 16:08
  • 性能、安全和稳定,DataAPI 为企业 API 保驾护航

    对于 API 平台管理者、开发者和调用者来说,API 的调用性能、安全性和稳定性是在平台选型时最需要考虑的三个因素。本文将为大家分享 袋鼠云数据服务平台DataAPI 是如何实现这三方面保障的。

    数栈DTinsight Hadoop 593 2023-09-13 11:12
  • @全体开发者们,ChunJun 有奖征文,精美奖品,快来参加!

    2022年4月,在 FlinkX 进行初版开源的整整四年后,技术团队决定对FlinkX进行整体升级,并更名为 ChunJun。到目前为止,ChunJun 正式更名上线已经过了一年多了。作为一款稳定、易⽤、⾼效、批流⼀体的数据集成框架,相信各位关注着、喜爱着、使用着 ChunJun 的开发者们在过去的这段日子里肯定和 ChunJun 发生了众多有趣的故事。本着促进社区活跃,倾听用户诉求的目的,我们将

    数栈DTinsight Hadoop 595 2023-09-11 14:21
  • Hadoop主要是用来做什么的呢?

    Hadoop以一种可靠、高效、可伸缩的方式进行数据处理,用户可以在不了解分布式底层细节的情况下开发分布式程序。主要解决海量数据存储与计算的问题,是大数据技术中的基石。 Hadoop用途:海量数据存储HDFS有高容错性的特点,并且设计用来部署在低廉的(low-cost)硬件上;而且它提供高吞吐量(High throughput)来访问数据,适合那些有着超大数据集(large data se

    候鸟之恋 Hadoop 584 2023-09-08 15:09
  • “数据驱动”时代,企业为什么需要实时湖仓?

    随着业务对数据时效性要求的提高,许多企业的实时任务体量,正在逐步接近存量离线任务。实时湖仓解决方案,利用湖存储的特性和 Flink 的流批计算能力,统一存储和计算,无疑会是企业当前最优的选择。

    数栈DTinsight Hadoop 632 2023-09-06 10:54
  • 大数据计算引擎 EasyMR 如何简单高效管理 Yarn 资源队列

    在Yarn框架中,资源调度是十分重要的内容,EasyMR出于简单高效原则,开放了资源队列管理功能。本文就为大家详细介绍大数据计算引擎 EasyMR 是如何简单高效管理 Yarn 资源队列的。

    数栈DTinsight Hadoop 605 2023-09-01 10:24
  • 直播预约丨《实时湖仓实践五讲》第一讲:企业为什么需要实时湖仓?

    如今,大规模、高时效、智能化数据处理已是“刚需”,企业需要更强大的数据平台,来应对数据查询、数据处理、数据挖掘、数据展示以及多种计算模型并行的挑战,湖仓一体方案应运而生。《实时湖仓实践五讲》是袋鼠云打造的系列直播活动,将围绕实时湖仓的建设趋势和通用问题,邀请奋战于企业数字化一线的核心产品&技术专家,结合实践案例分析,和听众共同探讨实时湖仓领域的前沿技术。*《实时湖仓实践五讲》第一讲——《企

    数栈DTinsight Hadoop 563 2023-08-29 11:56
  • HDFS - 文件块大小的设置

    概述1、Hadoop文件大小的设置取决于HDFS的块(block)大小,块大小是HDFS存储和处理数据的基本单位。一般来说,文件大小应该大于或等于块大小,以避免产生大量的小文件,影响HDFS的性能和效率。2、HDFS的块大小可以在配置文件中进行设置,不同版本的Hadoop默认的块大小可能不同。在Hadoop 2.x、3.x中,默认的块大小为128MB。3、块大小的设置应该根据磁盘的传输速率和寻址时

    元亨利贞 Hadoop 206 2023-08-26 22:34
  • HDFS - 文件块大小的设置

    概述1、Hadoop文件大小的设置取决于HDFS的块(block)大小,块大小是HDFS存储和处理数据的基本单位。一般来说,文件大小应该大于或等于块大小,以避免产生大量的小文件,影响HDFS的性能和效率。2、HDFS的块大小可以在配置文件中进行设置,不同版本的Hadoop默认的块大小可能不同。在Hadoop 2.x、3.x中,默认的块大小为128MB。3、块大小的设置应该根据磁盘的传输速率和寻址时

    元亨利贞 Hadoop 173 2023-08-26 22:29
  • 前端开发进阶:前端开发中如何高效渲染大数据量?

    本文通过分享一个实际场景中的前端开发思路,介绍当遇到大量数据时,如何实现高效的数据渲染,以达到提升页面性能和用户体验的目的。

    数栈DTinsight Hadoop 572 2023-08-23 14:56
  • 预算不足也要远离传统云服务器?云耀云服务器 L 实例就能轻松上云

    在当今的数字化时代,中小企业正在寻找更有效、更灵活的方式来开展业务。在这个过程中,云计算技术的应用成为了一个重要的选择。然而,传统的云服务器可能并不是这类企业的选择。首先,我们需要理解传统云服务器的特性。传统云服务器通常需要用户自行配置和管理,包括硬件、操作系统、中间件、数据库等。这对于中小企业来说,可能会带来一些挑战。1. 技术门槛高:对于许多中小企业来说,他们可能没有专业的 IT 团

    YJKJN Hadoop 480 2023-08-22 23:08
  • hadoop 常用端口号

    端口列表端口名称Hadoop2.xHadoop3.xNameNode内部通信端口8020 / 90008020 / 9000/9820NameNode HTTP UI500709870MapReduce查看执行任务端口80888088历史服务器通信端口1988819888

    元亨利贞 Hadoop 421 2023-08-22 19:20
  • Hadoop 日志聚集开启,日志保留时间

    概述Hadoop 日志聚集是指将 Hadoop 集群中各个节点上的日志文件收集到一个中心位置,以便于管理和分析。要开启 Hadoop 日志聚集,您需要在 Hadoop 配置文件中进行相应的配置。具体操作步骤如下:在 yarn-site.xml 文件中,添加以下配置项: &nb

    元亨利贞 Hadoop 425 2023-08-22 19:16
  • Hadoop 历史服务器配置

    概述Hadoop历史服务器默认情况下是没有启动的,需要自己配置和启动该服务。在步骤开始之前,建议先把hdfs和yarn停掉:stop-dfs.sh、stop-yarn.sh。然后,您需要在mapred-site.xml文件中添加一些配置,以满足基本使用需求。例如,在mapred-site.xml中添加以下配置(注意根据自己的ip进行修改):

    元亨利贞 Hadoop 406 2023-08-22 19:06
  • 分布式可视化 DAG 任务调度系统 Taier 的整体流程分析

    Taier 作为袋鼠云的开源项目之一,是一个分布式可视化的 DAG 任务调度系统。旨在降低 ETL 开发成本,提高大数据平台稳定性,让大数据开发人员可以在 Taier 直接进行业务逻辑的开发,而不用关心任务错综复杂的依赖关系与底层的大数据平台的架构实现,将工作的重心更多地聚焦在业务之中。本文将从 Taier 的流程简述、结构分析以及可扩展点三个方面对 Taier 的整体流程进行分析探讨。Taier

    数栈DTinsight Hadoop 173 2023-08-17 10:28
点击加载更多下一页

成为大咖

联系我们
itpub
help@itpub.net
ITPUB-饶
扫描二维码联系客服
关于 广告服务 使用条款
京ICP备16024965号
经营性网站备案信息
网络110报警服务
中国互联网举报中心
北京互联网违法和不良信息举报中心

关注公众号获取更多技术文章