ITPub博客

首页 > 大数据 > 数据挖掘 > 大数据#Futures

大数据#Futures

数据挖掘 作者:Tybyq 时间:2018-11-29 17:03:59 0 删除 编辑

为了解大数据的当前和未来状态,我们采访了来自28个组织的31位IT主管。 我们问他们,“从您的角度来看大数据摄取,管理和分析的未来是什么 - 最大的机会在哪里?”  这是他们告诉我们的:

AI / ML

  • 我们将看到从内部迁移到云,然后看到传统的Hadoop转向云。 这将导致更高的AI / ML采用率。 

  • 只需推动公司的数字化议程。 您有足够的计算能力和数据 - 您可以做什么? 充分利用这一能力。 使用AI / ML过滤数据。 让更多人参与进来。 

  • 利用更多传感器进入世界,利用大数据和ML异常检测。 摄像头检查安全头盔,ML模型来自城市传感器预警指示器。 整个经济成为信息驱动。 了解可能发生异常的原因。 

  • 1)AI / ML变得不那么炒作,更多的是趋势。 ML需要大数据才能工作。 任何ML都需要大数据。 大数据本身并没有用。 能够让引擎自动查看趋势并对要查看的内容提出建议是有价值的。 2)期待更多用于可视化和报告大数据的工具。 Salesforce有爱因斯坦。 Tableau有一个工具。 我们还没有看到更多的人。 AI / ML将变得更加普遍。 

  • AI保护系统。 保持并保持数据更安全。 为人类创造道德和道德困境。 保护数据,因为在某些时候它会被转交给可怕的机器,因为你不知道机器可以用它做什么,你无法恢复。 

  • 使用AI和ML技术,如TensorFlow,为大数据应用提供了最大可能的未来机会。 通过AI,计算机可以发现人类无法看到的模式。 

  • 我们将在组织中遇到人才问题。 能够使非数据科学家的人可以看到数据的价值是一个重要的因素。 AI / ML将专注于理解数据,为人们提供答案。 背景也很重要 - 我们如何创造背景并将其从人们的头脑中解脱出来?

  • 成熟过去的Hadoop数据湖世界。 Hadoop对于某些事情来说是一个很好的工作负载,并不适用于所有事情。 每个人都深呼吸。 Hadoop对这些东西很有用。 数据湖也是如此。 你必须经历成长的痛苦才能弄明白。 随着我们越来越多地进入人工智能世界并且系统在未来发现事物,机会增加,这就是现实,我们将作为一个行业实现目标。 跨越数据和工作负载的巨大机会。 你必须考虑范围。 一些用例和工作负载。

  • 流式传输可实现更实时,更快速的摄取和分析。 仍处于数据动画行动的早期阶段。

  • 如何连接实时数据以充分利用大数据。 连接数据和点以探索和预测关系。

工具

  • 对各种数据的认识。 合理化所有不同类型的数据。 变量汇总 - 信用局,核心银行系统,Hadoop数据。 您可以将大量工具放在数据分析师或业务用户手中,而不是依靠数据治理或DBA。 让人们可以访问数据和操作工具。 

  • 更具成熟度和更多具有解释能力的工具。 1)更多数据,更多类型,更快地流式传输。 2)用于处理数据的分析方法。 3)洞察力的自动化。 

  • 通过API使跨系统的共同点更加以SQL为中心的趋势。 SQL是开发人员如何跨不同系统与数据交互。 作为可视化步骤,转向更开源和更低成本的工具。 Power BI和Tableau之间的差异正在缩小。 数据即服务使可视化工具不那么重要。 增加数据管理员在分析师和数据消费者之间的桥梁作用,使其更加自给自足。 

  • 数据摄取标准化的持续动力,许多公司希望Kafka用于本地或私有云或Kinesis用于AWS云。 然后,数据管理和分析工具成为这些数据移动框架的数据汇和源,为这些公司创建了一种数据公用网,有点像家中的电气系统。 如果您需要电力,您只需要一个带有标准插头的设备并插上电源。如果您需要使用数据或向其他人提供数据,那么数据访问也是如此 - 并且已经在某些公司使用过。 ,您只需使用标准的“插件”(或接口)将应用程序插入数据网格。 这也将允许使用更多“最佳”组件, 就像最好的BI或分析工具或特定工作负载的最佳数据库,而不是必须在劣质的一体化产品上妥协,因为数据集成将比定制更加标准。 数据的本地化也是一个很好的机会。 也就是说,让数据位于需要它的世界中,而不是需要遍历长网络以便检索,处理,更改或分析它。 这意味着更多的主 - 主,主动 - 主动架构可以为任何企业创建应用程序挑战,因此正确选择组件将非常重要。 使数据位于需要它的世界中,而不是需要遍历长网络以便检索,处理,更改或分析它。 这意味着更多的主 - 主,主动 - 主动架构可以为任何企业创建应用程序挑战,因此正确选择组件将非常重要。 使数据位于需要它的世界中,而不是需要遍历长网络以便检索,处理,更改或分析它。 这意味着更多的主 - 主,主动 - 主动架构可以为任何企业创建应用程序挑战,因此正确选择组件将非常重要。  

  • 领先的公司正在越来越多地使用Apache Kafka,Apache Ignite和Apache Spark等成熟的开源技术进行标准化,以便对其大数据进行摄取,管理和分析。 所有这些项目在过去几年中都经历了主要的采用增长,并且在可预见的未来似乎可能会持续增长。 随着这些技术的成熟和安装和使用越来越容易,它们将为那些知道如何在日益实时的世界中使用和实现分布式计算技术的人创造机会。

其他

  • 查看标记,获取正确的元数据模型,确保信息的上下文。 标签和元数据绘制上下文。 确保包含适当的元数据。 具有可靠性的可追溯性。

  • 专注于流媒体永远在线技术的推动所带来的运营化。 完全了解正在发生的事情。 云驱动这个家庭,基于云的应用程序架构始终在不断更新。 使用自动化的数据架构也需要这样做。 客户看到自己走下了数据运营的道路。

  • 大数据的所有三个部分都可以在ROI和数据治理方面带来相当成功的项目。 我会按层次排序。 首先,我们需要能够从许多不同的来源收集大量数据。 一旦数据可用,正确的管理(如正确创建信息性KPI)可能已经导致一些意外的发现。 最后,在数据转变之后,他们的分析产生了对公司业务至关重要的进一步见解。 因此,如您所见,您已经从第1步获得了信息。但是您可以在未完成第1步的情况下获得第2步。

  • 这一切都会变得更容易。 今天具有挑战性的事情将成为第二天性,并在未来实现自动化。 轻松访问大数据就像我们在计算机上执行的任何操作一样简单。 搬运,移动,连接的摩擦力要小得多。 使用识别数据中的价值主张的大数据是每个企业中的机会所在。

  • 增强分析将自然语言,数据和分析结合在一起,以推动答案。 我们如何根据识别您不知道要查询的内容进行分析?

  • 数据分析师和科学家并不关心数据的位置,他们只是想要分析数据所需的数据和工具。 目录并知道数据的位置。 下一步只是想要我想要的数据。 构建虚拟目录以访问交付。 我们正在做的事情是合乎逻辑的进展。

  • 无论是本地还是云需要公司确保引擎继续工作以便您获得价值。 作为服务模型不会自动解决问题。 需要了解和管理性能问题。 提高绩效透明度。 从端到端考虑安全性。

  • 未来是大数据分析平台,以速度和规模提供经过验证的摄取,管理和分析功能,使企业能够竞争并获胜。 最大的机会是让企业不再受到企业想象力的限制,以获得准确的洞察力,以便他们能够抓住所有机会 - 准确了解哪些客户可能会流失并发展业务,建立全新的业务模式数据的创收能力(例如,以驾照付费保险为例)。 每个行业都可以根据数据的宝贵见解来区分自己。 对经过验证的数据分析平台进行投资,该平台不会妥协,并为部署模型(云,内部部署,未来)所做的任何事情做好准备

  • 最大的机会在于提供真正的敏捷数据工程流程,使公司能够快速创建数据流水线来回答新的业务问题,而无需业务人员依赖IT。 这需要以集成的方式实现端到端开发,操作和大数据环境持续治理的自动化。 成功的关键是自动化复杂性,以便组织可以使用具有基本SQL和数据管理技能的人员充分利用大数据以获得竞争优势。

  • 所有这些都有一个非常光明的未来。 物联网领域的一个巨大机会领域。 随着设备成本的降低和设备的复杂性的增加,部署的设备数量超过90亿,部署速度也在加快。 该设备数据需要非常高速的摄取和强大的管理。 它也适用于高级分析,例如用于异常值检测的机器学习。

  • 我们在未来的数据驱动营销和销售中看到了三个关键任务机会。 1)   线切割机 -   我们客户的客户比以往更具移动性和数字化。 传统的数据元素和ID(如家庭电话,家庭住址,业务扩展等)必须辅以数字身份证,如手机号码,GPS坐标,cookie ID,设备ID,MAID等.2)   预测世界  - 人工智能贯穿于我们的日常生活和经历中。 我们的手机会预测我们正在发短信的句子中的下几个字。 我们的恒温器可以预测哪种温度最适合个人保暖和节省成本。 在事故发生之前,我们的汽车为我们刹车。 消费者现在预计营销和销售体验也将是预测性的,使用数据和智能实时改善他们的品牌体验。 3)   B2B2C生活  - 我们的业务和消费者自我融为一体。 研究表明,在过去10年中,大约43%的消费者远程工作,并且花费大约50%的时间在家工作的人数增长了115%。 因此,营销人员必须能够连接个人的数据ID,属性和行为,而不是孤立的B2B或B2C定位。 


来自 “ ITPUB博客 ” ,链接:http://blog.itpub.net/31557424/viewspace-2222164/,如需转载,请注明出处,否则将追究法律责任。

请登录后发表评论 登录
全部评论

注册时间:2018-10-31

  • 博文量
    173
  • 访问量
    60513