ITPub博客

首页 > Linux操作系统 > Linux操作系统 > 网络时代的大数据

网络时代的大数据

原创 Linux操作系统 作者:zhgazn 时间:2013-06-29 21:54:28 0 删除 编辑
        最近两年,计算机界最热的词之一就是大数据(big data),而且会越来越热。那什么是大数据呢,它在网络时代主要可以应用在那些方面;本文尝试做一番探讨。
        首先,我们要对大数据进行定义,Gartner公司的merv Adrian说:“大数据超出了常用硬件环境和软件工具在可接受时间内为其用户收集、管理和处理数据的能力”;而麦肯锡全球数据分析研究所定义大数据是:“大数据是指大小超出了典型数据库软件工具收集、存储、管理和分析能力的数据集”;从以上两个定义可以看出来,大数据有几个特征:一是,数据涵盖的范围广,数据量很大;二是,随着技术的进步而变化,今天的大数据,明天就不是大数据了。三是,由于大数据是复杂的格式(非结构化和半结构化),因此处理大数据的方法和技术非常复杂。
        在网络时代,如果能够理解顾客意图而不仅仅理解顾客行为,这成为网络卖家追求的目标。因此,对网络数据有可能在那些方面可以继续挖掘,挖掘的数据可以主要应用在那些方向,我们一一来探讨。
       探索顾客的网络行为细节,从中获悉顾客购买商品以外的更多信息,了解他们如何做出决策。需要了解顾客购买的整个过程,而不仅仅是结果;因此挖掘网络数据中的大数据,结合传统交易,成为网络数据的全新信息来源,这样可以针对收集的信息对顾客的360度视野分析,可以产生意想不到的效果。
        根据分析网络数据,我们可以从中找到一些应用方向:       
        首先,购物行为:购物行为就是弄清楚顾客如何进入一个网站并开始购物的;他们使用什么搜索引擎?输入什么关键字搜索?使用了以前的收藏的书签吗?然后从获取的信息中找出一些模式;例如,那些搜索关键字、搜索引擎以及推荐网站与更高的销售率相关联。不仅可以查看给定网页中那些产品的销售率高,可以查看同意顾客在那段时期的购买率更高;将网站的销售和顾客的购买行为跨渠道地结合起来。
        通过分析购物行为,可以在顾客购买前弄明白他们所感兴趣的商品捆绑;在顾客购买后,紧跟着推销其他产品的做法已经落伍了。相反地,在第一时间,应该查看他们所浏览的东西,并向他们提供完整的商品捆绑。
        其次,顾客购买路径和偏好:利用网络数据,并通过查看顾客在网站中的浏览历史,可以弄清楚他们做出最后购买决定的过程,同样也可以洞察他们的偏好。比如,航空公司可以通过预订的机票来了解顾客偏好,顾客喜欢提前多久预订机票,那些价格的舱位被预订?航班是否跨过周末?但是这些是远远不够的,航空公司还可以通过收集网络数据的其他更多信息:通过收集顾客搜索记录(只搜寻特定时间的直飞航班--》看重时间的顾客)(价格相差较大,时间上不便利情况下,选择便宜的航班--》价格的选择更重要...);通过这些研究,航空公司可以制定出针对不同顾客个体的航班位置,从而满足顾客需求。
        接着,可以研究反馈行为:顾客能够提供的最有价值的信息是关于商品和服务的详细反馈信息。事实上顾客愿意花时间最一件事意味着他们钟情于某一个品牌。通过文本挖掘理解顾客反馈的语气、意图和主题,可以更好了解这个顾客所看重的因素。
        某些顾客是否会按照管理在购买商品后发表评论?如果这些评论通常是积极的,而且会继续被其他顾客阅读到,那么给予这些顾客特殊的激励以获得他们持续的积极评价将是明智的。
        下一个是最优的推荐商品:一个很常见的市场分析是针对每个顾客做商品推荐。在所有可用的选项里,接下来应该向顾客推荐那件商品,从而使成功的几率最大?拥有网络行为数据可以完全改变推荐商品的决策,并且使这些决策更加稳健。
        比如一个银行的顾客的信息如下:
        - 他有4个账户:支票,储蓄,信用卡和汽车贷款
        - 每个月完成5次存款和15词提款。
        - 没有亲自去一个支行
        - 存款50W RMB
        - 信用卡和汽车贷款总额20w RMB
如果你需要向这个客户推荐理财产品,这时候基于这些信息,你可能会推荐更低的信用卡利率,而不会推荐抵押贷款。但是如果你从其他渠道收集到一下信息,你肯定会改变想法:
         - 过去一个月,搜索抵押贷款利率5次
         - 查看了房屋保险信息
         - 查看了洪水保险信息
         - 上个月调研了房屋贷款方案。
         最后,讨论流失模型:在电信行业,企业付出很多时间和精力来创建、增强和完善“流失”模型。流失模型指出了那些最有可能注销账户的顾客,从而可以及早采取措施以防这些客户流失。
         Smith是1001电信运营商的顾客,他在google输入“如何取消与1001电信运营商的合约?”。然后从一个链接进入1001网站合约取消政策网页。因此如果电信运营商能收集这方面的信息,然后做出最早的分析和报警,完全可以在smith有取消的意愿时挽留,而不是等到smith来办理这个取消业务时再询问原因。
         以上只是对一些网络数据应用方向的一些探讨,当然还有很多方面可以,比方响应模型、顾客分类等,这些都需要我们一一去挖掘和应用到实际系统中,才能不断对企业产生更好的效益.
 
        

来自 “ ITPUB博客 ” ,链接:http://blog.itpub.net/647161/viewspace-765140/,如需转载,请注明出处,否则将追究法律责任。

上一篇: DW事实表快照
请登录后发表评论 登录
全部评论

注册时间:2013-06-05

  • 博文量
    16
  • 访问量
    56579