ITPub博客

首页 > 大数据 > 数据挖掘 > NoSQL数据模型的基本原则

NoSQL数据模型的基本原则

数据挖掘 作者:whxq52056 时间:2013-11-16 15:35:00 0 删除 编辑

(1) 反规格化 Denormalization反规格化 Denormalization 可以被认为是把相同的数据拷贝到不同的文档或是表中,这样就可以简化和优化查询,或是正好适合用户的某中特别的数据模型。这篇文章中所说的绝大多数技术都或多或少地导向了这一技术。总体来说,反规格化需要权衡下面这些东西: "查询数据量 /查询IO  VS  总数据量。使用反规格化,一方面可以把一条查询语句所需要的所有数据组合起来放到一个地方存储。这意味着,其它不同不同查询所需要的相同的数据,需要放在别不同的地方。因此,这产生了很多冗余的数据,从而导致了数据量的增大。 "处理复杂度  VS 总数据量. 在符合范式的数据模式上进行表连接的查询,很显然会增加了查询处理的复杂度,尤其对于分布式系统来说更是。反规格化的数据模型允许我们以方便查询的方式来存构造数据结构以简化查询复杂度。适用性: Key-Value Store 键值对数据库, Document Databases文档数据库, BigTable风格的数据库。(2) 聚合 Aggregates所有类型的NoSQL数据库都会提供灵活的Schema(数据结构,对数据格式的限制): "Key-Value Stores 和 Graph Databases 基本上来说不会Value的形式,所以Value可以是任意格式。这样一来,这使得我们可以任意组合一个业务实体的keys。比如,我们有一个用户帐号的 业务实体,其可以被如下这些key组合起来: UserID_name, UserID_email, UserID_messages 等等。如果一个用户没有email或message,那么相应也不会有这样的记录。 "BigTable 模型通过列集合来支持灵活的Schema,我们称之为列族(column family)。BigTable还可以在同一记录上出现不同的版本(通过时间截)。 "Document databases 文档数据库是一种层级式的“去Schema”的存储,虽然有些这样的数据库允许检验需要保存的数据是否满足某种Schema。灵活的Schema允许你可以用一种嵌套式的内部数据方式来存储一组有关联的业务实体(陈皓注:类似于JSON这样的数据封装格式)。这样可以为我们带来两个好处。 "最小化“一对多”关系——可以通过嵌套式的方式来存储实体,这样可以少一些表联结。 "可以让内部技术上的数据存储更接近于业务实体,特别是那种混合式的业务实体。可能存于一个文档集或是一张表中。

来自 “ ITPUB博客 ” ,链接:http://blog.itpub.net/1695442/viewspace-1110724/,如需转载,请注明出处,否则将追究法律责任。

上一篇: 没有了~
下一篇: 没有了~
请登录后发表评论 登录
全部评论