• 博客访问: 1034276
  • 博文数量: 442
  • 用 户 组: 普通用户
  • 注册时间: 2007-12-30 18:35
个人简介

暂无介绍

ITPUB论坛APP

ITPUB论坛APP



APP发帖 享双倍积分

文章分类

全部博文(442)

文章存档

2011年(22)

2010年(13)

2008年(22)

2007年(229)

2006年(106)

2005年(50)

我的朋友
微信关注

IT168企业级官微



微信号:IT168qiye



系统架构师大会



微信号:SACC2013

发布时间:2010-10-26 11:17:33

cluster可以把一个或者多个表的数据按照键值聚合在一起,在很多应用场景能提高查询性能。cluster可以为B*Tree cluster也可以是hash cluster,这篇文章主要讨论hash cluster。(延伸阅读《用hash cluster表提高查询性能 (一)》[@more@]二、hash cluster实际应用场景下面通过一个实例来说明hash cluster的应用场景。这个例子是从一个推荐系统中拿到的一个SQL,该SQL目的是从用户看过的视频中找出与之相关的、推荐度最高的相关视频。这个应用有如下特点:1) 表数据隔一段时间才统一刷新一次,平时基本不变2) 视频ID是这个表的KEY,一个KEY大概......【阅读全文】

阅读(2452) | 评论(0) | 转发(0)

发布时间:2010-10-26 11:15:59

cluster可以把一个或者多个表的数据按照键值聚合在一起,在很多应用场景能提高查询性能。cluster可以为B*Tree cluster也可以是hash cluster,这篇文章主要讨论hash cluster。[@more@]一、hash cluster重要参数与传统的表不同,cluster在创建的时候就要定好大小,预先分配空间,这个步骤至关重要。如果空间分配过大,则会导致空间浪费,如果过小,会导致块溢出(同一个hash key分布在不同的block中),从而导致IO增大。那么,如何合理设定空间呢?这就需要合理设定hashkeys和size两个参数了。hashkeys: cluster预期的唯一键值的数量(count(......【阅读全文】

阅读(2184) | 评论(0) | 转发(0)

发布时间:2010-10-20 23:54:51

一个SQL会包含很多个子句,在写SQL时,理解SQL个部分子句执行的优先级非常重要,否则可能会导致简单的SQL变成多个嵌套的SQL,更可能导致错误的返回结果。下面通过一个例子说明各子句的优先级:[@more@]select a,b,count(sum(c)) over ()from twhere t.d=1start with e is not null connect by prior f=ggroup by a,bhaving sum(c)>100order by 3;这个SQL包含:1. SELECT 子句2. group by子句3. 分析函数4. from子句5. where子句6. start with...connect by子句7. having子句8. order by子句对于FROM子句,可以简单理解为表或者扫描扫描......【阅读全文】

阅读(3773) | 评论(0) | 转发(0)
给主人留下些什么吧!~~
留言热议
请登录后留言。

登录 注册