ITPub博客

首页 > 大数据 > 数据分析 > Greenplum索引设计的规范

Greenplum索引设计的规范

原创 数据分析 作者:chenfeng 时间:2020-11-05 13:50:09 0 删除 编辑

1.   原则上,数据仓库中的数据表不建立索引。只有提供给外部用户访问的表,才考虑按用户访问特性,针对常用查询字段建立索引;

2.   对于跑批的中间表和临时表,不允许创建索引;

3.   对于记录数在百万级别以下的小表,建议不使用索引;

4.   创建组合索引时,必须将经常作为查询条件且可选择性最大的列设置为索引的首列;

5.   不允许创建冗余索引和重复索引;

6.   对于区别度高的索引,应使用B-tree索引,例如账号、合同号等等;对于区别度低的索引,应使用Bitmap索引,

例如机构、产品类型等等;

7.   创建组合索引时,建议列数不要超过5列;

8.   每张数据表的索引数,建议不超过5个;

9.   在创建和更新索引后,必须执行Analyze操作,更新索引的统计信息;

10.  在对大表进行数据加载的时候,如果存在索引,建议先删除索引,待数据加载完成,再重新创建索引;

11.  对频繁更新的数据表,应定期对其执行reindex 操作,以重建索引;

12.  如果在分区表中使用了索引,不允许在子表上单独创建和修改索引;通常,删除顶级分区的索引,系统会自动删除相关

子表的索引,但如果子表的索引有缺失,将不能自动删除子表的索引,需要挨个手动删除。

13.  确认不再使用的索引必须删除.

来自 “ ITPUB博客 ” ,链接:http://blog.itpub.net/15498/viewspace-2732341/,如需转载,请注明出处,否则将追究法律责任。

请登录后发表评论 登录
全部评论
交流MySQL,MongoDB和Redis技术。 微信或QQ:410294

注册时间:2015-12-07

  • 博文量
    754
  • 访问量
    2164028