首页 > 大数据 > 数据分析 > Greenplum索引设计的规范
1. 原则上,数据仓库中的数据表不建立索引。只有提供给外部用户访问的表,才考虑按用户访问特性,针对常用查询字段建立索引;
2. 对于跑批的中间表和临时表,不允许创建索引;
3. 对于记录数在百万级别以下的小表,建议不使用索引;
4. 创建组合索引时,必须将经常作为查询条件且可选择性最大的列设置为索引的首列;
5. 不允许创建冗余索引和重复索引;
6. 对于区别度高的索引,应使用B-tree索引,例如账号、合同号等等;对于区别度低的索引,应使用Bitmap索引,
例如机构、产品类型等等;
7. 创建组合索引时,建议列数不要超过5列;
8. 每张数据表的索引数,建议不超过5个;
9. 在创建和更新索引后,必须执行Analyze操作,更新索引的统计信息;
10. 在对大表进行数据加载的时候,如果存在索引,建议先删除索引,待数据加载完成,再重新创建索引;
11. 对频繁更新的数据表,应定期对其执行reindex 操作,以重建索引;
12. 如果在分区表中使用了索引,不允许在子表上单独创建和修改索引;通常,删除顶级分区的索引,系统会自动删除相关
子表的索引,但如果子表的索引有缺失,将不能自动删除子表的索引,需要挨个手动删除。
13. 确认不再使用的索引必须删除.
来自 “ ITPUB博客 ” ,链接:http://blog.itpub.net/15498/viewspace-2732341/,如需转载,请注明出处,否则将追究法律责任。