ITPub博客

首页 > 大数据 > 数据挖掘 > 什么是数据压缩

什么是数据压缩

数据挖掘 作者:ITPUB总片反主 时间:2013-01-24 14:52:54 0 删除 编辑
火星高科www.marstor.com是国内最早从事专业存储技术的研发团队之一,是集生产、研发、设计和制造为一体的高科技IT企业,是数据存储、备份和容灾等领域国内最知名的软件开发商和设备制造商,也是数据安全领域重要的国产解决方案提供商。相继打造了以"火星Mars"为品牌的系列软件及"火星舱"硬件产品。全国免费咨询电话:400-610-9901
    火星舱备份一体机作为一款国内领先的数据备份设备,集备份服务器、磁盘备份空间和备份软件于一体,突破了传统备份系统分离式部署的格局,大大减低了备份系统的部署难度和操作难度,使用户真正达到了"数据安全、简单易备"的真实效果。火星舱备份一体机采用高性能的硬件配置,与存储备份管理软件火星企业级跨平台数据备份软件(Mars Backup advanced 简称:MBA)无缝结合,经过反复测试及优化,将两者有机的结合在一起。火星舱备份一体机具有最广泛的备份功能,可满足大中型企业组织机构异构环境的复杂需求,包括从 Windows 、 Linux 到Unix操作系统平台,Oracle、Sybase、SQL Server、MySQL、ExchangServer、Domino等各种主流数据库和应用软件,支持各种物理环境和虚拟环境备份,简化虚拟服务器的数据保护过程。

本文将为大家简单介绍什么是数据压缩以及数据为何能被压缩的相关内容,下面是文章的正文部分,有兴趣的读者不妨看看此篇文章,希望能为各位读者带来些许的帮助。

1.什么是数据压缩

数据压缩,通俗地说,就是用最少的数码来表示信号。其作用是:能较快地传输各种信号,如传真、Modem通信等;在现有的通信干线并行开通更多的多媒体业务,如各种增值业务;紧缩数据存储容量,如CD-ROM、VCD和DVD等;降低发信机功率,这对于多媒体移动通信系统尤为重要。由此看来,通信时间、传输带宽、存储空间甚至发射能量,都可能成为数据压缩的对象。

2.数据为何能被压缩

首先,数据中间常存在一些多余成分,既冗余度。如在一份计算机文件中,某些符号会重复出现、某些符号比其他符号出现得更频繁、某些字符总是在各数据块中可预见的位置上出现等,这些冗余部分便可在数据编码中除去或减少。冗余度压缩是一个可逆过程,因此叫做无失真压缩,或称保持型编码。

其次,数据中间尤其是相邻的数据之间,常存在着相关性。如图片中常常有色彩均匀的背影,电视信号的相邻两帧之间可能只有少量的变化影物是不同的,声音信号有时具有一定的规律性和周期性等等。

因此,有可能利用某些变换来尽可能地去掉这些相关性。但这种变换有时会带来不可恢复的损失和误差,因此叫做不可逆压缩,或称有失真编码、摘压缩等。

此外,人们在欣赏音像节目时,由于耳、目对信号的时间变化和幅度变化的感受能力都有一定的极限,如人眼对影视节目有视觉暂留效应,人眼或人耳对低于某一极限的幅度变化已无法感知等,故可将信号中这部分感觉不出的分量压缩掉或“掩蔽掉”。这种压缩方法同样是一种不可逆压缩。

对于数据压缩技术而言,最基本的要求就是要尽量降低数字化的在码事,同时仍保持一定的信号质量。不难想象,数据压缩的方法应该是很多的,但本质上不外乎上述完全可逆的冗余度压缩和实际上不可逆的嫡压缩两类。

冗余度压缩常用于磁盘文件、数据通信和气象卫星云图等不允许在压缩过程中有丝毫损失的场合中,但它的压缩比通常只有几倍,远远不能满足数字视听应用的要求。

在实际的数字视听设备中,差不多都采用压缩比更高但实际有损的媳压缩技术。只要作为最终用户的人觉察不出或能够容忍这些失真,就允许对数字音像信号进一步压缩以换取更高的编码效率。

摘压缩主要有特征抽取和量化两种方法,指纹的模式识别是前者的典型例子,后者则是一种更通用的摘压缩技术。
<!-- 正文结束 -->

来自 “ ITPUB博客 ” ,链接:http://blog.itpub.net/24117175/viewspace-1121518/,如需转载,请注明出处,否则将追究法律责任。

上一篇: 没有了~
下一篇: 没有了~
请登录后发表评论 登录
全部评论

注册时间:2010-06-19