位置:首页生活家居>为什么数字图像可以被压缩? 为什么数字图像数据可以用矩阵来表示

为什么数字图像可以被压缩? 为什么数字图像数据可以用矩阵来表示

所属分类:生活家居 发布时间:2025/8/21 14:43:08

01

图片是由像素块组成的,像素经实际测量后,把真实值与预测值的差值求出来,并利用这个差值来表示第二个格子的色彩,后面的色彩值就可以滚雪球似的一个个求出来,被称为无损压缩。如果把很少的差值彻底丢弃,这种方法属于有损压缩。

如果想要搞清楚这个问题,就要从图像是如何被数字化的谈起。先来看一张玩具鸭子的图片是怎么被数字化的。

首先,要把这张图片分成若干小块,每个小块中的颜色用一个数字来表示。如果图像是纯黑纯白两色的,那每块只用1 或0 表示即可。如果图像是16 色的,那每块就要用4 位二进制数来表示,因为4 位二进制数有16 种组合,每种组合表示一种颜色,正好可以表示16 种颜色。而真彩色位图的每个小块,都是由不同等级的红、绿、蓝三种色彩组合的,表达起来就更复杂一些。如果每种颜色有28 个等级,那就可以有224 种颜色,这样一来,每小块就需要24 位二进制数来表示,才能囊括所有色彩。

由此可见,数字图像色彩越绚丽,需要记录的二进制数就越多。小色块越多,分布得越密,则一幅图的总数据量就越大。

回头来看这个玩具鸭子图片,如果像图中所示被分成了154 个色块(11×14)(11×14),并按真彩色位图来计算,则总数据量就是154×24=3696154×24=3696比特。这些小格子显然是太大了,如果这样来切分图片,还原后的图片就不能表现图片的细节。在实际应用中切分的格子要密得多。这些格子其实就是我们常说的像素。格子分得越多表示像素越高,也就是分辨率越高,大家都熟悉的显示器分辨率就是1024×7681024×768。所谓数字化图片,就是将图片的画面信息用二进制数字来表示。

知道了图像数字化的道理,再来看图像为什么可以被压缩和还原。先看一张滑雪图,由于人体的色彩变化比较多,而天空和雪的色彩却非常单调,可以想象,天空与雪所代表的每个小格颜色的数值应该非常接近,图右下的原始数据是8个相邻格子的色彩数据,由于两个相邻格子的数据差异很小,所以可以用第一个格子的数据来表达第二个格子数据的预测值,经实际测量后,把真实值与预测值的差值求出来,并利用这个差值来表示第二个格子的色彩,那么,实际记录下的就是第三行差值。恢复数据时,用前面一个值加上差值,就是当前的色彩值,只要有第一位的基础值,后面的色彩值就可以滚雪球似的一个个求出来。用差值来记录色彩,只是简单地进行了很多个减法运算,在还原时再加回来,数据并没有一丁点的损失,因此被称为无损压缩。如果把很少的差值彻底丢弃,在还原时让一个格子的色彩信息代表了周围很多格子的色彩,则压缩率更高,但这样一来格子之间的微小差别就丢失了,这种方法属于有损压缩。

压缩文件有很多种格式,你在自己的图片文件后看到的“.bmp”或“.jpg”就是文件格式的名称。bmp 格式是将图像的每个格子都独立记录的,因此数据量很大。如果按照前述的预测差值运算后,就变成了有损压缩式,jpg 格式就是其中之一。对于画质基本相同的两幅图像,jpg 格式的数据量要比bmp 小得多。不过,虽然jpg 是有损压缩的,但画质的损失非常小。因为它是很智能的,比如它可以自动对有大面积相似色彩的飞机图片给予较大的压缩率,而对人群图片给予较小的压缩率。

相对于上述的静态的图像压缩,视频图像的压缩率就更大了。视频图像文件也有很多文件格式。一般情况下,一秒钟视频会切换成几十张画面,而这些画面的绝大部分都是相同的,可是采集是每幅独立采的,因此生成的avi格式的数据量是很大的。不仅每幅画面本身可以压缩,更重要的是幅与幅之间也可以压缩,这就形成了数据量小得多的mpeg 格式。当然,也可以采用压缩率更高的rm 格式。rm 格式的画质比mpeg 差得不多,但数据量却小了很多倍,更方便在网上传输。

不同的视频,幅与幅之间的相似度是不同的,有些相似度很大的电视剧,也许在几分钟内,演员都坐在沙发上聊天,除了嘴巴动作外每幅画面都基本一样,对这种视频可以采用较大的压缩率,而对动感性很强的武打片,则需要采用较小的压缩率,这种格式就是rmvb。跟rm 格式不同的是,它的压缩率是可变的,vb 就是可变比特率的意思。rmvb 则比rm 更先进,相同数据量的rmvb 视频会比rm 视频清晰,而相同清晰度的视频,rmvb 格式的数据量会更小。

是不是一旦进行了有损压缩,数据缺失了,画质就很难复原了?是很难复原,但这也并不是完全不可能,这里面有个关键的概念是“先验信息”(先验信息也就是我们以前已经知道了的知识)。例如下图左边这张民国女性黑白照片的嘴唇,要压缩成这个灰度,右边的彩色图例中有五种可能,但通过先验信息知道,美女的嘴唇不可能是绿的、蓝的和紫的,只能是右下的红色,把它还原成红色就对了。

根据先验信息我们知道,只有极少数的组合是经常出现的,绝大多数的组合是基本不会出现的,如果我们得到了一组模糊不清的组合,它跟经常出现的某个组合与基本不会出现的某个组合的相似度一样,那我们就毫不犹豫地认定它就是那个经常出现的组合。当然,它是那个基本不会出现的组合的可能性也是不能排除的。就好比那个民国美女如果真的涂了蓝嘴唇,那我们依靠先验信息做的判断就可能出错了。

推荐信息

  • 夏天真的穿得越少越凉快吗? 夏天真的穿得越少越凉嘛

    生活家居时间:2025/8/22 13:07:02

    01正常情况下,人体温度接近37摄氏度。在气温接近或超过37℃时,人体热量的散发几乎全靠出汗来完成。皮肤不但不能散热,反而会从外界环境中吸收热量。此时人们穿得越少,从外界吸收热量的面积也就越大,反而越热。从科学的角度来看,穿的少了并不见得真的凉快,当气温高于33度时,穿衣服少反而热!正常情况下,人体

  • 世界上最深的海是什么海? 世界上最深的海是什么英语

    生活家居时间:2025/8/23 20:16:27

    01珊瑚海在全球的大海中,面积大小、水体深度等都各不相同,其中面积最大、水体最深的海是位于南太平洋的珊瑚海。珊瑚海的海底地形大致由西向东倾斜,大部分地方水深3000-4000米,最深处则达9174米。在广阔无垠的地球表面有70%的地表为水所覆盖,因此地球又被称之为“水星球”而

  • 二月初二龙抬头为什么要理发? 二月初二龙抬头的由来

    生活家居时间:2025/8/24 1:47:47

    01农历二月二是蛰龙升天的日子,民间认为在这一天理发,会使人红运当头、福星高照。儿童理发,叫剃“喜头”,借龙抬头之吉时,保佑孩童健康成长,长大后出人头地;大人理发,则寓意辞旧迎新,希望带来好兆头、好运气。故民谚说“二月二剃龙头,一年都有精神头”。俗话说

  • 为什么经常把计算机中存在的问题叫bug? 计算机为什么要存在rom

    生活家居时间:2025/8/24 16:57:47

    01是因为在计算机出现之前,人们就已经开始用臭虫“Bug”这个词来称呼难以捉摸的电路或者机械故障了。随着计算机从业者的增多和计算机应用的推广,越来越多的人开始使用这个词来称呼计算机中存在的设计缺陷和不足。位于美国首都华盛顿的美国历史博物馆中,保存着三百多万件珍贵的历史资料,涵

  • 飞机是不是越大越安全? 飞机大了安全还是小了安全

    生活家居时间:2025/8/21 19:43:37

    01不是小型机的巡航是在对流层中,而大型机的巡航则在平流层之中,平流层中的大气相对于对流层稳定得多,颠簸会比较少,但都是在安全范围之内的。因此飞机大小所影响的主要是舒适性,而非安全性。通常情况下,飞行大体可以分为:起飞、初始爬升(离场程序)、爬升、巡航、下降、进近(进场程序)、最终进近、着陆这八个阶

  • 鸡会游泳吗? 兔子会游泳吗

    生活家居时间:2025/8/11 16:46:44

    01不会鸟类骨头中空还有气囊,在水上浮起来问题不大,但是和“会游泳”还是有很大差距的。鸡形目的羽毛虽然也有防水能力,但不像水鸟会分泌大量油脂,在水里泡久了会湿从而降低行动能力。大部分动物的密度,其实都和水差不多或比水要小。这一点在鸟身上会更为明显,因为它们骨头中空,还有气囊。

  • 蜡梅是不是梅花? 蜡梅是不是梅花的别称

    生活家居时间:2025/8/22 14:51:16

    01不是蜡梅与梅花几乎没有亲缘关系。蜡梅是蜡梅科蜡梅属植物,梅花是蔷薇科杏属植物。蜡梅是落叶灌木,枝条略显杂乱,梅花为落叶乔木,树枝齐整,多为直枝,常给人疏影横斜的美感。两者花色也完全不同,蜡梅的花朵宛如黄蜡制成,多为黄色,梅花则以粉红、紫红和白色为主。“蜡梅因与梅花一样在冬春时节盛放,

  • 龙抬头剪头发上午还是下午好? 龙抬头剪头发上午还是下午好

    生活家居时间:2025/8/21 2:10:30

    01龙抬头剪头发的时间没有固定的说法,只需要在这一天完成就好。一般中国人的习惯都是宜早不宜晚,所以选择上午剪头发的占多数。俗话说“龙不抬头,天不下雨”,龙是祥瑞之物,又是和风化雨的主宰,农历二月二人们祈望龙抬头兴云作雨、滋润万物,素有“二月二剃龙头”的

  • 世界上最深的湖是什么湖? 世界上最深的湖是什么英语

    生活家居时间:2025/8/18 23:44:21

    01贝加尔湖贝加尔湖位于俄罗斯东西伯利亚南部,在布里亚特共和国和伊尔库茨克州境内,介于北纬51°29′一55°46′,东经103°41′-109°57′之间,湖总容积23.6万亿立方米(2015年),最深处达1637米(

  • RNA是什么? rna是什么检查

    生活家居时间:2025/8/21 17:34:32

    01核糖核酸(缩写为RNA,即Ribonucleic Acid),存在于生物细胞以及部分病毒、类病毒中的遗传信息载体。RNA由核糖核苷酸经磷酸二酯键缩合而成长链状分子。核糖核酸由至少几十个核糖核苷酸通过磷酸二酯键连接而成的一类核酸,因含核糖而得名,简称RNA。RNA普遍存在于动物、植物、微生物及某些