数字图像基础
计算机视觉是人工智能的大门
图像的离散化
连续图像
- 人眼直接感受到的图像。
数字图像
- 把连续的图像数字化、离散化之后的图像,它是对连续图像的一种近似。
- 像素(Pixel):是图像中的一个最小单位。
- 位图(bitmap):通过记录每一个像素值来存储和表达的图像。
- 色彩深度/位深度:位图中每个像素点要用多少个二进制来表示。
- BMP格式:Windows系统的标准位图格式。
二值图像(Binary Image)
- 每个像素只有2种可能的取值,使用1位二进制来表示,位深度为1。
- 在图像处理和分析时,常常首先对图像进行二值化处理。
- 凸显出感兴趣的目标,有效的减小数据量。
- 只要是仅有两种颜色的图像,都可以被称为二值图像。
灰度图像(Gray Image)
- 每个像素使用1个字节来表示,为深度为8,可以表示256种级别的灰度0表示黑色;255表示白色。
彩色图像(RGB)
- 每个像素都有红(R)、绿(G)、蓝(B)三个分量。
- 1个像素使用3个字节,位深度为24位。
- 可以表示256✖️256✖️256=16777216种颜色。
- 24位真彩色
RGBA图像
- RGB图像+8位透明度信息Alpha。
- 32位真彩色:1个像素点使用4个字节,位深度为32位
256色彩色图像
- 每个像素用8位二进制表示,是调色板中的索引值。
- 对于不同的图像,所对应的这256种颜色的合集是不一样的
- 在保存和加载这种类型的位图时,需要将调色板和图像一同保存和加载
图像格式
- BMP格式
- 占用存储空间大,不支持文件压缩,不适用于网页。
- JPEG格式
- 有损压缩。
- 压缩率很高,所占空间小。可以压缩到原图的20/1大小,而图片的质量不会有明显的下降。
- 适合于色彩丰富、细节清晰细腻的大图像。
- 不适合所含颜色较少,具有大块颜色相近的区域,或亮度差异十分明显的简单图片。
- 每次编辑都会降低图像质量,不适合需要进行多次编辑的情况。
- PNG格式(Portable Network Graphics, PNG)
- 无损压缩。
- 适合于有规律渐变色彩的图像。
- GIF格式(Graphics Interchange Format)
- 支持静态格式和动态格式。
- 动态图片由多幅图片保存为一个图片,循环显示,形成动画效果。
- 只支持256色,适用于色彩简单、颜色较少的小图像。
- TIFF格式(Tag Image File Format)
- 定义了4类不同类型的格式:二值图像(TiFF-B)、黑白灰度图像(TIFF-G)、带调色板的彩色图像(TIFF-P)、RGB真彩图像(TIFF-R)。
- 支持RGB、JPEG等多种编码方法。
- 具有非常好的扩展性、方便性、可改性,是印刷行业中最常用的格式。
- Web浏览器不支持TIFF格式。
图像压缩
适当降低图像质量来减小它所占用的空间
不同的图像压缩算法,对应不同的图像格式。
色彩模式
二值图像、灰度图像、RGB图像、RGBA图像
- CMYK—-印刷四分色
- C:Cyan = 青色
- M:Magenta = 洋红色
- Y:Yellow = 黄色
- K:blacK = 黑色
- YCbCr—-DVD、摄像机、数字电视等消费类产品中常用的色彩编码方式
- Y:亮度
- Cb:蓝色色度
- Cr:红色色度
- HSI
- H:色调
- S:饱和度
- I:亮度
图像类型
- 序列图像:时间上有一定顺序和间隔、内容上相关的一组图像。
- 例如视频图像就是一种特殊的序列图像。
- 其中的每幅图像,称为帧图像。
- 帧图像之间的时间间隔是固定的。
- 深度图像(Depth Map)
- 是一种三位场景信息的表达方式
- 每个像素点的取值,代表这个点由离摄像机的距离。
- 采用灰度图表示,每个像素点由一个字节表示。
- 深度图像中,像素点的取值并不代表实际的距离,颜色的深浅只代表相对距离的远近。