昊虹君 发表于 2022-10-19 20:45

Python-OpenCV中的函数cv.imread()读取到的图像的数据存储结构是怎样的?

Python-OpenCV中的函数cv.imread()读取到的图像的数据存储结构是怎样的?

用一个例子实测一下就知道了。

测试代码如下:
import numpy as np
import cv2 as cv

src = cv.imread("F:/material/images/P0037-pure_red-02.bmp")
代码中用的图像百度网盘下载链接:
https://pan.baidu.com/s/1ldfJmdUnq_Os7QPGS8njyA 提取码:pltg

该图像是一张纯红色的图像,其属性如下图所示:
http://pic1.hhai.cc/pic1/2022/2022-10/0007/021.png

上面的代码运行后src对象的属性和数据值如下:
http://pic1.hhai.cc/pic1/2022/2022-10/0007/022.png
                                          
http://pic1.hhai.cc/pic1/2022/2022-10/0007/023.png
                                          
http://pic1.hhai.cc/pic1/2022/2022-10/0007/024.png

上图代表第0行第0列像素点的BGR分量分别为(0,0,254)

由上面的结果可知:
第3维度(最高维度)代表图像有多少行,是图像的行维度。
第2维度代表图像有多少列,是图像的列维度。
第1维度代表图像有几个通道,是图像的通道维度。

这与我们在Python中通常遇到的三维矩阵的维度顺序不一样,我们看下面这个例子:


import numpy as np

B = np.array([[,
               ],
            [,
               ],
            [,
               ]])
               

上面的代码中,B矩阵为三通道、两行、四列,运行代码后,B中的数据结构如下:
http://pic1.hhai.cc/pic1/2022/2022-10/0007/025.png
可见在这里:
最高维度是通道维度(代表有几个通道,或者说是页维度,代表有几页),其次是行维度(代表多少行),最后是列维度(代表多少列)。

而上面用函数cv.imread()读取到的图像的数据存储结构如下图所示:
http://pic1.hhai.cc/pic1/2022/2022-10/0007/026.png
从上图可以看出:
用函数cv.imread()读取到的图像的数据存储结构为“最高维度是行维度(代表多少行),其次是列维度(代表多少列),最后是通道维度(代表有几个通道)”。
这一点,我们必须清楚,如果连这一点都不清楚,我们在进行图像处理时就是处于迷糊状态。

页: [1]
查看完整版本: Python-OpenCV中的函数cv.imread()读取到的图像的数据存储结构是怎样的?