Python-OpenCV中的函数cv.imread()读取到的图像的数据存储结构是怎样的？

昊虹君 发表于 2022-10-19 20:45

Python-OpenCV中的函数cv.imread()读取到的图像的数据存储结构是怎样的？

用一个例子实测一下就知道了。

测试代码如下：
import numpy as np
import cv2 as cv

src = cv.imread("F:/material/images/P0037-pure_red-02.bmp")
代码中用的图像百度网盘下载链接：
https://pan.baidu.com/s/1ldfJmdUnq_Os7QPGS8njyA 提取码：pltg

该图像是一张纯红色的图像，其属性如下图所示：
http://pic1.hhai.cc/pic1/2022/2022-10/0007/021.png

上面的代码运行后src对象的属性和数据值如下：
http://pic1.hhai.cc/pic1/2022/2022-10/0007/022.png

http://pic1.hhai.cc/pic1/2022/2022-10/0007/023.png

http://pic1.hhai.cc/pic1/2022/2022-10/0007/024.png

上图代表第0行第0列像素点的BGR分量分别为(0,0,254)

由上面的结果可知：
第3维度(最高维度)代表图像有多少行，是图像的行维度。
第2维度代表图像有多少列，是图像的列维度。
第1维度代表图像有几个通道，是图像的通道维度。

这与我们在Python中通常遇到的三维矩阵的维度顺序不一样，我们看下面这个例子：

import numpy as np

B = np.array([[,
            ],
         [,
            ],
         [,
            ]])


上面的代码中，B矩阵为三通道、两行、四列，运行代码后，B中的数据结构如下：
http://pic1.hhai.cc/pic1/2022/2022-10/0007/025.png
可见在这里：
最高维度是通道维度(代表有几个通道，或者说是页维度，代表有几页)，其次是行维度(代表多少行)，最后是列维度(代表多少列)。

而上面用函数cv.imread()读取到的图像的数据存储结构如下图所示：
http://pic1.hhai.cc/pic1/2022/2022-10/0007/026.png
从上图可以看出：
用函数cv.imread()读取到的图像的数据存储结构为“最高维度是行维度(代表多少行)，其次是列维度(代表多少列)，最后是通道维度(代表有几个通道)”。
这一点，我们必须清楚，如果连这一点都不清楚，我们在进行图像处理时就是处于迷糊状态。

页: [1]

昊虹AI笔记网's Archiver

Python-OpenCV中的函数cv.imread()读取到的图像的数据存储结构是怎样的？