用Python进行机器学习(13)-图像特征提取
相对于前面的机器学习都是处理一些简单的数字,今天我们来用机器学习处理一点稍微高级的内容,我们进行图像的特征提取。图像的特征提取有很多的用途,比如图像分类、目标检测、图像检索、聚类分析、异常检测、图像生成、特征融合等,但是饭总是要一口一口吃,知识也是一点一点学,我们先看一下如何提取图像特征。
我们提取到的图像特征是patch,可以理解为是一个图像块,它是指从图像中提取的小区域,它可以包含物体的某个部分或者某个特定的纹理。这里还是使用sklearn加skimage,直接看实际代码吧,如下:
import numpy as np
import matplotlib.pyplot as plt
from sklearn.feature_extraction import image
from skimage import data
# 使用skimage自带的硬币图像
original_image = data.coins()
# 显示原始图像
plt.subplot(1, 2, 1)
plt.imshow(original_image, cmap='gray')
plt.title('Original Image')
plt.axis('off')
# 从图像中提取随机 patches
patches = image.extract_patches_2d(original_image, (32, 32), max_patches=25, random_state=42)
# 显示提取的patches
plt.subplot(1, 2, 2)
for i, patch in enumerate(patches):
plt.imshow(patch, cmap='gray',
extent=(i%5 * 32, (i%5 + 1) * 32,
(i//5) * 32, (i//5 + 1) * 32))
plt.xlim(0, 5*32)
plt.ylim(5*32, 0)
plt.title('Extracted Patches')
plt.axis('off')
plt.tight_layout()
plt.show()
上面的代码还是比较好理解的,重点介绍两个地方吧:
第一个就是使用data.coins()来调用类库中已经有的硬币图像,当然也可以使用其他方法比如moon方法来查看月球表面的图像,或者加载自己的图片也可以。
第二个就是extract_patches_2d这个方法,它用来提取二维的图像特征,这里我们最多只抽取25个,每个都是32*32像素大小的。
然后我们来看一下展示的效果吧,如下所示:
需要说明的是,原始图像就是左边的图像,右边则是提取出来的25个特征,每行展示5个特征,每列展示5个特征,为了防止部分朋友看不清,我们再来对这个特征部分来个单独的截图看一下:
可以看到,这里提取到的特征大部分是硬币的边缘部分,不过方向和面积各不相同,有的只截取到了一点,有的则截取到了比较多的部分,下面对这两处做了具体的说明:
对于图片的特征提取,我们先介绍到这里吧,通过特征提取,我们可以更加关注到图片的纹理细节,为图片类型的更多应用打下基础。