星期四, 05. 一月 2017 07:23下午


传 统 的 西 红 柿 采 摘 机 器 人 的 视 觉 系 统 都 是 采 用 双 目 摄 像 头 , 使 用 时 需 要 进 行 摄 像 头 参 数 标 定 , 使 用 过 程 复 杂 。 本 文 提 出 用Kinect 代 替 传 统 的 双 目 摄 像 头 , 获 得 RGB 彩 色 图 像 和 目 标 深 度 图 像 , 对 彩 色 图 像 分 别 在 HSI 和 Lab 颜 色 空 间 进 行 分 通 道 图 像 分割 , 再 将 两 种 结 果 进 行 融 合 后 去 除 背 景 噪 声 。 对 采 集 的 样 本 图 像 进 行 分 割 实 验 , 结 果 表 明 此 种 方 法 分 割 效 果 良 好 。 对 深 度 图 像 进 行三 维 重 建 获 得 西 红 柿 质 心 的 三 维 立 体 坐 标 值 , 实 验 表 明 目 标 定 位 准 确 度 高 , 该 空 间 坐 标 值 可 用 于 指 导 真 空 吸 盘 机 械 手 进 行 目 标 西红柿的自动采摘 。


研究情况

  • 目前对西红柿识别的方法有很多 , 例 色空间可以通用。如将图像进行灰度变换 , 采用拟合曲线对西红柿的分割传统的分割方法是在 RBG 颜色空间, 将图像分成; 由 RGB 颜色空间转到 HSI 颜色空间, 采用遗 R 、 G 、 B 三个单通道的灰度图像, 然后对 R 通道的图传算法训练多层前馈神经网络实现西红柿成熟度的 像进行分割。 一般是采用多幅图像统计的方法, 得到自动判别 最佳阈值然后进行阈值分割, 实验结果如图 1 所示。[1][2]; 根据颜色特征利用阈值自动设定的方法对西红柿进行分割[2]。 这些方法都能从背景中将西红柿分割出来 , 但这些方法都有一定的不足 , 成功 率 较 低 。
  • 传统的果实定位采用双目立体视觉技术 ,缺 点 是 要 进 行 复 杂 的 摄像机标定 , 使用不方便 ,计 算 速 度 较 慢 。

本文核心

本 文 采 用 分 别 在 HSI 和 Lab 颜 色 空 间 进 行图像分割 , 然后将两个结果进行融合 , 再去除背景噪声的分割方法 , 该方法可以提高西红柿分割的准确性。本 文 利 用 Kinect 代 替 双 目 摄 像 头 ,无需进行参数标定可直接获得深度图像信息 , 实验表明此种方法可降低成本 , 提高定位速度和精度。

传统做法

传统的分割方法是在 RBG 颜色空间, 将图像分成 R 、 G 、 B 三个单通道的灰度图像, 然后对 R 通道的图 像进行分割。 一般是采用多幅图像统计的方法, 得到最佳阈值然后进行阈值分割, ![](../../../pic/lunwen/2017-01-05 16:31:46屏幕截图.png)

从图 1 所示的分割结果可以看出, 背景 噪声不能完全去除, 而且分割结果受光照的影响较大, 西红柿上有明显的亮斑。 RGB 颜色空间适合于显示, 不适合 于图像分割和分析, 因为 R 、 G 、 B 的 3 个分量 是高度 相关的, RGB 色彩空间容易受到光照的影响, 即只要 亮度改变, 3 个分量都会相应改变, 很难将图像中目标与背景区分。

利 用 线 性 或 非 线 性 变 换 , 则 可 以 由 RGB 颜 色 空间推导出其他的颜色特征空间 。 线性变换空间主要有 YIQ 、 YUV 、 I 1 I 2 I 3 [ 4]。 由于是线性变换 , 所以计算 量 小 , 并 且 部 分 消 除 了 RGB 的 相 关 性 。 非 线 性 变换 空 间 主 要 有 HSI 、 Lab 、 Luv 、 NRGB 等 , 其 中 HSI与人眼看物体时的感知特性类似 。 目前虽有多种颜色空间用于彩色图像处理 , 但由于无论哪一种都无法替代其他的颜色空间而适用于所有彩色图像处, 故选择最佳的颜色空间是彩色图像分割的一个难题[10]。

HSI 颜色特征分析与提取

HSI 色 彩 空 间 直 接 采 用 彩 色 特 性 意 义 上 的 3 个量 : H 代表 色调 ; S 代 表 饱 和 度 ; I 代 表 亮 度 或 透 明度 。 因色调与高亮 、 阴影无关 , 色调对区分不同颜色 的 物 体 非 常 有 效 。 从 RGB 到 HSI 颜 色 空 间 转 换 的公式为 :

![](../../../pic/lunwen/2017-01-05 16:44:21屏幕截图.png)

在 HSI 颜 色 空 间 中 H 、 S 、 I 的 3 个 分 量 相 互 独 立 ,可分别对这 3 个量进行控制。 西红柿表面光滑, 在光照变化的情况下影响图像的提取, 所以处理时只考虑 H 分量, 这样就避免了光照的影响, 使得图像处理针 对性更强。 具体做法是只对 H 分量进行阈值分割。 阈 值分割的方法有很多, 如大津法、 双峰法、 迭代法、最大熵法、 Otsu 法等。 本文提出基于门限改进的 Otsu法完成对 H 分量的图像分割。

改进Otsu法

改进的思路就是结合迭代法和 Otsu 法, 根据图像先确定一个初始阈值 T 1 , 然后利用 Otsu 法自动获取最佳阈值 T : ![](../../../pic/lunwen/2017-01-05 16:49:50屏幕截图.png)

式中:

  • p 1 ( t )、 p 2 ( t )———被阈值 t 分割后目标和背景 2 个区域的概率;

  • μ 1 ( t )、 μ 2 ( t )——被阈值 t 分割后目标和背景 2 个区域的平均灰度值;

  • σ 2 ( t )——目 标 和 背 景 类 间 方 差 值 , 当 σ 2 ( t )最 大时, t 即为分割的最佳阈值。

将获得的两 个阈值 进 行 比 较 , 如 果 T 1 ≥T , 则 最佳阈值为 T , 如果 T 1 ≤T , 则最佳阈值为 T 1 。 本例初始阈值 T 1 =115 。 HIS 颜色空间分割结果如图 2 所示。 ![](../../../pic/lunwen/2017-01-05 16:53:16屏幕截图.png)

Lab 色彩空间图像分割

Lab 色 彩 空 间 是 根 据 色 度 和 亮 度 组 成 的 3 维 空 间图, 它适用于一切光源色或物体色的表示与计算。 其中 L 表示心理明度, a 、 b 为心理色度。 在 Lab 色彩空间坐标中, +a 表示红色, -a 表示绿色, +b 表示黄色, -b在 HSI 颜 色 空 间 中 H 、 S 、 I 的 3 个 分 量 相 互 独 立 ,可分别对这 3 个量进行控制。 西红柿表面光滑, 在光表示蓝色, 颜色的明度由 L 的百分数来表示, 其取值从 0~100 。 通过西红柿的颜色特征, 我们很明显得出成熟的西 红 柿 为 +a ( 红 色 ) , 未 成 熟 的 西 红 柿 及 枝 干 和 叶 子为 -a ( 绿色 ) 。 因此选择 Lab 色彩空间来对成熟西红柿进行分割是非常合适的。 ![](../../../pic/lunwen/2017-01-05 17:00:43屏幕截图.png)

将原始图像 由 RGB 颜色空间 转换到 Lab 颜色 空间后, 将图像的 L 通道、 a 通道、 b 通道的图像分离出来,得到 3 个独立的灰度图像,所以我们只需对 a 通道的图像进行处理从而完成对成熟西红柿的分割 。 基于灰度图像的分割方法很多, 本文采用 K 均值聚类算法它通过迭代地执行分类算法来提取各类的特征值。 最终的分割结果如图 3 所示。 ![](../../../pic/lunwen/2017-01-05 17:05:00屏幕截图.png)

将在 HSI 与 Lab 颜色空间的到的两个分割结果进行融合处理。 图像融合方法有多种, 如颜色过渡法、 小波融合法和多分辨率样条法等。 虽然这些算法的效果较好, 但计算量较大。 本文采用简单快速的加权平均算法。 该算法的主要思想是: 图像重叠区域中像素点的灰度值 P 由两幅图像 中对应点的 灰度值 P H 和 P a 加 权平均得到, 即:

P=K×PH + ( 1-K) ×Pa (3)

式 中 : K —可 调 因 子 。 通 常 情 况 下 0<K<1 , 即 在 重 叠 区 域 中 , 沿 左 图像 向 右 图 像 的 方 向 , K 由 1 渐 变 为 0 , 从 而 实 现 重 叠区域的平滑拼接 , 最后对融合得到的分割结果去除背景噪声 。 本文采取的方法是 : 对于联通区域较小的背景噪声采取形态学运算的方法去除 ; 对于连通区域面积较大的背景噪声采取设定阈值进行面积判断 , 比如小于西红柿面积多少的连通区域认为是噪声 , 此种去噪声方法对于遮挡较少的情况具有很好的 鲁 棒 性 。