世界智能制造,探索智能技术引领下的制造业未来
266
2024-01-13
先简单再深入:
在应用最新和最好的深度学习解决问题之前,请尝试经典的计算机视觉技术特别是在数据可能稀缺的情况下,就像许多现实世界的问题一样检查计算图像像素的统计值(例如均值、峰度、标准差)是否会导致不同类别的统计值不同。
然后可以在这些值上训练一个简单的分类器,例如 SVM、KNN,以在不同的类之间进行分类增加图像信噪比:将它们输入深度学习模型前,检查预处理技术是否增强了图像的主要特征并提高了信噪比这有助于模型获得更好的准确性。
使用阈值处理等技术、腐蚀和膨胀等噪声消除技术、高斯模糊(平滑边缘)和中值模糊(消除椒盐噪声)等模糊技术对于不同的问题,不同的运算可能在不同的顺序下有用通常的做法是多次使用特定运算符,如果可以增强特征,那就在几个步骤之后再次应用。
找到滤波器、阈值等不同kernel大小的最佳组合,可以产生产生最佳效果的图像,可以通过构建交互式滑块来帮助找到这些值的理想范围直方图均衡:增强图像特征的另一种方法是使用直方图均衡化直方图均衡化提高了图像的对比度。
直方图均衡化的目的是使出现频率最高的像素值均匀分布示例:
上图的对比度非常低,在这种情况下,重要的是要提高对比度,使图像的特征更清晰可见OpenCV 提供了两种这样做的技术 —— 直方图均衡化和对比度受限自适应直方图均衡化 (CLAHE)应用直方图均衡化,图像的对比度确实有所提高。
但是,它也会增加图像中的噪点,如下图中间所示这就是CLAHE 的用武之地使用这种方法,图像被分成 m x n 网格,然后将直方图均衡应用于每个网格可以使用交互式滑块找到理想的对比度阈值和网格大小,如下所示。
用于查找最佳阈值和图块大小值的交互式滑块
从左到右:原始图像、直方图均衡图像、CLAHE 后图像图像的颜色空间变换:将图像转换到不同的颜色空间,例如 HSV,通常可以提供更好的信息来分割目标,用于目标跟踪等情况通常,RGB 颜色空间对阴影、光照的轻微变化(影响目标的颜色)不稳健。
对于使用经典计算机视觉进行目标跟踪等任务,因上述原因,在稍有不同的环境中使用时,RGB 空间中经过调试的mask通常会失败此外,一旦将图像转换为不同的空间(例如 HSV),分离通道通常有助于分割感兴趣的区域并消除噪声。
如下图所示,一旦将图像转换为 HSV 空间并拆分通道,就可以更轻松地去除阴影并分割网球
不同的颜色空间(RGB、HSV)及其分量拆分归一化图像:如果将图像输入深度学习模型,则必须使用批归一化等技术对图像进行归一化,这将有助于标准化网络的输入这将有助于网络学习得更快、更稳定批量归一化有时也会减少泛化误差。
进行有意义的增强:在增强图像时,确保应用的增强技术保留图像的类别并且类似于现实世界中遇到的数据例如,对狗的图像应用裁剪增强可能会导致增强后的图像不像狗在某些目标使用旋转和翻转进行增强的情况下也是如此在增强时更改图像属性(例如颜色)时要非常小心。
此外,请确保扩充数据不会更改图像的标签始终检查增强图像是否有意义并反映现实世界
随机裁剪等增强如何导致数据损坏的示例训练集和验证集的数据泄露:确保相同的图像(比如原始图像和增强图像)不在训练集和验证集中同时出现是很重要的这通常发生在训练验证集拆分之前就执行数据增强忽略这一点可能会导致给出错误的模型指标,因为它会在训练期间从非常相似的图像中学习,这些图像也存在于验证集中。
在测试集合验证集上需要包括所有类别:确保测试集和验证集包含所有标签样本这样模型指标反映的才是模型的真实表现以标签的样本数量较少的情况为例执行随机训练集测试集拆分可能会导致更少标签的类根本不会出现在验证/测试集中。
当训练好的模型被测试时,它不会在那个特定的类上被测试,模型指标也不会反映其性能的真实表现后处理完整性检查:模型训练好之后,执行完整性检查也很重要:确保在多类分类器的情况下所有类的输出总和为 1确保在测试或部署模型时也应用训练期间应用于图像的预处理。
版权声明:本文内容由网络用户投稿,版权归原作者所有,本站不拥有其著作权,亦不承担相应法律责任。如果您发现本站中有涉嫌抄袭或描述失实的内容,请联系我们jiasou666@gmail.com 处理,核实后本网站将在24小时内删除侵权内容。
发表评论
暂时没有评论,来抢沙发吧~