理解这5个关键的深度学习分类指标,以获得更好的应用程序成功
![数据可视化前的神经网络大脑](http://m.czl106.com/library/media/blogs/deep-learning-blogs/2021/classification-metrics-large.jpg?sc_lang=en&h=300&w=945&la=en&hash=C210AA0C90C5E8496D016184A59DBFF4)
产品质量是大多数企业的命脉。一次又一次地做对可以带来客户信任,正面的口碑,更少的昂贵的召回,最终更好的业务结果。在工厂或生产线上,在生产的每一步都依赖机器视觉系统是提供高质量产品的最佳投资之一。德国必威具体来说,分类器等深度学习工具可以帮助制造商识别生产线上潜在的质量控制问题,从而限制成品的整体缺陷。
分类器是一种重要的检测工具,因为它不仅仅是生产线识别缺陷或损坏部件并将其撤出生产。这些缺陷也必须分类,以便检查系统能够识别模式,以确定一个缺陷是划痕,还是另一个缺陷是凹痕。对这些产品缺陷的正确分类会让劣质产品无法进入市场,而错误的预测会让优质产品无法上架,从而拖垮生产,增加成本。
在…的世界4.0行业在美国,大数据对流程和质量控制至关重要,从这些数据中获得正确的指标可以让组织了解他们是否深度学习分类检查工作正处于最佳状态。分类应用依赖于四个主要结果来产生这些数据:
- 真正:地面真理是正的,预测类也是正的
- 假阳性:地面真实为阴性,而预测类为阳性
- 真否定:基础真理是否定的,预测类也是否定的
- 假阴性:地面真理是正的,而预测类是负的
地面真相是查明汽车保险杠上的凹痕等实际检查结果。开发人员和工程师想要磨练他们的能力深度学习的应用正确地预测和分类缺陷,例如,匹配在实际零件上发现的地面真实缺陷。
组织可以使用许多指标来衡量其分类应用程序的成功,但这里只介绍其中的5个指标。
准确性和错误率
在制造深度学习应用程序中最常用的度量是分类精度,因为它简单且有效地以单个数字传递底层信息。错误率是准确性的重要补充。
这些是最基本的指标,因为它们确定了深度学习应用程序的基本有效性。
测量准确性是相对简单的:用正确预测的数量除以总预测的数量。错误率是错误预测的数量除以总预测的数量。
值得注意的是,对于分类应用来说,正确的预测包括所有真实的积极和消极的结果。
逃跑率
一个分类应用程序,错误地预测有缺陷的部分是好的,被称为逃逸。允许损坏或有缺陷的产品在不被发现的情况下“逃逸”到市场,可能会损害公司产品质量的声誉。此外,召回这些逃逸产品可能会造成数百万美元的损失。
逃逸率是用假阴性数除以总预测数来计算的。
过度的速度
产生假阳性预测的分类应用程序产生过度杀伤,这意味着没有缺陷的好产品或部件被错误地从生产线上移除。从生产线上移除的无缺陷部件可能最终成为废料或被人工返工。这两种结果都会让制造商在零部件和劳动力方面付出额外的成本。
过度杀伤率是用假阳性数除以预测总数来衡量的。
精度
精确回答了什么比例的积极预测是正确的问题?换句话说,分类应用程序是否在不影响假阳性的情况下预测正确的类别?
值为1表示分类模型很好地预测了正确的类别,同时也实现了0%的过度杀伤。值0表示模型不能做它应该做的事情。
F1分数
F1-Score定义为精度和召回率的调和平均值。它是测试准确性的衡量标准。最高的可能值是1,表示完美的精度和召回率。
如前所述,精度是正确识别的阳性结果的数量除以所有阳性结果的数量,包括那些没有正确识别的结果。召回是正确识别阳性结果的数量除以应该被识别为阳性的所有样本的数量。
F1-Score是分类应用程序生成的正确预测的百分比。
测量最重要的
为了简单起见,我们保留了这些示例的基本内容。现实世界中的深度学习算法可能有六种或更多的分类。这会产生一个更复杂的混淆矩阵。例如,还有更复杂的公式来评估学习算法的记忆力和准确性。
最终,这些分类指标让公司能够创建成功的基线,并应用评分机制,就像老师给学生评分一样。随着时间的推移,深度学习开发人员可以使用这些指标来帮助微调他们的应用程序,并对哪些工作有效、哪些不有效产生更准确的评估。
当涉及到工业自动化时,制造商需要更好地了解他们部署的应用程序中哪些是有效的,哪些是无效的。选择关注哪个度量标准取决于每个组织独特的生产线,他们试图解决的问题,以及最重要的业务结果。