【Profinet专栏】关于结构化思维在PROFINET诊断中应用的思考

【0. 前言】
工业4.0趋势下的机器故障诊断,正在向更智能化的预防性维护系统发展:通过构建覆盖设备上各个部件的传感器与通讯网络,几乎所有电动、气动、液压、机械元件的状态数据都能得到实时监控,由此可结合机器学习与大数据分析,再结合日趋完善的故障处理知识库与决策系统,实现对机器异常状态的实时感知,预测出可能的故障隐患点,第一时间通知用户并提供最优化的维护方案。那么,这是否就意味着,经典的基于人的经验的故障诊断,今后就毫无用武之地了呢?
【1.传统故障诊断的价值与局限性】
尽管拥有了越来越强大的诊断工具,人,依旧是当前故障诊断活动中的核心。因为故障诊断其实是一个非常复杂的活动,不单单面向机器,而且面向各种各样不同知识与社会背景的用户。这就要求诊断者不仅拥有丰富的机器故障处理经验,而且需要具备良好的沟通协作与社交能力,因此体现出一定的服务价值。但同时我们也必须承认,人在当前机器故障诊断中的局限性也越来越明显了,因为机器正变得越来越复杂,哪怕是经验再丰富的诊断者,在面对千奇百怪的疑难杂症时,也难免会遇到自身知识技能的盲点。所以很多长期从事现场诊断的工作者都会有相似的体验:当遇到一个前所未见的故障现象,苦思冥想无果,承受着各方的压力,感觉是苦恼的。这个时候,想要化解被动局面就变得难上加难,而想尽快获得支援也不是一件容易的事情,因为首先你要将这个连你自己都没搞清楚是怎么回事的问题,客观的描述出来,让别人充分了解你所处的困境、异常的内容与背景,才有可能引起对方的重视。那么如何突破这些困局?不妨试试结构化思维的方法。
【2.结构化思维有助于解决传统故障诊断遇到的难题】
在传统的基于人的经验的诊断过程中,除了对诊断者经验的过度依赖,还伴随着跳跃性思维所产生的一些不确定性因素。跳跃性思维,有时候能起到剑走偏锋出其不意的神奇效果,帮助人们在故障诊断中走出一条捷径,但是一旦计划落空其后果也是相当尴尬,可能会使诊断活动陷入停滞甚至混乱。当面对现场出现的疑难杂症,能够保持头脑冷静采用结构化思维,相对来说是个更加稳妥的选择。因为这样就能使我们从多个侧面进行思考,深刻分析导致问题出现的原因,系统性制定行动方案,采取性价比最优的手段,使诊断计划得以高效率开展,有助于使问题得到彻底解决,也有助于形成信息全面逻辑清晰的问题调研报告。下面以典型的工厂自动化项目中PROFINET通讯网络问题诊断为示例,推演结构化思维方法论在机器故障诊断活动的应用思路。
【3.1.结构化诊断步骤1:4W1H,充分理解面临的问题】
WHAT:故障的表面现象是什么?例如:用户看到的是某机电设备无法动作、生产线停机,但是更换备件仍不能修复,那就不是头痛医头脚痛医脚那样简单。搞清楚表象背后的本质是什么?例如:借助各种通讯工具(特别是远程访问软件)与现场联系,了解用户曾经做了什么,获取现场设备与控制器状态的照片与录像,获取报警信息与报错代码,如果发现设备本身功能是正常的,而有证据显示控制器曾经丢失与设备的网络连接与数据交换,那么就可以初步确认故障本质其实是现场总线/以太网通讯控制网络方面,或者是机器设备系统集成方面的问题。搞清楚该机器遵循的是什么行业的什么公司的什么标准?例如:某些重大自动化项目,在规划阶段就已经定义了通讯网络的协议与架构,具体到参数设置固件版本等细节都有明文规定,这些都是标准的一部分,事先需要充分了解。
WHEN:什么时候 /
每隔多长时间发生该故障?例如:长时间关机后再上电时 / 每次开机都有 / 周期性可人为重现 / 偶发但可人为重现 /
偶发且无法人为重现(这是最困难的一种情况,往往重启后又正常了,需要一直等到下一次发生类似故障时,保护好现场,做尽可能完整的故障记录表,才有可能进行下一步的原因分析)。
WHERE:故障点具体在哪里?

例如:现场设备本身 / 生产线某区域 / 整条生产线 /
整个工厂(涉及的故障影响区域范围越大,就越要画出与故障区域大小相匹配的尽可能详细的通讯控制网络架构图,具体哪个网口连到哪个网口,中间经过了哪些对接装置,都要了解清楚)。
WHO:谁是联系人 /
谁可以帮助我们进行现场诊断?例如:操作者 / 维修组 / 项目管理 / PLC机器人编程 /
电气规划(用与对方知识背景相匹配的方式,进行沟通交流,不轻易放弃任何人提供的线索)。
HOW:搞清楚问题是如何发生的?

想方设法重现出这个故障,如能复现就容易找到根本原因,可以直接实施检查方案,否则进入步骤2进行全面故障可能原因分析。
【3.2.结构化诊断步骤2:头脑风暴、鱼骨图、思维导图,列出可能的原因】
重视团队协作的力量,将疑难问题的4W1H细节呈现给同事/同行,条件允许就尽量组织头脑风暴会议收集团队的建议。例如:同样是面对PROFINET通讯网络诊断的话题,同样是一群具有相关资质的专员,但是有些人更擅长硬件,有些人更擅长软件,有些人更熟悉标准,有些人更熟悉操作,有些人更熟悉产品,有些人更熟悉系统,等等。集思广益一番之后,我们就能在短时间内总结出比较全面的PROFINET通讯问题原因分析,通常用鱼骨图或思维导图表达。按照以上思路,特绘制出典型的鱼骨图,如下所示。

【3.3.结构化诊断步骤3:制定排查方案与行动计划】
现在我们把能够想到的可能原因,全面的呈现出来了,接下来如何制定排查方案与行动计划?人的精力有限,现场诊断可用资源也有限,有必要把最容易操作的检查项目优先执行,即按照从容易到困难、从成本低到成本高的规则,来划分每个可能原因排查的优先级。一般来说,网络架构与网线质量规范的检查、软件内参数设置的检查,都是比较方便实施的,所以优先级较高。按照以上思路,制定简洁的原因排查与行动计划进度检查表,如下所示。

【3.4.结构化诊断步骤4:PDCA 循环,直到验证根本原因】
现在我们就可以按照这个检查表,投入现场的诊断与调研工作了。需要做好思想准备的是,刚开始这个检查表其实是类似于三板斧的常规套路,对付常规故障可以,遇到疑难杂症就需要加入更多的检查项目。

新的检查项目哪里找?就是来自于步骤2鱼骨图中那些所有可能原因,这也就形成了新的排查计划,开始一轮新的故障排查行动。于是接下来我们就进入了PDCA循环,不断加入新的检查项并行动,直到验证出根本原因为止。综上所述,在故障诊断中采用结构化思维,有助于我们避开假象的迷惑,避开凭空猜想的误区,即使现场调研看似陷入举步维艰,诊断者依旧可以胸有成竹脚踏实地,向着问题的真相不断靠近。

作者简介

章文俊:工控爱好者,擅长气动与电动融合的自动化产品与控制方案,并致力于将其应用到全国的汽车制造等行业中。