设备故障分析的多级代码标准化方法研究
作者:胡黛任 张永军 王 字数:6800 点击:
摘 要:设备维护的基础是对故障信息的正确记录和汇总。但是实际中,故障信息的日常非一致性描述往往使得重复和重点故障的筛选变得困难,进而妨碍了有效维护策略的制定。鉴于目前市面上尚未有成熟的体系化通用类设备故障记录分析方法,本文在设备管理现状及传统故障分析方法的简要综述基础上,提出和开发了“多级代码标准化故障分析方法”,并通过示例阐述其实际应用和优点。
关键词:设备管理;多级代码;标准化;故障分析
Equipment Failure analysis method based on Multi-level Breakdown code standardization
Hu Dai-Ren, Zhang Yong-Jun, Wang Shi-Jin
(School of Economics and Management, Tongji University, Shanghai 200092)
Abstract: Equipment maintenance is based on records and summary of breakdown information. However, in practice, it is quite difficult to identify the duplicate and serious equipment breakdown due to the daily non-conformance descriptive information, which lead to the inefficiency of preventative maintenance model. However, there is no an existing mature system of universal equipment breakdown recording and failure analysis. In this context, this paper proposed and developed accordingly an innovative “multi-level breakdown code standardization failure analysis method”, after briefly reviewing the traditional failure analysis methods. The method is then illustrated through practical examples and its benefits are demonstrated.
Key Words: Equipment Management, Multi-level Breakdown Code (BDC), Standardization, Breakdown Analysis
1 引言
生产型工厂,尤其自动化程度较高的流水线型生产工厂,其质量管理体系中,虽然都会有一份关于“预防措施”的设备管理程序,但仍难以精确预见较全面的潜在问题。类似于PM分析(即4P&5M: Phenomena Physical Problem Preventive Mechanism Material Machine Manpower Method)、FMEA(Failure Mode and Effects Analysis)等传统故障分析法多解决已知问题,存在无法纵观全局、不利于发现重点故障、分析工作量巨大、难以全覆盖等问题。
设备维护管理体系历经多个阶段,从早期基于时间的维护TBM(Time Based Maintenance)到目前较普遍的预防性维护体系,历经预测维修(Predictive Maintenance)、状态维修(Condition Based Maintenance, CBM),以利用率为中心维护(Availability Centered Maintenance, ACM),以可靠性为中心的维护(Reliability Centered Maintenance, RCM)、全面生产维护TPM(Total Production Maintenance)和全面规范化生产维护TnPM(Total Normalized Productive Maintenance)[1~2]。维修策略总体优化除了基于费用的策略优化外,同时需要兼顾设备故障特征的维护策略选择[3]。诚然预防性维修是当今设备实际维护中主要采用的维护策略[4~7],但目前现有预防性维护研究,大多基于单一设备本身失效率、基于设备本身的历史故障信息建模[8~12]。建模的前提基础是精确记录、汇总和分析故障信息。由于缺乏完整和一致性的数据采集、记录、汇总分析系统,常使设备系统的维修策略很难准确制定。
为此,本文从设备维修管理的基础出发,提出一种多级代码标准化故障分析方法,在设备故障信息数据库建立方面,采用分区、分级、标准化、代码化等方法,综合考虑现实应用问题,包括通用性、企业因素的自由拓展、灵活多变、简单实用等,通过试验应用验证并不断优化,最终获得设备故障信息的标准化、数据化,简单明了地通过图表展现企业设备总体状况、提示重点问题,有利于企业设备维护策略的制定。
2.多级代码标准化故障分析方法
2.1. 为何需要引入多级代码标准化故障分析方法(简称BDC方法)
为了确保设备的正常运行并使其发挥最佳技术性能,采用最佳的维修策略尤为重要。以监测为主的状态维修、以改进设计为主的改进维修、以充分利用生产空隙为主的机会维修,以及传统的定期和事后维修,无论从管理还是从技术上,都需要更多的技巧和经验[1~2]。完备的设备技术和故障信息数据库,以及更清晰、便捷的分析方法可以很好地弥补技巧和经验,对于维修策略的制定大有裨益。然而,现下故障信息收集、汇总、分析当中,尽管相同的设备、部件、故障现象或类似的故障原因,不同人描述常常会有不同。描述迥异令我们很难筛选出重复、重点故障,继而难以有效地解决问题。BDC(Breakdown Code)故障标准化代码有利于发现问题,故障记录、分析不是花更多时间做文字工作,而是花更多时间思考问题。
2.2. BDC简介
该多级代码标准化故障分析方法提供一种系统性全覆盖、标准化的分析工具。首先对工厂分区,按一定规则(车间、功能或工艺段等)进行分区,并对各区域标准化编码,称为一级代码;区域内设备按规则(产线、台套等)进行分类,再对分类设备标准化编码,称为二级代码;再对设备部件进行标化区分而后编码,称为三级代码;参考基于规则、基于实例推理(Case-based reasoning, CBR)、基于行为(Behavior-based)的诊断专家系统(Fault Diagnosis Expert System)原理[13~15],收集、汇总所有设备部件故障,关键对所有常见故障亦进行标准化描述并对其编码,称为四级代码;多级代码组合起来形成标准化的故障代码BDC。收集过去几年数据,并对其变化规律做出统计、分析和归纳,从而得到一个总体的预测模型[13~15],据预测制定维修策略及生产策略参考。运用BDC进行故障登记,以登记表作为源数据建立数据透视表,利用透视表功能选择关键字段进行报表筛选,再插入帕累托(PARETO)图。至此,由图表很容易发现设备多发、重复故障、重点故障等,要获得任意区域、设备、部件及某故障的重要信息非常简单。继而还可以开发应用电子数据信息系统对源数据进行汇总、分析(要求不高或可直接应用Excel),并按需要生成各类报表、分析图等;然后,利用FMEA、PM、鱼骨图等传统故障分析方法,找出根本原因;针对根本原因制定预防、纠正、改进等措施予以解决。管理层可根据这些报表、帕累托图制定相关设备的维修策略。该BDC方法可衍生为二级、三级、四级直至多级代码分析方法。
3. BDC应用示例说明
3.1 设立BDC建立故障数据库
如图1所示,将某工厂A车间所有设备按工艺及产线进行分区,并对区域标化编码;以两位阿拉伯数字为代码(01、02、03……),前两位是大分区或车间代码、小分区或产线分区;如图2所示,在分区的基础上对设备按工艺流程顺序进行标准化编码,如一区设备标记为(0101、0102……0109、0110……),二区设备标记为(0201、0202、0203……)。如图3所示,将一整台套设备(暂且记为工艺设备A,不便详介)分为几大系统或机构,称为子设备,标记编号(A、B、C……)。如图4所示,将子设备、系统或机构再细分到部件,如子设备A细分为(AA、AB、AC……),系统E细分为(EA、EB、EC……)等。最后,也是最关键和繁琐的一步,依据经验收集所有部件已发或可能发生的故障,标准化描述所有部件常发故障,并进行标记编码(01、02、03……)。此项工作可能耗时最久。
3.2 应用BDC故障记录
图(略)。Excel中建立数据表,,各级代码及其所代表的内容输入同一单元格内(代码和内容的前后顺序涉及后面的公式应用),对所有分区、设备、系统机构、部件以及故障描述进行区域定义,即哪些二级代码从属于某一级代码,哪些三级代码又从属于某二级代码,以此类推直至完成各级定义(方法参照Excel应用);故障登记时,首先选择设备(一级代码),再选机构(二级代码),再选择标准故障描述(三级代码),Excel即可自动生成故障代码。此处为了方便理解,已经简化了代码等级;实际应用过程中会发现有时候选择不到想要的选项,这就说明之前的数据建立不完善,可在之后工作中不断完善BDC数据库(多级代码正是方便于此)。如此以来,对于相同设备、部件、故障现象或类似原因之故障记录,都相同且唯一。
3.3 应用BDC故障分析
图(略),Excel中插入透视表,以故障登记表为数据源;选择需要分析的基础数据到报告过滤器(Report Filter)即选择字段添加到报表;一般以时间(年、月、周等)、区域(车间、线别等)为报表表头,以各级代码为行标签,以维修时间、影响OEE (Overall Equipment Effectiveness)时间、故障次数为统计内容,生成数据透视表;再依据数据透视表插入帕累托图,而后即可分级查看故障分布;报表可任意筛选出某一时段、某区域、设备、部件甚至某一特定故障类型的重要信息,故障时间、次数等,PARETO图跟随筛选内容相应自动变化。非常方便维修工程师做出维修策略判断,亦方便管理层掌握全厂设备总体情况。计算机化维护管理系统CMMS(Computerized Maintenance Management System)是为设备管理提供决策信息的系统。以BDC数据库为基础,亦可开发电子数据信息系统,该系统包含八大功能,数据录入、数据查寻、故障数据录入、报表功能、故障数据查询、基础数据管理、故障信息查询修改、数据批量导入、基础数据修改。系统将生产损失与故障数据进行整合,自动生成各类数据报表、分析报告等,应用于生产决策和维修策略。该信息系统可完全替代前面Excel各应用,包括数据管理、登入、汇总、分析、生成报表等等,并且可与工厂其它信息系统匹配数据,此处不再展开。
BDC代码的应用不止于此,可以拓展应用至设备技术信息库、备件管理信息库等,并将设备维修管理体系整合优化,本文不再展开。
4. 小结
BDC法编码规则并非一成不变,可以灵活运用,可据厂情定义其他编码层级、顺序、规则等。企业无论实行哪种维修管理体制,CBM、ACM、RCM等,应用何种故障分析方法,PM、FMEA等,都需要全面、准确的数据记录、统计及清晰、便捷的分析方法,都以首先识别出关键问题为基础。多级代码标准化故障分析(BDC)方法,以其多级、可拓展、标准化、数据化等特点,将会在设备维修管理领域发挥非常重要作用。
PS: 文中技术涉及国家专利,有意应用请联系作者。
参考文献
[1] 洪孝安、杨申仲等,《设备管理与维修工作手册》(修订本),中国机械工程学会设备维修工程分会组织编写,长沙:湖南科学技术出版社,2007(2)。
[2] 徐保强、李葆文,《TnPM推进实务和案例分析》,机械工业出版社,2007(2)。
[3] 李葆文,《现代设备资产管理》,机械工业出版社,2006(2)。
[4] Barlow RE, Hunter L C. Optimum preventive maintenance policies [J]. Operations Research, 1960, 8(1): 90-100.
[5] Pham H, Wang H. Imperfect maintenance [J]. European Journal of Operational Research, 1996, 94(3):425-435.
[6] Nakagawa T. Imperfect preventive maintenance [J]. IEEE Transactions on Reliability [J], 1979 R-28/5: 402.
[7] Zhou X J, Xi L., Lee J. Reliability Centered Predictive Maintenance Scheduling for a Continuously Monitored System Subject to Degradation [J]. Reliability Engineering and System Safety, 2007, 92(4): 530-534. (SCI 135DB, EI 065210334274).
[8] Jaturonnatee J, Murthy D N P, Boondiskulchok R. Optimal Preventive Maintenance of leased equipment with Corrective minimal repairs [J]. European Journal of Operational Research, 2006, 174: 201-215.
[9] Pongpech J, Murthy D N P. Optimal periodic preventive maintenance policy for leased equipment [J]. Reliability Engineering and System Safety, 2006(91) 772-777.
[10] Ruey H Y, Cheng K. Periodical Preventive-maintenance contract for a leased facility with weibull life-time [J]. Quality & Quantity, 2006(40): 303-313.
[11] Ruey H Y, Wen L C. Optimal threshold value of failure-rate for leased products with preventive maintenance actions [J]. Mathematical and Computer Modeling, 2007(46): 730-737.
[12] Ruey H Y, Wen L C. Hui-C. Optimal length of lease period and maintenance policy for leased equipment with a control-limit on age [J]. Mathematical and Computer Modeling, 2011: 9-25.
[13] 夏虹, 刘永阔, 谢春丽,《设备故障诊断技术》,北京 : 北京航空航天大学出版社, 2010(1)。
[14] Peter Harrington著 李锐译,《机器学习实战》,北京:人民邮电出版社,2013(1)。
[15] Tom M. Mitchell. Machine Learning [J]. China Machine Press, 2003(1).