时间:2014-08-04 16:41 文章来源:http://www.lunwenbuluo.com 作者:刘克明 点击次数:
【摘 要】 数据挖掘技术理念,对大功率中短波发射机的科学维护、规范运行具有非常广阔的应用前景和现实意义。
【关键词】 数据挖掘 发射机 运行 维护
1 引言
随着西新工程多年的建设,我国以100KWPSM、150KWPSM、500KWPSM和DX为主的四种大功率中短波发射机的广播机型全面普及,经过多年的运行和维护,取得了大量的维护经验,各维护单位也十分重视维护经验的积累和交流,切实的提高了设备的维护水平和发射机运行稳定性,但是传统的维护水平已经进入一个相对较高的稳定的平台期,以往的单纯依靠经验积累的传统维护方法,短期内难以再有明显的提高,但是我们却忽视了一些对我们很有价值的东西,这就是我们在日常维护和设备运行中积累的大量的数据,随着近年来大规模的信息化建设,播音设备全面的计算机化、网络化,很多维护单位已经积累了数以TB计的设备运行和维护的数据,但是拥有大量的数据与拥有许多有用的知识完全是两回事,这些数据除过极少量的部分被工作人员拿来进行维护管理参考外,大多数都被搁置或沉睡在数据库中,没有发挥出应有的效益,如何有效的发现这些数据的价值呢?数据挖掘技术无疑给我们指出了一条道路,特别是对我们的预防性维护工作有很好的指导和借鉴意义,下面我们就来对数据挖掘技术理念在预防性维护中的应用作一探讨。
2 数据挖掘的定义
数据挖掘就是从大量的数据中挖掘出有用的信息,即从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中发现隐含的、规律性的、人们事先未知的,但又是潜在有用的并且最终可理解的信息和知识的非平凡过程。这个定义包括好几层含义:数据源必须是真实的、大量的、含噪声的;发现的是用户感兴趣的知识;发现的知识要可接受、可理解、可运用;并不要求发现放之四海皆准的知识,仅支持特定的发现问题。原始数据可以是结构化的,如关系数据库中的数据;也可以是半结构化的,如文本、图形和图像数据;甚至是分布在网络上的异构型数据。发现知识的方法可以是数学的,也可以是非数学的;可以是演绎的,也可以是归纳的。发现的知识可以被用于信息管理,查询优化,决策支持和过程控制等,还可以用于数据自身的维护。因此,数据挖掘是一门交叉学科,它把人们对数据的应用从低层次的简单查询,提升到从数据中挖掘知识,提供决策支持。这里所说的知识发现,不是要求发现放之四海而皆准的真理,也不是要去发现崭新的自然科学定理和纯数学公式,更不是什么机器定理证明。实际上,所有发现的知识都是相对的,是有特定前提和约束条件,面向特定领域的,同时还要能够易于被用户理解。最好能用自然语言表达所发现的结果,把先进的数据挖掘技术理念引入到大功率发射设备的运行和维护中,为设备维护和管理人员提供有价值的潜在信息,这样就能更好的保证设备的运行质量。无疑对我们提高设备运维的科学化、系统化有着非凡的意义。
3 数据挖掘步骤
数据挖掘的处理对象是大量的数据,这些数据一般存储在数据库系统中,是长期积累的结果。但往往不合适直接在这些数据上进行知识挖掘,需要做一些准备工作,也就数据的预处理。数据预处理包括数据的选择(选择相关数据)、净化(消除噪音、冗余数据)、推测(推算缺值数据)、转换(离散型数据与连续型数据之间的转换)、数据缩减(减少数据量)等。
数据挖掘的过程可能需要多次的循环反复,每一个步骤一旦与预期目标不符,都要回到前面的步骤,重新调整,重新执行。数据挖掘是一个多领域技术人员合作的过程,也是一个在资金上和技术上高投入的过程,但我们可以在日常的设备运行和维护中借鉴数据挖掘的理念,在反复过程中,不断地趋近事物的本质,不断地优化问题的解决方案。
4 数据挖掘主要解决的四类问题
数据挖掘非常清晰的界定了它所能解决的几类问题,数据挖掘的应用就是把这几类问题演绎的一个过程。
4.1 分类问题
分类问题属于预测性的问题,但是它跟普通预测问题的区别在于其预测的结果是类别而不是一个具体的值。例如:发射机倒频时发生故障,一般判断可能为调谐类故障,那么这个问题就属于分类问题;但是如果根据各种信息直接判断为调谐电容击穿,那么这个问题就属于后面要说到的预测问题。调谐类故障我们一般认为主要在倒频时发生,不会马上造成直接性的停播,分类问题在故障处理中有着重要的意义,根据基本现象作出预测性的判断,在故障处理中起着方向性的作用。
4.2 聚类问题
聚类问题不属于预测性的问题,它主要解决的是把一组数据划分几个分组的问题。划分的依据是聚类问题的核心,也就是分类条件、属性。聚类的问题很容易与分类的问题混淆,但分类问题与聚类问题是有本质区别的:分类问题是预测一个未知类别的数据于哪个类别,而聚类问题是根据选定的条件,对一组数据进行划分,它不属于预测问题。聚类问题在我们日常维护工作中也是一个非常常见的的问题,例如根据发射机的几大系统构成进行的故障分类,不同系统的故障均有可能造成设备停机,但故障原因归属的系统不同就应该划归不同的系统故障分类,如一样是高末调谐电容引起的故障,如果是电容击穿打火我们就应该将故障划归为射频系统类故障,但如果是调谐电容抱死造成调谐不到位则应划归为调谐类故障,需要选择若干个明确区分条件对已有的数据进行划分:条件一致的数据聚为一类,不同的数据分属于不同的类。聚类的方法层出不穷,比较直观的就是依据积累的经验和已知问题、条件进行分类,这些方法也是我们日常工作中最常使用的方法,而依据数据挖掘理论,运用数学方法对隐含其中的知识进行挖掘才是我们更加需要探索的方向。
4.3 关联问题
说起关联问题,最典型应该是大家都知道的沃尔玛超市“啤酒和尿布”的故事,这个典型的案例给了我们一个启示:世界上的万事万物都有着千丝万缕的联系,寻找和发现这种关联,可以给我们带来一些意想不到的收获。
关联分析要解决的主要问题是:一组数据发生后,哪些数据必然同时发生或发生几率比较高?例如:我们常见的DF100型PSM短波发射机,1PS6R33烧毁故障,一般均伴随着1A9的滤波电容的击穿,细心的维护人员从这种多次出现的伴生现象,分析电路,得出结论,原来1A9的滤波电容才是这个故障的“元凶”。现在我们从原因看结果视乎觉得一切都理所应当,逻辑明晰,但这个故障更大的价值不在于故障本身,而是发现这个故障的过程给我的启迪,从数据挖掘的视角看,这就是典型的数据关联的问题,我们因为多次的关联找到了故障的根本原因。所以说在研究问题的过程中,分析的重点就是所有数据之间关联性。
4.4 预测问题
此处说的预测问题指的是狭义的预测,并不包含前面阐述的分类问题,因为分类问题也属于预测。一般来说我们谈预测问题主要指预测变量的取值为连续数值型的情况。例如:估计下一年度的播音量、预测下一年度的备件需求、规划调整检修周期等等,预测问题的解决更多的是采用统计学的方法。
5 总结与展望
数据挖掘技术是一项庞大的应用工程,也是一项新兴学科,很多行业也均在积极的尝试阶段,在过去,我们常用的知识获取方法是由有经验的维护人员把积累的经验和知识经过分析、筛选、比较、综合、再提取出知识和规则。然而,由于维护人员本身所拥有知识的局限性,所以很多时候就难以收到理想的结果。但借鉴数据挖掘技术的理念可以给我很大的帮助,对大功率中短波发射机的科学维护、规范运行具有非常广阔的应用前景和现实意义。
联系方式
随机阅读
热门排行