热门标签:代写本科论文 写作发表 工程师论文 代写一篇论文多少钱

当前位置: 代写一篇论文多少钱 > 计算机论文 > 电站故障预警中数据挖掘的运用

电站故障预警中数据挖掘的运用

时间:2020-12-29作者:张振宇 孟兆博 亓皓宽
本文导读:这是一篇关于电站故障预警中数据挖掘的运用的文章,数据挖掘中主要的数据类别定义算法是分类和聚类,其中分类算法常见的有KNN、决策树、支持向量机、朴素贝叶斯等,聚类算法常见的有K-means、DBSCAN等。

  摘    要: 近年,电站企业从自动化转型为信息化、智能化的需求升高,通过对电站DCS中储存的大量数据进行分析,能够提示设备劣化状态,对电站企业提高生产效率、经济安全运行有积极的指导意义。将数据挖掘应用于电站数据分析,试图为电站安全性运行提供理论依据。介绍了数据挖掘的概念,着重研究了数据挖掘中数据预处理、聚类、回归的方法,之后将该方法应用于实际电站的预警中取得了较好的效果。

  关键词: 数据挖掘; 故障预警; 聚类; 回归;

  Abstract: In recent years, the demand for power plant companies to transform from automation to informationization and intelligence has increased. By analyzing the large amount of data stored in the power plant's DCS, it can prompt the deterioration of equipment, it also has positive guiding significance for power plant enterprises to improve production efficiency and economic and safe operation. The data mining is applied to power plant data analysis in an attempt to provide a theoretical basis for the safe operation of power plant. The concept of data mining is introduced, and focuses on the methods of data preprocessing, clustering and regression in data mining. After that, the method has been applied to the predictive alarm of actual power plants and achieved good results.

  Keyword: data mining; failure predictive alarm; clustering; regression;

  电站设备的可靠、安全运行是各个发电企业管理者最为关注的事情。同时,为了追求高利润,就需要合理安排检修周期和内容。实现设备的高可靠性运行与减少检修费用的双向需求,是电厂管理者的难题,往往现场人员少、任务多,能够让计算机代替人员在海量的数据中挖掘出有价值的信息,并主动、准确地发现设备潜在的问题,帮助电站有重点、合理的安排检修计划。目前大多电站主要以DCS报警为依据对设备进行故障状态观察,这些传统的技术方法无法发现数据背后隐藏的规律,很难了解设备运行的劣化状态,造成了数据资源的巨大浪费。

  近年来,数据挖掘随着计算机性能的发展越来越多的得到了人们的关注,它是一门利用数据库、统计学、人工智能、专家知识库等知识,把海量历史数据作为研究对象,对这些数据通过分类、关联规则分析、回归拟合等方式进行分析、处理,从而挖掘出隐藏在数据中有用的知识,帮助管理者和技术人员决策提供有力的依据。将数据挖掘应用于电站故障预警中,可帮助电站实现预测性检修管理,在保证设备安全有效的情况下,减少检修费用。

  1 、数据挖掘

  1.1 、数据预处理过程

  在工况复杂的工业电站中传感器数据通过DCS读取和传输,传感器数据往往会因为环境影响产生数值跳变或者损坏。为了提高预警建模的准确性,首先我们需要提高数据的质量,清除数据中的噪声,纠正不一致。数据预处理就是将准确、完整、一致、可信的数据提取出来。数据预处理通过数据清理、数据集成的方式来完成。
 

电站故障预警中数据挖掘的运用
 

  通过填写缺失值,光滑噪声数据,识别或删除离群点对原始数据进行清理。首先对于采集的数据进行偏差检测,对于错误和退化的数据进行分离或者修正。数据的缺失值采用回归基于推理的方式填写。噪声数据采用分箱的方法将数据分成多个不同的区间,进行箱中位数光滑或者箱边界光滑。同时设置数据上下限过滤和时间过滤,可按照上下限或时间对于故障数据、停机数据进行过滤处理。对于一般的离群点数据进行分析,对于无效数据删除,离群点清理如图所示。

  1.2 、数据聚类

  数据挖掘中主要的数据类别定义算法是分类和聚类,其中分类算法常见的有KNN、决策树、支持向量机、朴素贝叶斯等,聚类算法常见的有K-means、DBSCAN等。本文选取的是聚类算法k-means,该算法是无监督学习算法可以在不定义样本类别的情况下,自动的根据数据特征进行迭代分析从而聚类。该算法的主要思想是将数据分为K类,则随机选取K个对象作为初始的聚类中心,然后计算每条数据与定义过的中心之间的距离,把该条数据分配给距离它最近的一个聚类中心。聚类中心以及分配给它的所有数据条就代表一个类。系统会不断迭代计算聚类中心直到满足条件结束,一般来说就是每条数据到聚类中心的误差平方和最小为最佳聚类方案。

  迭代方法,给定数据集划分假设的聚类数K,每个类各自一个聚类中心:

  准则函数:

  1.3 、标准值预测模型

  将数据分类后,对机理意义上数据相关的两个或多个属性进行数据挖掘找寻他们之间的关系建立标准值预测模型。本文标准值预测模型选取的算法是回归算法,回归算法模型中利用梯度下降法对损失函数求最优解。

  损失函数:

  批梯度下降:

  2、 数据挖掘在电站故障预警中的应用

  2.1 、省煤器泄漏预警

  锅炉水冷壁、过热器、再热器和省煤器为火电最易发生泄漏的四类受热面,他们造成的泄漏统称为“四管泄漏”。在发电机组的非计划停运统计中,锅炉四管泄漏占30%以上,在具体泄漏表现形式中,爆管约占90%。在泄漏事故发生时,影响重大,不仅对机组的稳定运行构成了严重威胁,影响发电指标的完成和导致经济效益降低,影响机组寿命,而且还直接影响到电网的正常调度,锅炉四管泄漏的防治是电厂的重点工作,对因四管泄漏造成的非计划停运意义很大。本文针对省煤器泄漏进行分析,选取测点为:省煤器入口烟温、省煤器出口烟温、主蒸汽流量。

  2.2、 省煤器预警模型

  首先利用k-means算法将选择的3个属性的数据进行聚类,经过验证当k取值为4时,聚类误差最小。然后将每个类别的数据(选取省煤器入口烟温、省煤器出口烟温)利用回归算法进行曲线拟合。拟合结果图如下。

  2.3、 省煤器泄漏预警模型在电站中的应用

  下图是某电厂省煤器出口烟温实时值和模型输出正常值的曲线图,曲线中可以看出当泄漏故障发生时实际值和正常值发生明显偏离,根据数据偏离提示与现场省煤器位置进行验证,发现省煤器部分确实有少量泄漏现象,经过现场工作人员检修后,数据恢复正常。

  3、 结论

  省煤器是电站锅炉系统的主要设备,在应用中及时发现了省煤器泄漏风险,经提示现场及时检修避免了故障进一步扩大,基于数据挖掘的预警模型建立为机组安全性运行提供了有效依据。

  参考文献

  [1]汤羽,林迪.大数据分析与计算[M].2018.
  [2] D Hand,H Mannila,P Smith.Principle of Data Mining[M].2011.
  [3] 沙德生,陈江.火电厂设备状态检修技术与管理[M].2016.

关联标签:
联系我们
  • 写作QQ:3008635931
  • 发表QQ:3008635930
  • 服务电话:13701839868
  • 售后电话:18930493766
  • 邮箱:shlunwen@163.com
网站地图 | 网站介绍 | 联系我们 | 服务承诺| 服务报价| 论文要求 | 期刊发表 | 服务流程