|华能原CIO朱卫列:“工业互联网”概念中存在五大认知误区( 四 )
想一想一个发电厂一台机组就有1.5万-2万的实时数据测点 , 每个测点按秒级输送 , 这个数据量非常之大 。 所以我们说工业智能化的方向 , 不能停留在表面的图像识别这样一些数据上 , 而应该对工业的真正的大数据 , 能够有一些突破 。 这个突破 , 才会产生更大的经济效益 。
早期的工业里头对这些数据有没有应用和探索呢?是有的 。
过去我们也曾对实时数据做过一些分析 , 主要统计学知识进行分析 , 比如说我们的统计发电量 , 统计机组可靠性指标等等 , 按月统计 , 做一个环比、同比的一些分析 , 并用BI技术进行展示 , 给管理层做一些真正的一些比较好的报表、图形等等 。
稍深一些层次的应用 , 也有一些建模的技术 , 比如我们用同一个变量来计算不同的时间点参数的AR(p)的这种自回归的方式;也有用因变量与自变量之间的设置 , 也就是我们现在比较多的 , 特征选择的这样的一种方式 。 当然也有把两个方式统一起来 , 建一个ARMA这样一个自回归模式去解决一些工业、经济学、金融领域的问题 。 这些技术未来依然会用到 , 但是经过几年的探索和开发 , 我们发现我们可以将人工智能技术应用到工业生产实时数据中 。
这一人工智能技术 , 我们用的更多的是机器学习 。 工业生产实时数据量太大了 , 将这些数据用机器学习进行计算后 , 形成工业设备的数字模型 , 或者是它的系统的一个模型 。 这种模型的产生和建立 , 就是定量化的 , 它将给工业带来巨大的变化 。
生产实时数据 , 跟过去的自动控制有什么区别?
自动控制是一个短时间的数据的反馈 , 这个数据反馈 , 它是几秒钟、几分钟的数据反馈 , 但是机器学习 , 是用至少半年到一年的数据反馈 , 它是更大领域上的时间跨度的建模和分析 。
我们发现建模可以有更大时间跨度的 , 具了解美国有一个earthcube项目 , 它是研究整个地球的数据系统 。 在这个系统建模后 , 可以进行远期的考古分析 , 预测地球未来的发展变化 , 预测地震 , 了解石油资源等等 。 他实际上是在更大的时间维度上去建模 。
机器学习今天带给我们的 , 依然也是这样的一个道理 。 我们在工业领域 , 也是加大了时间跨度 , 变成一个比较长周期的数据分析 。
利用工业时序数据和机器学习我们解决了一个什么问题?
我们找到了工业设备、以及系统这样一个复杂系统的一个建模的方法 , 寻找到工业设备各个输出参数之间的定量的数据关系 。 有了这样一个数据关系 , 实际上我们打开了工业领域智能化的一个天窗 。
因为过去我们工业领域这么多的数据 , 它们之间的这种逻辑关系 , 我们很难用一个显函数来表示 。 工业领域系统参数那么多的维度 , 之间的关系往往以隐函数的方式显示 , 我们不知道它的具体数值关系 , 这种维度太多的时候 , 我们很难解决问题 。
有了机器学习 , 我们 终于 找到了工业系统里头多输出量这样的一个隐函数这样一个 问题。 实际上搞到工业设备 , 或者是系统 , 或者是机组它们之间的运行的内在关系 , 内在逻辑关系就找到了 。 再来用这样的方法解决我们的实际问题 。
比如我们现在正在探索的锅炉优化燃烧的问题 , 在过去是非常复杂的 , 现在这个问题我们能够解决 。
举几个简单的例子 。 比如说我们在水电领域 , 我们来进行状态检修 。 过去我们在厂里也有监控系统 , 这种监控系统 , 实际上把 , 像我们自控系统似的 , 把数据进行展示 , 靠人进行分析 。 用了机器学习以后 , 等于我们能够找到这个设备的特征关系 , 从而预测它什么时候出现问题 , 主要是通过特征量的劣化这样的一个时间维度来解决 , 从而完成设备状态检修的技术问题 。
去年一年 , 我们通过这种方式在一些电厂减少了100多天的检修 , 流域之间的检修间隔也拉长了 , 节省了大量的检修费用 。
