通过为客户解决一个又一个项目的挑战,体验了不同机型与主控版本下的复杂条件,也不断优化着产品的可配置型性,模型的抗干扰性。一开始有的项目甚至要做耗时数月的“数据大扫除”,不断提高数据的准确性和可靠性。业界领先的95%的数据合格率就是这样一点一滴提升而来的。
远景的很多客户都曾建立数字化系统,最后却发现系统用不起来,追查原因都出奇地一致——最基本的数据准确性问题没有解决,最多只能算算电量。
“你说设备连接起来就是物联网?真没这么简单。一会儿电量表数据跳变、一会儿无连接,怎么监控?很多风机状态都不准,敢不敢远程复位?总之,如果物联网的边缘计算不可靠,人还是撤不下来。”EnOS™大数据平台架构师闫博士直言不讳,“物联网的CAP实践难度比互联网高许多,远端网络容错度成倍降低,系统的一致性和可用性就必须更精细的平衡设计。数据模型上,以前在互联网做大数据,本质上是离散数据管理,一单就是一单,哪里像传感器数据,是连续数据,成千上万设备要做到近乎任意时间维度的查询、分析,这需要大量的抗干扰算法、告警算法,才能保证数据质量、甚至说起码的系统功能。”
远景持续七年的投入,攻克了无数细节上的魔鬼,近100GW项目的产品化积累,才和客户肩并肩基本解决了数据连接、采集、运算、质量控制等难题,这些是数字化的基础。
在接下来的数据分析上,机器学习无疑是最佳技术,但是如何能够将机器学习和大数据结合起来,长期解决业务挑战,而不是做一两个样板项目,做一两项原来物理模型方法没有的发现,这需要在组织上进行创新。
远景基于EnOS™能源物联网平台开发的Ensight产品,基于2PB高质量数据和机器学习算法包,训练设备健康度模型,衡量发电性能和设备健康度,提供关键部件的健康度预警与状态维护提示,从而实现预测维护。Ensight Wind基于海量数据与机器学习技术,不断优化算法,实现风机发电性能与设备亚健康状态识别告警,进行预测维护,减少大部件故障造成的非计划性停机损失,使故障风机提升等效利用77小时。
远景一直很清楚,机器学习并不是挖几个算法大牛就可以实现的。“几年前我们也认为招些数据算法专家就可以发掘数据里的价值,但实践发现学习能源领域的垂直领域知识很关键,否则传统机器学习所发现的一些规律,对垂直领域来说,不过是常识,精度能不能做到极致先不论,仅一个不可解释性就让你举步维艰。”EnOS™大数据平台架构师闫博士说。
他找到的解决方法是让机器学习的专家和领域技术骨干相互学习,每两周举办一次培训,让机器学习的人弄明白能源领域的理论知识,“不仅是文字表达的讲懂,更要把里面的数学模型、物理模型公式都看懂”。反过来原来的领域专家则要学习python语言和算法包,还要参加软件培训,大家做真正的“跨界”人才,用闫博士的话说就是“让大气动力学的领域专家学神经网络,让神经网络专家搞懂流体力学。”