直面大数据
不久前,互联网巨头马云在一封内部邮件中提到的,以控制为出发点的IT时代正在走向激活生产力为目的的DT(Data Technology)数据时代。这不仅仅是技术的升级,更是思想意识的巨大变革,大数据应用已经成为各行各业的前沿领域。作为正向能源互联网转型的能源电力行业,大数据时代的到来为能源电力行业的发展带来了新的机遇,有可能产生革命性的影响。
其实,在能源电力行业,数据的分析利用并非新鲜事物,在油气领域,地面上的作业者对于地下几千米处的油气藏的情况只有通过数据分析才能判断,在钻探和开采的过程中,也只能通过过程数据来推测井下情况。在电力领域,由于电力“发输变配用”系统的紧耦合性和生产消费的即时性,电网公司和管理机构也只能通过各项电网运行数据的分析来解读电网的运行情况。
但过去能源电力行业的传统数据分析手段的本质还是统计学分析,总是试图按照分析者过去的经验来解读未知并且多变的世界,总希望用尽可能简单的模型来归纳现实世界中无比复杂的各种现象。这背后的原因,既有过去数据采集、储存、分析能力不足的原因,也有传统统计学本身的巨大瑕疵。传统统计学的本质其实就是基于过去经验寻找普适规律,但是知道规律并不代表能预见将来。举个能源电力行业的例子,风电所适用的空气动力学的物理规律并不复杂,牛顿力学足以解释。但要计算整个风场的最佳效率,却是难上加难。
首先,虽然理论上,如果知道每台风机的准确布局,就能精确计算出每台风机的最佳效率。但是由于风场的风机数量众多,每台风机除了捕获风能发电外,对附近的气流还会产生一定影响,每台风机都会对后面的风机造成影响,之间所有的影响的叠加实在难以预计,理论上的计算是可行的,但实际中并不方便,这就是多个主体相互影响带来的复杂性。
其次,由于地表特征、热蒸汽和天气变化,地表气流变幻莫测,因此,风不仅是每天在变化,而是每时每刻都在变化。换句话说,风场这个动力系统对于微小的扰动是非常敏感的,这远比理想状态复杂得多。类似这样的系统,就是非线性的混沌系统,原来遵循简单规律的有序形态,在某种条件下突然偏离预期的规律性而变成了无序的形态。其实整个自然界包括人类社会到处都是非线性系统,但人类总是希望用线性系统来简单归纳这个非线性的世界,这其实是人类懒惰和无能的表现,也是人类面对无穷的混沌未知一种自我安慰和自我保护的鸵鸟手段。
过去,整个能源电力价值链还算比较简单,可以用简单的线性系统来近似模拟真实的非线性系统。但是,未来我们要面对的将是一个无比复杂的能源电力行业,到处都是非线性系统。在油气领域,传统油气生产正在转向各种勘探开采都十分艰难的非传统油气,比如页岩油气、海上油气、甲烷水合物、极地油气等。在电力领域,波动性极强的各种可再生能源正在全球范围内代替化石能源和核能,能源消费的随机性也在迅速增加。此外,由于互联网和信息通信技术的发展,未来电力整条价值链上的所有主体都能够积极参与互动,这和过去自上而下,消费者完全被动接受电力的电力系统完全不一样,因此数十亿主体之间的互相影响将形成一个超级混沌系统。而这种超级混沌系统的复杂性将让执著于因果的传统统计学分析手段完全无能为力。更重要的是,拜互联网所赐,不仅仅是能源电力价值链上各环节正在端到端融合,整个世界各行业之间也正在前所未有的快速融合,整个世界将变成一个数千亿智能主体互动的超级混沌系统。面对这种混沌,传统统计学手段已经力不从心,而关注相关性的大数据手段将是解释和预测的最佳手段。因此,大数据对于能源电力行业来说,不是个可选项,而是一条迈向下一代能源系统必须的道路。
相对于其他行业,能源电力行业的具有其特殊的数据特点。首先,能源电力行业数据类型繁杂,数据维度多。以配电网为例,不仅包括各节点的电压、电流、频率、有功和无功功率等,还包括大量的消费者的能源消费数据。此外,采集的数据既有结构化数据,又有非结构化数据。而且非结构化数据越来越多,包括网络日志、气象图片、地理位置信息等,这些多类型的数据对数据的处理能力提出了更高要求。
其次,能源电力行业价值密度低。由于能源电力数据多为常规性数据,一个风力发电机运行的过程中,在连续不间断的监控过程中,有用数据可能仅有一两个,价值密度的高低与数据总量的大小成反比。
另外,能源电力行业对数据处理速度要求高。电力行业要求实时的电力电量大平衡和瞬时性,因此巨量的用电数据和巨量的发电数据,必须在非常快的时间内处理完毕,才能确保整个电力系统的安全和高效。