前言
油气行业的各位同仁,无论您是从事上、中、下游哪个环节,我想近年大家一定在各种渠道频频听到大数据(Big Data)和数据科学(Data Science)的概念。那么究竟什么是大数据,什么又是数据科学呢,它们说完全同一个概念吗 。在油气领域它们究竟有什么实际的应用,真的带来了附加值吗?
笔者基于自己的认识,从大数据和数据科学的基本概念出发,逐步引出今年10月份JPT杂志中谈到的Devon石油公司如何使用数据分析技术给公司带来附加值。
1. 大数据 (Big Data)和数据科学 (Data Science),它们是什么?
大数据描述数据的特征。在数据分析领域,大数据的特征已经形成了比较统一的认识,核心就是“3V”。换句话说,谈大数据就不可不知道“3V":
- Volume (容量):产生和存储的数据容量巨大;
- Velocity (速度):数据产生速度较快,数据的传输和处理具有实时性。例如实时交通数据;在油气领域,比如生产井中的测量仪(downhole gauge)和海上平台的传感器(sensors)的产生的 实时数据;
- Variability (多样性):数据的类型和格式多种多样,比如文本、email、视频、音频、图片、财务交易等各种数据。
在不同的应用领域,可以再加入“3V”以外的一到两个特征。以笔者看来,在油气领域,如果数据具有3V中的一个或者以上的特征,都可以叫大数据(Big Data)。文章源自云智设计-https://www.cidrg.com/news/forward/14890.html
文章源自云智设计-https://www.cidrg.com/news/forward/14890.html
那数据科学(data science)科学又是什么呢?顾名思义,就是从数据中获取知识和信息的一种科学方法。严格意义上说,大数据和数据科学在应用中的侧重点还是有所不同。大数据的应用范围一般指数据的产生、存储、整合和整理,它需要更多的计算机领域的知识。而数据科学则强调数据的分析和可视化,更多需要统计、机器学习、数据挖掘等知识。
文章源自云智设计-https://www.cidrg.com/news/forward/14890.html
在数据科学领域,最近还有一个很热的词叫Business Analytics (业务分析),JPT封面用的词是Oilfield Analytics(油田分析)。这里的Analytics是指把业务领域问题转成数据科学问题的分析方法。在应用领域,人们往往把Big Data、Data Science和Analytics几个词语混用,并没有特别明显的分界线。
2. 油气从业人员该扮演什么角色?
前面提到了大数据和数据科学需要计算机、统计、机器学习等方面的知识,那作为传统的油气从业人员,比如钻、完井工程师,油藏工程师,生产工程师,地质学家,那数据科学是不是和我没什么关系?当然不是。领域或行业专家才是数据科学成功应用的关键所在!文章源自云智设计-https://www.cidrg.com/news/forward/14890.html
3. 下面我们看看2016年10月份JPT杂志分享的Devon石油公司的几个数据科学应用实例:
(1)定向钻井
井下钻具(BHA - Bottom Hole Assembly)装备有地质定向(geo-steering)设备,其离最前面的钻头有一些距离,并且每90 英尺才作一次定向测量 (survey),也就说两次地质测量间的井筒轨迹(Well Trajectory)有超过100英尺是未知的,需要从测量数据中推算出来。Devon公司因此开发了基于人工智能和机器学习的实时钻头跟踪程序,更为准确和真实的推算出井筒的真实轨迹。定向钻井数据从油田现场实时地传回公司的钻井部门, 钻头跟踪程序把井筒轨迹实时地可视化地呈现给钻井工程师,如果轨迹偏离了既定轨迹,工程师则可以实时作出调整。
Devon公司另外一个在钻井中的应用就是建立数据模型来分析井下钻具(BHA)配置和钻井性能(drilling performance)的关系。例如,该数据模型可以判断出井的哪个部分可能给钻井工程师带来麻烦(non-productive time),哪一项或者多项参数(钻头类型 drilling bit,钻杆重量 weight-on-bit)最影响钻井的快慢(rate of penetration)。文章源自云智设计-https://www.cidrg.com/news/forward/14890.html
(2)预测压裂中的支撑剂(proppant)堵塞 (screen-outs)
水力压裂中的支撑剂堵塞是指支撑剂不能再流入裂缝而堵塞在井筒中。支撑剂堵塞非常令人头痛和棘手的问题,工程师都希望能及时避免而不是发生后再去解决。如果在堵塞发生前有程序自动发出堵塞警示,那么压裂工程师则可及时暂停泵入支撑剂。
Devon公司开发出了提前15秒警告支撑剂堵塞即将发生的人工智能程序,该程序在使用中逐步演化(evolve),目前已经成为可以基于多项因素(压裂液类型,地层特征和油田开发历史等)作出决定性判断的程序,大大降低了公司支撑剂堵塞发生率。
(3)全美页岩区块剩余油气可视化 - 交互式地图
交互式地图程序包括了全美陆地48个州 (Lower 48) 过去10年10万口水平井的数据。每重新计算一遍当前所剩余油气量并以交互式地图的方式呈现出来,只需短短10分钟时间。工程师可以使用该交互式地图快速地作出至少两类重要的决策:
a. 快速找出理想的再次压裂井 (refracturing candidates)
b. 快速找出理想的矿权租赁区块
(4)人工举升 (Artificial lift)设备维护
常规的油田设备维护是周期性的 - 现场技术员按先后顺序周期性地巡视和检查人工举升设备。基于设备故障的大量历史数据,以及每次故障相关联的各种因素,Devon公司开发出了可以预测哪些井的人工举升设备更有可能出现故障,从而不再使用周期性的设备检查方式,而是由数据分析程序每天自动地告诉现场技术员需要巡视和检查的设备。这种方式大大降低了设备故障率,并且节省了大量开支。
4. 结语
诚然以上几个实例离不开数据分析人员,而笔者认为成功的关键是领域专家 (钻井工程师,压力工程师,油藏工程师/地质学家和生产工程师)与数据科学家的紧密合作。前者的领域知识是保证数据模型准确率的关键。
Devon公司从2012年开始投资大数据相关技术以来,水平井90天产量提高了250%,而钻井、完井和运营费用下降了40%。除去油价下跌带来的供应商降价,数据科学的应用也功不可没。
数据科学(数据挖掘,机器学习,人工智能)并不是新兴事物,如何在油气领域中有效地利用这些工具并带来价值,才是关键所在,值得我们每位从业人员思考。文章源自云智设计-https://www.cidrg.com/news/forward/14890.html 文章源自云智设计-https://www.cidrg.com/news/forward/14890.html
评论