【关键词】大数据 钻具组合 辅助设计
MapReduce
石油钻井设计是一个不同于一般工程设
计的复杂过程,需要针对地层岩性特点、造斜
能力、井深结构与钻井参数等,设计出多种下
部结构优化的钻具组合方案,并从中确定最优
方案。由于钻井设计所涉及的因素和限制条件
较多,在进行设计时,通常都要参考和借鉴以
往类似设计的数据与结果。因此,为提高钻井
设计的效率、可靠性和适应性,本文运用大数
据中对海量数据分布式存储管理和并行分析处
理的能力,构造基于大数据的钻具组合辅助设
计系统,提出一种基于大数据的钻具间关联性
分析方法和算法,从而为钻井设计人员提供快
速有效的辅助支持。
1 基于大数据的钻具组合辅助设计系统
总体结构
随着各油气钻井企业将信息网络技术不
断应用于油气钻井工程领域,多年来,积累了
大量的油气钻井数据信息。然而钻井作业地区
跨度大,数据来源广泛、数量巨大,各油气钻
井企业的数据信息彼此割裂、难以共享,传统
数据处理方法效率低、时间长、集成难。因此,
本文运用大数据的理论和技术,基于云计算开
放式网络服务架构,结合Hadoop/MapReduce
技术,构建基于大数据的钻具组合辅助设计系
统的总体结构,如图1 所示。
系统采用大数据和多租户的理论和方法,
结合Hadoop/MapReduce 技术,将分布在不同
地区钻井企业钻具组合设计所存储的数据作为
节点数据库,以分布式存储的方式,设计构建
文/方明 李欣
钻具组合设计通常要借鉴以
往类似设计的数据与结果,而相
关数据信息因钻井作业的特殊性,
具有分布广、数据量大,难以集
成等问题,本文采用大数据的理
论和方法,构建基于大数据的钻
具组合辅助设计系统的总体结构;
提出了一种钻具间关联性分析方
法,同时,给出了基于MapReduce
的钻具间关联性并行分析算法,
从而能有效地为钻井设计人员提
供辅助支持。
摘 要
面向大数据的钻具组合辅助设计分布式数据
库,并建立支持为不同设计人员定制的多租户
共享存储架构和并行访问控制模式。采用云计
算开放式网络服务架构,结合用户创造内容、
Web2.0 技术,设计实现系统数据信息资源的
注册、管理、调度和使用的资源的协调机制与
管理策略。针对以往数据组织多是面向部门和
以油井为主题的,缺少相应的分析,不便于设
计人员应用,提出基于大数据的钻具间关联性
分析和钻具数据组织方法,构建相应的基于大
数据的钻具关联分析平台、基于大数据的钻具
数据组织平台和钻具辅助设计工作平台,从而
支持设计人员能根据需要,通过有针对性的分
析和数据组织,快速、方便、有效地参考和借
鉴以往钻具组合设计信息进行钻具组合的设
计。
2 基于大数据的钻具间关联性分析方法
基于大数据的钻具组合辅助设计系统的
重点,在于对以往各钻井企业各油井钻具组合
数据信息的有效分析和利用,从中挖掘和发现
有助于设计人员进行钻具组合设计的有效信
息。在钻井过程中,一口井钻具的使用是由钻
井设计所形成的钻具组合来确定的。表1 是某
油井钻具组合设计表:
表 1 所示油井根据地层情况分三次开钻
钻进,每次开钻所使用的钻头、管材等大小、
型号、强度不同,并且从钻头到钻杆等逐项连
接形成,钻具间有一定的关联性。本系统钻具
间关联性分析方法的核心思想是针对钻具组合
的特点,以钻具间关联频次为基础,对以往钻
具组合设计中包含的钻具间关联性进行分析,
形成钻具间的关联链,从而有效地为钻井设计
人员提供辅助支持。有关概念和分析方法定义
如下:
定义1:钻具间的关联度
设W 为不同油井钻具组合设计集合,D
为W 中钻具集合,di
k、dj
k ∈ D 表示W 中各
油井第K 次开钻钻具组合中两个不同钻具,
则di
k、dj
k 间的关联度r(di
k,dj
k) 为di
k 和dj
k 在
集合W 中不同油井的第K 次开钻钻具组合中
同时出现的次数。
定义2:钻具关联邻域
给定数值ε>0,且di
k ∈ D,则钻具di
k 的
ε 邻域为ε(di
k)={dj
k, 其中dj
k ∈ D ∧ r(di
k,
dj
k) ≥ ε}。
定义3:钻具关联链
设d、e ∈ D, 给定数值ε>0,若存
在d1
k,d2
k,…, dn
k, 其中d1
k=d,dn
k=e, 且di+1
k
∈ ε(di
k), 则称钻具d、e 间存在关联链; 若
e ∈ ε(d),则称钻具d、e 是直接关联。
定义4:钻具集合上的关系
设W 为以往不同油井的钻具组合设计集
合,D 为W 中出现的所有钻具的集合,定义
图1:基于大数据的钻具组合辅助设计系统的总体结构