阳光石油网|石油技术交流|石油人论坛

 找回密码
 欢迎注册
楼主: Joseph

[Petrel使用技巧] 闲扯地质统计学

  [复制链接]
  • TA的每日心情
    开心
    2025-2-6 10:48
  • 签到天数: 242 天

    [LV.8]以坛为家I

    发表于 2013-12-23 21:36:33 | 显示全部楼层
    转播求扩散!
  • TA的每日心情
    奋斗
    2021-9-6 20:56
  • 签到天数: 327 天

    [LV.8]以坛为家I

    发表于 2013-12-23 23:48:35 | 显示全部楼层

    闲扯地质统计学
  • TA的每日心情
    开心
    2014-1-11 00:20
  • 签到天数: 38 天

    [LV.5]常住居民I

     楼主| 发表于 2013-12-24 13:08:23 | 显示全部楼层
    本帖最后由 Joseph 于 2013-12-24 13:13 编辑

    继续我们的闲扯,呵呵。
    做软件培训的那些年,最容易被问到的一个问题就是:什么样的参数最好,或者大致怎么设。老实说,这是极难回答的问题,因为真正来说,只有理解了油藏规律的人才真的可以找到参数设定的规则。当然,有时候也难免和别的培训者一样懒得去细掰扯这些,干脆给一些指标:什么Lag Tolerance (注意:Petrel中此项参数是写做Lag Distance的)要设定为一个到一点五个井距啦,什么Lag的个数一般设为七个啦,什么Tolerance Angle应该小于九十度啦,什么Band Width要在半个到四分之三个井距啦,诸如此类。为什么可以真的这么说呢,其实你仔细想想也就都清楚了。
    就像我们讨论过的,地质统计学是建立于你对于油藏的现有认识基础之上的数学实现的基础,地质统计学模型中要表达的是你对于油藏各种物性属性的规律性认识。没有了地质统计学建模就好比你的数字照相机没有存储卡一样。
    我自己不懂股票,但是我知道很多人都参与其中,所以我愿意给你说一个股票行当的例子来告诉你地质统计学是怎样的东西:
    Capture.PNG
    这是我随便在网页里Google到的一个最常见的分析图,其中比较突出的是在其中的蓝色、粉色、绿色和红色的线,这些线其实就是不同采样之后回归得到的股票的升降规律曲线,换言之,就是股市的“变差函数”。如果有人拿这个函数的预测结果真的去买了股票他真的会赚到预期的那么多钱吗?答案几乎是肯定的,不会。但是为什么股民都要去关注这些函数呢?因为这些函数代表了总体趋势。
    这就好比我们都知道扔硬币出“字儿”的概率是百分之五十,但是我们不会因此在第一次出了“背儿”以后压宝说肯定出“字儿”。
    一直以来,把“地质统计学”神秘化是某些软件培训师的把戏:他们要么就是深知自己的东西不足以与油藏描述这个大课题相呼应,要么就是干脆自己也说不清楚。但是,这样的神秘化操作其实从根本上贬低了地质统计学的地位。对于地质统计学神秘化把自身地位贬低,我愿意说一个很重要的例子:就是现在仍有很多中国的决策层领导至今还没有接受地质统计学观点。这实在是我们这个战线最大的悲剧。有一次我去某油田讨论一个项目,我说我可以给出一个储量的分布让我们的储量估算更加科学。领导说,你给一大堆储量,到底哪个是对的?其实,哪一个是对的,如果让容积法的人来说他会比我更加胆怯。可是,很多油田就直接简单的认定他们辛苦计算的那个储量是“对”的。(请有时间的时候想想我前面举的扔硬币的例子,这么简单的行为你都没有绝对的把握,那么复杂的油藏你拿什么去赌你是“对”的?)。进而产生出一个有趣的结论就是:地质建模是数学游戏。我认为,这个事实,就是我们这些Geomodeller的现实的悲剧。而这个悲剧的产生和一些给“地质统计学”制造神秘色彩的行为具有一定的联系。
    所以,从某种角度来说,我们把地质统计学狭隘的关联到“变差函数”也是我们最后无法向我们的领导、我们的客户讲解技术层面问题的缘由之一。我因为有一个朋友问到了地质统计学,所以愿意陆陆续续的把这个问题剖析清楚。至少,我希望他能通过这些文字明白:一、地质统计学是很直接的科学,它和其它统计学知识一样理性和规律化。二、地质统计学具有非常广的外延,因此而得到的很多信息将对于我们今后的生活产生深远影响。
    ——噢,不是说我的啰嗦就此止步了,还有很多东西要说呢:比方说“变差函数”的类型啦,“变差函数”的参数啦,克里金算法啦,序贯高斯模拟算法啦。

    点评

    这一番牢骚烦请对照4楼的精彩点评来看,立刻就知道大师为什么是大师了!  发表于 2013-12-24 18:12
  • TA的每日心情
    开心
    2014-1-11 00:20
  • 签到天数: 38 天

    [LV.5]常住居民I

     楼主| 发表于 2013-12-24 13:20:09 | 显示全部楼层
    本帖最后由 Joseph 于 2013-12-24 13:21 编辑

    [ 我相信会有很多高校的教程讲地质统计学,但是最后却把地质统计学讲成了纯粹的数学或者计算机应用一类的东西。所以我谈地质统计学宁可是舍弃了这种最容易的严谨表述的形式,而采用一种博客文体,尽量用家长里短和比喻来说明其中的意思。但是需要提请注意的是,如果你真的感兴趣于这种科学本身,不要再继续阅读下去了,我推荐你去看几本经典:
    Clark 《Practical Geostatistics》,入门好读物
    Davis 《Statistics and Data Analysis in Geology》,偏理论的介绍性读物,要求有一定数理基础
    Isaaks & Srivastava 《Applied Geostatistics》,相当深入的一本教程
    Mallet 《Geomodelling》,如果学习GOCAD,这是一个最基本而且直接的选择,就是艰深了点
    C.V. DeutschGeostatistical Reservoir Modeling》,最值得推荐的
    Jean-Paul Chiles & Pierre Delfiner《Geostatistics: Modeling Spatial Uncertainty》,最值得推荐的]
    闲话少叙,书归正传。
    我用比较浅显的词句对于模型的过高期望和对于地质统计学的神秘化进行了一些辩解,那么会不会因此我就得出结论说:模型是没有预测性质的呢?当然不是。无论哪种科学,作为科学不可避免的要做两方面工作:a、总结经验;b、推广经验。模型作为一种深层次的认识总结当然具有预测的意义,否则我们根本就不会叫那个东西作“模型”。那么需要回答的问题就是:模型具有怎样的或者说多大的预测性?
    其实,这个问题的答案本来我们是知道的。我们做变差函数就是为了找到预测的偏差度与距离的关系,那么从道理上来说,我们就应该知道模型是如何从一个已知点几乎100%可信到完全不可信的过程。

    同样的Sill、同样Nugget和同样的Range情况下的高斯、球形和指数模型。这三种函数形式是最常见的模拟方式,所以我们暂时以此为说明。仅仅从图上来说,当然高斯函数是理想的,几乎在整个Range范围内都是取最低的变差,这意味着你对于你的预测结果的信心很强,其数据的变化也是比较缓慢的。换作指数模型则相反,你对于预测的结果似乎不那么确定,变化的可能性肯定要加大一些。把不同的算法和参数并列在一起然后落实自己工区的需求是肯定的。但是仅仅从理论上来说我们也可以知道:高斯型的结果连续性好,指数型则连续性差,而球形则居中。
    那么,接下来的问题是:哪个模式是你所需要的?在数据保有量很大的时候其实这个问题由数据本身负责就可以,因为数据统计得到的规律是最好的选择。但是如果数据不是很多(井稀少),或者由于相带参与(相控)等因素导致数据不能被充分利用(其它如井在工区内的分布严重不均衡)都会导致我们无法直接从原始的变差计算散点中看到规律,或者说看对规律。你该怎么办?这个情况经常发生,很多人也有经验去应对:平缓变化的相带使用高斯模式,变化较剧烈的想带使用指数模式,增加地震属性参与,增加平面趋势控制,增加垂向趋势控制等等。很多不错的想法,我先不一一去点评,只是提醒一点,在这种情况下你要知道你的模型的可信度是严重下降的。
    这儿要指出的一个建模的误区是:在数据空白地带增加“控制井”。其实,正如我们一再强调的,当数据不充分的时候模型的可信度就会下降,这是一个自然的情况。人为在未知的区域增加虚假的“控制”数据就等于把一些本来可以评估的可能性变成了一个假设的肯定。这和我曾经提到的做储量模拟直接在孔隙度和含水上做文章一样。而且这个行为是一个类似于吃毒品的方式在工作,开始可能很兴奋,也确实可以收到意向中的结果;但是随着你的研究的深入,你要么是最终选择放弃这种原始的工作方式“抄近路”,要么是最终让它同化成认为一切成果都是虚幻构建起来的。正是这种“抄近路”让地质建模的科学性大打折扣,最终沦为其它学科的附庸或者报告的花边。作为行里人,我们应该知道我们的职业操守底线,否则我们只是这个行业的“蠹虫”。

  • TA的每日心情
    奋斗
    2023-5-17 09:51
  • 签到天数: 542 天

    [LV.9]以坛为家II

    发表于 2013-12-24 17:56:50 | 显示全部楼层
    写得太好了!!咋么送花呢,我要给你送朵花!!
  • TA的每日心情
    开心
    2014-1-2 11:00
  • 签到天数: 29 天

    [LV.4]偶尔看看III

    发表于 2013-12-24 23:26:52 | 显示全部楼层
    看完了感觉有几句话想要说:
    第一、地质建模不是地质统计学所能完全概括的,地质统计规律做好了不代表建立的模型就是完美的,但是不满足地质统计规律的模型没有任何意义。
    第二、影响地质模型输出结果的因素有很多。如果用随机模拟,SIS做相,相约束下的SGS做孔隙度,孔隙度协同下的SGS做渗透率。这个过程中有另外一些重要的因素需要考虑,(1)、相用什么约束?(2)、同样的约束条件下,随机过程的影响有多大?我个人的经验,通常情况下直接做岩相(砂-泥),平面用砂地比平面图做趋势面约束,纵向用井统计的纵向分布曲线约束。但是影响更大的是随机过程(即随机种子值 seed number),曾经做过一个敏感性分析,考虑随机种子、主次变程、方位、孔隙度cut-off值对模型地质储量的影响,结果发现随机种子影响最大,孔隙度cut-off期次,编程第三,方位最小。
    第三、目前国内建立地质模型都是一个唯一的模型,而实际上不管是地质研究还是地质建模,都存在极大的不确定性。众多不确定因素的组合可能会使得地质认识存在较大的允许空间,也就是说在满足所有认识的情况下,可能会有许多种不同的地质模型(这里我指的不是随机实现的模型),而是不同的模式,如下图:
    图片2.png
    这里三种不同情况下砂体的连通关系不一样,如果我们有更多的动态资料来对其进行验证可能我们能否定其中的2种,或者3种都是错的,需要重新考虑,这都有可能,但是在没有足够动态资料的前提下,我们是不是有必要考虑多种不同的可能性呢?
    第四、地质统计学不仅仅应该在建立地质模型之前用,同时也应该在模型建立之后再用一用,用来检验地质模型的输出参数与输入参数是否一致。
  • TA的每日心情
    开心
    2014-1-11 00:20
  • 签到天数: 38 天

    [LV.5]常住居民I

     楼主| 发表于 2013-12-25 01:02:17 | 显示全部楼层
    benbiao 发表于 2013-12-24 23:26
    看完了感觉有几句话想要说:
    第一、地质建模不是地质统计学所能完全概括的,地质统计规律做好了不代表建立 ...

    benbiao,恕我冒昧,先在这里对你的观点作个小说明(但是你所提及的事情的确是我们稍后阶段会着重一一说明的部分,所以我还不便于马上扩展那么细致)。
    如果把你这些观点用一个词来归纳,如你在观点三中明确提出的,就是“不确定性(Uncertainty)”问题。


    观点一,地质建模之所以不能用地质统计学来概括(你使用了完全,那就更可以确信)并非因为统计学本身的适用性出了问题,而是有一些先验理论可能暂时无法清晰的数字化表达。但是从另一个角度来说,其实任何确定性或者随机性的建模并不与地质统计学的理论相违背,没有非此即彼的对立。比如你在观点三中所使用的多种可能的概念模型,你只给了三种模式,而能够验证这些确定性模式的方式只有靠生产动态数据。那你肯定也会意识到其实生产动态数据并不能帮助你确定哪个模式是对的,而只是能否定哪些模式肯定是错的。换句话来说,在可能正确的模式下还是存在多种——甚至也可以说是无数种——更小模式的可能性。如果用统计学的说法就是,你可以通过后续的信息来降低模型的不确定性,但是还是无法消除不确定性。


    观点二,你这个讨论在不确定性分析中叫做敏感性分析(Sensitivity Analysis),当然你规定了4种参数来讨论,并且得出结论说Seed Number——我们会在后面的讨论中给大家解释这个数字的本质意思——影响最大,即,现在4个参数中你作了针对性的Ranking。但是你要明白一点,任何地区其实都需要作Sensitivity Analysis,而且其结果自然会需要Ranking的。也许在你工作的经验来说,这样的规律是重复发生的,我们非常高兴看到你有这样的成就;但是我们需要你能突破你的经验,把更多的参数考虑到Sensitivity Analysis上来,把Sensitivity Analysis的工作做到更贴合你的油田需要上来。


    观点三,越少的信息带来越大的不确定性是肯定的,我们这些一线工作者其实对此并无异议。关键其实是这些多解性、这些风险性如何更加直接和有效的传递到决策阶段。

    观点四,其实地质统计学,或者说任何统计学,都没有提出过一次建模就完成了全部过程。对于统计学来说,样本或者信息的增加都是对于模型的检验和修订过程,并且通过这样的过程来提高模型的预测能力、降低模型的不确定性。很多油田事实上早就在利用油田模型的不断更新来指导生产。只好像是我国某些特定机制下才导致了模型不是在被随时更新而是一再被重新创建这样的尴尬之中。

    对于不确定性的认识,正是地质统计学的核心,甚至也可以说是统计学的核心!在此非常感谢你特意指出这个要点出来。

    点评

    尊重并感谢你的认真,期待后续的讨论  发表于 2013-12-25 07:52
  • TA的每日心情
    开心
    2014-1-11 00:20
  • 签到天数: 38 天

    [LV.5]常住居民I

     楼主| 发表于 2013-12-25 07:57:22 | 显示全部楼层
    本帖最后由 Joseph 于 2013-12-25 08:15 编辑

    好罢,我们暂时先把铅笔头儿的事儿放一放,说一说我一直在强调的观点:a在目前的地质世界里,我们没有唯一的那个“真相”,我们有的全部都是假设和推论;b统计学过程中你是一步一步远离你的具体数据而走向了数据规律性总结油藏规律性的总结和认识才是我们这项工作的真正目标所在。


    这个观点并非基于狭隘的地质统计学,更非基于更狭隘的序贯高斯模拟系列的计算机技术而起。这个观点,烦请对照4楼引用的统计学大师乔治-博克斯的那句最有名的名言“总体来说,所有的模型都是错误的,但有些是有用的”。(注意:博克斯所谓的模型并非我们所谓静态模型或者动态模型这么狭隘的东西!Wikipedia甚至今时仍未有中文版小传给这位大师,对此感兴趣的同学只好先参观一下英文版


    首先要跟大家说一个显然的、但是异常痛心的事实——因为我们的教育体系是继承了前苏联的模式,我国国民的基本教育导致了我们对于统计学的理解层次是错误的。


    百度百科:
    统计学(statistics)是应用数学的一个分支,主要通过利用概率论建立数学模型,收集所观察系统的数据,进行量化的分析、总结,并进而进行推断和预测,为相关决策提供依据和参考。它被广泛的应用在各门学科之上,从物理和社会科学到人文科学,甚至被用来工商业及政府的情报决策之上。



    维基百科/Wikipedia:
    统计学是在统计实践的基础上,自17世纪中叶产生并逐步发展起来的一门社会学科。它是研究如何测定、收集、整理、归纳和分析反映客观现象总体数量的数据,以便给出正确认识的方法论科学,被廣泛的應用在各門學科之上,從自然科学社會科學人文科學,甚至被用來工商業政府的情報決策之上。



    所以,我们一直以为统计学是数学的分支,是概率论的延续;而早在18世纪,西方人已经明确了统计学是类似经济学、社会学、数学、物理学、化学等基础学科之一。(其实,很多时候,统计学甚至是其它基础学科的基础。你看看后文会特别容易理解。)



    我们从一个最生活的场景开始:今天早上你一出门儿,看到斜对门儿宿舍出来一个同学。你一估算,这家伙二十多岁。请问:你怎么估算的?有人会随口说:我猜的啊。更逻辑一点:他念这么多年大学,大致推算云云。但,我告诉你,这是你本能的在使用统计学,你信吗?


    你信吗?统计学是你生活中必须要使用的。你估计那个同学的年纪也许可以通过柯南小朋友式的严格逻辑推理,但是在你第一眼看到这张面孔而反应出他的年纪的时候你是根据类似面孔的经验来作一种规律/趋势的预测。换个场景,如果你跟我一样不熟悉俄罗斯人或者黑人的面孔,你在猜测他们年龄的时候的准确度就会低很多。为什么?你可以理解为人生经验匮乏,也可以像我一样理解为样本覆盖率不足。如果你把你现在的学习过程都反思反思,你会发现很多所谓的经验都是统计学本质的。好比说我们说阳光总坛主的“爱派科技”受到普遍好评这样的事情,你仔细想想也是要拆解作一个一个样本的培养而来的。比这个更加隐晦一点儿的,学习写字。学习毛笔字的人更知道“永字八法”,因为一个字要包含各种中国字的笔画,怎么想到的这个“永”字?不用我说,你想想。

    在说一个,各大学普遍会流传某些“面经”,就是面试宝典。你仔细想想这些面经能够流传的因素是什么?它并非精确的对应了你,它只是很大或者部分程度的适合了你的需要。这,也是统计学。

    然后我们还要接茬儿说说“不确定性”在生活中的实例。我们还是接茬儿说从你斜对门儿出来的那个同学,你猛一看四十大几了。--》然后仔细一辨认原来他正是阳光石油论坛的Joseph,听说是1972年出生的,算来应该是四十一周岁。--》然后再更仔细一打听他好像是10月的生日,乖乖浪个东,这家伙已经四十一岁另两个月了。--》然后再更更仔细去了解他确实是10月20日的生日,算到2013年的圣诞节这家伙已经是四十一岁另两个月又五整天。......按照这样的逻辑你能说准确我的岁数吗?你一直不过是依据信息的补充更新我的岁数模型在逼近着,逼近着,对罢?量子力学有个“不确定性原理”,其实事情根本没有必要说到原子核这个程度才遇到。每个人仔细想想自己的准确岁数,你是无论如何也说不上来的——你说的时候它就在发生着变化!有趣罢?这就是不确定性,这就是你天天都在用却未必意识到在用的统计学。


    认识埋藏在地下的油气田,你猜测了多少种模式?这非常重要,好比是从《千金方》上抄来的验方。但是你必须根据眼前这个情况来增减各药剂可能的配比才能让病人最快复原。但是增加一钱就是精确的一钱吗?如果仔细想,一钱也不过就是个逼近一钱的重量。那么同样情况却极有可能更加不容易判断的油气田的孔隙度、渗透率的波动呢?


    中国的教育,尤其是早期教育,附着了过多的“是非对错”这样绝对的大观念,所以中国孩子最不能理解的就是我们在认识这个世界的时候会存在一定程度的模糊性,甚至最容易精确的事情其实都是模糊的!如果各位跟我一样上过普通物理实验课,你就应该记得第一堂课教会你的是“不要说一个尺子长10厘米”,要说平均多少次测量10后面还要有正负的偏差。但是,大学老师不能把这个理念向诸位扩展,因为在现行体制下我们确实有“绝对正确”,你回头考试没写清楚一个词句也会被判个叉子在上面。但是,如果各位能回想回想自己的生命经历,其实不难发现除了老师规定的“是非对错”其实没有什么是可以说得上确定无疑的,只是多大程度的精确罢了,不是么?


    对于你研究的地下永远不能去看一眼的所在——像我开玩笑说的:一个可能没有尸体和凶手的现场——你必须更加包容你的认识可能存在的局限性,你必须承认了这个局限性才有机会降低自己的决策风险。


    对于更加深入的不确定性的说明,我会在讨论完算法以后展开,这里只是给各位作个小引子罢。谢谢你的时间!



  • TA的每日心情
    奋斗
    2023-5-17 09:51
  • 签到天数: 542 天

    [LV.9]以坛为家II

    发表于 2013-12-25 20:07:09 | 显示全部楼层
    感谢楼主!能看见这样的好帖子,简直是太感动了!感谢楼主这样花费时间和心思。
    “对于更加深入的不确定性的说明,我会在讨论完算法以后展开,这里只是给各位作个小引子罢”
    很期待!!
  • TA的每日心情
    奋斗
    2023-8-12 20:11
  • 签到天数: 1891 天

    [LV.Master]伴坛终老

    发表于 2013-12-26 11:24:42 | 显示全部楼层
    说的太深刻了,学习了,
    顺便说一句,理论再加上具体的软件操作就好了,

    点评

    花又跑楼上去了,你稍等等哦。  发表于 2013-12-26 11:57
    谢谢建议,给你朵花。这个部分大多数文字是在公寓的Mac小本上敲的,所以相对思考更多,结合软件更少一些。  发表于 2013-12-26 11:56
    您需要登录后才可以回帖 登录 | 欢迎注册

    本版积分规则

    QQ|Archiver|手机版|小黑屋|阳光石油网 ( 鲁ICP备2021003870号-1 )

    GMT+8, 2025-2-23 10:50 , Processed in 0.058883 second(s), 23 queries .

    Powered by Discuz! X3.4 Licensed

    Copyright © 2001-2021, Tencent Cloud.

    快速回复 返回顶部 返回列表