根据某种经验和我们的统计(并非地质统计)我们可以获得 DT vs RT的线性关系如图上红线所示,如果我们简单应用该线性函数,那么所谓的E(AC(x))就是非常明确的红线上的具体位置了。当然我们知道统计回归函数反馈结果会有一定的偏差度,但是我们在没有实测的时候无从判断具体准确的偏差度。克里格先生说,我们可以根据现在数据的分布估算出偏差度,只要把数据的偏差度也计算进来我们对于预测就更容易把控一些。这是一个非常有趣而且大胆的转向:从这个假设开始,我们的插值算法不再追求测量点本身的最小预测误差,而是希望更多测量点上获得平摊预测误差最小。正是这个特点也导致了马特隆教授把这个算法能够升级为我们现在的整个统计学理论的数学基础。
你看Kriging算法的课程的时候老师都会说到一个关键的词“最优线性无偏估值(BLUE, Best linear unbiased estimator)”。有一个麻烦就出在了我们中文语言的模糊性上,这里说的“最优”、“无偏”常常会刺激到很多人的神经,有人甚至过于热衷于这样的名词而宣布他通过Kriging插值在后续预测验证中获得了比原来好得不得了的成功。
例文:(为免引发争议已经删除链接,读者可自行搜索)(这样的论文在中国有很多,但是如果仔细看看它用于对比的平面图件或者三维模型,行家大致也能看出更多的问题在于插值算法的参数设置不合理,而非算法本身问题。)如果一种算法明显优于其它算法,那么在现在的时代变迁中其它算法就会被淘汰,而不会再刻意保留在我们的商业化软件中。如果你不懂数学,你也可以从经济学角度来理解这个事情:如果土豆对于中国人民来说是优势的蔬菜,那么种植其它蔬菜的量就会显著减少,而再花费高昂代价从国外引进其它蔬菜的几率则更低。