期刊鉴别 论文检测 免费论文 特惠期刊 学术答疑 发表流程

基于协同克里金空气湿度空间插值研究

时间:2014-08-21 10:30 文章来源:http://www.lunwenbuluo.com 作者:胡丹桂 舒红 点击次数:

摘要:以东北三省(吉林、黑龙江、辽宁)38.90°-52.97°N,119.70°-132.97°E区域为试验区,利用东北三省1970-2009年气象站的空气相对湿度观测数据的40年平均值,采用普通克里金和协同克里金空间内插方法,估计试验区的空气湿度分布情况。结果表明,空气相对湿度和降水量具有显著相关关系。当选取其中46个观测值时,引入了降水量作为协变量的协同克里金的插值方法比采用46个观测值的普通克里金的插值方法的均方根误差(RMSE值)降低了7.66%;当采用同样的协变量(77个降水量站点数据),46个湿度观测值的协同克里金比77个湿度观测值的协同克里金的精度更高,均方根误差降低了20.58%。因此,引入了降水量作为协变量的协同克里金插值方法提高了插值精度,并且使用协同克里金插值方法可以适度减少观测站点数量。
 
  关键词:协同克里金;插值;湿度;降水量
 
  东北地区是中国最大的商品粮基地和农业生产最具发展潜力的地区之一,同时也是中国重要的工业和能源基地。东北地区位于北半球的中高纬度,是我国纬度最高的地区,是世界著名的温带季风气候区,是典型的气候脆弱区和受气候变暖影响最为敏感的地区[1,2]。近年来针对东北地区气候变化已展开不少研究。已有研究较多地关注气温、降水等方面,李莎等[3]将时空Kriging方法应用于东北地区气温空间插值研究中;贺伟等[4]将Morlet小波分析应用于东北地区气温和降水变化趋势研究中;孙力等[5]针对东北地区夏季降水变化的时空分布及变化规律进行研究。这些研究对于正确认识东北地区气候变化规律具有重要意义。但是以往的研究大多都是基于气温或降水的单一气象要素,而对东北地区空气相对湿度的研究却较少。在气候资源中,气温、降水和湿度与农作物及生物的生长发育有密切关系。气温和降水固然是气候资源中最主要的两个因子,但也不能忽视空气湿度这个气候因子。空气湿度的大小是形成天气演变主要因素之一,与生产、生活有密切关系,如农作物病虫害的发生直接取决于湿度的大小;空气湿度过大或过小对人体健康也有很大影响等。
 
  本研究对东北三省(黑龙江、吉林、辽宁)的空气相对湿度进行空间插值,利用有限的空气湿度站点数据来估算未知点的空气湿度。目前已发展了较多空间内插方法,如泰森多边形[6]、克里金(Kriging)内插法[7]、反距离加权平均法[8]、趋势面分析法[9]、多项式回归法[10]等。这些方法只是局限于观测站点的湿度值,没有考虑到降水量、气温、地形地貌、大气环流等因素对空气湿度的影响。而空气湿度与降水量具有直接的关系,我国一般通过降水量来划分湿润区和干旱区。800mm的年降水量为湿润区与半湿润区界线,400mm的年降水量为半湿润和半干旱区界线,200mm的年降水量为半干旱与干旱区界线。因此,在进行空气湿度插值时,考虑降水量的影响可以提高插值精度。为此,本研究针对空气相对湿度,选取不同的样本数,结合降水量的观测值,采用协同克里金方法对空气相对湿度进行插值,并对插值结果的精度与普通克里金插值方法得到的结果进行对比分析与探讨,同时对不同样本数的插值结果进行对比。
 
  1研究区域概况与数据处理
 
  1.1研究区域
 
  研究的是中国东北三省87个气象站点,站点地处38.90°-52.97°N,119.70°-132.97°E之间。地面观测台站所观测的资料来自1970-2009年东北三省日空气相对湿度和日降水量。由于气象台站观测资料不可避免存在缺测,本研究剔除了缺测较多的台站,共选择77个资料较好的观测台站。空气相对湿度选用不同的样本数,选用两种不同数量的观测值分别是77个和46个,而降水量共选用77个台站的观测值。具体情况如图1所示。
 
  1.2数据处理
 
  结合降水量对东北三省空气相对湿度进行插值,以得到更加丰富和准确的空气湿度信息。利用数据相对较全的1970-2009年的空气相对湿度观测数据,也就是对观测站的空气湿度的40年平均值分别进行普通克里金插值和协同克里金插值,并分别选取不同的样本数量,对不同样本数量的两种不同空间插值方法进行比较。
 
  40年的平均空气相对湿度分别选取46个样本数和77个样本数时的统计结果(表1)。从表1中可以看到,通过Kolmogorov-Smirnov法[11]对两种不同样本数的平均空气相对湿度分别进行正态检验的p-value分别为0.2360和0.2879,均大于0.05,因此认为符合正态分布。
 
  当选择多个变量信息进行插值时,第一信息有限时,合理有效地选择第二信息辅助插值是提高预测精度的关键。辅助因子的选择需要符合较易获取、与第一信息关联度强等特点[12]。根据研究目的,将空气湿度作为主变量,降水量作为辅助变量,将空气湿度和降水量这两种变量进行Person相关系数分析。从表1可以看到,当空气湿度选取77个观测值时,这两种变量的相关系数为0.548,同时达到了0.01显著水平;当空气湿度选取46个观测值时,这两种变量的相关系数为0.596,并且达到了0.01的显著水平,因而空气湿度与降水量密切相关,可以将降水量作为提高空气湿度插值精度的辅助变量。
 
  2克里金插值及降水量信息利用
 
  空间插值是通过已知样本值估计未知点的属性值或由不规则观测点数据生成连续表面或等值线。它的本质是根据给定的一组或多组离散点的属性值与空间位置拟合一个函数,该函数能充分反映样本点属性值与空间位置间的数学关系,从而推断研究区域范围内未知空间点的属性值。空间插值结果的精度受到插值模型、模型算法、尺度范围和样本代表性等多种因素的影响。
 
  2.1区域化变量
 
  当一个变量呈空间分布时,就称之为区域化变量。这种变量反映了空间某种属性的分布特征。地质、海洋、土壤、气象、水文、生态等领域都具有某种空间属性。区域化变量具有双重性,在观测前区域化变量Z(x)是一个随机场,观测后是一个确定的空间结构函数值。
 
  区域化变量具有两个最显著的特征,即随机性和结构性。一是区域化变量Z(x)是一个随机函数,多数时候它具有局部的、随机的、异常的特征;其次是区域化变量具有一般的或平均的结构性质,即变量在点X与偏离空间距离为h的点X+h处的随机量Z(x)与Z(x+h)具有某种程度的自相关性,而且这种自相关性依赖于两点间的距离h与变量其他结构特征。在某种意义上说这就是区域化变量的结构性特征。
 
  2.2普通克里金方法
 
  克里金法[13]是地统计学的主要内容之一,从统计意义上说,是从变量相关性和变异性出发,在有限区域内对区域化变量的取值进行无偏、最优估计的一种方法;从插值角度讲是对空间分布的数据求线性最优、无偏内插估计的一种方法。首先假设区域化变量Z(x)满足二阶平稳假设和本征假设,其数学期望为m,协方差函数c(h)及变异函数?酌(h)存在。即
 
  E[Z(x)]=m(1)
 
  c(h)=E[Z(x)Z(x+h)]-m2(2)
 
  ?酌(h)=■E[Z(x)-Z(x+h)]2(3)
 
  假设在待估计点x0的临域内共有n个实测点,即x1,x2,…,xn。那么,普通克里金法(OrdinaryKriging)的插值公式:
 
  Z*(x0)=■?姿iZ(xi)(4)
 
  式中,Z*(x0)为待估计空气湿度栅格值;n为用于空气湿度插值站点数;Z(xi)为第i个站点平均湿度值;?姿i为赋予第i个站点平均湿度的一组权重系数。引入拉格朗日系数u进行推导可得:
 
  ■?姿i?酌(xi-xj)+u=(xj-x0),j=1,…,n
 
  ■?姿i=1(5)
 
  因此,权重系数(?姿i,i=1,…,n)和拉格朗日乘数u可由以上式(5)求得,从而由式(4)可得研究区域内任意点的插值估计。
 
  2.3引入降水量信息的协同克里金方法
 
  协同克里金法(CoKriging)[13]是普通克里金法的扩展,把区域化变量的最佳估值方法从单一属性发展到两个或两个以上的协同区域化属性,用一个或多个辅助变量对所感兴趣的变量进行插值估算,这些辅助变量与主要变量都有相关关系,并且假设变量之间的相关关系能用于提高主要预测值的精度。当研究区内的辅助信息(如降水量)较容易获取且变化平稳时,可将这类信息作为辅助影响因素引入协同克里金方法,用协同克里金法对东北三省年均湿度进行插值时,将年均降水量作为一个协变量有利于区域估值的结果,在计算中要用到两属性各自的变异函数和协变异函数[14]。在二阶平稳假设下,其期望为:
 
  E[Z2(x)]=m2(6)
 
  协变异函数为:
 
  ?酌12(h)=E{[Z1(x+h)-Z1(x)][Z2(x+h)-Z2(x)]}(7)
 
  协同克里金法的插值公式:
 
  Z2,CK*(x0)=■?姿1iZ1(x1i)+■?姿2jZ2(x2j)(8)
 
  式中,Z2,CK*(x0)为x0处空气湿度估算值;Z2(x2j)为各点空气湿度;?姿2j为赋予各个站点空气湿度的一组权重系数;Z1(x1i)为各点降水量;?姿1i为赋予各个站点降水量的一组权重系数;N1、N2分别为降水量和空气湿度用于湿度插值站点数,其中N1>N2。引入两个拉格朗日系数u1和u2进行推导可得:
 
  ■?姿1i?酌11(x1i-x1)+■?姿2j?酌21(x2j-x1)+u1=?酌21(x0-x1),
 
  i=1,2,…,N1
 
  ■?姿1i?酌21(x1i-xJ)+■?姿2j?酌22(x2j-xJ)+u2=?酌22(x0-xJ),
 
  j=1,2,…,N2
 
  ■?姿1i=0,■?姿2j=1(9)
 
  式中?酌11和?酌22分别是Z1和Z2的变异函数模型,?酌12和?酌21是这两个变量的变异函数模型,其中,?酌12(h)=?酌21(h)
 
  求解线性方程组式(9)即可获得权重系数(?姿1i,i=1,2,…,N1;?姿2j,j=1,2,…,N2)以及两个拉格朗日乘数u1和u2可由以上两式求得,从而由(8)式可得研究区域内任意点的插值估计。
 
  2.4估值精度评价方法
 
  采用交叉验证(Cross-validation)比较不同模型和寻找最佳的插值结果[15]。在交叉验证过程中,首先将观测值Z(xi)暂时去除,然后通过其他观察值Z(x1),…,Z(xn)和变异函数模型来预测Z(xi)值,最后将预测值放回到原始数据中去,重复以上过程直到对所有观测点进行估值,所以在所有的观测点处既有实际观测值又有估计值,用统计方法一一比较实际值和预测值。均方根误差(RMSE)可以用来评价预测值与观测值的接近程度。利用协同克里金(COK)相对于普通克里金(OK)的均方根误差(RMSE)减少的百分数(RRMSE)表示预测精度的提高程度。
 
  RMSE=■(10)
 
  RRMSE=■×100%(11)
 
  式中,Z(xi)和Z*(xi)分别为在xi处的测量值和预测值;n为样点数。

  •   论文部落提供核心期刊、国家级期刊、省级期刊、SCI期刊和EI期刊等咨询服务。
  •   论文部落拥有一支经验丰富、高端专业的编辑团队,可帮助您指导各领域学术文章,您只需提出详细的论文写作要求和相关资料。
  •  
  •   论文投稿客服QQ: 论文投稿2863358778 论文投稿2316118108
  •  
  •   论文投稿电话:15380085870
  •  
  •   论文投稿邮箱:lunwenbuluo@126.com
 
QQ在线咨询
咨询热线:
15380085870
微信号咨询:
lunwenbuluoli