1.1 水文集合预报理论与方法
水文集合预报的发展历史较短,其中,比较著名的方法有长期径流预报方法(ESP)(Twedt等,1977)。ESP方法以预报当日流域土壤状态为初始条件,对历史观测信息进行随机采样,使用历史降水、气温等历史时间序列代表未来气象信息,驱动水文模型进行径流预报。
传统ESP方法采用历史观测信息作为未来预报信息,相当于完全忽略了气象预报信息,理论上其预报精度不高,因此,越来越多的科研人员尝试将各预报中心的气象预报信息应用到水文集合预报中。气象集合预报与水文模型结合是产生水文集合预报最简单的方法(李俊等,2007;彭涛等,2010),与传统ESP方法相比,提高了预报精度、减小了预报偏差、延长了预见期。值得注意的是,气候模式产生的数值降水预报产品精度太低,无法直接驱动水文模型,往往需要进行集合前处理,如贝叶斯降尺度(Schaake等,2010;Wu等,2012)。
2004年,美国海洋与大气管理局(NOAA)、欧洲中期天气预报中心(ECMWF)等研究机构的科研人员联合发起了水文集合预报实验计划(HEPEX)(Schaake等,2007),HEPEX旨在发展水文集合预报,推动概率水文预报技术发展,保证预报信息的精确度和可靠性,为灾害应急管理部门和水资源管理决策部门提供决策依据。HEPEX的发起标志着水文预报进入一个新纪元,大量新型的水文集合预报方法和技术涌现出来(McEnery等,2005;Pappenberger等,2011;Cloke等,2009;Luo等,2007;Wang等,2012)。
HEPEX研究计划指出(Schaake,2006;Schaake等,2007;陆桂华等,2012),影响水文集合预报精度及可靠性的不确定性因素很多,主要来源于模型的输入、流域初始条件和边界条件的赋值,以及模型结构和参数的选择等(段青云,2012)。不同来源的不确定性在水文模拟过程中相互作用和影响,最终将反映到输出的预报结果上,在进行水文预报时,我们必须量化随机不确定性、降低认知不确定性。将这些不确定性进行量化并通过集合或概率的形式输出的预报即为集合预报。根据模型的不确定性来源,集合预报可以分为如下几个大的模块:①水文集合前处理;②集合数据同化;③参数集合处理;④水文集合后处理;⑤分布式水文模型。
将以上所有模块耦合到一起即是水文集合预报系统,如图1-1所示。此处将重点总结水文集合预报的前处理与后处理模块。
图1-1 水文集合预报系统结构图
1.1.1 水文集合预报前处理理论与方法
水文集合预报前处理也称为气象集合预报后处理。水文集合前处理主要消除定量降水/温度预报的系统偏差,并给出包含不确定性信息的集合预报。现有的水文气象耦合技术虽然已取得了很大的发展,但仍然存在许多问题:
(1)数值天气预报普遍存在系统偏差,譬如降雨带位置偏离或者降雨量整体偏大(偏小),导致气象预报产品很难直接为水文模型提供降水等输入。
(2)数值气象预报产品精度太低,在时空尺度上无法与水文模型匹配(Klein等,1959)。
(3)如何在海量的集合预报产品(如降水平均、离散度或暴雨降水概率等)中进行综合集成,获得最优的集合预报结果,还需要更多更好的方法。
因此,我们需要对数值气象预报产品进行统计前处理。统计前处理的基本思想是:根据多年实测与后预报数据,研究历史预报误差的统计特征,剔除系统偏差,用概率分布的形式代替单一确定的气象要素值,最终生成的降水、气温等预报信息作为水文模型的输入。
经典的水文集合前处理方法有如下几种:
(1)早在1959年,Klein等(1959)率先提出了用于校正气象预报偏差的统计处理方法——完美后预报方法(Perfect Prognosis),该方法提出将不同的观测气象要素之间的统计关系直接应用于模式输出的气象要素中。
(2)Glahn和Lowry(1972)建立了模型输出统计法(Model Output Statistics,MOS),该方法采用多元回归建立起观测与模型输出之间的统计关系,在气象预报中得到了广泛应用(Glahn等,2009)。
(3)贝叶斯方法是水文集合前处理中研究与应用最广泛的方法之一。贝叶斯方法的主要思想是通过对历史预报与观测事件的统计分析,求取预报事件对应观测事件的条件概率函数,在获得未来预报数据后即可得到未来实际(观测)事件发生的概率。
针对降水事件,降水概率预报是用百分率表示降水出现可能性大小的预报形式,这个百分数就是降水概率(马培迎,1999)。如在某天的日降水集合成员等可能发生的集合预报中,日降水量Ro发生的概率为(陈朝平等,2010):
其中
式中:P为降水集合预报概率;n为集合预报成员数目;Pi为每个成员降水预报值与给定降水量的比较;R为每个成员预报日降水量值,mm。
贝叶斯公式在降水集合前处理中可写为:
式中:P(Ro)和分别为降水量Ro发生的概率与不发生的概率,称之为先验概率;P(Rf|Ro)为对应降水量Ro的预报降水Rf发生的条件概率,称之为似然函数;P(Ro|Rf)为已知集合预报降水概率已知的条件下实际降水发生的概率,称之为后验概率。
Raftery等(2005)提出一种多模型集合概率预报的统计处理方法——贝叶斯多模型平均方法(BMA)。BMA是一种统计处理方法,通过对多个模型的预报值进行概率集成,产生高技能、无偏差的预报概率分布。该方法可以针对某一特定变量的概率预报,求取经过偏差校正后单个模型概率预报的加权平均,其权重是相应模型的后验概率,代表着每个模型在模型训练阶段相对的预报技巧(刘建国等,2013)。Sloughter等(2007、2012)应用BMA方法分别研究了降水和风速的多模式集合预报;段青云等(2007、2010)将BMA方法应用到水文、气候变化预测中;Fraley等(2010)针对TIGGE中缺失数据的处理问题,对BMA方法进行了改进;田向军等(2011)则对BMA的(对数)似然函数进行改进,利用一种有限记忆的拟牛顿优化算法(LBFGS-B)对其进行极大化,进而提出了一种求解贝叶斯模型平均的新方法(BMA-BFGS),并将BMA-BFGS与EM法及MCMC法在计算精度和耗时性方面进行了比较;赵琳娜等(2011)也应用BMA算法对TIGGE降水预报数据进行了有效地偏差修正;刘建国等(2013)基于TIGGE数据和BMA方法建立了24小时气温预报。
水文预报中输入的气象信息需要时空连续,所以要求降水/气温集合预报各个成员构成的时间序列必须连续。如:不能将所有概率都是1%的成员构成一个时间序列作为水文模型的输入,而是根据一定的统计规律构建时间序列。Schaake等(2006)和Clark 等(2004)提出了“Schaake Shuffle”。“Schaake Shuffle”方法的基本原理是:通过生成历史预报与历史观测之间的相关参数,记录观测降水和预报降水在时空上的分布关系,重构可以体现历史观测降水连续关系的集合空间,使得集合成员间具有连续的时间信息,从而减少输入水文预报系统的数据偏差。
1.1.2 水文集合预报后处理理论与方法
Krzysztofowicz等(1985、1999、2004)于20世纪90年代开发出以贝叶斯理论为基础的降水和径流集合处理器,建立起贝叶斯预报系统。王善旭(2001)研究指出,基于贝叶斯理论的概率水文预报,综合考虑各方面的不确定性,并以分布函数形式描述水文预报的不确定性,从而能较好地满足优化决策的需要。BFS将系统的总不确定性分解为输入不确定性和水文模型不确定性,并采用不同的方法进行处理,再综合成为总的不确定性概率分布。针对降雨径流模型来说,输入不确定性主要指预见期内的降雨量,而水文模型不确定性是指模型误差、测量误差等。Krzysztofowicz又将BFS方法与数值预报产品相融合,建立起贝叶斯预报处理器(1985、2008)。Wood和Schaake(2008)提出了一种适用于月径流预报的统计后处理方法;Brown和Seo(2010)使用指示器协克里金方法(ICK)来校正集合预报的系统偏差;Weerts等(2011)使用分位数回归的方法来处理英国国家洪水预报系统的径流预报不确定性。
从概率上讲,水文集合后处理即是求水文集合预报对应的观测值的条件概率密度函数。由于未来观测值未知,在求出概率密度函数后,即可通过模型预报值求出未来的观测值。
式中:Qo为观测流量;Qs为模拟流量;Qf为预报流量。
如果是服从高斯正态分布,式(1-3)即可求解,即为广义线性后处理模型(GLMPP)(Zhao等,2011)。实际降水、流量的分布一般都不是正态分布,所以很多研究者将非正态分布通过正态转换变成正态分布研究(Kelly等,1994、1997)。
对于流量或水位的预报,每个水文模型都有各自的特色与局限性,单一模型不可能在任何情况下都能提供始终优于其他模型的预报结果(Reid,1968;Bates等,1969;Dickinson,1973),因此,将不同模型的预报结果进行集合,通过赋予不同的权重,可以发挥各个模型的优势,提高预报精度。可以使用BMA方法将多个水文模型预报结果进行综合,得到预报变量的概率分布及预报值的置信区间估计,为防洪决策提供更多的信息,使决策人员能定量地考虑预报的不确定性(梁忠民等,2010)。
统计后处理方法早已在气象预报中得到广泛应用(Glahn 等,2008),Klein等(1959)提出了完美后预报(Perfect Prog)方法,该方法最早对数字天气预报模型产生的直接模型输出进行后处理的工作,它的基本假设是不同的观测气象要素之间的统计关系,能够直接被应用到相关的数字天气预报模型产生的相应气象要素中。Glahn和Lowry(1972)建立了模型输出统计法(MOS),该方法采用多元回归方法建立起观测气象要素与模型直接输出的气象要素间的统计关系。到目前为止,已经有多种多样的数字天气预报后处理方法,从贝叶斯多模型平均方法到各类非参数统计方法,如人工神经网络方法和小波理论方法等(Raftery等,2005;Hall等,1999;Kuligowski和Barros,1998;Briggs和Levine,1997)。
1.1.3 水文集合预报应用现状
Webster等(2010)将欧洲中期气象预报中心的1~15天气象气候预报应用到孟加拉国的河流水文预报中,指出忽略了气象预报信息的传统水文预报方法,其预见期仅为1~2天,这种预报能帮助减少洪水损失2%~3%,而新的应用气象气候预报信息的水文预报能把预见期提高到10天或更长,可以减少洪灾损失20%左右。Shukla等(2011)也指出对于全球多个地区而言,尽管受降水等气象预报信息的局限,但通过对初始水文条件的良好率定,也可以有效地提高季节水文集合预报的预报水平。
美国建立了以水文集合预报为标志产品的现代水文预报业务(AHPS)(McEnery,2005),欧洲也建立了欧洲洪水预警系统(European Flood Awareness System,EFAS)(Thielen,2009;Bartholmes,2009),这些集合预报的洪水预警系统带来了显著的经济效益和社会效益。
Day G N等(1985)在美国国家天气局河流预报系统(NWSRFS)中展开对ESP方法的应用,提供中长期河道径流和入库水量的预测服务;李岩等(2008)在丹江口水库对ESP进行了应用研究。
Andrew Wood等人(2002)率先于2002年在美国东海岸和俄亥俄河流域进行了长期实验性水文集合预报,以GSM气候模型产生的数值降水预报驱动VIC水文模型得到高精度、无偏差、预见期更长的水文预报。之后,他们又在美国西部五个地区,对比了基于GSM气候模型的季节水文预报与传统ESP方法两者间预报技能的差异。Shi Xiaogang等人(2008)也在美国西部8个流域上做过类似的工作,发现对于季节性径流集合预报而言,通过水文模型率定或百分位映射误差校正方法,均可以相同程度地减少预报误差。Gullaume Thirel等(2008)在Météo-France境内分别使用ECMWF和PEARP两套数值降水预报来驱动ESP,以评估它们各自预报极端水文事件的能力。Li Haibin等(2009)在传统ESP的基础上进一步探索,发现若以统计降水尺度后的CFS数据驱动水文模型,其预报效果要优于传统的ESP方法。Reggiani等(2009)通过贝叶斯方法有效地修正了莱茵河集合预报系统中的不确定性。