摘要: 根据浏渭河流域水文特性对多维混合回归系统模型的结构进行了改进,并在系统输入非线性化处理基础上建立了朗梨水文站洪峰水位多维混合回归系统预报模型,经检验评定,效果良好。
关键词: 洪峰水位预报 多维混合回归预报模型 渭河流域
0 前言
流域水文系统因其输入输出和系统输送既受确定性因素的作用又受随机性因素的影响 ,因此变化十分复杂,其精确描述显然是十分困难的。在当前一种既考虑水文过程形成的物理背景又不苛求预报量与预报因子间确切的运行机制的系统建模思想比较符合人们对客观水文规律 认识的现实,因而得到了众多学者和专家的认可[1~5] 。多维混合回归系统模型是将回归与自回归有机结合起来的混合回归模型,它既考虑了预报量自身的演变规律又充分利用了预报量对预报因子的依赖关系,预报模型具有一定的物理基础又不过分强调每一个参数的物理意义。其建模方式灵活,使用方便,精度较高[6] 。
1 多维混合回归系统水文模型的结构 和参数识别
1.1 模型结构
回归模型是利用因变量与自变量的统计相关关系建立起来的, 并可预报因变量的未来值。自回归模型则是利用自变量自身取值的相互依赖的统计关系建立起来的,并可用它预报时间序列的未来值。前者没有利用因变量自身变化的统计规律,而后者没有利用其它自变量对因变量的统计依赖关系,成因概念不十分明确。将回归和自回归结合起来的混合模型,取两家之长,补两家之短,在理论 和具体方法 上没有实质性的障碍,但在实际应用 上却可以拓宽范围,丰富模型种类[1] 。
具体到流域水文系统,设其为多输入、单输出线性系统,系统的输出为 ,输入为{Z} ,{y1 } ,{y2 } ,…,{ys } ,则经过流域输送作用后,系统的混合回归描述可表示为
式(1 )即为多维混合回归系统水文的结构。式中y1,t ,y2,t ,…,ys,t 分别为系统输入{y1 } ,{y2 } ,…,{ys } 在t 时刻的数值,Zt 为系统输入{Zt } 在t 时刻的数值,{b(0) } ,{b(1) } ,{b(2) } ,…,{b(s) } 为系统响应函数。
1.2 参数识别
式(1 )中包含了s 1 个变量,是多维的。参数共有(p0 p1 p2 … ps 1 )个。实际上p0 为系统自回归阶数,p1 ,p2 ,…,ps 为因子{y1 } ,{y2 } ,…,{ys } 的阶数。模型阶数和参数识别算法如下。
设已知实测数据{Zt } ,{y1,t } ,{y2,t } ,…,{ys,t } ,其中 t=1 ,2 ,…,m 。令p=max{p0 ,p1 ,…,ps } ,在式(1 )中分别取t=p 1 ,p 2 ,…,m ,由此可得m-p 个等式,其缩写形式为
式中
根据最小二乘原理,B 的最小二乘估计为
相应的残差平方和表达式为
可按赤池信息准则(AIC 准则)确定阶数p0 ,p1 ,…,ps 。AIC 准则函数为
对给定某个备选的最大延迟量 时,在所有可能的符合以下不等式的值中找出使式(5 )中的AIC 最小的p0 ,p1 ,…,ps 。
0 ≤ p0 ,p1 ,…,ps ≤ p (6 )
如此选取出的p0 ,p1 ,…,ps 即为式(1 )中各变量的阶数。
当s 较大时,参数个数很多,识别计算 工作量很大。实际上参数估算和阶数确定是相互联系,互为前提的,为减少计算工作量,提高模型的统计稳定性,实际应用时可采用疏系数方法求解[6] 。
2 朗梨站洪峰水位多维混合回归预报模型
2.1 流域基本情况
朗梨站系湘江一级支流浏渭河的总控制站,控制流域面积3815km2 ,干流长度110km ,平均坡降0.27 ‰。该站为平原地形,上下游附近两岸均为堤垸,上游15 km 浏阳市境内为丘陵地形,河谷仍较开阔,河槽发育。浏阳双江口以上为山间盆地,山势平缓,有二级阶地,在双江口设有双江口水文站,控制流域面积2067km2 ,区间有江背报汛雨量站。浏渭河在朗梨站下游约25km 处汇入湘江。长沙站位于湘江干流浏渭河汇合处上游约2km 处。朗梨站洪峰主要由上游流域的暴雨形成,同时也受湘江洪水顶托。但浏渭河洪峰一般先于湘江干流洪峰到达长沙,故朗梨站洪水历时较长,全年最高水位多发生在6-7 月。由于洪水波运动的非线性特征加之下游严重的回水顶托影响 ,使得朗梨站的水位流量关系异常复杂,相似的上游来水和区间降水在朗梨站形成的洪峰水位相距甚远。用传统的上下游水位相关法建立洪峰水位预报方案合格率不高,方案不能正常投入运行,作业预报的难度很大。为此考虑建立该站洪峰水位多维混合回归预报模型。
2.2 模型结构的改进
根据朗梨站洪峰水位预报的实际需要,系统以朗梨站洪峰水位 为输出,以双江口站出峰前相关站的水位和区间降水为输入。其混合回归预报模型的结构在式(1 )的基础上略加改进,结构形式为
式中 朗 Zt 为t 时刻朗梨站的水位;τ为洪峰从双江口至朗梨站的传播时间,也是本模型的预见期;双 Zm,t 为 t 时刻双江口站的水位,下标加注m 表示其值同时为洪峰水位;长 Zt 为t 时刻长沙站的水位; 为(t-1)~t 时刻双江口站的降水量非线性化因子; 为(t-1)~t 时刻江背站的降水量非线性化因子;si 为第i 个河段的水力特性因子;bj (k) ,ai 为系统响应。
2.3 系统输入的非线性化处理
由于降水径流和河段水力特性的非线性特征,线性系统的模拟能力有限,对系统的降水和河段水力特性输入因子均作非线性处理。即:
根据现行概念性降雨径流模型,降雨径流关系均为非线性关系,且接近指数型曲线,故对降水输入取 =pα ,为简便起见α分别取 0.1, 0.2, 0.3, …, 2.0 后,按AIC 准则确定采用值;
对河段水力特性因子主要考虑双江口站出峰时双江口~ 朗梨,朗梨~ 长沙的水面落差,由曼宁公式不难推知河道流量与水面比降的平方根成正比,故模型固定取:
其中α和β为基面换算系数,以保证s1 和 s2 大于零。
2.4 模型的建立
因式(7 )较之式(1 )有较大改进,在资料处理上已将连续水文系统截断为以单次洪峰为单位的多个序列资料,以之分别代入式(7 )采用疏系数方法 并结合AIC 准则,即可得到最优预报模型。
采用朗梨站1965 ,1973~1995 年共34 次洪峰资料,并取近30 小时的所有有效信息即给定最大延迟量p=5 ,得到洪峰水位最优预报模型为:
朗 Zm , t τ = 45.7604 – 0.6304 朗 Zt – 0.6913 朗 Zt-1 0.2188 朗 Zt-2 1.8674 双 Zm,t 0.2970 双 Zt-1 -0.5683 双 Zt-2 0.0007 双 Zt-3 0.0409 长 Zt 0.3240 长 Zt-1 0.1854 长 Zt-2 0.0588 双 0.0458 双 0.0713江 - 7.8302 s1 0.5204 s2
式中:
峰现时间的预报采用同期资料建立双江口站洪峰水位与洪峰传播历时相关图,即(双 Zm,t ~ τ)经验相关图查得。限于篇幅(双 Zm,t ~ τ)关系图从略。
2.5 模型的检验与评价
根据《水文情报预报规范》[7] ,模型的评定指标主要有合格率和有效性两项。其中:
合格率 = 合格场次/ 总场次×100%
模型率定期内34 场洪水洪峰水位变幅 6.37m ,模型拟合均方差σ△ 为1.61m ,评定时允许误差最大值取1.00m ,最小值取0.30m ,单次洪水洪峰水位允许预报误差据预见期水位变化幅度(△i )在0.30~1.00m 间内插确定,允许误差为
△ 允许 = 0.30 (0.70 △i )/6.37
作业预报的评定按每次预报误差的大小分四个等级,即:
优级:预报误差/ 许可误差<25%;
良级: 25% ≤预报误差/ 许可误差<50%;
合格: 50% ≤预报误差/ 许可误差<100%;
不合格: 预报误差/ 许可误差≥100% 。
模型的有效性评定采用效率系数衡量,效率系数公式为:
其中 ; 为预报误差; △i 为预见期内水位变幅; 为△i 的均值;n 为点据数。
以1966~1971 年共10 场洪水对模型作验证预报。
率定期 34 场洪水回顾预报和验证期 10 场洪水的检验预报精度的综合评价详见表1 。
表1 模型预报精度的综合评价
单次预报误差幅度 确定性系数 单次预报优等率 单次预报良好率 单次预报合格率
资料分段 | △|min ~| △|max d △ (%) (%) (%)
率定期 0~0.67 0.97 41.1 64.7 94.1
验证期 0.02~0.59 0.93 50.0 70.0 90.0
按《水文情报预报规范》预报方案的等级划分标准和我国现行通用的水文预报精度评定方法[8] :
甲等方案: 合格率≥85% ,效率系数≥0.91;
乙等方案: 85%> 合格率≥70% ,0.91> 效率系数≥0.71;
丙等方案: 70%> 合格率≥60% ,0.71> 效率系数≥0.50.
对照上表,本方案可综合评定为甲等方案。
2.6 实际预报作业
模型用于1997 年至1999 年四次洪水预报,预报结果列于表2 。
表2 模型作业预报精度评定
洪 号 实测洪峰水位(m ) 预报洪峰水位(m) 预报误差(m) 允许误差(m) 评定
970608 38.65 38.75 -0.10 0.76 优秀
980614 36.58 36.44 0.14 0.45 良好
980627 40.23 40.18 0.05 0.42 优秀
990718 37.90 38.09 -0.19 0.67 良好
四次预报二优二良,可见预报效果是令人满意的。
3 存在问题 和解决办法
(1 )流域区间有官庄、友谊、乌川、东庄等水利 工程,由于报汛站网布局不尽合理,难于收集水库调蓄和开闸泄洪的信息,对部份洪峰水位的预报精度造成一定影响 ,有待报汛站网的补充和调整。
(2 )在双江口出现洪峰后,如流域内特别是流域上游继续降大到暴雨,本模型对此类洪水洪峰水位的预报精度不高。对这类洪水应考虑过程预报方案。
(3 )鉴于本模型使用的水文资料序列不长,很难完全反映浏渭河流域的水文系统特征。用信息论的观点看,属于信息不完全系统。在正式投产预报作业时,应及时补充新的水文资料,重新识别模型参数,以求尽可能地接受信息,以包容各种水情状况,增强模拟和实际预报效果。
参考 文献 :
[1]. 李纪人,刘德平. 水文时间序列模型及预报方法 [M]. 南京:河海大学出版社,1991.218~226
[2]. 李正最,吴雅琴. 混合门限自回归模型在长期水文预报中的应用 [J]. 江西水利科技 ,1993 ,19 (4 ):309~314
[3]. 李正最,吴雅琴. 非方程灰色系统在长期水文预报中的应用初探[J]. 四川水力发电,1994 ,13(1): 16~22
[4]. 徐向阳. 具有物理基础的太湖水位多元回归模型[J]. 河海大学学报,1990 ,18 (6 ):48~54
[5]. 葛守西. 现代 洪水预报技术[M]. 北京:中国 水利水电出版社,1999 :30~129
[6]. 吴雅琴. 多维混合回归系统水文预报模型及其应用[A]. 迈向新世纪[C] 。长沙:湖南科学 技术出版社,1999:251~255
[7]. 中华人民共和国行业标准. 水文情报预报规范[S]. 北京:中国水利水电出版社,2000.9~14
[8]. 长江水利委员会. 水文预报方法(第二版)[M]. 北京:水利电力出版社,1993.354~362
A Multidimensional Mixed Regression Model to Forecast Peak Stage at Langli Statio n
Abstract: The multidimensional mixed regression model is a comprehensive model combined with regression and autoregression. According to the hydrologic characteristics of Liuweihe River Basin, this paper establishes multidimensional mixed regression model to forecast peak stage at Langli hydrometric station. The test forecast results are satisfactory.Key words: forecasting of peak stage; multidimensional mixed regression forecast model; Liuweihe River Basin