热门标签:代写本科论文 写作发表 工程师论文 代写一篇论文多少钱
当前位置: 代写一篇论文多少钱 > 医学论文 > 手足口病预测的最佳模型探究

手足口病预测的最佳模型探究

时间:2018-11-13 10:14作者:玲佩
本文导读:这是一篇关于手足口病预测的最佳模型探究的文章,目的 应用多种数学模型拟合出手足口病发病最优模型, 预测手足口病发病趋势, 为疾病防控提供科学依据。方法 采用SPSS 18. 0软件建立差分自回归移动平均模型 (autoregressive integrated moving average, ARIMA模型)

  摘要:目的 应用多种数学模型拟合出手足口病发病最优模型, 预测手足口病发病趋势, 为疾病防控提供科学依据。方法 采用SPSS 18. 0软件建立差分自回归移动平均模型 (autoregressive integrated moving average, ARIMA模型) 、差分自回归移动平均模型与多层感知神经网络组合模型 (autoregressive integrated moving average and multilayer perceptron, ARIMA-MLP模型) 和差分自回归移动平均模型与径向基函数神经网络组合模型 (autoregressive integrated moving average and radial basis function, ARIMA-RBF模型) , 分别对手足口病发病情况进行拟合, 通过对三种模型比较, 找到预测最优模型。结果 ARIMA模型的拟合度R2和平均绝对误差MAE值分别为0. 725、2. 672, ARIMA-MLP模型为0. 724、2. 672, ARIMA-RBF模型为0. 801、2. 206。结论 ARIMA-RBF模型的拟合度最大、平均绝对误差最小模型, 拟合效果优于其他两种模型。

  关键词:手足口病; ARIMA模型; ARIMA-RBF模型; ARIMA-MLP模型; 发病预测;

  Abstract:Objective To predict the incidence trend of hand, foot and mouth disease ( HFMD) through an optimal prediction model of HFMD incidence fitted by various mathematical models, and to provide a scientific basis for HFMD prevention and control. Methods SPSS18.0 software was employed to establish ARIMA, ARIMA-MLP and ARIMA-RBF models, and then the models were respectively used to fit the incidence of HFMD. The optimal prediction model was found out by comparing the three models. Results The goodness of fit R2 and MAE ( mean absolute error) values of ARIMA, ARIMA-MLP and ARIMA-RBF models were 0.725 and 2.672, 0.724 and 2.672, 0.801 and 2.206 respectively. Conclusions ARIMA-RBF model has maximum R2 and minimum MAE, and its fitting efficiency is superior to those of two other models.

  Keyword:hand, foot and mouth disease; ARIMA model; ARIMA-RBF model; ARIMA-MLP model; forecasting;

  手足口病是由肠道病毒引起的急性传染病, 多发于5岁以下学龄前儿童, 尤其以3岁以下年龄组发病最高, 临床表现为手、足、口腔、臀部等部位皮疹, 轻症病例愈后良好, 少数病例出现肺水肿、神经性脑膜炎、循环衰竭等症状[1]。2008年5月中华人民共和国卫生部将手足口病纳入法定传染病管理后, 陕西省安康市开始手足口病监测工作, 自2008年起其发病率逐年上升至100/10万以上, 成为安康市婴幼儿传染病发病率最高的疾病之一。

  传染病预测是根据其发病的规律及有关影响因素, 应用数理模型对可能发生情况做出预测性分析, 为疾病防控提供科学依据[2,3]。时间序列模型是安康市传染病预测常用的模型之一, 已纳入常态化工作之中。本文应用历史数据分别采用差分自回归移动平均模型和神经网络模型建立模型, 对各模型预测效果进行比较, 选出最优模型为手足口病防控提供依据。

  1 资料与方法

  1.1 数据资料

  安康市2009-2016年手足口病发病数据, 来源于中国疾病预防控制信息系统中“传染病报告信息管理系统”, 2009-2016年安康市人口学资料来源于安康市统计局统计年鉴。

  1.2 模型基本原理

  1.2.1 差分自回归移动平均模型 (autoregressive inte-grated moving average, ARIMA模型)

  通过时间序列数据, 考虑其季节性和周期性波动, 应用数理统计计算, 预测数据发展, 模型记为ARIMA (p, d, q) (P, D, Q) s, p为自回归阶数, d为差分次数, q为滑到平均阶数, P为季节周期自回归阶数、D差分次数、滑动平均阶数, s循环周期[4]。具体步骤一般通过序列平稳性转换、模型识别、参数估计和模型检验、预测应用4个方面[5]。

  1.2.2 差分自回归移动平均模型与多层感知神经网

  络组合模型 (autoregressive integrated moving average and multilayer perceptron, ARIMA-MLP模型) 人工神经网络是模拟人类思维的方式, 由处理单元 (神经元) 广泛互相连接形成复杂网络系统, 反映人脑功能基本特征, 是高度复杂的非线性动力学习系统。多层感知神经网络 (multilayer perceptron, MLP) 是目前人工神经网络研究最基本模型之一, 基于误差反传算法的单项传播多层前馈网络结构, 根据预测变量值生成应变量的预测模型。差分自回归移动平均模型与多层感知神经网络组合模型 (ARIMA-MLP模型) 是基于时间序列建立ARIMA模型, 利用最优模型计算出的每一个拟合值, 将拟合值作为输入值, 观测值作为输出值, 随机将数据分成训练样本、检测样本、坚持样本, 分别采用MLP神经网络模型, 模拟输入和输出的变量关系, 预测疾病的发病率。

  1.2.3 差分自回归移动平均模型与径向基函数神经

  网络组合模型 (autoregressive integrated moving average and radial basis function, ARIMA-RBF模型) 径向基函数神经网络模型 (radial basis function, RBF) 是函数逼近理论为基础而构造的前馈网络, 主要由输入层、隐含层和输出层构成三层前馈网络, 是鉴别非线性系统的有效工具。差分自回归移动平均模型与径向基函数神经网络组合模型 (ARIMA-RBF模型) 和ARIMA-MLP模型原理较为相似, 在时间序列ARIMA模型最优模型的基础上, 采用MLP神经网络模型, 模拟输入和输出的变量关系, 预测疾病的发病率。

  1.3 统计方法

  采用SPSS 18.0软件建立ARIMA模型、ARIMA-MLP模型和ARIMA-RBF模型, 并对预测值和实际值进行拟合优度检验和卡方检验。

  2 结果

  2.1 安康市2009-2016年手足口病月发病特征

  安康市手足口病发病有明显的季节性, 呈双峰分布, 每年4-7月为发病第一个高峰, 11-次年1月为发病第二个高峰, 在2009、2010、2011、2013、2014、2016年每年4-7月第一个高峰发病高于第二个高峰, 而在2012、2015年第二个高峰发病高于第一个高峰。见图1。

  图1 安康市2009-2016年手足口病月发病率

  

  2.2 差分自回归移动平均模型 (ARIMA模型)

  2.2.1 序列平稳性判断

  安康市2009-2016年手足口病发病, 呈双峰分布特征, 总体数据不平稳, 必须对数据继续平稳化处理, 对序列季节一阶差分, 消除季节的影响。

  2.2.2 模型的识别

  绘制序列季节一阶差分后自相关和偏相关图, 初步判断数据平稳, ACF及PACF滞后数均为0, 因此判断ARIMA模型的季节性模型确定为 (0, 1, 1) , 绘制残差自相关、偏向关图, 显示ACP在滞后0后均开始衰减, PACF在滞后2后均开始衰减, 因此判断模型为ARIMA (0, 0, 2) (0, 1, 1) 12, 因非季节性判断有主观性, 因此考虑ARIMA (0, 0, 2) (0, 1, 1) 12, ARIMA (1, 0, 2) (0, 1, 1) 12, ARIMA (1, 0, 1) (0, 1, 1) 12, ARIMA (0, 0, 0) (0, 1, 1) 12四种模型比较拟合效果。见图2。

  图2 原序列经一阶季节性差分后自相关图和偏相关图

  

  2.2.3 模型的参数估计与模型检验

  在SPSS中对4种模型进行比较, 计算模型各R2、MAE、BIC值, 最终确定ARIMA (0, 0, 2) (0, 1, 1) 12拟合度最小, 为最优模型, 其R2、MAE值分别为0.725、2.672, 进行残差相关性检验, Ljung-Box值=13.739, P=0.545>0.05, 据此认为残差序列是白噪声, 各参数估计均有统计学意义, 该模型可以预测分析。

  2.3 ARIMA-MLP模型

  将ARIMA (0, 0, 2) (0, 1, 1) 12模型拟合得到2009-2016年手足口病发病率为神经网络模型的协变量因子, 观测值为因变量, 模拟拟合值与观测值之间的非线性关系, 将ARIMA (0, 0, 2) (0, 1, 1) 12模型得到的手足口病发病率拟合值作为输入样本, 自动产生隐藏层、输出层, 个案相对数量随机值生成分区变量, 优化算法采用梯度下降, 得到ARIMA-MLP模型, 其R2、MAE值分别为0.724、2.672。

  2.4 ARIMA-RBF模型

  将ARIMA (0, 0, 2) (0, 1, 1) 12模型拟合得到2009-2016年手足口病发病率为RBF神经网络模型的协变量因子, 观测值为因变量, 协变量R2、MAE值分别为0.801、2.206。

  2.5 模型精度判定

  应用ARIMA模型、ARIMA-MLP组合模型和ARIMA-RBF组合模型拟合安康市2009-2016年手足口病发病情况, 3种模型均有拟合效果, 预测月发病数曲线, 见图3。其中ARIMA模型的拟合度R2和平均绝对误差MAE值分别为0.725、2.672, ARIMA-MLP模型为0.724、2.672, ARIMA-RBF模型为0.801、2.206, 提示ARIMA-RBF模型的拟合度最大、平均绝对误差最小, 模型拟合效果优于其他两种模型。

  图3 3种模型拟合安康市2009-2016年手足口病发病与实际发病的比较

  

  3 讨论

  安康市手足口病从2008年5月纳入法定传染病管理后开始监测, 其发病率呈逐年上升趋势, 从2009年94.01/10万上升至2016年175.32/10万, 已成为严重影响婴幼儿童身体健康的传染病之一。手足口病是由20多种肠道病毒引起, 传播途径主要通过消化道、呼吸道和密切接触传播, 在日常疾病防控中, 如果能应用预测方法预测出疾病的发病趋势, 在疾病高发流行季节前采取有效的防控措施, 对预防疾病暴发和流行有重要意义。

  目前, 手足口病预测模型较多, 有动力学模型、空间统计学、灰色模型、差分自回归移动平均模型、控制图法、BP神经网络模型等[3]。传染病在时间分布上具有复杂的特征, 如季节性波动、长期、周期性趋势等, 因此对于传染病时间序列分析研究较多, 如ARIMA模型、马尔可夫模型、神经网络等预测方法。ARIMA模型建模所需要的资料简单, 只要发病的时间序列即可, 可作为早期预测应用, 但是ARIMA模型需要数据量相对较大在50个以上, 主要还是短期预测, 预测数据有波动性和周期性时, 预测值和实际值有一定差异。神经网络模型具有拟合非线性数据的特点, 可以逼近任意非线性函数, 具有强大的容错能力, 局部出现错误时不会对整个网络产生过大的影响;将输入输出数据输入网络, 网络可以通过学习、自学习达到良好的效果;神经网络需要大量的训练样本, 但样本过大, 学习速度下降, 相反样本过小, 预测误差增大;隐含层的节点根据经验选取, 预测精度不稳定。

  传染病传播和流行都是受自然环境、经济条件、气象环境等多种因素影响的, 在预测时每一种方法都有其优点和缺点, 因此在实际工作中, 可以采取多种预测模型相结合, 组合模型可以将两种模型优势相结合, 从而得到更好的预测结果, 实际意义更大。曹飞等[6]、曹磊等[7]研究表明ARIMA-MLP组合模型比ARIMA模型具有更好的预测效果, RBF神经网络模型具有更好的函数逼近能力, 而且收敛速度快, 稳定性好, 抗干扰能力强[8]。本研究应用安康市手足口病时间序列历史数据, 采用ARIMA拟合安康市手足口病发病情况, 再应用ARIMA-MLP和ARIMA-RBF组合模型, 对安康市2009-2016年手足口病月发病率进行拟合, 结果显示ARIMA模型、ARIMA-MLP组合模型和ARI-MA-RBF组合模型均能拟合安康市手足口病发病情况, 但ARIMA-RBF组合模型具有更好拟合优度, 可更精确的预测手足口病的发病情况。

  在日常疾病防控工作中, 如果能及时运用传染病发病数据, 建立疾病预测预报数据模型, 预测疾病发病趋势, 在疾病高峰来临之前, 建议各级部门做好疾病防控工作, 对疾病防控有着重要意义。任何一种疾病的发生、流行受多种因素的影响, 本研究只是应用发病时间序列数据, 未考虑传播因素、自然环境、空间因素等影响, 研究结果在日常防控中短期防控参考依据。在以后疾病预测中, 如能考虑多因素影响, 预测效果和精度会更精确, 在实际工作中意义更大。

  参考文献

  [1]中华人民共和国卫生部.手足口病诊疗指南 (2010版) [Z].2010-4-20.
  [2]孙振球.医学统计学[M].北京:人民卫生出版社, 2013:229-318.
  [3]杨仁东, 胡世雄, 曾小敏, 等.手足口病疫情预测预警模型研究进展[J].实用预防医学, 2015, 22 (11) :1399-1402.
  [4]张文彤.SPSS统计分析教程[M].北京:北京希望电子出版社, 2002:250-289.
  [5]徐国祥.统计预测和决策[M].上海:上海财经大学出版社, 2005:209-215.
  [6]曹飞, 况荣华, 李辉, 等.不同数学模型对手足口病发病的预测效果分析与比较[J].南昌大学学报 (医学版) , 2014, 54 (1) :12-16, 39.
  [7]曹磊, 张义, 刘峰, 等.ARIMA-MLP和ARIMA-RBF模型在流行性腮腺炎发病预测中的应用[J].公共卫生与预防医学, 2016, 27 (1) :26-30.
  [8]康军.基于径向基函数神经网络的应用研究[D].长沙:湖南师范大学, 2009.

联系我们
  • 写作QQ:79211969
  • 发表QQ:78303642
  • 服务电话:18930620780
  • 售后电话:18930493766
  • 邮箱:lunwen021@163.com
范文范例
网站地图 | 网站介绍 | 联系我们 | 服务承诺| 服务报价| 论文要求 | 期刊发表 | 服务流程