Abstract
目的
:比较广义相加模型(GAM)和长短时记忆循环神经网络(LSTM-RNN)对糖尿病合并呼吸系统疾病患者入院频数的预测效果。
方法:
收集2014年1月1日至2019年12月31日北京市大气污染物、气象因素和呼吸系统疾病入院数据,基于LSTM-RNN预测糖尿病合并呼吸系统疾病患者入院频数并与GAM对比,模型评价采用五折交叉验证法。
结果:
与GAM相比,LSTM-RNN具有较低的预测误差[均方根误差(RMSE)分别为21.21±3.30和46.13±7.60, P<0.01;平均绝对误差(MAE)分别为14.64±1.99和36.08±6.20, P<0.01]和较高的拟合优度( R 2值分别为0.79±0.06和0.57±0.12, P<0.01)。在性别分层中,预测女性入院频数时,LSTM-RNN三项指标均优于GAM(均 P<0.05);预测男性入院频数时,两模型误差评价指标差异无统计学意义(均 P>0.05)。在季节分层中,预测温暖季节的入院频数时,LSTM-RNN的RMSE和MAE均低于GAM(均 P<0.05), R 2值差异无统计学意义( P>0.05);预测寒冷季节入院频数时,两种模型的RMSE、MAE和 R 2值差异均无统计学意义(均 P>0.05)。在功能区分层中,预测首都功能核心区入院频数时,LSTM-RNN的RMSE、MAE和 R 2值均优于GAM(均 P<0.05)。
结论:
LSTM-RNN预测误差较小,拟合程度优,可作为污染天气提前精准配置医疗资源的预测手段。
Abstract
Objective:
To compare the performance of generalized additive model (GAM) and long short-term memory recurrent neural network (LSTM-RNN) on the prediction of daily admissions of respiratory diseases with comorbid diabetes.
Methods:
Daily data on air pollutants, meteorological factors and hospital admissions for respiratory diseases from Jan 1st, 2014 to Dec 31st, 2019 in Beijing were collected. LSTM-RNN was used to predict the daily admissions of respiratory diseases with comorbid diabetes, and the results were compared with those of GAM. The evaluation indexes were calculated by five-fold cross validation.
Results:
Compared with the GAM, the prediction errors of LSTM-RNN were significantly lower [root mean squared error (RMSE): 21.21±3.30 vs. 46.13±7.60, P<0.01; mean absolute error (MAE): 14.64±1.99 vs. 36.08±6.20, P<0.01], and the R 2 value was significantly higher (0.79±0.06 vs. 0.57±0.12, P<0.01). In gender stratification, RMSE, MAE and R 2 values of LSTM-RNN were better than those of GAM in predicting female admission (all P<0.05), but there were no significant difference in predicting male admission between two models (all P>0.05). In seasonal stratification, RMSE and MAE of LSTM-RNN were lower than those of GAM in predicting warm season admission (all P<0.05), but there was no significant difference in R 2 value ( P>0.05). There were no significant difference in RMSE, MAE and R 2 between the two models in predicting cold season admission (all P>0.05). In the stratification of functional areas, the RMSE, MAE and R 2 values of LSTM-RNN were better than those of GAM in predicting core area admission (all P<0.05).
Conclusion:
LSTM-RNN has lower prediction errors and better fitting than the GAM, which can provide scientific basis for precise allocation of medical resources in polluted weather in advance.
Keywords: Long short-term memory recurrent neural network, Generalized additive model, Respiratory disease, Diabetes mellitus, Daily admission, Prediction
广义相加模型(generalized additive model,GAM);循环神经网络(recurrent neural network,RNN);长短时记忆RNN(long short-term memory RNN,LSTM-RNN);《国际疾病分类》第10版[(10th revision),ICD10];均方根误差(root mean squared error,RMSE);平均绝对误差(mean absolute error,MAE);细颗粒物(particulate matter 2.5,PM2.5);可吸入颗粒物(particulate matter 10,PM10);
2019年全球糖尿病患者数近5亿,其中我国糖尿病患者约占25% [1] 。约30%的糖尿病患者合并呼吸系统疾病,合并呼吸系统疾病是糖尿病患者致死、致残的主要原因之一 [2] 。10.1%~20.0%的2019冠状病毒病患者有糖尿病基础疾病,这类患者的病死率是无糖尿病基础疾病患者的2~7倍 [ 3- 4] 。因此,对糖尿病合并呼吸系统疾病患者的救治具有十分重要的临床意义。慢性呼吸系统疾病发作与缓解受环境因素影响较大。分析和预测环境因素对人类健康的影响不仅能提高患病风险识别能力,也可以为健康促进措施和相关政策的制订提供科学的指导。
传统呼吸系统疾病时间序列研究大多基于GAM,但其受观测时间的限制及采样时间间隔的影响,可能形成伪趋势;加上模型本身的限制,GAM要进一步提升预测精确度十分困难。随着大数据时代的到来,以人工神经网络为基础的深度学习受到了广泛关注 [ 5- 6] 。其中,RNN是一种以时间为轴构建非线性关系的神经网络模型。LSTM-RNN有良好的时序处理能力,适用于预测时间延迟的数据,在医学领域有很好的应用前景 [ 7- 8] 。本研究拟通过比较GAM和LSTM-RNN对糖尿病合并呼吸系统疾病患者入院频数的预测效果,为污染天气提前精准配置医疗资源提供科学的手段。
污染物数据来自卫星遥感监测( https://doi.org/10.5281),收集2014年1月1日至2019年12月31日北京市6种大气污染物(PM2.5、PM10、二氧化氮、二氧化硫、臭氧和一氧化碳)的日平均浓度和空气质量指数。气象资料来源于中国气象局,收集同时期北京市16个区的日均温度、比湿、气压和风速共四个气象因素数据。16个行政区根据中共北京市委、北京市人民政府出台的《关于区县功能区定位以及评价指标的指导意见》分为四大功能区,分别为首都功能核心区(东城区、西城区)、城市功能拓展区(海淀区、朝阳区、丰台区、石景山区)、城市发展新区(通州区、顺义区、大兴区、昌平区、房山区)和生态涵养区(门头沟区、平谷区、怀柔区、密云区、延庆区)。季节分为温暖季节(4—9月)和寒冷季节(10—3月)。
疾病入院数据收集自北京市卫生健康大数据与政策研究中心( http://www.phic.org.cn/)。病历系统中患者数据包括入院日期、性别、年龄、主要诊断等。本研究选定疾病亚类为呼吸系统疾病(ICD10编码J00~J99),合并糖尿病情况根据次要疾病诊断判断(ICD10编码E10~E14)。
对2014—2019年北京市糖尿病合并呼吸系统疾病总入院频数、每日入院频数、大气污染物浓度和气象因素进行描述性分析。计量资料若符合正态分布采用均数±标准差( ± s)描述,若不符合正态分布采用中位数( M)、最小值、上四分位数( Q 1)、下四分位数( Q 3)、最大值和四分位数间距描述。采用ArcGIS软件绘图描述污染物的时空分布,采用R4.0.5进行数据分析。
①GAM:选用泊松分布作为GAM的分布族,以此解释入院频数与污染水平之间的非线性关系 [9] 。使用带自然立方样条函数的GAM将大气污染物、气象因素与每日糖尿病合并呼吸系统疾病入院频数相关联 [ 10- 11] ,气象因素的自由度为4,时间(1,2…2190,2191)的自由度为7/年 [12] 。指示变量“星期几”和“节假日”分别控制时间序列中可能存在的星期效应和节假日效应。为了排除模型中大气污染物间共线性的影响,还将主成分分析中的主成分引入模型中。主要采用R 4.0.5软件中的“mgcv”包实现模型建模过程。②LSTM-RNN:整合大气污染物、气象因素、既往入院数据等多维特征,基于LSTM-RNN对2014年1月1日至2019年12月31日北京市糖尿病合并呼吸系统疾病患者入院频数构建预测模型。以天为单位构建时间序列,具体输入为当天的入院频数,输出为7 d后的入院频数,输入及输出数据的特征见 表1。
表 1 长短时记忆循环神经网络输入及输出数据的特征
Table 1 Input and output data in long short-term memory recurrent neural network model
|
序号 |
变量名称 |
变量种类 |
单位 |
赋值 |
|
1 |
月份 |
特征变量 |
— |
无 |
|
2 |
日期 |
特征变量 |
— |
无 |
|
3 |
节假日 |
特征变量 |
d |
0∶非节假日 1∶节假日 |
|
4 |
星期 |
特征变量 |
d |
无 |
|
5 |
既往入院频数 |
特征变量 |
例次/d |
无 |
|
6 |
PM2.5 |
特征变量 |
μg/m 3 |
无 |
|
7 |
PM10 |
特征变量 |
μg/m 3 |
无 |
|
8 |
二氧化硫 |
特征变量 |
μg/m 3 |
无 |
|
9 |
二氧化氮 |
特征变量 |
μg/m 3 |
无 |
|
10 |
臭氧 |
特征变量 |
μg/m 3 |
无 |
|
11 |
一氧化碳 |
特征变量 |
mg/m 3 |
无 |
|
12 |
空气质量指数 |
特征变量 |
— |
无 |
|
13 |
温度 |
特征变量 |
℃ |
无 |
|
14 |
比湿 |
特征变量 |
g/kg |
无 |
|
15 |
气压 |
特征变量 |
hPa |
无 |
|
16 |
风速 |
特征变量 |
m/s |
无 |
|
17 |
预测入院频数 |
目标变量 |
例次/d |
无 |
“—”:无相关资料. PM2.5:细颗粒物;PM10:可吸入颗粒物.
具体预测步骤包括:①数据预处理,对于个别缺失的数据采用均值插补法进行插补;②采用线性函数法将数据归一化,即转换后数据=(原数据-最小值)/(原数据-最大值);③将数据集按8∶2的比例分割为训练集和测试集;④设置超参数,预测结果;⑤根据RMSE,利用网格搜索调整超参数至模型理想。涉及的超参数包括模型优化方式、LSTM-RNN层数、随机断开连接比例、训练迭代次数和每次批次大小。经过不断调整误差,以损失(loss)和RMSE最小来确定最佳模型。为了避免过拟合的情况,本文用Dropout(随机失活正则化)方法优化模型。采用R 4.0.5软件中的“tensorflow”和“keras”包实现建模过程。
用决定系数 R 2检验模型的拟合情况,并用RMSE和MAE评价不同模型的预测效能 [ 13- 14] 。 R 2值越大,RMSE、MAE越小,说明模型的预测效果越好。采用五折交叉验证测试模型评价指标 [15] 。即将数据集分成5份,依次将其中4份作为训练集,1份作为测试集,5次结果的平均值作为对模型预测效果的估计,采用 t检验比较两模型预测值差异。
本研究纳入糖尿病合并呼吸系统疾病总入院频数共251 655例次,男性146 958例次,占58.40%,每日入院频数中位数为121例次。PM2.5、PM10、二氧化硫、二氧化氮、臭氧和一氧化碳的日均浓度中位数分别为47.34、82.67、9.56、36.42、87.09 μg/m 3和0.85 mg/m 3;中位温度为9.70 ℃,中位比湿为6.44 g/kg。2014—2019年北京市糖尿病合并呼吸系统疾病患者入院频数构成、大气污染物和气象因素的描述性分析结果分别见 表2和 表3。Kruskal-Wallis H检验结果显示,2014—2019年北京市不同功能区间各污染物浓度差异均有统计学意义(均 P<0.05),6种大气污染物的浓度从城市中心到郊区均呈现从高到低的变化特征( 图1)。
表 2 2014—2019年北京市糖尿病合并呼吸系统疾病患者入院频数的基本描述
Table 2 Distribution characteristics of total and daily hospital admission for respiratory diseases with comorbid diabetes in Beijing during 2014 and 2019
[ n(%)或 M( Q 1, Q 3)]
|
类别 |
总入院频数 |
每日入院频数 |
|
患者性别男性 |
146 958(58.40) |
71(37,89) |
|
女性 |
104 697(41.60) |
48(29,63) |
|
患者年龄≤60岁 |
34 281(13.62) |
16(9,21) |
|
>60岁 |
217 374(86.38) |
104(57,132) |
|
季节寒冷 |
134 665(53.51) |
131(69,164) |
|
温暖 |
116 990(46.49) |
114(62,141) |
|
功能区首都功能核心区 |
36 795(14.62) |
18(7,24) |
|
城市功能拓展区 |
114 049(45.32) |
55(26,71) |
|
城市发展新区 |
67 393(26.78) |
30(21,39) |
|
生态涵养区 |
33 418(13.28) |
14(10,20) |
|
合计 |
251 655(100.00) |
121(65,151) |
表 3 2014—2019年北京市大气污染物及气象因素的描述性统计分析结果
Table 3 Descriptive statistical analysis of air pollutants and meteorological factors in Beijing during 2014 and 2019
|
变量 |
中位数 |
最小值 |
Q 1 |
Q 3 |
最大值 |
四分位数间距 |
|
污染物PM2.5(μg/m 3) |
47.34 |
8.32 |
30.64 |
73.01 |
301.08 |
42.38 |
|
PM10(μg/m 3) |
82.67 |
22.23 |
59.36 |
116.79 |
689.27 |
57.42 |
|
二氧化硫(μg/m 3) |
9.56 |
3.86 |
6.10 |
15.77 |
109.24 |
9.67 |
|
二氧化氮(μg/m 3) |
36.42 |
12.01 |
29.32 |
48.63 |
113.34 |
19.30 |
|
臭氧(μg/m 3) |
87.09 |
10.85 |
56.50 |
128.65 |
246.85 |
72.15 |
|
一氧化碳(mg/m 3) |
0.85 |
0.31 |
0.67 |
1.14 |
6.04 |
0.47 |
|
空气质量指数 |
74.69 |
15.16 |
49.64 |
111.68 |
431.69 |
62.04 |
|
气象因素温度(℃) |
9.70 |
–16.33 |
–1.87 |
18.92 |
28.01 |
20.79 |
|
比湿(g/kg) |
4.71 |
0.22 |
1.80 |
10.44 |
22.08 |
8.64 |
|
气压(hPa) |
997.85 |
972.97 |
990.25 |
1005.84 |
1023.25 |
15.59 |
|
风速(m/s) |
0.72 |
0.27 |
0.57 |
0.99 |
5.25 |
0.41 |
PM2.5:细颗粒物;PM10:可吸入颗粒物.
图 1 .
2014—2019年北京16个行政区大气污染物空间分布图PM2.5: 细颗粒物. PM10: 可吸入颗粒物.
训练集和验证集的损失函数图见 图2,训练集和验证集的损失曲线均随迭代数增加趋于0,模型训练不断完善,模型总体较稳定。经反复调整超参数,比较不同迭代次数下的RMSE( 图3),选取最小RMSE对应的迭代次数。最终采用的模型为单层LSTM-RNN模型,有90个神经元,以0.2的比例随机断开连接,单层输出,每次输入数据量为40,训练迭代次数为50,模型超参数设置见 表4。
图 2 .

长短时记忆循环神经网络的损失曲线
图 3 .

不同迭代次数下长短时记忆循环神经网络的均方根误差
表 4 长短时记忆循环神经网络(LSTM-RNN)超参数设置
Table 4 Parameters of long short-term memory recurrent neural network (LSTM-RNN)
|
训练超参数 |
设置 |
训练超参数 |
设置 |
|
原始数据集/条 |
2191 |
随机断开连接比例 |
0.2 |
|
记录时间间隔/d |
1 |
预测时长 |
7 |
|
训练集大小/d |
1753 |
参数优化方式 |
AdaMax |
|
测试集大小/d |
438 |
模型损失评价 |
MSE |
|
LSTM-RNN层数 |
1 |
训练迭代次数 |
50 |
|
连接的神经元个数 |
90 |
每次批次大小 |
40 |
|
输出层层数 |
1 |
|
LSTM-RNN和GAM的预测值与实际入院频数对比结果见 图4。两种模型的拟合效果整体均较好,但在波动较为频繁时,LSTM-RNN的预测值更贴近真实值。将基于两种模型预测北京市糖尿病合并呼吸系统疾病入院频数的评价指标进行比较,结果见 表5。结果显示,在糖尿病合并呼吸系统疾病患者总人群预测中,LSTM-RNN的RMSE、MAE均低于GAM, R 2值高于GAM(均 P<0.01)。在性别分层中,预测女性入院频数时,LSTM-RNN三项指标均优于GAM(均 P<0.05);预测男性入院频数时,两模型误差评价指标差异无统计学意义(均 P>0.05)。在季节分层中,预测温暖季节入院频数时,LSTM-RNN的RMSE和MAE均低于GAM(均 P<0.05), R 2值差异无统计学意义( P>0.05);预测寒冷季节入院频数时,两种模型的RMSE、MAE和 R 2值差异均无统计学意义(均 P>0.05)。在功能区分层中,预测首都功能核心区入院频数时,LSTM-RNN的RMSE、MAE和 R 2值均优于GAM(均 P<0.05)。上述结果提示,总体来说LSTM-RNN预测误差小,拟合优度高于GAM。
图 4 .
长短时记忆循环神经网络(LSTM-RNN)与广义相加模型(GAM)预测糖尿病合并呼吸系统疾病患者入院频数比较
表 5 长短时记忆循环神经网络(LSTM-RNN)与广义相加模型(GAM)预测效果评价
Table 5 The prediction performance of long short-term memory recurrent neural network (LSTM-RNN) and generalized addictive model (GAM)
( ± s)
|
类别 |
RMSE |
MAE |
调整后 R 2值 |
|||||
|
GAM |
LSTM-RNN |
GAM |
LSTM-RNN |
GAM |
LSTM-RNN |
|||
|
患者性别 男性 |
40.28 ± 24.63 |
13.36 ± 2.03 |
30.95 ± 18.89 |
9.68 ± 1.40 |
0.52 ± 0.08 |
0.75 ± 0.06 ** |
||
|
女性 |
34.30 ± 16.85 |
10.95 ± 1.27 * |
26.69 ± 13.13 |
8.12 ± 0.83 * |
0.31 ± 0.05 |
0.73 ± 0.06 ** |
||
|
季节温暖 |
30.26 ± 8.38 |
19.62 ± 4.84 * |
24.88 ± 7.72 |
13.87 ± 3.19 * |
0.77 ± 0.06 |
0.76 ± 0.07 |
||
|
寒冷 |
38.26 ± 19.18 |
22.60 ± 4.50 |
29.51 ± 16.09 |
16.11 ± 3.36 |
0.67 ± 0.15 |
0.78 ± 0.11 |
||
|
功能区首都功能核心区 |
9.25 ± 2.72 |
5.58 ± 0.62 * |
6.99 ± 2.24 |
4.13 ± 0.47 * |
0.54 ± 0.02 |
0.65 ± 0.09 * |
||
|
城市功能拓展区 |
38.09 ± 22.52 |
11.96 ± 2.01 |
29.01 ± 16.88 |
8.56 ± 1.12 |
0.48 ± 0.08 |
0.74 ± 0.07 ** |
||
|
城市发展新区 |
8.23 ± 1.50 |
6.80 ± 0.88 |
6.31 ± 1.16 |
5.26 ± 0.69 |
0.58 ± 0.05 |
0.66 ±0.03 * |
||
|
生态涵养区 |
5.51 ± 0.81 |
4.58 ± 0.69 |
4.25 ± 0.43 |
3.59 ± 0.48 |
0.32 ± 0.12 |
0.41 ± 0.11 |
||
|
合计 |
46.13 ± 7.60 |
21.21 ± 3.30 ** |
36.08 ± 6.20 |
14.64 ± 1.99 ** |
0.57 ± 0.12 |
0.79 ± 0.06 ** |
与GAM比较, * P<0.05, ** P<0.01. RMSE:均方根误差;MAE:平均绝对误差; R 2:决定系数.
GAM作为一种传统时间序列预测模型,在控制长期趋势、季节趋势、气象因素和预测健康风险等方面具有显著优势,但在建模过程中只使用一种函数进行训练,模型训练不足,对时间序列信息的利用度较低,预测精确度无法进一步提升 [16] 。LSTM-RNN属于深度学习,具有较好的泛化性和非线性能力 [17] ,可通过复杂的网络,实现多层循环计算,不断更新权重值,直到达到最佳训练效果,解决了RNN预测时出现的梯度爆炸和梯度消失问题 [18] 。LSTM-RNN还具备记忆性,可将上一时刻信息带入当前计算,增加了变量在时间上的联系强度,因此LSTM-RNN稳健性佳,预测能力稳定。本研究基于LSTM-RNN探讨如何精准预测糖尿病合并呼吸系统疾病患者入院频数。
本研究在构建预测模型时,将影响糖尿病合并呼吸系统疾病入院的常见特征纳入模型中。大量流行病学研究证实,大气污染物的暴露会增加呼吸系统疾病 [ 19- 20] 和糖尿病 [ 21- 22] 的发病风险。PM2.5和PM10暴露会增加呼吸系统疾病入院人数 [ 23- 24] ,糖尿病患者可能更容易受到PM2.5的影响 [25] 。气象因素也对疾病的发病起到一定作用,特别是气温。极端温度会增加呼吸系统疾病患病风险 [26] ,温度每升高1 ℃,胰岛素抵抗系数能增加17% [27] 。同时,有研究指出女性呼吸系统疾病患者对空气污染的敏感性高于男性 [28] ,且大气污染物浓度和气象因素会随着季节而改变 [ 29- 30] 。北京市大气污染物浓度分布还具有明显的空间差异,城市发展新区靠近河北重工业污染区,外来源输入污染严重 [31] ;而生态涵养发展区多为山区,污染物浓度则较低 [32] 。综合以上因素,本研究构建预测模型后,对性别、季节和功能区分层预测,以进一步检验模型的稳健性。
模型比较结果表明,预测总入院频数时,LSTM-RNN预测误差小,拟合优度高于GAM,这与以往的研究结论基本一致 [33] 。分层分析中,在预测女性、温暖季节及首都功能核心区入院频数时,LSTM-RNN预测误差和拟合情况更优。预测男性、寒冷季节入院频数时,两种模型差异虽不具有统计学意义,但LSTM-RNN模型评价指标仍略优于GAM。研究发现,PM10、PM2.5、二氧化硫、二氧化氮等污染物在低温与高浓度条件下交互影响最显著 [34] 。寒冷季节温度大幅度降低,相比于温暖季节,污染物与低温间的交互作用可能会影响LSTM-RNN模型的预测效果。随着地理位置的改变,温度和大气污染物对健康的交互作用各不相同 [35] ,因此可能导致不同功能区预测效果差异。
本研究数据量较大,来源准确可靠,考虑了多维混杂因素的影响。由于模型中输入的各种数据具有不同的物理意义,为了消除各类数据之间的量纲影响,本研究在建模前对数据进行了归一化处理,有助于加快训练模型的收敛。此外,本研究还通过对LSTM-RNN进行Dropout处理,加速了整个模型的训练,有效避免后期的过拟合问题,增加了模型的稳健性。
本研究整合了大气污染物、气象因素、既往入院数据等多维特征,分别基于LSTM-RNN和GAM构建糖尿病合并呼吸系统疾病患者入院频数的预测模型,预测了不同性别、不同季节和不同功能区入院频数。LSTM-RNN的预测误差较小,拟合程度优,为医院根据污染天气提前精准配置医疗资源提供了新的科学依据。下一步考虑基于小尺度精确估计个体室内、室外污染暴露,以期精准估计效应量。
COMPETING INTERESTS
所有作者均声明不存在利益冲突
Funding Statement
国家自然科学基金(82003559);北京市优秀人才培养资助青年骨干个人项目;首都医科大学自然培育项目(PYZ2018046)
References
- 1.SAEEDI P, PETERSOHN I, SALPEA P, et al. Global and regional diabetes prevalence estimates for 2019 and projections for 2030 and 2045: results from the International Diabetes Federation Diabetes Atlas, 9th edition[J] Diabetes Res Clin Pract. . 2019;157:107843. doi: 10.1016/j.diabres.2019.107843. [DOI] [PubMed] [Google Scholar]
- 2.KYU H H, ABATE D, ABATE K H, et al. Global, regional, and national disability-adjusted life-years (DALYs) for 359 diseases and injuries and healthy life expectancy (HALE) for 195 countries and territories, 1990—2017: a systematic analysis for the Global Burden of Disease Study 2017[J] Lancet. . 2018;392(10159):1859–1922. doi: 10.1016/S0140-6736(18)32335-3. [DOI] [PMC free article] [PubMed] [Google Scholar]
- 3.GUAN W J, LIANG W H, ZHAO Y, et al. Comorbidity and its impact on 1590 patients with COVID-19 in China: a nationwide analysis[J] Eur Respir J. . 2020;55(5):2000547. doi: 10.1183/13993003.00547-2020. [DOI] [PMC free article] [PubMed] [Google Scholar]
- 4.SHI Q, ZHANG X, JIANG F, et al. Diabetic patients with COVID-19, characteristics and outcome: a two-centre, retrospective, case control study[J] SSRN J. . 2020. DOI: 10.2139/SSN.3551369 doi: 10.2139/ssrn.3551369. [DOI] [Google Scholar]
- 5.SILVER D, HUANG A, MADDISON C J, et al. Mastering the game of Go with deep neural networks and tree search[J] Nature. . 2016;529(7587):484–489. doi: 10.1038/nature16961. [DOI] [PubMed] [Google Scholar]
- 6.张军阳, 王慧丽, 郭 阳, 等. 深度学习相关研究综述[J]. 计算机应用研究, 2018, 35(7): 1921-1928, 1936 ; ZHANG Junyang, WANG Huili, GUO Yang, et al. Review of deep learning[J]. Application Reasearch of Computer, 2018, 35(7): 1921-1928, 1936. (in Chinese)
- 7.王志远, 王守相, 陈海文, 等. 考虑空间相关性采用LSTM神经网络的光伏出力短期预测方法[J]. 电力系统及其自动化学报, 2020, 32(5): 78-85 ; WANG Zhiyuan, WANG Shouxiang, CHEN Haiwen, et al. Short-term photovoltaic output forecasting method using LSTM neural network with consideration of spatial correlation[J]. Proceedings of the CSU-EPSA, 2020, 32(5): 78-85. (in Chinese)
- 8.黄钰姝, 宋和佳, 张 睿, 等. ARIMAX与多变量LSTM模型在盐城市总死亡人数预测中的比较研究[J]. 公共卫生与预防医学, 2021, 32(5): 6-10 ; HUANG Yushu, SONG Hejia, ZHANG Rui, et al. Comparison of ARIMAX and multivariate LSTM model in predicting daily death toll in Yancheng city[J]. Journal of Public Health and Preventive Medicine, 2021, 32(5): 6-10. (in Chinese)
- 9.PENG R D, DOMINICI F, LOUIS T A. Model choice in time series studies of air pollution and mortality[J] J R Statistical Soc A. . 2006;169(2):179–203. doi: 10.1111/j.1467-985X.2006.00410.x. [DOI] [Google Scholar]
- 10.ZEGER S L, IRIZARRY R, PENG R D. On time series analysis of public health and biomedical data[J] Annu Rev Public Health. . 2006;27(1):57–79. doi: 10.1146/annurev.publhealth.26.021304.144517. [DOI] [PubMed] [Google Scholar]
- 11.DOMINICI F, MCDERMOTT A, ZEGER S L, et al. On the use of generalized additive models in time-series studies of air pollution and health[J] Am J Epidemiol. . 2002;156(3):193–203. doi: 10.1093/aje/kwf062. [DOI] [PubMed] [Google Scholar]
- 12.PENG Z, WANG Q, KAN H, et al. Effects of ambient temperature on daily hospital admissions for mental disorders in Shanghai, China: a time-series analysis[J] Sci Total Environ. . 2017;590-591:281–286. doi: 10.1016/j.scitotenv.2017.02.237. [DOI] [PubMed] [Google Scholar]
- 13.孙锦峰, 耿云亮, 郭奕瑞, 等. Elman神经网络与ARIMA模型对流感发病率预测效果的比较[J]. 郑州大学学报(医学版), 2013, 48(5): 584-587 ; SUN Jinfeng, GENG Yunliang, GUO Yirui, et al. Application and comparison of Elman neural network model and ARIMA model to predict the incidence of influenza[J]. Journal of Zhengzhou University (Medical Sciences), 2013, 48(5): 584-587. (in Chinese)
- 14.侯伟涛, 姬东鸿. 基于Bi-LSTM的医疗事件识别研究[J]. 计算机应用研究, 2018, 35(7): 1974-1977 ; HOU Weitao, JI Donghong. Research on clinic event recognition based Bi-LSTM[J]. Application Reasearch of Computer , 2018, 35(7): 1974-1977. (in Chinese)
- 15.李艳芳, 王 钰, 李济洪. 几种交叉验证检验的可重复性[J]. 太原师范学院学报(自然科学版), 2013, 12(4): 46-49 ; LI Yanfang, WANG Yu, LI Jihong. The replicability of several cross-validated tests[J]. Journal of Taiyuan Normal University (Natural Science Edition), 2013, 12(4): 46-49. (in Chinese)
- 16.刘相佟, 伍梦秋, 孙 玥, 等. 2013—2014年北京市脑卒中日入院人数的两种预测模型比较研究[J]. 健康体检与管理, 2021, 2(4): 295-301 ; LIU Xiangtong, WU Mengqiu, SUN Yue, et al. Comparison of two prediction models for daily admission of stroke in Beijing from 2013 to 2014[J]. Journal of Health Examination and Management, 2021, 2(4): 295-301. (in Chinese)
- 17.欧阳红兵, 黄 亢, 闫洪举. 基于LSTM神经网络的金融时间序列预测[J]. 中国管理科学, 2020, 28(4): 27-35 ; OUYANG Hongbing, HUANG Kang, YAN Hongju. Prediction of financial time series based on LSTM neural network[J]. Chinese Journal of Management Science, 2020, 28(4): 27-35. (in Chinese)
- 18.李 冰, 张 妍, 刘 石. 基于LSTM的短期风速预测研究[J]. 计算机仿真, 2018, 35(11): 456-461 ; LI Bing, ZHANG Yan, LIU Shi. Wind speed short term prediction study based on LSTM[J]. Computer Simulation, 2018, 35(11): 456-461. (in Chinese)
- 19.TAJ T, MALMQVIST E, STROH E, et al. Short-term associations between air pollution concentrations and respiratory health——comparing primary health care visits, hospital admissions, and emergency department visits in a multi-municipality study[J] Int J Environ Res Public Health. . 2017;14(6):587. doi: 10.3390/ijerph14060587. [DOI] [PMC free article] [PubMed] [Google Scholar]
- 20.LAI H K, TSANG H, WONG C M. Meta-analysis of adverse health effects due to air pollution in Chinese populations[J] BMC Public Health. . 2013;13(1):360. doi: 10.1186/1471-2458-13-360. [DOI] [PMC free article] [PubMed] [Google Scholar]
- 21.THIERING E, HEINRICH J. Epidemiology of air pollution and diabetes[J] Trends Endocrinol Metab. . 2015;26(7):384–394. doi: 10.1016/j.tem.2015.05.002. [DOI] [PubMed] [Google Scholar]
- 22.PAUL L A, BURNETT R T, KWONG J C, et al. The impact of air pollution on the incidence of diabetes and survival among prevalent diabetes cases[J] Environ Int. . 2020;134:105333. doi: 10.1016/j.envint.2019.105333. [DOI] [PubMed] [Google Scholar]
- 23.GURUNG A, SON J Y, BELL M L. Particulate matter and risk of hospital admission in the kathmandu valley, nepal: a case-crossover study[J] Am J Epidemiol. . 2017;186(5):573–580. doi: 10.1093/aje/kwx135. [DOI] [PubMed] [Google Scholar]
- 24.YAO C, WANG Y, WILLIAMS C, et al. The association between high particulate matter pollution and daily cause-specific hospital admissions: a time-series study in Yichang, China[J] Environ Sci Pollut Res. . 2020;27(5):5240–5250. doi: 10.1007/s11356-019-06734-2. [DOI] [PubMed] [Google Scholar]
- 25.YANG B Y, GUO Y, MARKEVYCH I, et al. Association of long-term exposure to ambient air pollutants with risk factors for cardiovascular disease in China[J/OL] JAMA Netw Open. . 2019;2(3):e190318. doi: 10.1001/jamanetworkopen.2019.0318. [DOI] [PMC free article] [PubMed] [Google Scholar]
- 26.SONG X, WANG S, LI T, et al. The impact of heat waves and cold spells on respiratory emergency department visits in Beijing, China[J] Sci Total Environ. . 2018;615:1499–1505. doi: 10.1016/j.scitotenv.2017.09.108. [DOI] [PubMed] [Google Scholar]
- 27.BLAUW L L, AZIZ N A, TANNEMAAT M R, et al. Diabetes incidence and glucose intolerance prevalence increase with higher outdoor temperature[J/OL] BMJ Open Diab Res Care. . 2017;5(1):e000317. doi: 10.1136/bmjdrc-2016-000317. [DOI] [PMC free article] [PubMed] [Google Scholar]
- 28.SONG W M, LIU Y, LIU J Y, et al. The burden of air pollution and weather condition on daily respiratory deaths among older adults in China, Jinan from 2011 to 2017[J/OL] Medicine. . 2019;98(10):e14694. doi: 10.1097/MD.0000000000014694. [DOI] [PMC free article] [PubMed] [Google Scholar]
- 29.顾 晨, 王佳欣, 吕沛诚, 等. 兰州市3种主要污染物大气环境容量季节差异及排放总量控制[J]. 兰州大学学报(自然科学版), 2021, 57(3): 302-310, 317 ; GU Chen, WANG Jiaxin, LYU Peicheng, et al. Seasonal variations in atmospheric environmental capacity and total quantity control for three criteria pollutants in Lanzhou[J]. Journal of Lanzhou University (Natural Sciences), 2021, 57(3): 302-310, 317. (in Chinese)
- 30.张 玉, 兰 剑, 乔利平, 等. 气象参数和节假日对上海市区大气污染物浓度的影响[J]. 广州化工, 2021, 49(18): 85-87, 108 ; ZHANG Yu, LAN Jian, QIAO Liping, et al. Influence of meteorological parameters and holidays on air pollutant concentration in Shanghai[J]. Guangzhou Chemical Industry, 2021, 49(18): 85-87, 108. (in Chinese)
- 31.臧星华, 鲁垠涛, 姚 宏, 等. 中国主要大气污染物的时空分布特征研究[J]. 生态环境学报, 2015, 24(8): 1322-1329 ; ZANG Xinghua, LU Yintao, YAO Hong, et al. The temporal and spatial distribution characteristics of main air pollutants in China[J]. Ecology and Environment Sciences, 2015, 24(8): 1322-1329. (in Chinese)
- 32.王嫣然, 张学霞, 赵静瑶, 等. 2013—2014年北京地区PM 2.5时空分布规律及其与植被覆盖度关系的研究[J]. 生态环境学报, 2016, 25: 103-111 ; WANG Yanran, ZHANG Xuexia, ZHAO Jingyao, et al. Temporal and spatial distribution of PM 2.5 and its relationship with vegetation coverage in Beijing during the period of 2013—2014[J]. Ecology and Environment Sciences, 2016, 25: 103-111. (in Chinese)
- 33.朱晓娟. 基于机器学习的健康风险评估与预测[D]. 成都: 电子科技大学, 2020 ; ZHU Xiaojuan. Health risk assessment and prediction based on machine learning[D]. Chengdu: University of Electronic Science and Technology of China, 2020. (in Chinese)
- 34.洪 也, 张 莹, 马雁军, 等. 沈阳大气污染物与气象因素对呼吸疾病门诊数的影响[J]. 中国环境科学, 2020, 40: 4077-4090 ; HONG Ye, ZHANG Ying, MA Yanjun, et al. Effects of air pollutants and meteorological factors on outpatient visitors for respiratory diseases in Shenyang[J]. China Environmental Science, 2020, 40: 4077-4090. (in Chinese)
- 35.LI J, WOODWARD A, HOU X Y, et al. Modification of the effects of air pollutants on mortality by temperature: a systematic review and meta-analysis[J] Sci Total Environ. . 2017;575:1556–1570. doi: 10.1016/j.scitotenv.2016.10.070. [DOI] [PubMed] [Google Scholar]


