Abstract
脑龄预测作为评估大脑健康和早期诊断神经退行性疾病的重要方法,近年来受到广泛关注。脑电(electroencephalogram,EEG)作为一种无创、便捷且低成本的神经生理信号,与大脑功能状态联系紧密,时间分辨率极高,这些特性使EEG在脑龄预测领域具备无可比拟的独特优势。尽管基于EEG的脑龄预测模型在准确性和泛化能力方面取得了一定进展,但数据质量和模型可解释性等挑战依然存在。本文综述了基于EEG的脑龄预测研究进展,详细介绍了数据预处理、特征提取、模型构建和结果评价的关键环节,总结了机器学习和深度学习方法在该领域的应用现状,并分析了当前存在的问题和未来发展趋势,以推动基于EEG的脑龄预测技术在临床和研究中的广泛应用。
Keywords: 脑电, 脑龄预测, 机器学习, 深度学习, 临床应用
Abstract
Brain age prediction, as a significant approach for assessing brain health and early diagnosing neurodegenerative diseases, has garnered widespread attention in recent years. Electroencephalogram (EEG), an non-invasive, convenient, and cost-effective neurophysiological signal, offers unique advantages for brain age prediction due to its high temporal resolution and strong correlation with brain functional states. Despite substantial progress in enhancing prediction accuracy and generalizability, challenges remain in data quality and model interpretability. This review comprehensively examined the advancements in EEG-based brain age prediction, detailing key aspects of data preprocessing, feature extraction, model construction, and result evaluation. It also summarized the current applications of machine learning and deep learning methods in this field, analyzed existing issues, and explored future directions to promote the widespread application of EEG-based brain age prediction in both clinical and research settings.
Keywords: Electroencephalogram, Brain age prediction, Machine learning, Deep learning, Clinical application
0. 引言
脑龄,即通过生物标志物或神经影像学数据估计的大脑“生物学年龄”,其概念可追溯至20世纪中叶[1]。到了现代,神经影像学技术和人工智能技术的兴起,使得脑龄预测逐步成为现实[2]。脑龄预测作为新兴的神经科学方法,在评估大脑健康、早期诊断神经退行性疾病以及研究大脑衰老机制等方面展现出巨大潜力[3]。基于磁共振成像(magnetic resonance imaging,MRI)的脑龄预测已形成成熟的研究体系[4]。通过多模态数据整合,其平均绝对误差(mean absolute error,MAE)可低至2.4~2.8年[5-6]。Holm等[7]通过纵向队列研究揭示了青春期发育与脑龄加速呈正相关(r = 0.32)。在AD早期筛查和发育轨迹研究中[6],基于MRI的脑龄预测展现出临床价值。然而,该技术仍存在MRI设备成本高、检查需严格静息状态配合,以及图像处理耗时等挑战。
与MRI相比,脑电(electroencephalogram,EEG)作为一种无创、便捷且相对低成本的神经生理信号,具有独特优势。EEG具有高时间分辨率,与大脑的结构和功能状态紧密相关,且随年龄增长会发生可检测的变化,而这些变化与大脑的衰老过程密切相关[8]。此外,EEG信号在不同个体之间存在显著差异,这些差异在一定程度上与年龄相关,如随着年龄增长,EEG信号的α(8~13 Hz)波段功率通常会降低,而θ(4~7 Hz)波段功率会增加[9]。总之,随着神经科学的发展,基于EEG信号的脑龄预测在评估大脑健康和衰老进程方面具有重要意义。因此,本综述旨在系统梳理基于EEG信号进行脑龄预测的流程与方法(见图1),总结研究与应用进展,分析优势与局限,深入挖掘脑龄与EEG信号之间的潜在联系,以期为理解大脑衰老机制提供有力支持,并为未来研究提供参考。
图 1.
Process of brain age prediction based on EEG
基于EEG的脑龄预测流程
1. 数据预处理
EEG预处理旨在去除噪声和伪迹,增强信号质量,降低数据维度,提高数据标准化,从而提高后续分析的准确性和效率,保证分析结果的稳定性。
1.1. 去除伪迹
EEG信号在采集过程中容易受到噪声、生理活动和信号异常等各种伪迹的干扰,去除伪迹是EEG信号处理的关键环节,旨在消除各类干扰因素,使EEG信号能更准确地反映大脑神经元的真实电生理活动。
EEG信号的噪声干扰包括工频噪声和设备噪声。常用陷波器消除50/60 Hz的工频噪声,用带通滤波器限制信号频率范围,去除高频噪声和低频漂移。Dong等[10]基于EEG信号进行脑龄预测时,在50、100、150、200、250 Hz下进行陷波滤波以去除工频干扰,并应用有限脉冲响应滤波器进行0.3~50 Hz范围内的带通滤波,有效去除了噪声。
生理活动伪迹主要来源于眼动、肌肉收缩和心脏搏动,常用基于分解或回归的方法去除。基于分解的方法常见的有独立成分分析[11](independent component analysis,ICA)、小波变换[12](wavelet transform,WT)、经验模态分解[13]和稀疏分解[14]等方法。ICA通过矩阵分解将EEG信号分解为独立成分,结合人工或算法识别伪迹成分。Bomatter等[11]通过ICA进行EEG伪迹去除,显著提升了信号质量。近年研究趋势表明,多方法协同优化可进一步提升性能。Yedukondalu等[15]融合循环奇异谱分析与离散小波变换的混合框架自动去除眼电伪迹,为EEG信号的预处理提供了一种有效的解决方案,对非周期性肌电干扰的处理可结合稀疏分解优化。基于回归的方法通过建立伪迹参考信号与EEG信号之间的线性关系,估计并去除伪迹成分,适用于已知伪迹源的情况,去除效果较好。常用的方法包括线性回归和自适应滤波。He等[16]提出一种改进的自适应滤波框架,能快速收敛并自动适应信号非平稳性,显著提升了在线去伪迹的效率。
信号异常包括运动伪迹、基线漂移和信号缺失等,常用基于自适应的方法剔除异常数据,适用于大规模数据处理。Sun等[17]通过设置绝对振幅阈值(> 500 μV)排除受运动伪迹污染的时段,剔除EEG信号缺失超过5 s的无效时段,共剔除约6.7%的噪声数据,有效提升了信号质量。但该方法需要根据实际调整参数,过度剔除可能导致数据丢失。
1.2. 其他预处理流程
原始EEG信号的采样频率往往较高,虽然能够捕捉到丰富的细节信息,但也包含大量冗余数据,给后续计算和分析带来较大负担。降采样技术可以在不损失关键信息的前提下,降低数据维度,减少计算量。在脑龄预测研究中,常见的降采样频率有100 Hz[10]、250 Hz[11]等,通过降采样在不影响预测精度的情况下降低了计算复杂度。
由于不同通道采集到的EEG信号幅值可能存在较大差异,这种差异会影响后续的特征提取和模型训练。数据归一化能够有效消除通道间幅值差异,加速算法的收敛速度,同时突出数据中的相对变化特征,为更准确地分析大脑活动信息奠定基础。常用的数据归一化方法包括z-score[18]、min-max等。Apicella等[19]发现数据归一化后EEG分类精度可达到与领域自适应技术相当的性能。需要注意的是,z-score归一化对数据正态分布有假设要求,对于非高斯分布的数据,可能会导致特征失真。
由于连续EEG信号具有非平稳性,在预处理过程中常将EEG信号分割为固定长度或事件相关片段以实现任务匹配。Iyer等[20]在儿童脑龄预测研究中,把EEG划分为时长60 s且30 s重叠的片段后进行分析。这种时长的分段在临床上被认为足以充分捕捉EEG信号的时间特征,同时有效减轻信号非平稳性带来的影响。
2. 特征提取
EEG信号蕴含着丰富的信息,可从多个维度进行特征提取,以全面反映大脑的状态,为后续基于EEG信号的研究和分析提供核心数据支持[21]。常见的特征包括时域特征、频域特征、时频特征、空间特征和非线性特征,然而这些特征之间可能存在冗余性或多重共线性问题,在实际应用中需要谨慎考虑。
在EEG信号的时域特征中,统计与几何特征通过直接量化EEG形态学和统计特性揭示大脑活动的基本规律;Hjorth参数[22]则通过活动度、流动性和复杂度三个维度,为EEG提供量化指标,应用三个指标对癫痫发作进行分类的准确率可分别达到99.5%、99.272%和100%[23]。不过,Hjorth参数中的活动度与部分统计特征(如方差)在反映信号能量方面可能存在一定程度的信息重叠,这就涉及到特征冗余问题,可能会对后续的模型训练和分析造成干扰。
为了揭示EEG信号在不同频率成分上的分布规律,常用傅里叶变换(Fourier transform,FT)和周期图法等方法将信号从时域转换为频域,计算得到功率谱密度(power spectral density,PSD)等频域特征。Monsy等[24]通过计算频率加权功率特征,在生物特征识别中获得了0.003 9的等错误率,仅为传统方法的1/5。但需要注意的是,FT得到的不同频率成分的功率特征之间可能存在相关性。例如,低频段和高频段的功率变化可能受到某些共同因素的影响,导致这些频域特征之间出现多重共线性,这在构建模型时可能会影响模型的稳定性和准确性。
为了有效捕捉EEG信号的非平稳特性,常应用短时傅里叶变换[25]和WT等方法联合分析信号的时间与频率动态变化来获取时频域特征。研究表明,通过区分EEG信号特定频率下的功率和相位信息,时频分析能更敏感地检测大脑发育变化[26]。
为了提取EEG信号在多通道间的空间分布规律与功能连接模式,常通过通道间相关性及空间滤波技术实现空间特征挖掘。共空间模式[27]通过最大化两类信号的方差比生成空间滤波器,最终提取空间滤波后的能量比特征。Reddy等[28]进一步改进算法形成共空间谱模式,融合频率特异性分析,通过多频段空间-频谱联合滤波增强特征区分度,在预测实验中误差降低了9.94%。
此外,非线性特征进一步捕捉信号的复杂动态特性:样本熵通过量化信号复杂度,提示阿尔茨海默病患者θ频段熵值显著降低[29];分形维数描述信号自相似性,在癫痫发作期呈现特征性升高[30]。虽然非线性特征为EEG信号分析提供了独特的视角,但这些非线性特征与上述时域、频域等特征之间也可能存在关联。例如,样本熵与Hjorth参数中的复杂度特征在反映信号的复杂程度上存在一定联系,这就需要在特征选择和模型构建时加以考虑,避免因多重共线性导致模型性能下降。
在脑龄预测研究中,优化特征选择是提升预测精度与模型性能的关键环节。研究者通常会结合时域、频域和空间域的特征进行分析。Sun等[31]从睡眠EEG信号中提取了102个特征,包括时域的振幅包络、频域的PSD以及非线性域的信息熵等特征,这些特征能够反映睡眠过程中大脑的微结构变化,如慢波活动、纺锤波密度等,这些变化与年龄密切相关。Ye等[32]利用功率谱和其他EEG特征来构建脑龄指数(brain age index,BAI),并发现这些特征与痴呆症的进展密切相关,为进一步探究特征的重要性,研究者运用逻辑回归模型中的优势比进行深入分析,清晰地确定了不同EEG特征在反映痴呆症进展方面的相对重要性,强调了在复杂特征分析中,合理运用统计方法处理特征相关性问题的重要性。此外,Li等[33]结合了二进制粒子群优化和递归特征消除等方法进行特征选择,发现EEG信号中的特定特征(如爆发活动、慢波活动等)与脑功能成熟度密切相关,这种特征选择方法有助于减少特征间的冗余和多重共线性问题,但在实际操作中,仍需要进一步验证所选特征的独立性和有效性,以确保模型的可靠性和准确性。总之,优化特征选择可以提高预测性能,为脑龄预测提供更有效的工具。
3. 模型构建
3.1. 基于机器学习模型的脑龄预测
监督机器学习算法依据理论基础与实现机制可分为五大类,广泛应用于分类和回归任务。在基于EEG的脑龄预测研究中,不同类型的算法发挥着各自独特的优势,如表1所示。
表 1. Studies on EEG-based brain age prediction using machine learning methods.
应用机器学习方法进行EEG脑龄预测的研究
| 文献 | 样本量 | 年龄 | 数据类型 | 模型 | 结果评价 |
| [31] | 4 506 | 18~80岁 | 睡眠EEG | SVR | MAE = 7.6年, = 0.83 |
| [33] | 92 | 28~40周 | 早产儿EEG | SVR | MAE = 0.79周 |
| [34] | 39 | < 28周 | 早产儿EEG | SVR | r = 0.936 |
| [35] | 96 | 28~40周 | 皮层诱发电位 | SVR | MAE = 1.55周 |
| [36] | 73 | 24~31周 | 早产儿EEG | SVR | MAE = 2.1周 |
| [11] | 2 634 | 0~95岁 | 静息EEG | 四种基于协方差的方法(Upper、Log diagonal、SPoC和Riemann) | R2 = 0.8,AUC = 0.9 |
| [20] | 723 | 2月~ 18岁 | 睡眠EEG | GPR | MAE = 1.25年,R2 = 0.85 |
| [32] | 5 144 | > 50岁 | 睡眠EEG | 广义线性模型+Softplus函数 | BAI: 非痴呆组:0.20;有症状者:0.58;MCI:1.65;痴呆:4.18 |
| [37] | 4 877 | >40岁 | 睡眠EEG | 惩罚线性回归 | 风险比= 1.12 |
| [38] | 5 200 | 18~81岁 | 睡眠EEG | 岭回归模型 | R2 = 0.3~0.5 |
| [39] | 30 | 27~42周 | 早产儿EEG | 线性混合效应模型 | MAE = 1.51周,R2 = 0.8 |
| [40] | 1 538 | 5~18岁 | 静息EEG | RFR | MAE = 1.22年,r = 0.53~0.74 |
| [10] | 1 851 | 29~45周 | 新生儿EEG | 梯度推进模型 | AUC = 0.984 |
| [41] | 468 | 平均34.8岁 | 静息EEG | 嵌套交叉验证 + 堆叠回归集成模型 | MAE = 6.87年,R2 = 0.37,r = 0.6,RMSE = 8.46 |
| [42] | 596 | 30~93岁 | 静息EEG | SVR+弹性网回归 + 径向基函数核高斯过程 | MAE = 3.681年,R2 = 0.927,r = 0.965 |
基于边距的支持向量回归(support vector regression,SVR)方法,通过引入不敏感损失函数处理回归问题,借助核函数可有效应对非线性关系,常用于时间序列预测等场景。该方法在不同样本和年龄段的脑龄预测中均有应用[31, 33-36]。Sun等[31]利用SVR模型,基于MGH和SHHS两个大型数据集的睡眠EEG数据进行脑龄预测,MAE为7.6年,但该研究未深入探究脑龄预测结果与具体神经系统疾病或其他健康状况的因果关系。在早产儿脑龄预测方面,研究者[33-36]将SVR模型应用于小规模数据集,得到的MAE在0.79~2.1周之间。这些研究表明SVR在不同年龄段和样本规模的EEG数据上均能进行脑龄预测,但预测精度会因数据差异而有所不同。
基于协方差矩阵的方法能够精准捕捉变量间的线性关系,有效处理数据中的相关性问题,在脑龄预测研究中应用广泛[11, 20, 32, 37-39]。以高斯过程回归(Gaussian process regression,GPR)为例,它基于协方差函数建模数据相似性,能实现非线性回归并提供概率输出,尤其适用于小样本回归任务。Iyer等[20]利用GPR进行脑龄预测获得了高精度结果。此外,广义线性模型分析脑龄与认知状态关系,惩罚线性回归得出风险比,岭回归模型有一定拟合能力,线性混合效应模型在特定样本脑龄预测中发挥作用,这些方法在不同样本和研究目的下展现出各自的特点和价值。
基于集成学习的随机森林回归(random forest regression,RFR)、梯度提升树(gradient boosting tree,GBT)和梯度推进模型等方法,通过结合多个弱学习器构建强学习系统,在复杂任务中展现出显著优势,广泛应用于脑龄预测研究中[10, 40-41]。Vandenbosch等[40]应用RFR方法进行脑龄预测研究,发现EEG与MRI数据的脑龄预测准确性相当,显示出RFR在脑龄预测方面的有效性。
除上述三类方法外,基于频率表的方法如朴素贝叶斯适合小规模文本场景,基于相似度度量的方法如K近邻算法以近邻投票分类,适用于图像识别等,这些方法未见在脑龄预测中应用。为了进一步提高预测性能,一些研究采用了模型集成方法。Kounios等[42]结合了多种机器学习模型,通过堆栈集成学习预测脑龄,结果表明该方法能够显著提高预测的准确性和稳定性。通过不断优化模型结构和集成策略,研究者们显著提高了EEG脑龄预测模型的准确性和泛化能力,为未来的大规模大脑健康监测和疾病早期筛查提供了有力的技术支持。
3.2. 基于深度学习模型的脑龄预测
深度学习模型凭借强大的特征学习与模式识别能力,在基于EEG信号的脑龄预测中发挥着重要作用。主流研究范式普遍采用端到端模型框架,该方法直接将预处理后的EEG信号输入神经网络,无需进行传统的信号特征提取,最大程度地保留了原始信号的信息,在处理动态复杂信号和高维时间序列数据时优势显著。常用的深度学习方法包括卷积神经网络(convolutional neural network,CNN)、循环神经网络(recurrent neural network,RNN)和Transformer架构等。这些方法各有优势,适用于不同的数据特征和研究目标,如表2[18, 43-54]所示。
表 2. Studies on EEG-based brain age prediction using deep learning methods.
应用深度学习方法进行EEG脑龄预测的研究
| 文献 | 样本量 | 年龄 | 数据类型 | 模型 | 结果评价 |
| [43] | 140 | < 32周 | 静息EEG | CNN | MAE = 1.03周,R2 = 0.82 |
| [44] | 7 048 | 1~103岁 | 睡眠EEG | MIMFs + CNN | MAE = 13.76年 |
| [45] | 1 274 | 5~88岁 | 静息EEG | DCNN | MAE = 5.96年,R2 = 0.81 |
| [46] | 43 | 23~28周 | 早产儿EEG | CNN | 重复率 = 96% |
| [18] | 225 | > 8岁 | 睡眠EEG | DenseNet | 准确率 = 86%,BAI =(–0.6 ± 2.7)年 |
| [47] | 4 215 | 20~70岁 | 睡眠EEG | DenseNet | MAE = 5.4年,r = 0.8 |
| [48] | 5 282 | > 18岁 | 睡眠EEG | DenseNet | MAE = 4.8年,r = 0.86 |
| [49] | 546 | 2~88岁 | 静息EEG | LSTM、GRU、BLSTM、BGRU | MAE = 7 |
| [50] | 375 | 8月~20岁 | 静息EEG | BLSTM、Transformer | 准确率 = 86% |
| [51] | 60 | 6~55岁 | 静息EEG | Deep BLSTM、LSTM | 准确率 = 97.5% |
| [52] | 13 616 | 0~100岁 | 睡眠EEG | Swin transformer、CNN、DenseNet | MAE = 4.19年,r = 0.97 |
| [53] | 13 299 | 20~90岁 | 睡眠EEG | CNN+LSTM+attention | MAE = 5.8年,r = 0.839 |
| [54] | 5 306 | — | fMRI、EEG | GCN | MAE = 5.34年,R2 = 0.37,F = 0.59,RMSE = 6.9 |
CNN通过卷积层、池化层和全连接层的结构自动学习输入数据的特征,并执行分类、识别和预测等任务[55]。经典CNN对EEG信号中的局部规律和特征捕捉能力强,可减少人工提取特征的工作量,该方法已广泛用于EEG脑龄预测中[43-46]。Gschwandtner等[46]应用CNN模型估计早产儿脑龄,直接从EEG信号中学习非线性特征,8通道EEG数据上的MAE为±2周内的准确率达93.6%,显著优于传统特征提取方法。但Paliwal等[44]应用多元本征模态函数结合CNN方法进行脑龄预测,结果MAE为13.76年,分析原因可能是由于EEG数据是从临床收集,数据质量差异大导致。DenseNet作为CNN变体,层间密集连接,每层接收前层所有特征,利于缓解梯度消失,以较少参数实现更强特征学习能力,在预测任务中可学习更丰富特征组合,提升预测精度[18, 47-48]。Yook等[48]应用DenseNet取得了较高的预测结果(MAE = 4.8年,r = 0.86)。
长短时记忆网络(long short-term memory network,LSTM)[49-51]在RNN基础上增加了记忆单元和门控机制,能够更好地处理EEG信号中的长时依赖关系,能学习EEG信号时间维度动态变化。Wong等[50]应用双向LSTM算法识别不同年龄段的EEG时表现出较高的准确性,二分类时准确率达到86%。Kaushik等[51]应用深度双向LSTM算法预测脑龄和性别取得了更高的准确率,分别达到了93.7%和97.5%。对于模型架构的优化,可以在LSTM层后添加自注意力层,动态捕捉不同时间或脑区的关键特征,提升对复杂脑龄相关模式的识别能力。针对多分类任务的类别不平衡问题,可采用类别权重或焦点损失等动态权重调整方法,提升模型对少数类的敏感性。
Transformer基于自注意力机制,能够对EEG信号中的长时序列依赖关系进行建模,学习到EEG信号中更复杂的长期模式和特征交互,且并行计算能力使其训练效率更高[50, 52]。Zhang等[52]提出了基于Transformer的深度学习模型,预测结果MAE仅为4.19岁,显示出较强的纵向敏感性。除此之外,有研究[53]将多种方法如CNN、LSTM和注意力机制相结合,应用多中心、大样本量数据进行脑龄预测,取得了较高精度的结果(MAE = 5.8年,r = 0.839)。另外,Moguilner等[54]应用图神经网络模型分别处理fMRI和EEG数据进行脑龄预测,结果显示预测脑龄的结果拟合度良好。这些方法不仅提高了预测的准确性,还为临床诊断和神经科学研究提供了新的工具。
4. 结果评价
在基于EEG信号进行脑龄预测的研究中,模型的评价至关重要,它直接关系到预测结果的可靠性和有效性。常用的评价指标中,MAE[33]计算预测值与真实值之间差值的绝对值的平均值,直观地反映了预测值与真实值之间的平均偏差程度。决定系数[11](R2)用于评估模型对数据的拟合优度。皮尔逊相关系数[31](r)衡量预测值与真实值之间的线性相关程度。BAI[32]是预测脑龄与实际年龄之差,可以作为生物标志物,用于评估大脑健康状态和疾病风险。另外,临床相关性评估通过相关性分析、回归分析或生存分析等方法,可以评估预测脑龄与临床指标(如认知功能、疾病进展、死亡率)之间的关系,验证模型在实际应用中的价值。
在脑龄预测实际应用中,在睡眠障碍评估方面,基于EEG的脑龄预测在诊断睡眠障碍中具有重要价值。Yook等[47]研究发现脑龄增长与睡眠障碍严重程度密切相关,其BAI可作为反映睡眠和大脑健康变化的有效指标。在癫痫相关神经退行性疾病风险评估上,脑龄预测能够有效评估癫痫患者患神经退行性疾病的风险[49]。在精神类疾病研究中发现,脑龄预测误差与各种精神和神经系统疾病相关[45]。对于阻塞性呼吸暂停患者脑健康评估,Yook等[18]结合睡眠EEG预测BAI来量化持续气道正压通气(continuous positive airway pressure,CPAP)治疗对大脑健康的影响,模型预测结果准确性高达86%,充分表明CPAP可缓解患者脑老化,同时BAI也能有效评估CPAP对大脑健康的影响。在寿命预测方面,Brink-Kjaer等[53]通过EEG估计脑龄和死亡风险,发现脑龄估计误差每增加10年,全因死亡率增加29%,估计误差从–10年增加到+10年,预期寿命减少8.7年,表明BAI是反映大脑健康状态的重要生物标志物。总之,基于EEG的脑龄预测,为睡眠障碍疾病、癫痫相关神经退行性疾病、精神类疾病和阻塞性呼吸暂停等多种疾病的诊断和寿命预测等健康评估提供了多维度、准确且有效的手段,具有广阔的临床应用前景。
5. 挑战与展望
尽管基于EEG的脑龄预测研究在近年来取得了显著进展,但在从实验室走向临床应用的过程中仍面临诸多挑战和问题。这些问题不仅影响了脑龄预测的准确性和可靠性,也限制了其在大规模人群中的应用。
在数据预处理层面,EEG数据的质量与一致性问题较为突出。EEG信号易受多种因素干扰,即便经过预处理,部分噪声仍可能残留,影响预测准确性。而且,不同研究采用的EEG采集设备各异,数据预处理标准不统一,导致数据质量参差不齐,这使得不同研究间的数据难以直接对比与整合,限制了模型的泛化能力提升。针对这一问题,可采取一系列改进措施。一方面,优化预处理算法,如运用深度学习降噪算法-生成对抗网络[56](generative adversarial network,GAN)学习噪声模式以去除噪声,提高噪声去除效果;另一方面,由相关组织制定统一标准,明确EEG数据采集设备、参数设置以及预处理流程和方法等方面的标准,严格执行以确保数据质量一致。同时,建立数据质量评估与筛选体系,对数据质量进行多阶段评估,并在数据整合时评估质量一致性。最后,鼓励建立公开共享数据库,为研究者提供丰富资源,加速领域研究进展。
从模型角度来看,模型的可解释性难题和过拟合风险依旧存在。深度学习模型在脑龄预测中虽展现出较高准确性,但因其结构复杂,难以清晰阐释EEG特征与脑龄预测结果之间的内在关联,这在临床应用中尤为关键,医生需要理解模型依据做出诊断决策。同时,模型的过拟合风险不容忽视。EEG数据样本量相对有限,而复杂模型为追求高准确率,容易过度学习训练数据中的噪声和特定模式,导致在新数据上泛化性能不佳。针对模型可解释性难题,可考虑引入诸如可解释人工智能的技术。如Rajpura等[57]运用逐层相关传播算法对模型进行解释,该算法能够清晰展示EEG信号特征在神经网络各层对最终输出结果的贡献程度,有助于理解模型决策过程。另外可通过新兴的SHAP值、LIME等[58]方法解释模型中各EEG特征对脑龄预测结果的影响,即使在复杂的模型结构下,也能为医生等专业人员提供清晰的模型决策依据,助力临床诊断。在应对过拟合风险上,除了持续优化正则化、交叉验证等常规手段,可尝试通过GAN技术生成与真实EEG数据分布相似的合成数据,以扩充有限的样本量,缓解模型对训练数据中噪声和特定模式的过度依赖。同时,考虑采用轻量级神经网络架构替代复杂深度模型,如MobileNet[59]等专为资源受限场景设计的架构,这类架构在保证预测准确性的同时,显著降低了过拟合风险。此外,迁移学习[60]也可应用于脑龄预测任务,借助在大规模相关EEG数据集上的预训练模型,将其知识迁移到当前脑龄预测任务中,减少模型对有限EEG数据的过度学习,增强模型在新数据上的泛化性能。
6. 总结
本文系统梳理了基于EEG信号的脑龄预测技术的研究进展,总结了其在数据预处理、特征提取、模型构建和结果评价等方面的关键技术与方法,并探讨了当前技术面临的挑战,如数据质量与一致性问题、模型可解释性不足以及过拟合风险等,针对这些问题,本文提出了优化预处理算法、引入可解释人工智能技术、采用轻量级神经网络架构等解决策略。未来,随着技术的进一步发展,EEG脑龄预测有望更深入地揭示大脑衰老机制,并结合多模态数据融合技术,为大脑健康评估提供更准确的生物标志物,推动脑龄预测技术在临床诊断和疾病早期干预中的应用。
重要声明
利益冲突声明:本文全体作者均声明不存在利益冲突。
作者贡献声明:祖红月搜集、整理文献并撰写文章,湛萍、于惠、王卫东负责稿件的写作指导和修订,刘洪运完成了文章的审阅和校对。
Funding Statement
国家重点研发计划(2022YFC2405603)
Contributor Information
卫东 王 (Weidong WANG), Email: ylooliu@163.com.
洪运 刘 (Hongyun LIU), Email: wangwd301@126.com.
References
- 1.Salih A, Boscolo Galazzo I, Raisi-Estabragh Z, et al Brain age estimation at tract group level and its association with daily life measures, cardiac risk factors and genetic variants. Sci Rep. 2021;11(1):20563. doi: 10.1038/s41598-021-99153-8. [DOI] [PMC free article] [PubMed] [Google Scholar]
- 2.Mishra S, Beheshti I, Khanna P A review of neuroimaging-driven brain age estimation for identification of brain disorders and health conditions. IEEE Rev Biomed Eng. 2023;16:371–385. doi: 10.1109/RBME.2021.3107372. [DOI] [PubMed] [Google Scholar]
- 3.Seitz-Holland J, Haas S S, Penzel N, et al Brain AGE, brain health, and mental disorders: A systematic review. Neurosci Biobehav Rev. 2024;159:105581. doi: 10.1016/j.neubiorev.2024.105581. [DOI] [PMC free article] [PubMed] [Google Scholar]
- 4.Soumya Kumari L K, Sundarrajan R A review on brain age prediction models. Brain Res. 2024;1823:148668. doi: 10.1016/j.brainres.2023.148668. [DOI] [PubMed] [Google Scholar]
- 5.Wen J, Zhao B, Yang Z, et al The genetic architecture of multimodal human brain age. Nat Commun. 2024;15(1):2604. doi: 10.1038/s41467-024-46796-6. [DOI] [PMC free article] [PubMed] [Google Scholar]
- 6.Wu Y, Gao H, Zhang C, et al Machine learning and deep learning approaches in lifespan brain age prediction: A comprehensive review. Tomography. 2024;10(8):1238–1262. doi: 10.3390/tomography10080093. [DOI] [PMC free article] [PubMed] [Google Scholar]
- 7.Holm M C, Leonardsen E H, Beck D, et al Linking brain maturation and puberty during early adolescence using longitudinal brain age prediction in the ABCD cohort. Dev Cogn Neurosci. 2023;60:101220. doi: 10.1016/j.dcn.2023.101220. [DOI] [PMC free article] [PubMed] [Google Scholar]
- 8.Javaid H, Kumarnsit E, Chatpun S Age-related alterations in EEG network connectivity in healthy aging. Brain Sci. 2022;12(2):218. doi: 10.3390/brainsci12020218. [DOI] [PMC free article] [PubMed] [Google Scholar]
- 9.Wang J, Fang J, Xu Y, et al Difference analysis of multidimensional electroencephalogram characteristics between young and old patients with generalized anxiety disorder. Front Hum Neurosci. 2022;16:1074587. doi: 10.3389/fnhum.2022.1074587. [DOI] [PMC free article] [PubMed] [Google Scholar]
- 10.Dong X, Kong Y, Xu Y, et al Development and validation of Auto-Neo-electroencephalography (EEG) to estimate brain age and predict report conclusion for electroencephalography monitoring data in neonatal intensive care units. Ann Transl Med. 2021;9(16):1290. doi: 10.21037/atm-21-1564. [DOI] [PMC free article] [PubMed] [Google Scholar]
- 11.Bomatter P, Paillard J, Garces P, et al Machine learning of brain-specific biomarkers from EEG. EbioMedicine. 2024;106:105259. doi: 10.1016/j.ebiom.2024.105259. [DOI] [PMC free article] [PubMed] [Google Scholar]
- 12.Al Fahoum A, Zyout A Wavelet transform, reconstructed phase space, and deep learning neural networks for EEG-based schizophrenia detection. Int J Neural Syst. 2024;34(9):2450046. doi: 10.1142/S0129065724500461. [DOI] [PubMed] [Google Scholar]
- 13.Jiao Y, Zheng Q, Qiao D, et al EEG rhythm separation and time-frequency analysis of fast multivariate empirical mode decomposition for motor imagery BCI. Biol Cybern. 2024;118(1-2):21–37. doi: 10.1007/s00422-024-00984-1. [DOI] [PubMed] [Google Scholar]
- 14.Swamy C P, Besheli B F, Branco L R F, et al Pulsation artifact removal from intra-operatively recorded local field potentials using sparse signal processing and data-specific dictionary. Annu Int Conf IEEE Eng Med Biol Soc. 2023;2023:1–4. doi: 10.1109/EMBC40787.2023.10340160. [DOI] [PMC free article] [PubMed] [Google Scholar]
- 15.Yedukondalu J, Sharma L D Circulant singular spectrum analysis and discrete wavelet transform for automated removal of EOG artifacts from EEG signals. Sensors (Basel) 2023;23(3):1235. doi: 10.3390/s23031235. [DOI] [PMC free article] [PubMed] [Google Scholar]
- 16.He P, Wilson G, Russell C Removal of ocular artifacts from electro-encephalogram by adaptive filtering. Med Biol Eng Comput. 2004;42(3):407–412. doi: 10.1007/BF02344717. [DOI] [PubMed] [Google Scholar]
- 17.Sun H, Jia J, Goparaju B, et al Large-scale automated sleep staging. Sleep. 2017;40(10):zsx139. doi: 10.1093/sleep/zsx139. [DOI] [PMC free article] [PubMed] [Google Scholar]
- 18.Yook S, Park H R, Joo E Y, et al Predicting the impact of CPAP on brain health: A study using the sleep EEG-derived brain age index. Ann Clin Transl Neurol. 2024;11(5):1172–1183. doi: 10.1002/acn3.52032. [DOI] [PMC free article] [PubMed] [Google Scholar]
- 19.Apicella A, Isgrò F, Pollastro A, et al On the effects of data normalization for domain adaptation on EEG data. Eng Appl Artif Intell. 2023;123:106205. doi: 10.1016/j.engappai.2023.106205. [DOI] [Google Scholar]
- 20.Iyer K K, Roberts J A, Waak M, et al Optimization of time series features to estimate brain age in children from electroencephalography. Annu Int Conf IEEE Eng Med Biol Soc. 2023;2023:1–4. doi: 10.1109/EMBC40787.2023.10340663. [DOI] [PubMed] [Google Scholar]
- 21.Geng X, Wang L, Yu P, et al A method of EEG signal feature extraction based on hybrid DWT and EMD. Alex Eng J. 2025;113:195–204. doi: 10.1016/j.aej.2024.11.056. [DOI] [Google Scholar]
- 22.Saghab Torbati M, Zandbagleh A, Daliri M R, et al Explainable AI for bipolar disorder diagnosis using Hjorth parameters. Diagnostics (Basel) 2025;15(3):316. doi: 10.3390/diagnostics15030316. [DOI] [PMC free article] [PubMed] [Google Scholar]
- 23.Kaushik G, Gaur P, Sharma R R, et al EEG signal based seizure detection focused on Hjorth parameters from tunable-Q wavelet sub-bands. Biomedical Signal Processing and Control. 2022;76:103645. doi: 10.1016/j.bspc.2022.103645. [DOI] [Google Scholar]
- 24.Monsy J C, Vinod A P EEG-based biometric identification using frequency-weighted power feature. IET Biom. 2020;9(6):251–258. doi: 10.1049/iet-bmt.2019.0158. [DOI] [Google Scholar]
- 25.Shen M, Yang F, Wen P, et al A real-time epilepsy seizure detection approach based on EEG using short-time Fourier transform and Google-Net convolutional neural network. Heliyon. 2024;10(11):e31827. doi: 10.1016/j.heliyon.2024.e31827. [DOI] [PMC free article] [PubMed] [Google Scholar]
- 26.Morales S, Bowers M E Time-frequency analysis methods and their application in developmental EEG data. Dev Cognit Neurosci. 2022;54:101067. doi: 10.1016/j.dcn.2022.101067. [DOI] [PMC free article] [PubMed] [Google Scholar]
- 27.Cai G, Zhang F, Yang B, et al Manifold learning-based common spatial pattern for EEG signal classification. IEEE J Biomed Health Inform. 2024;28(4):1971–1981. doi: 10.1109/JBHI.2024.3357995. [DOI] [PubMed] [Google Scholar]
- 28.Reddy T K, Arora V, Behera L, et al Multiclass fuzzy time-delay common spatio-spectral patterns with fuzzy information theoretic optimization for EEG-based regression problems in brain-computer interface (BCI) IEEE T Fuzzy Syst. 2019;27(10):1943–1951. doi: 10.1109/TFUZZ.2019.2892921. [DOI] [Google Scholar]
- 29.Simons S, Espino P, Abásolo D. Fuzzy entropy analysis of the electroencephalogram in patients with Alzheimer’s disease: Is the method superior to sample entropy? Entropy (Basel), 2018, 20(1): 21.
- 30.Namazi H, Kulish V V, Hussaini J, et al A signal processing based analysis and prediction of seizure onset in patients with epilepsy. Oncotarget. 2016;7(1):342–350. doi: 10.18632/oncotarget.6341. [DOI] [PMC free article] [PubMed] [Google Scholar]
- 31.Sun H, Paixao L, Oliva J T, et al Brain age from the electroencephalogram of sleep. Neurobiol Aging. 2019;74:112–120. doi: 10.1016/j.neurobiolaging.2018.10.016. [DOI] [PMC free article] [PubMed] [Google Scholar]
- 32.Ye E, Sun H, Leone M J, et al Association of sleep electroencephalography-based brain age index with dementia. JAMA Netw Open. 2020;3(9):e2017357. doi: 10.1001/jamanetworkopen.2020.17357. [DOI] [PMC free article] [PubMed] [Google Scholar]
- 33.Li L, Li J, Wu H, et al Optimal channel and feature selection for automatic prediction of functional brain age of preterm infant based on EEG. Front Neurosci. 2025;19:1517141. doi: 10.3389/fnins.2025.1517141. [DOI] [PMC free article] [PubMed] [Google Scholar]
- 34.Stevenson N J, Oberdorfer L, Koolen N, et al Functional maturation in preterm infants measured by serial recording of cortical activity. Sci Rep. 2017;7(1):12969. doi: 10.1038/s41598-017-13537-3. [DOI] [PMC free article] [PubMed] [Google Scholar]
- 35.Zandvoort C S, van der Vaart M, Robinson S, et al Sensory event-related potential morphology predicts age in premature infants. Clin Neurophysiol. 2024;157:61–72. doi: 10.1016/j.clinph.2023.11.007. [DOI] [PMC free article] [PubMed] [Google Scholar]
- 36.Stevenson N J, Nordvik T, Espeland C N, et al Inter-site generalizability of EEG based age prediction algorithms in the preterm infant. Physiol Meas. 2023;44(7):10. doi: 10.1088/1361-6579/ace755. [DOI] [PubMed] [Google Scholar]
- 37.Paixao L, Sikka P, Sun H, et al Excess brain age in the sleep electroencephalogram predicts reduced life expectancy. Neurobiol Aging. 2020;88:150–155. doi: 10.1016/j.neurobiolaging.2019.12.015. [DOI] [PMC free article] [PubMed] [Google Scholar]
- 38.Banville H, Jaoude M A, Wood S, et al. Do try this at home: Age prediction from sleep and meditation with large-scale low-cost mobile EEG. Imaging Neuroscience, 2024, 2: 1-15.
- 39.Lavanga M, De Wel O, Caicedo A, et al A brain-age model for preterm infants based on functional connectivity. Physiol Meas. 2018;39(4):044006. doi: 10.1088/1361-6579/aabac4. [DOI] [PubMed] [Google Scholar]
- 40.Vandenbosch M M L J Z, van 't Ent D, Boomsma D I, et al EEG-based age-prediction models as stable and heritable indicators of brain maturational level in children and adolescents. Hum Brain Mapp. 2019;40(6):1919–1926. doi: 10.1002/hbm.24501. [DOI] [PMC free article] [PubMed] [Google Scholar]
- 41.Obada A Z, Chung K W, Kuplicki R T, et al Predicting age from brain EEG signals—A machine learning approach. Front Aging Neurosci. 2018;10:184. doi: 10.3389/fnagi.2018.00184. [DOI] [PMC free article] [PubMed] [Google Scholar]
- 42.Kounios J, Fleck J I, Zhang F, et al Brain-age estimation with a low-cost EEG-headset: effectiveness and implications for large-scale screening and brain optimization. Front Neuroergon. 2024;5:1340732. doi: 10.3389/fnrgo.2024.1340732. [DOI] [PMC free article] [PubMed] [Google Scholar]
- 43.Ansari A, Pillay K, Arasteh E, et al Resting state electroencephalographic brain activity in neonates can predict age and is indicative of neurodevelopmental outcome. Clin Neurophysiol. 2024;163:226–235. doi: 10.1016/j.clinph.2024.05.002. [DOI] [PMC free article] [PubMed] [Google Scholar]
- 44.Paliwal V, Das K, Doesburg S M, et al Classifying routine clinical electroencephalograms with multivariate iterative filtering and convolutional neural networks. IEEE Trans Neural Syst Rehabil Eng. 2024;32:2038–2048. doi: 10.1109/TNSRE.2024.3403198. [DOI] [PubMed] [Google Scholar]
- 45.Khayretdinova M, Shovkun A, Degtyarev V, et al Predicting age from resting-state scalp EEG signals with deep convolutional neural networks on TD-brain dataset. Front Aging Neurosci. 2022;14:1019869. doi: 10.3389/fnagi.2022.1019869. [DOI] [PMC free article] [PubMed] [Google Scholar]
- 46.Gschwandtner L, Hartmann M, Oberdorfer L, et al Deep learning for estimation of functional brain maturation from EEG of premature neonates. Annu Int Conf IEEE Eng Med Biol Soc. 2020;2020:104–107. doi: 10.1109/EMBC44109.2020.9175380. [DOI] [PubMed] [Google Scholar]
- 47.Yook S, Miao Y, Park C, et al Predicting brain age based on sleep EEG and DenseNet. Annu Int Conf IEEE Eng Med Biol Soc. 2021;2021:245–248. doi: 10.1109/EMBC46164.2021.9631064. [DOI] [PubMed] [Google Scholar]
- 48.Yook S, Park H R, Park C, et al Novel neuroelectrophysiological age index associated with imaging features of brain aging and sleep disorders. Neuroimage. 2022;264:119753. doi: 10.1016/j.neuroimage.2022.119753. [DOI] [PubMed] [Google Scholar]
- 49.Jusseaume K, Valova I Brain age prediction/classification through recurrent deep learning with electroencephalogram recordings of seizure subjects. Sensors. 2022;22(21):8112. doi: 10.3390/s22218112. [DOI] [PMC free article] [PubMed] [Google Scholar]
- 50.Wong S B, Tsao Y, Tsai W H, et al Application of bidirectional long short-term memory network for prediction of cognitive age. Sci Rep. 2023;13(1):20197. doi: 10.1038/s41598-023-47606-7. [DOI] [PMC free article] [PubMed] [Google Scholar]
- 51.Kaushik P, Gupta A, Roy P P, et al EEG-based age and gender prediction using deep BLSTM-LSTM network model. IEEE Sens J. 2019;19(7):2634–2641. doi: 10.1109/JSEN.2018.2885582. [DOI] [Google Scholar]
- 52.Zhang D, She Y, Sun J, et al Brain age estimation from overnight sleep electroencephalography with multi-flow sequence learning. Nat Sci Sleep. 2024;16:879–896. doi: 10.2147/NSS.S463495. [DOI] [PMC free article] [PubMed] [Google Scholar]
- 53.Brink-Kjaer A, Leary E B, Sun H, et al Age estimation from sleep studies using deep learning predicts life expectancy. NPJ Digit Med. 2022;5(1):103. doi: 10.1038/s41746-022-00630-9. [DOI] [PMC free article] [PubMed] [Google Scholar]
- 54.Moguilner S, Baez S, Hernandez H, et al Brain clocks capture diversity and disparities in aging and dementia across geographically diverse populations. Nat Med. 2024;30(12):3646–3657. doi: 10.1038/s41591-024-03209-x. [DOI] [PMC free article] [PubMed] [Google Scholar]
- 55.关舒月, 吕奕谋, 李永春, 等 基于面部视频的非接触式心率测量的深度学习方法综述. 生物医学工程学杂志. 2025;42(1):197–204. doi: 10.7507/1001-5515.200405057. [DOI] [PMC free article] [PubMed] [Google Scholar]
- 56.An Y, Lam H K, Ling S H Auto-denoising for EEG signals using generative adversarial network. Sensors (Basel) 2022;22(5):1750. doi: 10.3390/s22051750. [DOI] [PMC free article] [PubMed] [Google Scholar]
- 57.Rajpura P, Cecotti H, Kumar Meena Y Explainable artificial intelligence approaches for brain-computer interfaces: a review and design space. J Neural Eng. 2024;21(4):041003. doi: 10.1088/1741-2552/ad6593. [DOI] [PubMed] [Google Scholar]
- 58.Vimbi V, Shaffi N, Mahmud M Interpreting artificial intelligence models: a systematic review on the application of LIME and SHAP in Alzheimer’s disease detection. Brain Inform. 2024;11(1):10. doi: 10.1186/s40708-024-00222-1. [DOI] [PMC free article] [PubMed] [Google Scholar]
- 59.Sarvi Zargar B, Karami Mollaei M R, Ebrahimi F, et al Generalizable epileptic seizures prediction based on deep transfer learning. Cogn Neurodyn. 2023;17(1):119–131. doi: 10.1007/s11571-022-09809-y. [DOI] [PMC free article] [PubMed] [Google Scholar]
- 60.Sedgwick R, Goertz J P, Stevens M M, et al. Transfer learning Bayesian optimization for competitor DNA molecule design for use in diagnostic assays. Biotechnol Bioeng. 2025, 122(1): 189-210.


