Abstract
超图神经网络(HGNN)能够捕捉脑区间的高阶交互关系,为精神疾病领域的脑功能连接网络分析提供了新途径。本文提出一种基于相位—振幅耦合加权的超图注意力神经网络(PAC-HyperGAT)模型,用于实现脑部精神疾病的诊断分析。该方法首先基于弹性网稀疏回归构建脑功能超图结构,进而通过计算超边内部节点间的相位—振幅耦合强度,为超边赋予具有神经生理学意义的权重。在此基础上,本文进一步设计了一种新型超图注意力卷积核,通过改进节点级消息传递机制,使PAC-HyperGAT模型能够有效融合超边权重信息,提升脑功能连接网络表示的判别能力。本研究在公开的注意力缺陷多动障碍(ADHD)与重度抑郁症(MDD)脑电数据集上进行系统验证。实验结果表明,PAC-HyperGAT在ADHD分类中的准确率达到(72.14 ± 9.19)%,多项性能指标均显著优于现有脑功能连接网络分析方法;该模型在MDD分类任务中同样表现出卓越性能,显示出良好的跨疾病泛化能力。此外,该模型还成功识别出与疾病病理相关的关键脑区。综合而言,本文所提方法在泛化性、鲁棒性与可解释性方面均表现优异,为精神疾病的客观诊断与脑机制解析提供了可靠的分析工具。
Keywords: 脑功能连接网络, 加权超边, 超图神经网络, 相位—振幅耦合, 精神疾病分类, 消息传递机制
Abstract
The hypergraph neural network (HGNN) has demonstrated efficacy in modeling high-order interactions among brain regions, thus providing a promising framework for analyzing brain functional connectivity networks in the context of psychiatric research. The present study proposes a phase-amplitude coupling-weighted hypergraph attention neural network (PAC-HyperGAT) model for the diagnosis of psychiatric diseases. The proposed methodology first constructs a functional hypergraph using elastic net-based sparse regression and then assigns physiologically meaningful weights to hyperedges by quantifying the phase-amplitude coupling strength among nodes within each hyperedge. In light of these findings, the present study proposes a novel hypergraph attention convolution kernel. The efficacy of this approach is evidenced by its enhancement of the node-level message passing mechanism, a feat that facilitates the integration of hyperedge weight information. This phenomenon, in turn, results in an enhancement of the discriminative ability of brain functional connectivity network representations. The proposed model is systematically evaluated on publicly available electroencephalogram datasets for attention deficit hyperactivity disorder (ADHD) and major depressive disorder (MDD). The experimental results demonstrate that PAC-HyperGAT attains an accuracy of (72.14 ± 9.19) % in ADHD classification, surpassing the performance of existing brain functional connectivity network methods across a range of evaluation metrics. The model exhibits notable efficacy in MDD classification, signifying substantial cross-disorder generalization capabilities. Furthermore, PAC-HyperGAT has demonstrated efficacy in identifying brain regions associated with these disorders. In summary, the proposed model demonstrates excellent generalizability, robustness, and neurobiological interpretability, providing a reliable analytical framework for objective diagnosis and mechanistic investigation of psychiatric diseases.
Keywords: Brain functional connectivity networks, Weighted hyperedge, Hypergraph neural network, Phase-amplitude coupling, Psychiatric diseases classification, Message passing mechanism
0. 引言
神经精神疾病已成为一个亟待解决的全球性公共卫生难题[1-2],其主要特征表现为认知、情感及行为功能的异常。在临床研究中,脑功能连接(functional connectivity,FC)网络[3],尤其是基于脑电图(electroencephalogram,EEG)等高时间分辨率数据所构建的脑功能连接网络及其分析方法,已成为探索神经精神疾病病理机制的重要工具[4-5]。然而,脑功能连接网络具有高度复杂的多脑区交互模式,如何有效捕捉并利用其高阶交互作用,仍是当前研究中的关键热点和难点[6]。
图神经网络(graph neural network,GNN)能够在保持图拓扑结构的同时,有效融合节点特征与边的关系信息,成为脑功能连接网络分析的重要工具,已广泛应用于精神疾病的辅助诊断[7-9]。例如,Li等[10]提出的可解释大脑GNN(interpretable brain GNN,BrainGNN)模型在自闭症分类和认知任务解码中表现优异;Gamgam等[11]提出的解耦注意力GNN在阿尔茨海默病(Alzheimer’s disease,AD)诊断任务中性能优于多种经典方法;Wang等[12]提出了一种基于图注意力网络(graph attention network,GAT)的自闭症谱系障碍(autism spectrum disorder,ASD)识别模型,通过引入特征构建与节点选择机制,在提升分类性能的同时,有效增强了模型的可解释性,取得良好的识别效果。然而,上述模型方法均建立在二阶图结构基础上,仅能刻画脑区之间的成对连接关系,难以充分捕捉多脑区间的高阶协同与复杂交互,从而限制了模型的表达能力与疾病诊断准确性的提升[13-14]。
作为GNN的泛化形式,超图神经网络(hypergraph neural network,HGNN)采用超图结构对节点间的高阶交互关系进行建模[15]。与传统图结构相比,超图结构通过单条超边同时连接多个节点,能够有效表征脑功能连接网络中多脑区之间的复杂高阶耦合关系[16]。近年来,基于HGNN的脑功能连接网络分析方法已逐渐发展为精神疾病脑机制研究中一项重要工具[17-18]。例如,Jie等[19]提出一种基于稀疏表示的HGNN方法,将其应用于注意力缺陷多动障碍(attention deficit hyperactivity disorder,ADHD)的分类,在显著提升分类性能的同时,识别出与疾病相关的生物标志物;Guo等[20]利用弹性网(elastic net)与组最小绝对收缩和选择算子构建静息态脑功能超网络,并借助HGNN实现对重度抑郁症(major depressive disorder,MDD)的鉴别,更精确地捕捉到脑功能连接网络的异常高阶功能连接模式;Lostar等[21]提出超图U型网络(U-Net),将U-Net架构扩展至超图结构中,通过超图卷积、池化与反池化操作实现高阶特征聚合,在AD与ASD分类中表现优异。然而,现有大多数基于HGNN的脑功能连接网络分析方法,在建模过程中未能有效融入超边权重信息。这导致超边中所蕴含的神经生理特征难以被充分挖掘,从而限制了模型的表达能力与可解释性[22-23]。此外,当前研究多基于单一类型疾病数据集进行验证,缺乏不同疾病下的泛化性能评估,在一定程度上限制了HGNN模型在实际临床应用的推广[24]。
为了克服现有基于HGNN的脑功能连接网络分析方法的局限性,本文提出一种基于相位—振幅耦合(phase-amplitude coupling,PAC)加权的超图注意力神经网络(PAC weighted-hypergraph attention neural network,PAC-HyperGAT)模型,以期实现脑部精神疾病的诊断分析。首先,采用弹性网稀疏回归捕捉脑区间的高阶交互关系,以剔除虚假关联,构建更加鲁棒的超图结构。随后,通过计算超边内部节点间的PAC强度并进行叠加,为每条超边赋予具有明确神经生理学意义的权重。在此基础上,本文进一步设计了一种新型超图注意力卷积核。该卷积核通过改进节点级的消息传递机制,使模型能够有效学习和融合超边权重信息,从而提升对脑功能连接网络的表征能力。为了验证所提出方法的有效性与泛化性能,本文在不同类型的精神疾病数据集上进行了系统实验,其整体技术路线图如图1所示。
图 1.

The overall framework of PAC-HyperGAT
PAC-HyperGAT整体框架
1. 技术路线
1.1. 基于生理先验的高阶脑功能连接网络构建
为了更有效表征脑区间复杂的高阶交互关系,本文采用弹性网构建高阶脑功能超图结构,并引入PAC方法为超边赋予生理权重,实现高阶连接量化,详细流程如图2所示。
图 2.

The construction process of the high-order brain functional connection networks
高阶脑功能连接网络构建流程
设样本数据为
,其中N和P分别表示感兴趣区域(region of interest,ROI)的数量及采样时间点。本文采用弹性网来建模脑区ROI间的高阶相互作用,该方法结合了L1与L2正则化的优势,其优化目标函数定义如式(1)所示:
![]() |
1 |
其中,xi表示第i个脑区的时间序列向量,Ai为由除i外其余ROI时间序列构成的矩阵,
刻画其余ROI对第i个ROI的作用权重;||·||1和||·||2分别对应L1范数和L2范数;λ1是L1正则化参数,用于控制稀疏性;λ2是L2正则化参数,以增强组效应。
在此基础上,构建包含脑区vi的超边
,最终得到的超图拓扑结构通过指示矩阵H∈RN × M(M表示超边数量)来进行表征,如式(2)所示:
![]() |
2 |
其中,Hij表示指示矩阵H中第i行第j列的元素,用于刻画脑区vi是否属于超边ej,vi表示第i个脑区,ej表示第j条超边。该超图有效刻画了多脑区之间的高阶交互作用。
完成超图拓扑结构构建后,本文采用PAC方法[25]为每条超边赋予具有生理意义的权重。具体而言,对于超边em内的任意节点对(vi,
vj),计算其PAC强度。令vi和vj表示任意两个节点,
表示vi信号中低频分量的相位,
表示vj信号中高频分量的幅度。该节点对的PAC强度PAC(·)通过归一化库尔贝克—莱布勒(Kullback-Leibler,KL)距离计算得出,如式(3)所示:
![]() |
3 |
其中,
,表示将相位时间序列
划分为均匀区间后,在每个相位区间内计算对应的幅度均值
。叠加所有节点对的PAC值作为该超边的权重W(em),计算方式如式(4)所示:
![]() |
4 |
由此得到的超边权重矩阵WPAC如式(5)所示:
![]() |
5 |
最终,结合超图指示矩阵H、超边权重矩阵WPAC和节点度矩阵Dv,得到加权超网络的邻接矩阵Aw表征脑功能连接网络,其形式如式(6)所示:
![]() |
6 |
其中,T代表矩阵转置。
1.2. 基于超边权重感知的消息传递机制
传统的HGNN在学习节点表示时,通常仅依赖邻居节点特征及自适应注意力机制,未显式引入连接边的权重信息。这导致模型难以准确捕捉脑区间功能连接强度的差异性,从而限制了其对脑功能连接网络的区分能力。为解决该问题,本文提出一种面向加权超图的消息传递机制,通过超边注意力卷积核有效融合带有PAC权重的超边信息,其原理如图3所示。
图 3.

Principle of message passing mechanism
消息传递机制原理
考虑连接边权重对信息传递的影响,本研究将超图高阶连接权重wij作为显式边权重,嵌入注意力得分计算中。具体而言,注意力得分
的计算过程被改写如式(7)所示:
![]() |
7 |
其中,xi, xj∈RF是节点i与其邻居节点j的输入特征向量;W∈RF×F为线性变换矩阵;a∈R2F是可学习注意力向量;||表示向量拼接操作;α是边权重缩放超参数;wij是高阶功能连接边权重,表示节点间的高阶关系;激活函数L选用带泄漏的修正线性单元(leaky rectified linear unit,LeakyReLU)。为确保可比性,本文选用归一化指数函数柔性最大(softmax)归一化,具体实现方法如式(8)所示:
![]() |
8 |
其中,αij表示节点j对中心节点i的归一化注意力系数,
是节点i的邻域,exp(·)为指数函数。信息聚合阶段,将αij与wij相乘实现加权传递,聚合过程如式(9)所示:
![]() |
9 |
其中,
是节点i更新后的特征,σ(·)表示非线性激活函数,b∈R
F'为偏置项。引入多头注意力增强稳定性和多视角学习,在K头并行计算后拼接,其形式如式(10)所示:
![]() |
10 |
其中,
和W(k)分别表示第k个注意力头下参数,hj表示节点j的特征向量。该多头机制允许从不同维度提取高阶连接信息,进一步提升模型在识别ADHD等疾病中的判别性能和病理特征建模能力。
1.3. 面向高阶功能连接的复合损失函数设计
为优化模型训练过程,本文设计了一种面向高阶脑功能连接的复合损失函数,包括交叉熵损失和创新的高阶功能连接对齐损失。该设计在提升分类准确性的同时,有效保留了高阶脑功能连接网络结构,进而提升了模型的可解释性与区分能力。交叉熵损失
,衡量预测概率与真实标签的差异,其定义如式(11)所示:
![]() |
11 |
其中,N是样本数量,K是样本类别数量,yi,k是样本i对于真实类别k的标签指示量(正确类别为1,其余为0),
是预测概率。本文提出对齐损失
,旨在最小化注意力系数与超边权重在归一化空间的差异,迫使模型捕捉判别特征的同时保留高阶连接模式,其定义如式(12)所示:
![]() |
12 |
其中,Ei是第i个图的超边数,
是第i个图所有超边注意力系数组成的向量,αie是第i个图第e条超边的注意力系数,wi是第i个图所有超边权重组成的向量,wie是对应权重(取绝对值),||·||2表示L2范数。最终,结合两者得到总损失函数
定义如式(13)所示:
![]() |
13 |
其中,λ是权重系数,控制对齐损失的重要程度。
2. 实验
2.1. 实验数据集
为验证本文所提出的PAC-HyperGAT模型在精神疾病诊断分析中的有效性与泛化能力,本研究基于两个不同类型精神疾病的公开EEG数据集进行实验:① ADHD数据集来源于ADHD/正常对照儿童EEG数据(EEG data for ADHD/control children,ADHD-EEG)[26],该数据集由鲁兹贝(Roozbeh)医院采集自19通道任务态EEG数据(采样率128 Hz),并以开放科研数据库形式发布于电气与电子工程师协会(Institute of Electrical and Electronics Engineers,IEEE)数据端口(IEEE dataport)平台,其中包含61例ADHD患者(男49例,女12例,年龄7~12岁)和60例健康对照儿童(男50例,女10例,年龄7~12岁);② MDD数据集则来自一个用于精神疾病分析的多模态开放数据集(multi-modal open dataset for mental-disorder analysis,MODMA)[27],该数据集由兰州大学第二医院精神科采集自128通道的静息态EEG数据(采样率250 Hz),并以受保护形式发布于英国数据档案馆(United Kingdom data archive,UKDA)旗下的数据共享平台(ReShare)(研究者可在注册并遵守最终用户许可条款后获得合法访问权限),其中包含24例MDD患者(男13例,女11例,年龄16~56岁)与29例健康对照受试者(男20例,女9例,年龄18~55岁)。
2.2. 实验数据预处理
ADHD与MDD数据集的预处理在科学计算软件MATLAB R2021b(MathWorks Inc.,美国)环境中基于EEGLAB 2025.0.0和Brainstorm 20191031工具箱完成[28-29]。主要流程包括:人工剔除存在显著伪影的区段,移除非信息性参考通道(A1、A2);采用有限脉冲响应(finite impulse response,FIR)带通滤波器(1~45 Hz)提取有效频段信号;插值校正自动识别出的坏通道;利用独立成分分析(independent component analysis,ICA)分离并去除眼动与肌电等生理伪迹。随后,将预处理后的EEG信号经标准化低分辨率EEG磁断层成像(standardized low-resolution electromagnetic tomography,sLORETA)进行皮层源定位,并在德西坎—基利安尼(Desikan-Killiany)脑图谱定义的68个皮层ROI上提取平均时间序列[30],作为后续分析的基础。考虑到深度学习模型易受小样本过拟合影响,本文通过将连续EEG信号分割为不重叠的10 s片段(每个片段视为独立样本)以扩充数据集:最终,MDD数据集包含576个患者样本与696个对照样本,ADHD数据集包含909个患者样本与724个对照样本。
2.3. 实验设置
本文实验在操作系统Windows 11(Microsoft Corporation,美国)下完成,模型基于编程语言Python 3.9.23与深度学习框架PyTorch 2.7.0(Meta Platforms Inc.,美国)框架实现。硬件配置包括中央处理器Core™ i9-13900HX(Intel Corporation,美国)与图形处理器GeForce RTX 4090(显存48 GB,NVIDIA Corporation,美国)。模型训练学习率设为0.01,批次大小为32,轮次为150,随机失活(dropout)为0.3,使用自适应矩估计(adaptive moment estimation,Adam)优化器来提升优化效果,激活函数为指数线性单元(exponential linear units,ELU)。为全面评估所提出模型的分类性能,本研究采用受试者级别十折交叉验证,确保同一受试者的所有样本仅用于训练或测试,避免信息泄露[31],并选取以下五项指标进行量化分析:分类准确率(accuracy,Acc)、灵敏度(sensitivity,Sen)、特异性(specificity,Spe)、阳性预测值(positive predictive value,PPV)和 F1 分数(F1 score,F1),最终的性能指标为10次独立测试结果的平均值。
2.4. 实验结果与分析
2.4.1. 对比模型
为验证本文方法的有效性与优越性,本文选用多种经典机器学习与深度学习模型作为对比,包括:支持向量机(support vector machine,SVM)[32]、卷积神经网络(convolutional neural network,CNN)[33]、GAT[34]及BrainGNN[5]模型。各对比模型的超参数如附表1所示。
2.4.2. 分类性能比较分析
本文基于两种精神疾病数据集(ADHD和MDD)展示了PAC-HyperGAT方法在分类任务中的优越性与有效性,相应结果如表1所示。实验结果表明,所提出的PAC-Hyper-GAT模型在ADHD和MDD数据集诊断任务中均取得了优越的分类性能。具体而言,在ADHD分类中,本文方法的Acc达到(72.14 ± 9.19)%,相比性能次优的SVM[(65.83 ± 9.40)%]有所提升;同时,F1分数为(75.18 ± 8.34)%,明显优于所有对比模型。在MDD分类任务中,本方法同样表现突出,Acc和F1分数分别达到(72.14 ± 12.79)%和(67.44 ± 14.99)%,均超过表现次优的CNN模型[Acc为(65.76 ± 10.04)%,F1为(58.66 ± 15.91)%]。综上所述,PAC-HyperGAT在不同类型精神疾病的诊断中具有良好的泛化能力。
表 1. Comparative experimental results on the ADHD and MDD datasets(x ± s).
ADHD数据集和MDD数据集对比实验结果(x ± s)
| 数据集 | 模型 | Acc | Sen | Spe | PPV | F1 |
| ADHD | SVM | (65.83 ± 9.40)% | (71.34 ± 14.85)% | (58.98 ± 13.74)% | (68.27 ± 9.04)% | (69.06 ± 10.42)% |
| CNN | (62.39 ± 10.35)% | (67.31 ± 11.16)% | (56.11 ± 16.70)% | (65.98 ± 12.79)% | (66.20 ± 10.82)% | |
| GAT | (58.64 ± 6.33)% | (56.11 ± 11.71)% | (61.67 ± 14.88)% | (65.51 ± 10.14)% | (59.42 ± 8.52)% | |
| BrainGNN | (57.72 ± 8.51)% | (73.75 ± 19.06)% | (37.98 ± 13.32)% | (59.18 ± 6.50)% | (64.81 ± 10.74)% | |
| 本文方法 | (72.14 ± 9.19)% | (76.23 ± 7.19)% | (66.49 ± 17.68)% | (74.79 ± 11.84)% | (75.18 ± 8.34)% | |
| MDD | SVM | (59.58 ± 14.92)% | (61.88 ± 20.16)% | (58.06 ± 22.36)% | (56.26 ± 16.59)% | (57.46 ± 14.84)% |
| CNN | (65.76 ± 10.04)% | (58.40 ± 23.63)% | (69.24 ± 20.10)% | (63.49 ± 13.59)% | (58.66 ± 15.91)% | |
| GAT | (63.32 ± 11.42)% | (59.93 ± 21.95)% | (68.47 ± 14.83)% | (61.08 ± 17.57)% | (58.22 ± 14.76)% | |
| BrainGNN | (52.97 ± 9.79)% | (48.13 ± 22.99)% | (58.75 ± 25.21)% | (49.76 ± 22.64)% | (45.08 ± 17.10)% | |
| 本文方法 | (72.14 ± 12.79)% | (64.65 ± 15.00)% | (77.29 ± 15.69)% | (71.94 ± 18.90)% | (67.44 ± 14.99)% |
从临床关键指标来看,本文方法在Sen和Spe上实现了较好的平衡。在ADHD任务中,Sen和Spe分别达到(76.23 ± 7.19)%和(66.49 ± 17.68)%,均高于GAT模型的对应结果;在MDD任务中,Sen和Spe分别为(64.65 ± 15.00)%和(77.29 ± 15.69)%,明显优于其他基线模型。尤其是在PPV上,本文方法在两项任务中表现明显优于对比模型。整体来看,本文方法在各项指标均表现出领先优势,证明其在不同受试者数据上的泛化能力和实用价值。
2.4.3. 消融实验
为了深入验证本文提出的PAC-HyperGAT模型中各模块对分类性能的贡献,本文设计了四个系统性消融实验,每次仅移除一个创新模块并保持其余部分不变。具体而言,① 为评估超图建模的有效性,构建对比模型1(model 1):将高阶超图替换为传统二阶图结构,采用皮尔逊相关性构建脑功能连接网络,边权代表脑区间信号的相关性强度;② 为检验基于PAC的超边赋权机制的作用,设计了模型2(model 2):仍使用弹性网构建超图,但将所有超边权重固定为1;③ 为验证基于超边权重感知的消息传递机制的有效性,设计了模型3(model 3):在消息聚合过程中不引入超边权重,仅依赖节点特征进行传播;④ 为评估面向高阶功能连接的复合损失函数的贡献,设计了模型4(model 4):仅使用交叉熵损失训练模型,不引入其他约束项。通过这些消融实验,能够清晰识别各关键模块对模型最终性能的影响程度,其消融实验结果如表2所示。
表 2. Ablation study results(x ± s).
消融实验结果(x ± s)
| 数据集 | 模型 | Acc | Sen | Spe | PPV | F1 |
| ADHD | model 1 | (68.09 ± 10.26)% | (71.91 ± 15.60)% | (62.62 ± 12.63)% | (70.60 ± 9.78)% | (70.69 ± 10.90)% |
| model 2 | (68.14 ± 13.23)% | (71.60 ± 20.23)% | (61.32 ± 21.50)% | (69.71 ± 13.46)% | (69.96 ± 16.78)% | |
| model 3 | (69.89 ± 11.65)% | (74.08 ± 15.55)% | (65.44 ± 17.18)% | (72.90 ± 10.65)% | (72.71 ± 10.45)% | |
| model 4 | (65.75 ± 8.25)% | (71.70 ± 12.26)% | (58.46 ± 16.84)% | (68.73 ± 10.63)% | (69.50 ± 8.89)% | |
| 本文方法 | (72.14 ± 9.19)% | (76.23 ± 7.19)% | (66.49 ± 17.68)% | (74.79 ± 11.84)% | (75.18 ± 8.34)% | |
| MDD | model 1 | (58.97 ± 13.56)% | (64.86 ± 23.13)% | (54.10 ± 16.13)% | (53.39 ± 12.88)% | (57.65 ± 15.13)% |
| model 2 | (63.99 ± 6.90)% | (57.22 ± 20.55)% | (67.78 ± 17.69)% | (61.96 ± 13.23)% | (56.84 ± 13.80)% | |
| model 3 | (69.82 ± 12.95)% | (60.63 ± 21.50)% | (77.22 ± 25.66)% | (71.33 ± 20.17)% | (63.54 ± 16.04)% | |
| model 4 | (66.68 ± 10.18)% | (56.74 ± 15.87)% | (74.31 ± 15.83)% | (65.37 ± 17.30)% | (59.61 ± 14.26)% | |
| 本文方法 | (72.14 ± 12.79)% | (64.65 ± 15.00)% | (77.29 ± 15.69)% | (71.94 ± 18.90)% | (67.44 ± 14.99)% |
通过消融实验,本节探讨了各个模块对模型整体性能的贡献。从结果来看,每个设计环节均在不同程度上提升了分类精度与鲁棒性。在ADHD数据集上,加入高阶超图构建后,Acc与F1值均高于仅使用二阶图的模型;引入PAC赋权机制后,Sen与F1值均优于无加权超边的模型;结合超边权重感知的消息传递机制后,Spe与Sen均有所提升;此外,复合损失函数的引入同样发挥了重要作用,相较于仅用交叉熵训练的模型,PPV与F1值均取得更优结果;最终,完整模型在ADHD数据集任务中达到(72.14±9.19)%的Acc和(75.18±8.34)%的F1值,整体性能最佳。
在MDD数据集上,加入高阶超图构建后,Acc与F1值均明显高于其他对比模型;PAC赋权机制的引入使模型性能进一步提升;加入加权超图消息传递机制后,Acc与Sen均表现更优;复合损失函数的引入则带来综合性能的改善。最终,完整模型在MDD任务中Acc与Spe均超过72.00%,在性能上优于去除任一模块的模型。
综合来看,无论是在ADHD数据集还是MDD数据集任务中,每个模块的引入都能带来性能提升,且多模块协同作用使模型达到最佳水平,充分证明了各组成部分的有效性与不可替代性。
2.4.4. 可解释性分析
为了验证PAC-HyperGAT模型在精神疾病诊断分析中的生物学合理性与可解释性,本文采用梯度加权类激活映射(gradient-weighted class activation mapping,Grad-CAM)方法来识别在分类任务中起关键作用的大脑区域[35]。
依据模型贡献度得分,本文进一步筛选出在ADHD数据集中ADHD患者与健康对照儿童区分重要性排名前十的脑区,并将其确定为与疾病病理相关的关键脑区,如图4所示,包括:左岛盖部(L. Parsopercularis)、左颞下回(L. Inferiortemporal)、左颞极(L. Temporalpole)、左额下回三角部(L. Parstriangularis)、左额上回(L. Superiorfrontal)、左内嗅皮层(L. Entorhinal)、左海马旁回(L. Parahippocampal)、右内嗅皮层(R. Entorhinal)、右颞上回(R. Superiortemporal)、右尾部前扣带回皮层(R. Caudalanteriorcingulate),这些脑区主要分布于大脑的颞叶和额叶区域。额叶,是执行控制的中枢,负责注意力与工作记忆。已有研究表明,ADHD儿童在注意力任务中表现出额叶活动异常[36]。颞叶,则主管听觉、记忆及情绪调节,该区域的功能连接异常已被证实与ADHD患者的注意缺陷明显相关[37]。
图 4.

Key brain regions related to pathology
与病理相关的关键脑区
此外,如图4所示,本文在MDD数据集中同样筛选出MDD患者与健康对照受试者差异较大的前十个关键脑区,包括:左距状裂周围皮层(L. Pericalcarine)、左顶下皮层(L. Inferiorparietal)、右颞中回(R. Middletemporal)、右颞横回(R. Transversetemporal)、右楔叶(R. Cuneus)、左楔叶(L. Cuneus)、右外侧枕叶皮层(R. Lateraloccipital)、右舌回(R. Lingual)、右楔前叶(R. Precuneus)、右距状裂周围皮层(R. Pericalcarine),主要分布于枕叶、顶叶和颞叶区域。已有研究表明,MDD涉及多个脑区的异常:不仅枕叶的异常神经动态与患者症状严重程度密切相关[38],顶叶异常也表现为患者脑网络协调性受损[39],而颞叶异常则体现在与情绪处理相关的灰质异常[40]。
综上所述,本文提出的方法能有效识别不同精神疾病的关键脑区,验证了其良好的跨数据集泛化能力。这些结果凸显了该模型在识别疾病特异性脑功能模式、挖掘潜在生物标志物方面的重要价值。
3. 总结和展望
本文提出了一种PAC-HyperGAT模型,成功解决了基于脑功能连接网络的精神疾病分析中的核心技术问题,具体如下:
(1)创新提出一种基于弹性网正则化的脑功能连接网络超图构建方法,有效刻画了脑区之间的高阶交互。相较于传统成对连接模型,在ADHD与MDD分类任务中均取得了更优的分类效果。
(2)创新引入PAC作为神经生理学先验,对超边进行量化赋权,充分挖掘其神经生理学信息。该设计在两项疾病分类任务中均带来了稳定的性能增益,显著增强了模型的生理可解释性与判别能力。
(3)首创基于超边权重感知的消息传递机制,成功强化了模型对脑区间功能连接强度差异的学习能力,在ADHD和MDD任务中均取得更高的Acc。
(4)首次引入融合拓扑约束的复合损失函数,成功解决了模型训练中图结构信息保留不足的问题,并提升了ADHD和MDD分类的稳定性,充分展示了多目标优化策略的泛化优势。
综上所述,本文所提方法在ADHD与MDD分类任务中Acc分别达到(72.14 ± 9.19)%和(72.14 ± 12.79)%,性能优于传统模型,充分证明了本文方法的整体有效性,为精神疾病的客观诊断提供了可靠的新工具。此外,本文方法还成功识别出与病理机制相关的关键脑区,增强了模型的病理可解释性,为理解精神疾病的病理基础提供了新的视角,凸显了其临床应用潜力。
本研究仍存在一定局限性,将在未来工作中进一步完善。首先,脑功能连接网络分析依赖高质量的超图构建,当前采用的弹性网方法较为简单。后续,将引入更先进技术,以提升高阶交互关系的建模精度。其次,超边权重目前仅基于单一PAC指标,未来拟融合多维度神经生理特征,建立更鲁棒的加权机制。
Funding Statement
国家自然科学基金项目(52305459);南方医科大学基础研究苗圃项目(BR202509);广东省基础与应用基础研究基金(2023B1515120014);广东省自然科学基金项目(2023A1515012945)
National Natural science Foundation of China; Southern Medical University; Guangdong Basic and Applied Basic Research Foun; Guangdong Basic and Applied Basic Research Foun
References
- 1.Vigo D, Thornicroft G, Atun R Estimating the true global burden of mental illness. Lancet Psychiatry. 2016;3(2):171–178. doi: 10.1016/S2215-0366(15)00505-2. [DOI] [PubMed] [Google Scholar]
- 2.Wang Z, Dou Y, Yang X, et al Global, regional, and national burden of mental disorders among adolescents and young adults, 1990–2021: a systematic analysis for the Global Burden of Disease Study 2021. Transl Psychiatry. 2025;15(1):397. doi: 10.1038/s41398-025-03623-w. [DOI] [PMC free article] [PubMed] [Google Scholar]
- 3.Rahimi Saryazdi A, Bayani A, Ghassemi F, et al Brain functional connectivity network during deception: a visibility graph approach. Eur Phys J Spec Top. 2025;234(6):937–950. doi: 10.1140/epjs/s11734-025-01607-x. [DOI] [Google Scholar]
- 4.Khaleghi N, Hashemi S, Peivandi M, et al EEG-based functional connectivity analysis of brain abnormalities: a systematic review study. Inform Med Unlocked. 2024;47:101476. doi: 10.1016/j.imu.2024.101476. [DOI] [Google Scholar]
- 5.刘晨旭. 基于图卷积神经网络的脑网络特征分析及应用. 太原: 太原师范学院, 2023.
- 6.Ling Q, Liu A, Li Y, et al High-order graphical topology analysis of brain functional connectivity networks using fMRI. IEEE Trans Neural Syst Rehabil Eng. 2025;33:1611–1620. doi: 10.1109/TNSRE.2025.3564293. [DOI] [PubMed] [Google Scholar]
- 7.Scarselli F, Gori M, Tsoi A C, et al The graph neural network model. IEEE Trans Neural Netw. 2009;20(1):61–80. doi: 10.1109/TNN.2008.2005605. [DOI] [PubMed] [Google Scholar]
- 8.李松, 伏云发, 张妍, 等 基于图卷积神经网络和脑电信号的疲劳识别研究. 生物医学工程学杂志. 2025;42(4):686–692. doi: 10.7507/1001-5515.202410003. [DOI] [PMC free article] [PubMed] [Google Scholar]
- 9.侯涛, 丁卫平, 黄嘉爽, 等 DE-NNs: 基于动态证据神经网络的脑网络分析算法. 计算机研究与发展. 2025;62(4):888–904. doi: 10.7544/issn1000-1239.202330883. [DOI] [Google Scholar]
- 10.Li X, Zhou Y, Dvornek N, et al BrainGNN: interpretable brain graph neural network for fMRI analysis. Med Image Anal. 2021;74:102233. doi: 10.1016/j.media.2021.102233. [DOI] [PMC free article] [PubMed] [Google Scholar]
- 11.Gamgam G, Kabakcioglu A, Yüksel Dal D, et al. Disentangled attention graph neural network for Alzheimer’s disease diagnosis//International Conference on Medical Image Computing and Computer-Assisted Intervention. Marrakesh: MICCAI, 2024: 219-228.
- 12.Wang C, Xiao Z, Xu Y, et al A novel approach for ASD recognition based on graph attention networks. Front Comput Neurosci. 2024;18:1388083. doi: 10.3389/fncom.2024.1388083. [DOI] [PMC free article] [PubMed] [Google Scholar]
- 13.Li Y, Liu J, Gao X, et al Multimodal hyper-connectivity of functional networks using functionally-weighted LASSO for MCI classification. Med Image Anal. 2019;52:80–96. doi: 10.1016/j.media.2018.11.006. [DOI] [PubMed] [Google Scholar]
- 14.Eavani H, Satterthwaite T D, Filipovych R, et al Identifying sparse connectivity patterns in the brain using resting-state fMRI. NeuroImage. 2015;105:286–299. doi: 10.1016/j.neuroimage.2014.09.058. [DOI] [PMC free article] [PubMed] [Google Scholar]
- 15.Bai S, Zhang F, Torr P H S Hypergraph convolution and hypergraph attention. Pattern Recognit. 2021;110:107637. doi: 10.1016/j.patcog.2020.107637. [DOI] [Google Scholar]
- 16.Gao Y, Zhang Z, Lin H, et al Hypergraph learning: methods and practices. IEEE Trans Pattern Anal Mach Intell. 2022;44(5):2548–2566. doi: 10.1109/tpami.2020.3039374. [DOI] [PubMed] [Google Scholar]
- 17.孔文文. 基于静息态脑电数据的高阶脑网络分析和抑郁识别研究. 兰州: 兰州大学, 2023.
- 18.Liu J, Cui W, Chen Y, et al Deep fusion of multi-template using spatio-temporal weighted multi-hypergraph convolutional networks for brain disease analysis. IEEE Trans Med Imaging. 2024;43(2):860–873. doi: 10.1109/TMI.2023.3325261. [DOI] [PubMed] [Google Scholar]
- 19.Jie B, Wee C Y, Shen D, et al Hyper-connectivity of functional networks for brain disease diagnosis. Med Image Anal. 2016;32:84–100. doi: 10.1016/j.media.2016.03.003. [DOI] [PMC free article] [PubMed] [Google Scholar]
- 20.Guo H, Li Y, Xu Y, et al Resting-state brain functional hyper-network construction based on elastic net and group lasso methods. Front Neuroinform. 2018;12:25. doi: 10.3389/fninf.2018.00025. [DOI] [PMC free article] [PubMed] [Google Scholar]
- 21.Lostar M, Rekik I. Deep hypergraph u-net for brain graph embedding and classification. arXiv, 2020: 2008.13118.
- 22.Wang J, Li H, Qu G, et al Dynamic weighted hypergraph convolutional network for brain functional connectome analysis. Med Image Anal. 2023;87:102828. doi: 10.1016/j.media.2023.102828. [DOI] [PMC free article] [PubMed] [Google Scholar]
- 23.Xiao L, Wang J, Kassani P H, et al Multi-hypergraph learning-based brain functional connectivity analysis in fMRI data. IEEE Trans Med Imaging. 2020;39(5):1746–1758. doi: 10.1109/TMI.2019.2957097. [DOI] [PMC free article] [PubMed] [Google Scholar]
- 24.Xu B, Dall’Aglio L, Flournoy J, et al Limited generalizability of multivariate brain-based dimensions of child psychiatric symptoms. Commun Psychol. 2024;2(1):16. doi: 10.1038/s44271-024-00063-y. [DOI] [PMC free article] [PubMed] [Google Scholar]
- 25.Lu J, Li A, Li K, et al An EEG study on β−γ phase-amplitude coupling-based functional brain network in epilepsy patients. IEEE J Biomed Health Inform. 2024;28(6):3446–3456. doi: 10.1109/JBHI.2024.3379194. [DOI] [PubMed] [Google Scholar]
- 26.Alim A, Imtiaz M H Automatic identification of children with ADHD from EEG brain waves. Signals. 2023;4(1):193–205. doi: 10.3390/signals4010010. [DOI] [Google Scholar]
- 27.Cai H, Gao Y, Sun S, et al. Modma dataset: a multi-modal open dataset for mental-disorder analysis. arXiv, 2020: 2002.09283.
- 28.Delorme A, Makeig S EEGLAB: an open source toolbox for analysis of single-trial EEG dynamics including independent component analysis. J Neurosci Methods. 2004;134(1):9–21. doi: 10.1016/j.jneumeth.2003.10.009. [DOI] [PubMed] [Google Scholar]
- 29.Tadel F, Baillet S, Mosher J C, et al Brainstorm: a user-friendly application for MEG/EEG analysis. Comput Intell Neurosci. 2011;2011:879716. doi: 10.1155/2011/879716. [DOI] [PMC free article] [PubMed] [Google Scholar]
- 30.Desikan R S, Ségonne F, Fischl B, et al An automated labeling system for subdividing the human cerebral cortex on MRI scans into gyral based regions of interest. NeuroImage. 2006;31(3):968–980. doi: 10.1016/j.neuroimage.2006.01.021. [DOI] [PubMed] [Google Scholar]
- 31.Brookshire G, Kasper J, Blauch N M, et al Data leakage in deep learning studies of translational EEG. Front Neurosci. 2024;18:1373515. doi: 10.3389/fnins.2024.1373515. [DOI] [PMC free article] [PubMed] [Google Scholar]
- 32.Jakkula V. Tutorial on support vector machine (SVM). Pullman: Washington State University, 2006.
- 33.Moon S E, Jang S, Lee J S. Convolutional neural network approach for EEG-based emotion recognition using brain connectivity and its spatial information//2018 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP). Calgary: IEEE, 2018: 2556-2560.
- 34.Veličković P, Cucurull G, Casanova A, et al. Graph attention networks. arXiv, 2017: 1710.10903.
- 35.Selvaraju R R, Cogswell M, Das A, et al. Grad-cam: visual explanations from deep networks via gradient-based localization//Proceedings of the IEEE International Conference on Computer Vision. Venice: IEEE, 2017: 618-626.
- 36.Latifi B, Amini A, Nasrabadi A M Siamese based deep neural network for ADHD detection using EEG signal. Comput Biol Med. 2024;182:109092. doi: 10.1016/j.compbiomed.2024.109092. [DOI] [PubMed] [Google Scholar]
- 37.Hu Y, Ran J, Qiao R, et al Identifying ADHD-related abnormal functional connectivity with a graph convolutional neural network. Neural Plast. 2024;2024:8862647. doi: 10.1155/2024/8862647. [DOI] [PMC free article] [PubMed] [Google Scholar]
- 38.Scalabrini A, Poletti S, Vai B, et al Abnormally slow dynamics in occipital cortex of depression. J Affect Disord. 2025;374:523–530. doi: 10.1016/j.jad.2025.01.061. [DOI] [PubMed] [Google Scholar]
- 39.Chao Z C, Dillon D G, Liu Y H, et al Altered coordination between frontal delta and parietal alpha networks underlies anhedonia and depressive rumination in major depressive disorder. J Psychiatry Neurosci. 2022;47(6):E367–E378. doi: 10.1503/jpn.220046. [DOI] [PMC free article] [PubMed] [Google Scholar]
- 40.Zhao Y, Chen L, Zhang W, et al Gray matter abnormalities in non-comorbid medication-naive patients with major depressive disorder or social anxiety disorder. EBioMedicine. 2017;21:228–235. doi: 10.1016/j.ebiom.2017.06.013. [DOI] [PMC free article] [PubMed] [Google Scholar]













