Abstract
心肌梗死(MI)的自动检测对预防猝死和心血管疾病的早期干预至关重要。本文提出了一种基于轻量级卷积神经网络(CNN)与一维梯度加权类激活映射(1D-Grad-CAM)的深度学习框架,用于单导联心电图中MI的自动检测及其关键波形特征的可视化分析。实验采用了德国联邦物理技术研究院诊断心电数据库(PTBDB)和国际公开窦性心律数据库(NSRDB)数据库共432条记录(包括334条MI心电和98条正常心电)进行验证。结果表明,该模型在MI检测中的准确率、灵敏度和特异性分别达到了95.75%、96.03%和95.47%。可视化结果显示,模型决策所关注区域与临床诊断关键指标高度吻合,主要包括病理性Q波、ST段抬高及T波倒置等特征。研究证实,所提出的深度学习算法结合可解释性技术,在MI心电图的智能诊断与关键波形可视化分析中具有良好性能,有望为MI早期风险评估与辅助诊断提供有效工具。
Keywords: 心肌梗死, 深度学习, 心电图, 可解释性, 心电波形特征
Abstract
Automated detection of myocardial infarction (MI) is crucial for preventing sudden cardiac death and enabling early intervention in cardiovascular diseases. This paper proposes a deep learning framework based on a lightweight convolutional neural network (CNN) combined with one-dimensional gradient-weighted class activation mapping (1D Grad-CAM) for the automated detection of MI and the visualization of key waveform features in single-lead electrocardiograms (ECGs). The proposed method was evaluated using a total of 432 records from the Physikalisch-Technische Bundesanstalt Diagnostic ECG Database (PTBDB) and the Normal Sinus Rhythm Database (NSRDB), comprising 334 MI and 98 normal ECGs. Experimental results demonstrated that the model achieved an accuracy, sensitivity, and specificity of 95.75%, 96.03%, and 95.47%, respectively, in MI detection. Furthermore, the visualization results indicated that the model’s decision-making process aligned closely with clinically critical features, including pathological Q waves, ST-segment elevation, and T-wave inversion. This study confirms that the proposed deep learning algorithm combined with explainable technology performs effectively in the intelligent diagnosis of MI and the visualization of critical ECG waveforms, demonstrating its potential as a useful tool for early MI risk assessment and computer-aided diagnosis.
Keywords: Myocardial infarction, Deep learning, Electrocardiogram, Interpretability, Characteristics of electrocardiogram waves
0. 引言
急性心肌梗死(myocardial infarction,MI)是由冠状动脉急性持续缺血和缺氧引起的心肌坏死。MI可能导致不可逆的心肌损伤,进而引发各种心脏并发症,如心律失常、心力衰竭,严重情况下会导致猝死[1]。心电图(electrocardiogram,ECG)因能无创、便捷地反映心肌体表电活动,成为MI检测的常用手段,其典型特征(ST段异常、病理性Q波、T波倒置)是诊断的关键依据[2]。
近年来,越来越多的研究聚焦于利用人工智能算法进行MI检测。这些研究涵盖了半自动式的传统机器学习方法和全自动“黑盒”式的深度学习方法。传统机器学习依赖手动提取心电波形、小波系数、熵等特征[3-5],结合支持向量机(support vector machine,SVM)、K邻近算法(k-nearest neighbor,KNN)、随机森林(random forest,RF)以及决策树(decision tree,DT)等分类器进行诊断[6-9],但其流程繁琐且特征提取具有一定主观性。与之相比,深度学习凭借端到端结构规避手动特征提取,如基于一维或二维卷积神经网络(convolutional neural network,CNN)[10-16]的模型在不同导联心电图中均展现出良好的分类性能,相关研究已在多导联与单导联ECG、信号-频谱图转换等场景展开[17-20]。
然而,深度学习的“黑盒”特性导致其决策过程不透明,限制了在临床实践中的接受度,尤其在需要清晰解释诊断过程的场景中,模型可解释性与结果可视化至关重要。近期,研究者开始积极探索深度学习的可解释性方法。2016年,Zhou等[21]提出了类激活映射(class activation mapping,CAM)方法,主要用于模型最后一个卷积层的特征提取。卷积层中有多个通道,每个通道提取不同的抽象特征,这些特征对最终结果的贡献各不相同。由于单独可视化每个通道的贡献相对困难,因此,CAM通过合并各通道的贡献形成统一的视觉表示。然而,为了有效利用CAM,必须要在网络中引入全局平均池化(globle average pooling,GAP)操作。针对这一限制,Selvaraju等[22]于2017年提出了梯度加权类激活映射方法(gradient-weighted class activation mapping,Grad-CAM)。Grad-CAM适用于任何深度学习网络,基于梯度信息,通过对模型输出类别的梯度进行全局平均池化,生成一个权重矩阵。该矩阵反映了每个像素对于最终分类结果的关注程度。最终,将这个权重矩阵与卷积层的特征图进行加权相加,得到Grad-CAM图像。进一步地,Panwar等[23]在2020年提出了一种结合CAM技术的深度迁移学习算法,利用胸部X线和计算机断层扫描(computed tomography,CT)图像,旨在加速COVID-19病例的检测。尽管可解释性方法已在医学影像领域取得初步应用,但在MI心电图分析中,如何实现轻量化模型与可解释性分析的有机结合仍需深入探索。
为此,本文提出一种融合轻量级CNN与一维Grad-CAM的MI自动检测与可视化方法。本研究重点从心电信号片段长度和网络结构两个维度优化模型性能,通过构建MI心电与正常心电的分类模型,结合可解释技术定位诊断关键区域,旨在为MI早期诊断提供兼具高效性与透明度的智能化解决方案。
1. 材料和方法
1.1. 数据来源与预处理
本研究使用了来自PhysioNet站上的德国联邦物理技术研究院诊断心电数据库(Physikalisch-Technische Bundesanstalt Diagnostic ECG Database,PTBDB)中的Ⅱ导联心电信记录[24]。PTBDB包含290名受试者的549个记录,年龄范围17至87岁,平均年龄为57.2岁。其中,包括209名男性(平均年龄55.5岁)和81名女性(平均年龄61.6岁),此外还有1位女性和14位男性的年龄未记录。数据库覆盖了各类心脏疾病,如MI、心力衰竭等。本文主要关注124名MI患者和52名健康个体的数据,涵盖66名全前壁MI患者的180条记录和58名全下壁MI患者的154条记录,以及52名健康个体的80条记录。此外,为平衡健康信号和MI信号样本,本研究还引入了麻省理工学院与贝斯以色列医院(Massachusetts Institute of Technology and Beth Israel Hospital,MIT-BIH)联合构建的公开数据库中的窦律心律数据库(Normal Sinus Rhythm Database,NSRDB)中18名健康个体的记录[25]。表1中提供了使用数据的详细信息。
表 1. Summary of database.
数据库概况
| 数据库属性 | PTBDB | NSRDB |
| 来源平台 | PhysioNet | PhysioNet |
| 管理机构 | 德国柏林本杰明富兰克林大学 | 哈佛-麻省理工学院联合实验室 |
| 受试者总数 | 290 人(含年龄缺失 15 人) | 18 人 |
| 记录总数 | 549 条 | 18 条 |
| 年龄分布 | 17~87 岁(平均 57.2 岁) 男性:55.5 岁(209 人) 女性:61.6 岁(81 人) |
20~50 岁(NSRDB) 男性:26~45 岁(5 人) 女性:20~50 岁(13 人) |
| 疾病覆盖类型 | MI、心力衰竭、束支阻滞、心律失常、心肌肥大、瓣膜性心脏病、心肌炎等 | 无显著心律失常 |
| 样本类型 | MI 患者 148 例(全前壁 66 例/全下壁 58 例); 健康个体 52 例 |
健康个体 18 例 |
| 记录特征 | 每条含 12 导联 + 3 弗兰克导联 | 双导联 |
原始ECG信号易受到环境和人体产生的各种频率噪声干扰,尤其是基线漂移、肌电噪声和工频干扰[26]。为确保信号质量,本文采用了数字滤波器进行去噪。首先,使用了一个2阶巴特沃兹滤波器,以滤除心电信号中0.05~100 Hz范围以外的噪声。其次,ECG信号通过一个中值滤波器,其滑动窗口的长度为0.85 s。在每个位置,窗口内的所有值按大小排序,取新位置中间的值更新旧位置中间的值,从而有效滤除ECG信号中的基线漂移。然后,将ECG信号通过一个滑动平均滤波器,通过移动窗口对窗口内的数据进行平均运算,以有效去除信号中的毛刺和高频噪声。最后,将处理好的ECG分别分割成2、4、6、8 s的心电片段。其中包括:18 724个2 s MI片段和17 763个2 s正常片段;9 206个4 s MI片段和8 817个4 s正常片段;6 238个6 s MI片段和5 887个6 s正常片段;4 599个8 s MI片段和4 408个8 s正常片段。
1.2. MI检测CNN模型
本研究主要聚焦于两方面:首先,探讨了CNN层数对模型性能的影响,以简化网络结构、降低计算复杂度为目标,同时保持较好的性能,使模型在实际应用中更为高效。为达成此目标,设计了三种不同层数(7层、9层、11层)的轻量级CNN网络结构,并对其进行了测试。其次,分析了输入信号的长度(2、4、6、8 s)对模型检测准确度的影响,形成12种模型配置,旨在全面评估模型在不同输入长度下的性能表现,并找到实时性和准确率的最佳平衡点。表2详细描述了各模型的具体参数,图1给出了11层CNN模型和2 s ECG片段输入的网络结构图。
表 2. Parameters of CNN models with various layers and structures.
不同网络深度和网络结构的CNN模型参数
| 模型 | 模型1 | 模型2 | 模型3 | 模型4 | 模型5 | 模型6 | 模型7 | 模型8 | 模型9 | 模型10 | 模型11 | 模型12 | |
| ECG的长度 | 2 s | 4 s | 6 s | 8 s | 2 s | 4 s | 6 s | 8 s | 2 s | 4 s | 6 s | 8 s | |
| 卷积层 | 数量 | 16 | 16 | 16 | 16 | 16 | 16 | 16 | 16 | 16 | 16 | 16 | 16 |
| 尺寸 | 2 × 2 | 2 × 2 | 2 × 2 | 2 × 2 | 2 × 2 | 2 × 2 | 2 × 2 | 2 × 2 | 2 × 2 | 2 × 2 | 2 × 2 | 2 × 2 | |
| 步长 | 1 × 1 | 1 × 1 | 1 × 1 | 1 × 1 | 1 × 1 | 1 × 1 | 1 × 1 | 1 × 1 | 1 × 1 | 1 × 1 | 1 × 1 | 1 × 1 | |
| 池化层 | 尺寸 | 2 × 2 | 2 × 2 | 2 × 2 | 2 × 2 | 2 × 2 | 2 × 2 | 2 × 2 | 2 × 2 | 2 × 2 | 2 × 2 | 2 × 2 | 2 × 2 |
| 步长 | 2 × 2 | 2 × 2 | 2 × 2 | 2 × 2 | 2 × 2 | 2 × 2 | 2 × 2 | 2 × 2 | 2 × 2 | 2 × 2 | 2 × 2 | 2 × 2 | |
| 卷积层 | 数量 | 32 | 32 | 32 | 32 | 32 | 32 | 32 | 32 | 32 | 32 | 32 | 32 |
| 尺寸 | 2 × 2 | 2 × 2 | 2 × 2 | 2 × 2 | 2 × 2 | 2 × 2 | 2 × 2 | 2 × 2 | 2 × 2 | 2 × 2 | 2 × 2 | 2 × 2 | |
| 步长 | 1 × 1 | 1 × 1 | 1 × 1 | 1 × 1 | 1 × 1 | 1 × 1 | 1 × 1 | 1 × 1 | 1 × 1 | 1 × 1 | 1 × 1 | 1 × 1 | |
| 池化层 | 尺寸 | 2 × 2 | 2 × 2 | 2 × 2 | 2 × 2 | 2 × 2 | 2 × 2 | 2 × 2 | 2 × 2 | 2 × 2 | 2 × 2 | 2 × 2 | 2 × 2 |
| 步长 | 2 × 2 | 2 × 2 | 2 × 2 | 2 × 2 | 2 × 2 | 2 × 2 | 2 × 2 | 2 × 2 | 2 × 2 | 2 × 2 | 2 × 2 | 2 × 2 | |
| 卷积层 | 数量 | – | 64 | 64 | – | 64 | 64 | – | 64 | 64 | – | 64 | 64 |
| 尺寸 | – | 2 × 2 | 2 × 2 | – | 2 × 2 | 2 × 2 | – | 2 × 2 | 2 × 2 | – | 2 × 2 | 2 × 2 | |
| 步长 | – | 1 × 1 | 1 × 1 | – | 1 × 1 | 1 × 1 | – | 1 × 1 | 1 × 1 | – | 1 × 1 | 1 × 1 | |
| 池化层 | 尺寸 | – | 2 × 2 | 2 × 2 | – | 2 × 2 | 2 × 2 | – | 2 × 2 | 2 × 2 | – | 2 × 2 | 2 × 2 |
| 步长 | – | 2 × 2 | 2 × 2 | – | 2 × 2 | 2 × 2 | – | 2 × 2 | 2 × 2 | – | 2 × 2 | 2 × 2 | |
| 卷积层 | 数量 | – | – | 128 | – | – | 128 | – | – | 128 | – | – | 128 |
| 尺寸 | – | – | 2 × 2 | – | – | 2 × 2 | – | – | 2 × 2 | – | – | 2 × 2 | |
| 步长 | – | – | 1 × 1 | – | – | 1 × 1 | – | – | 1 × 1 | – | – | 1 × 1 | |
| 池化层 | 尺寸 | – | – | 2 × 2 | – | – | 2 × 2 | – | – | 2 × 2 | – | – | 2 × 2 |
| 步长 | – | – | 2 × 2 | – | – | 2 × 2 | – | – | 2 × 2 | – | – | 2 × 2 | |
| 随机失活 | 比例 | 0.5 | 0.5 | 0.5 | 0.5 | 0.5 | 0.5 | 0.5 | 0.5 | 0.5 | 0.5 | 0.5 | 0.5 |
| 全连接层 | 数量 | 8 | 8 | 8 | 8 | 8 | 8 | 8 | 8 | 8 | 8 | 8 | 8 |
| 全连接层 | 数量 | 2 | 2 | 2 | 2 | 2 | 2 | 2 | 2 | 2 | 2 | 2 | 2 |
| 参数量 | 17.51E3 | 33.90E3 | 50.28E3 | 66.67E3 | 21.67E3 | 38.06E3 | 54.44E3 | 70.83E3 | 38.19E3 | 54.57E3 | 70.95E3 | 87.34E3 | |
| 计算量/MFLOPs | 0.33 | 0.66 | 0.98 | 1.31 | 0.86 | 1.72 | 2.58 | 3.44 | 1.92 | 3.83 | 5.75 | 7.67 | |
图 1.

Structure of the MI automatic detection algorithm based on an 11-layer CNN and 2-second ECG segment input
基于11层CNN和2 s ECG片段输入的MI自动检测算法结构图
1.3. 模型的可视化
基于梯度加权类激活的方法在二维医学影像分析中已取得成效,但将其应用于一维心电信号分析仍面临挑战。为此,本研究创新性地将Grad-CAM技术适配于一维心电数据,提出专门针对时序信号的1D-Grad-CAM方法。流程图如图2所示。首先,将ECG片段输入轻量级CNN进行MI检测。此时,模型通过前向传播实现分类,其中上层神经元的输出为下层神经元的输入,最终的分类结果在全连接层中获得。与此相反,利用1D-Grad-CAM方法对模型进行解释则是一个反向传播过程。如图2所示,该过程首先利用分类结果进行反向传播,进而计算最终输出特征图相对于特定类别得分的梯度
。然后,通过在特征图梯度上执行全局平均池化操作,得到与该类别相关的权重
。其中,重要性权重
映射了特征图k对预测目标类别c的影响。通过对加权激活图求和并应用ReLU函数,生成目标类别c的热力图
。通过在原始输入数据上叠加能够展示模型做判断时关注区域的热图,直观地揭示了决策背后的原因。
图 2.

Visualization reconstruction flowchart of CNN model for key ECG waveform features
关键心电波形特征的CNN模型可视化重建流程图
1D-Grad-CAM的计算基于轻量级CNN的最后一个卷积层的特征图激活。选择深层卷积层的原因在于:深层特征图包含更高层次的抽象语义信息(如病理性Q波、ST段变化等全局形态特征),而浅层特征图更关注局部细节(如单个波形的边缘)。具体而言,首先将原始一维的心电图数据转化为坐标序列,每个数据点均对应坐标系中的特定位置。随后,基于全局平均池化,每个数据点对应的重要性权重(取值范围为0到1)被映射到颜色映射表中。权重值越高,对应的颜色越接近红色;权重值越低,对应的颜色越接近蓝色。例如,权重值为0的数据点对应的颜色是蓝色,而权重值为1的数据点对应的颜色是红色。
![]() |
1 |
![]() |
2 |
1.4. 模型的性能评估
在本研究中,为实现对算法性能的精准评估,采用了十折交叉和留一法这两种经典的验证策略。首先,针对模型实施十折交叉验证。将整个数据集均匀划分为十份。在每一轮的验证进程中,选取其中九份数据作为训练集,用于驱动模型进行训练,使其充分学习数据中的特征与规律;而剩余的一份数据则作为测试集,用于检验模型在未接触过的数据上的泛化能力。为了能够定量衡量该算法的性能,选用了四个关键指标,分别是灵敏度(sensitivity,Sen)、特异性(specificity,Spe)、准确性(accuracy,Acc)以及单个样本推理时间。计算公式如下:
![]() |
3 |
![]() |
4 |
![]() |
5 |
![]() |
6 |
其中,真阳性(true positive,TP)表示正确识别为MI片段的总次数;真阴性(true negative,TN)表示正确识别为健康的总次数;假阳性(false positive,FP)表示将健康片段错误地识别为MI的总次数,而假阴性(false negative,FN)表示将MI片段错误地识别为健康的总次数。
其次,开展模型的留一法验证。从PTBDB数据库中,通过随机抽样的方式,选择了10位泛前壁MI患者、10位泛下壁MI患者以及10位健康受试个体,共计得到30个病例样本。为便于后续的分析与处理,按照样本选取的先后顺序,对这30个病例样本依次进行编号,如表3所示。接着,对这些样本中的心电数据进行统一处理,将其切割成时长固定为2 s的ECG片段。在留一法验证过程中,每次保留一个样本作为测试集,而将其余的29个样本作为训练集用于模型训练。训练完成后,利用该模型对保留的那一个测试样本进行预测,并记录预测结果。如此循环操作,直至每一个样本都依次作为测试集被使用过一次,以此全面评估模型在不同样本上的预测性能和泛化能力。
表 3. Dataset for leave-one-out cross-validation.
留一法数据库
| 病例 | 数量 | 编号 |
| 泛下壁MI患者 | 10 | 4,43,58,74,97,131,155,195,223,239 |
| 泛前壁MI患者 | 10 | 15,26,36,51,69,83,90,96,105,111 |
| 健康个体 | 10 | 273,303,325,453,466,471,476,481, 490,527 |
2. 结果
本文深度学习模型基于开源库TensorFlow构建与训练,运行硬件核心配置为:16 GB内存、Intel Core i7-12700F CPU(美国),NVIDIA RTX 3060 GPU(12 GB显存,美国)。
图3分别展示了基于不同网络层数(7层、9层、11层)和不同输入ECG信号长度(2、4、6、8 s)的12种模型的实验结果,每种组合的性能均通过十折交叉验证进行评估。其中,模型9中的11层网络配合2 s ECG信号输入的组合表现最佳,其Acc、Sen和Spe分别达到95.75%、96.03%和95.47%,单个样本推理时间仅为0.96 ms。
图 3.
Performance evaluation results of 12 models with different network layers (7, 9, 11) and various ECG segment lengths (2 s, 4 s, 6 s, 8 s)
不同网络层数(7层、9层、11层)和不同长度ECG片段(2、4、6、8 s)组合形成的12种模型的性能评估结果
基于实验数据显示,随着心电信号片段长度的增加,模型的分类性能呈现衰减趋势。这一现象可以从信号特征表征和模型训练机制两个方面进行解析。在信号特征表征方面,短时心电片段包含的特征更明显,可辨识度较高。而随着心电片段的逐渐加长,单个样本内会同时包含多个心电周期,其中正常节律与异常信号的分布更为复杂,从而导致模型判别出现错误。从数据驱动模型训练的角度而言,本实验采用的2、4、6、8 s心电片段均源自同一原始数据库的切割处理。这种数据处理方式导致数据样本数量与片段长度呈显著负相关关系:较短片段可切割出更多独立样本,而长时片段的样本总量显著减少。深度学习模型的泛化能力高度依赖于训练数据的规模与多样性,长片段数据量不足,导致模型性能下降。
图4展示了模型留一法交叉验证的结果。横坐标表示不同患者的记录编号,纵坐标表示模型对每个患者进行测试得到的准确率。除了记录10和24外,所有记录的准确率均超过90%。具体而言,28名患者的准确率高于90%,平均准确率为97.45%。
图 4.
Accuracy of the proposed MI detection method performed on various patients
不同患者心肌梗死自动检测的准确度测试结果
图5分别通过三个正常ECG样本和三个MI样本的的热力图,展示了模型在进行MI检测时的关注焦点,突出了MI信号和正常信号的关键特征。热力图的颜色强度体现了模型在识别过程中对该区域的关注程度:颜色越蓝,关注程度越低;颜色越红,关注程度越高。图片中灰色区域为原始ECG信号,表示模型在分类过程中未关注该区域的特征。
图 5.

Visualization results of characteristic waveforms from three segments of healthy ECG samples and three segments of myocardial infarction ECG samples focused on by the CNN model
CNN模型重点关注的三段健康ECG样本和三段心肌梗死ECG样本的特征波形可视化结果
具体而言,图5上面三幅图展示了正常ECG信号关键特征的可视化结果,显示模型在判断其为正常ECG信号时主要关注P波和QRS波群是否正常。图5下面三幅图展示了MI信号关键特征的可视化结果,显示模型在将其识别为MI信号时主要关注ST段、T波和Q波。这些区域的异常是MI信号的重要标志,如果模型在分类时识别到ST段抬高、T波倒置和病理性Q波等异常特征,就会将其分为MI类别。
3. 讨论
本文提出了一种结合深度学习算法及其可解释性技术的方法,用于对MI心电图进行自动诊断和关键心电特征的可视化。具体来说,本文采用国际公认的PTB数据库的124名MI患者和52名健康个体以及MIT-BIH数据库中18名健康个体的ECG数据,对不同网络深度和网络结构的12个轻量级CNN网络结构进行了训练和评估验证。实验结果显示:① 本文的轻量级CNN模型可解释性技术,成功地将模型高度关注的兴趣点通过重建生成热力图的方式在原始心电波形上可视化重现出来,即通过生成能代表模型分类决策关注区域的热力图,并将其映射到原始ECG信号上,医生可以直观地了解模型的决策依据,从而更好地辅助临床决策,提高诊断的准确性和效率;② 包括病理性Q波、ST段抬高和T波倒置等在内的可视化重现的关键心电波形特征与临床MI心电诊断标准高度吻合;③ 结合CNN的模型结构复杂度和输入心电片段长度的协同优化,优化所得的11层轻量级CNN网络模型对2 s的心电信号片段的MI自动检测性能分别达到95.75%的准确率、96.03%的灵敏度和95.47%的特异性,优于国际同行的相关研究成果[27-28]。同时,我们发现在固定模型层数的情况下,较短的数据长度表现出更优的分类性能。一方面是因为较长的输入信号包含更多的心脏周期,其中既包括正常周期又包括MI周期,可能导致模型误判;另一方面是因为深度学习依赖大量的实验样本来完成准确的分类,而心电片段越长,实验样本数就越少,从而导致准确率降低。而在固定输入信号长度的条件下,增加CNN模型的层数有助于提升分类性能。这归因于更多的网络层数增强了模型的结构复杂度和特征提取能力。
如表4所示,本文分别从材料、方法、导联配置、验证方法及模型可解释性5个维度,全面评估了本研究所提出可解释深度学习模型与其他已报道模型的性能差异。实验结果表明,本研究模型在标准数据库上采用十折交叉验证和留一法验证策略,分别取得了95.75%和97.45%的准确率。与其他研究相比,本研究所提出的模型有以下三个优点:① 如表2所示,本文采用轻量级CNN架构,在保证检测精度的前提下减少了计算资源消耗,为临床实时心电分析提供可行性支撑;② 如图4所示,本文模型的留一法交叉验证的平均准确率为97.45%,突破了已有研究单一验证方法的局限,通过十折交叉验证与留一法验证组合策略的双重验证机制进一步提升了模型泛化能力与鲁棒性;③ 引入Grad-CAM特征可视化技术,突破传统黑箱模型的临床应用瓶颈,使检测结果具备医学可解释性与临床可回溯性。
表 4. Comparing the proposed method with other studies.
与其他研究方法的比较
| 文献来源 | 数据库 | 方法 | 可解释性 | 导联配置 | 验证方法 | 准确率(%) | 灵敏度(%) | 特异性(%) |
| [10] | PTB | CNN | — | Lead II | 十折交叉 | 95.22 | 95.49 | 94.19 |
| [12] | PTB | CNN | — | 12-Lead | 五折交叉 | 95.76 | — | — |
| [14] | PTB | CNN | — | Lead Ⅰ, Ⅱ, V1-6 | 十折交叉 | — | 93.3 | 89.7 |
| [15] | PTB | ResNet | — | 12-Lead | 五折交叉 | 95.49 | 94.85 | 97.37 |
| [18] | PTB | CNN-LSTM | — | Lead I | 十折交叉 | 95.40 | 98.20 | 86.50 |
| [27] | MIT-BIH European ST-T Long-Term ST |
KNN | — | Lead V1-V5 | 十折交叉 | 94.23 | 95.72 | 98.15 |
| [6] | PTB | SVM | — | 12-Lead | — | 91.07% | — | — |
| [8] | PTB, MIT-BIH | RF | — | 12-Lead | 十折交叉 | 75% | 77% | 73% |
| [9] | Clinical Data | DT | — | 12-Lead | — | 82.01% | — | — |
| [28] | PTB | BCNN | — | Lead V1 | 十折交叉 | 90.29 | 90.41 | 90.16 |
| 本研究 | PTB, MIT-BIH | CNN | Grad-CAM | Lead II | 十折交叉 | 95.75 | 96.03 | 95.47 |
尽管本文提出的人工智能及其可解释性方法在MI心电图自动诊断和关键心电特征分析中表现出了令人满意的效果,然而在研究中也发现还有诸多局限性需要在将来的工作中进一步探索:① 本文所采用的心电数据全部来自国际公开的标准心电数据库,尽管可对本文的人工智能算法重现和关键心电波形特征可视化分析提供公开、可查的数据支撑,但是构建来自多中心的临床患者数据库和开展更大规模的模型训练和泛化能力评估或将有助于进一步推动该方法的临床适用性验证。② 前期工作中,我们实验室已经开发了多种基于新型柔性生物电干电极的心电监测智能可穿戴设备,包括单导联心电贴片[29]、基于柔性生物电干电极的单导联心电胸带以及心电背心[30-31]。我们计划下一步通过智能可穿戴设备采集大量真实的MI数据和正常ECG数据,研究和拓展本文方法对于新型干电极所采集的体表心电信号分析及MI关键心电波形特征重建的适用性。这些真实的多样性数据将为模型的训练和测试提供更加可靠和全面的样本,使得模型在实际应用中的表现更加准确和稳定。通过增加真实采集数据的比例,能够更好地验证模型的泛化能力和临床适用性。
4. 结论
本研究提出了一种可解释的轻量级CNN模型用于单导联ECG信号的MI自动诊断及其关键心电波形特征的可视化重现。通过这一方法,本文成功地实现了MI心电图的人工智能诊断过程的“黑盒”问题“白盒化”,使得深度学习模型的内部决策过程更加透明和可解释。这不仅提升了模型的可信度,还为临床医生更容易接受和信任人工智能诊断结果提供了有效手段。一方面,使原本“黑盒化”的深度学习模型的自动检测结果获得更好的可解释性和内部推理的透明度,为医生提供了更直观的自动诊断依据再现,增加患者对治疗决策的理解和接受度;另一方面,本文的研究将为早期评估MI风险和智能化诊断提供新的技术手段,由于该模型的轻量级和可解释的特征,未来有望部署在智能可穿戴设备中,实现对MI等这类高风险心电波形特征的快速筛查和早期预测,降低急性MI可能引起的恶性心律失常和心脏猝死的发病率。
重要声明
利益冲突声明:本文全体作者不存在利益冲突。
作者贡献声明:张月负责模型搭建、数据分析和论文撰写,张翼飞负责课题背景调研和数据分析指导,谢宝杰负责论文审阅修订,赖大坤负责文章审阅和修订。
Funding Statement
四川省自然科学基金(2025ZNSFSC0457)
Natural Science Foundation of Sichuan Province, China
References
- 1.Choudhary P S, Dandapat S. Multibranch 1D CNN for detection and localization of myocardial infarction from 12 lead electrocardiogram signa// 2021 IEEE 18th India Council International Conference (INDICON). Guwahati: IEEE, 2021: 1-5.
- 2.万学红, 卢雪峰. 诊断学. 第9版. 北京: 人民卫生出版社, 2018: 501-514.
- 3.Arif M, Malagore I A, Afsar F A Detection and localization of myocardial infarction using k-nearest neighbor classifier. J Med Syst. 2012;36(1):279–289. doi: 10.1007/s10916-010-9474-3. [DOI] [PubMed] [Google Scholar]
- 4.Acharya U R, Fujita H, Adam M, et al Automated characterization and classification of coronary artery disease and myocardial infarction by decomposition of ECG signals: A comparative study. Inf Sci. 2017;377:17–29. doi: 10.1016/j.ins.2016.10.013. [DOI] [Google Scholar]
- 5.Fatimah B, Singh P, Singhal A, et al Efficient detection of myocardial infarction from single lead ECG signal. Biomed Signal Process Control. 2021;68:102678. doi: 10.1016/j.bspc.2021.102678. [DOI] [Google Scholar]
- 6.Bhaskar N A Performance analysis of support vector machine and neural networks in detection of myocardial infarction. Proced Comput Sci. 2015;46:20–30. doi: 10.1016/j.procs.2015.01.043. [DOI] [Google Scholar]
- 7.Lin Z, Gao Y, Chen Y, et al Automated detection of myocardial infarction using robust features extracted from 12-lead ECG. Signal Image Video P. 2020;14:857–865. doi: 10.1007/s11760-019-01617-y. [DOI] [Google Scholar]
- 8.Sraitih M, Jabrane Y, El Hassani A H A robustness evaluation of machine learning algorithms for ECG myocardial infarction detection. J Clin Med. 2022;11(17):4935. doi: 10.3390/jcm11174935. [DOI] [PMC free article] [PubMed] [Google Scholar]
- 9.Khan R H, Miah J, Nipun S A, et al. A comparative study of machine learning classifiers to analyze the precision of myocardial infarction prediction// 2023 IEEE 13th Annual Computing and Communication Workshop and Conference (CCWC). Las VegasA: IEEE, 2023: 949-954.
- 10.Acharya U R, Fujita H, Oh S L, et al Application of deep convolutional neural network for automated detection of myocardial infarction using ECG signals. Inf Sci. 2017;415:190–198. [Google Scholar]
- 11.Liu W, Huang Q, Chang S, et al Multiple-feature-branch convolutional neural network for myocardial infarction diagnosis using electrocardiogram. Biomed Signal Process Control. 2018;45:22–32. doi: 10.1016/j.bspc.2018.05.013. [DOI] [Google Scholar]
- 12.Jian J Z, Ger T R, Lai H H, et al Detection of myocardial infarction using ECG and multi-scale feature concatenate. Sensors. 2021;21(5):1906. doi: 10.3390/s21051906. [DOI] [PMC free article] [PubMed] [Google Scholar]
- 13.Liu W, Zhang M, Zhang Y, et al Real-time multilead convolutional neural network for myocardial infarction detection. IEEE J Biomed Health Inform. 2017;22(5):1434–1444. doi: 10.1109/JBHI.2017.2771768. [DOI] [PubMed] [Google Scholar]
- 14.Strodthoff N, Strodthoff C Detecting and interpreting myocardial infarction using fully convolutional neural networks. Physiol Meas. 2019;40(1):015001. doi: 10.1088/1361-6579/aaf34d. [DOI] [PubMed] [Google Scholar]
- 15.Han C, Shi L ML–ResNet: A novel network to detect and locate myocardial infarction using 12 leads ECG. Comput Meth Prog Bio. 2020;185:105138. doi: 10.1016/j.cmpb.2019.105138. [DOI] [Google Scholar]
- 16.Cao Y, Liu W, Zhang S, et al Detection and localization of myocardial infarction based on multi-scale resnet and attention mechanism. Front Physiol. 2022;13:24. [Google Scholar]
- 17.Baloglu U B, Talo M, Yildirim O, et al Classification of myocardial infarction with multi-lead ECG signals and deep CNN. Pattern Recogn Lett. 2019;122:23–30. doi: 10.1016/j.patrec.2019.02.016. [DOI] [Google Scholar]
- 18.Feng K, Pi X, Liu H, et al Myocardial infarction classification based on convolutional neural network and recurrent neural network. Appl Sci. 2019;9(9):1879. doi: 10.3390/app9091879. [DOI] [Google Scholar]
- 19.Ullah A, Anwar S M, Bilal M, et al Classification of arrhythmia by using deep learning with 2-D ECG spectral image representation. Remote Sens. 2020;12(10):1685. doi: 10.3390/rs12101685. [DOI] [Google Scholar]
- 20.Jikui L, Ruxin W, Bo W, et al Myocardial infarction detection and localization with electrocardiogram based on convolutional neural network. Chin J Electron. 2021;30(5):833–842. doi: 10.1049/cje.2021.06.005. [DOI] [Google Scholar]
- 21.Zhou B, Khosla A, Lapedriza A, et al. Learning deep features for discriminative localization// Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. Las Vegas: IEEE, 2016: 2921-2929.
- 22.Selvaraju R R, Cogswell M, Das A, et al. Grad-CAM: Visual explanations from deep networks via gradient-based localization// Proceedings of the IEEE International Conference on Computer Vision. Venice: IEEE, 2017: 618-626.
- 23.Panwar H, Gupta P K, Siddiqui M K, et al A deep learning and grad-CAM based color visualization approach for fast detection of COVID-19 cases using chest X-ray and CT-Scan images. Chaos Solitons Fractals. 2020;140:110190. doi: 10.1016/j.chaos.2020.110190. [DOI] [PMC free article] [PubMed] [Google Scholar]
- 24.Goldberger A L, Amaral L A N, Glass L, et al PhysioBank, PhysioToolkit, and PhysioNet: components of a new research resource for complex physiologic signals. Circulation. 2000;101(23):215–220. [Google Scholar]
- 25.Moody G B, Mark R G. The MIT-BIH arrhythmia database on CD-ROM and software for use with it// Proceedings Computers in Cardiology. Chicago: IEEE, 1990: 185-188.
- 26.Kumar A, Tomar H, Mehla V K, et al Stationary wavelet transform based ECG signal denoising method. ISA Trans. 2021;114:251–262. doi: 10.1016/j.isatra.2020.12.029. [DOI] [PubMed] [Google Scholar]
- 27.Kayikcioglu I, Akdeniz F, Köse C, et al Time-frequency approach to ECG classification of myocardial infarction. Comput Electr Eng. 2020;84:106621. doi: 10.1016/j.compeleceng.2020.106621. [DOI] [Google Scholar]
- 28.Rashid N, Al Faruque M A. Energy-efficient real-time myocardial infarction detection on wearable devices// 2020 42nd Annual International Conference of the IEEE Engineering in Medicine & Biology Society (EMBC). Montreal: IEEE, 2020: 4648-4651.
- 29.Lai D, Bu Y, Su Y, et al Non-standardized patch-based ECG lead together with deep learning based algorithm for automatic screening of atrial fibrillation. IEEE J Biomed Health Inform. 2020;24(6):1569–1578. doi: 10.1109/JBHI.2020.2980454. [DOI] [PubMed] [Google Scholar]
- 30.姜宇琛, 张月, 茶兴增, 等 基于多层丝网印刷柔性生物电干电极的单导联心电胸带. 中国生物医学工程学报. 2023;42(5):636–640. [Google Scholar]
- 31.Bu Y, Hassan M F U, Lai D The embedding of flexible conductive silver-coated electrodes into ECG monitoring garment for minimizing motion artefacts. IEEE Sens J. 2020;21(13):14454–14465. [Google Scholar]








