Abstract
阿尔茨海默症(AD)是一种典型的神经退行性疾病,临床上表现为失忆、丧失语言能力、丧失生活自理能力等。迄今为止,AD 病因尚不明确且病程不可逆,也没有治愈的方法,因此,AD 的早期诊断对于研发新型药物和措施以减缓病情发展具有重要意义。轻度认知障碍(MCI)是一种介于 AD 和正常老化(HC)之间的状态。研究表明,MCI 患者比没有患过 MCI 的人更有可能发展成 AD,因此,对 MCI 患者的准确筛查成为了 AD 早期诊断的研究热点之一。随着神经影像技术和深度学习的飞速发展,越来越多的研究者使用深度学习方法对大脑神经影像如磁共振影像(MRI)进行分析,用于 AD 的早期诊断。于是,本文提出基于卷积神经网络(CNN)和集成学习的多切片集成分类模型用于 AD 早期诊断。与只用单切片训练获得的 CNN 分类模型相比,本文采用三个维度上的多个二维切片进行训练而获得的集成分类器模型,能更充分地利用 MRI 包含的有效信息,从而提高分类的准确率和稳定性。
Keywords: 阿尔茨海默症, 轻度认知障碍, 卷积神经网络, 集成学习, 磁共振图像
Abstract
Alzheimer's disease (AD) is a typical neurodegenerative disease, which is clinically manifested as amnesia, loss of language ability and self-care ability, and so on. So far, the cause of the disease has still been unclear and the course of the disease is irreversible, and there has been no cure for the disease yet. Hence, early prognosis of AD is important for the development of new drugs and measures to slow the progression of the disease. Mild cognitive impairment (MCI) is a state between AD and healthy controls (HC). Studies have shown that patients with MCI are more likely to develop AD than those without MCI. Therefore, accurate screening of MCI patients has become one of the research hotspots of early prognosis of AD. With the rapid development of neuroimaging techniques and deep learning, more and more researchers employ deep learning methods to analyze brain neuroimaging images, such as magnetic resonance imaging (MRI), for early prognosis of AD. Hence, in this paper, a three-dimensional multi-slice classifiers ensemble based on convolutional neural network (CNN) and ensemble learning for early prognosis of AD has been proposed. Compared with the CNN classification model based on a single slice, the proposed classifiers ensemble based on multiple two-dimensional slices from three dimensions could use more effective information contained in MRI to improve classification accuracy and stability in a parallel computing mode.
Keywords: Alzheimer's disease, mild cognitive impairment, convolutional neural networks, ensemble learning, magnetic resonance imaging
引言
阿尔茨海默症(Alzheimer’s disease,AD)是一种慢性神经退行性疾病,潜伏期很长,随着时间推移病症会慢慢恶化,临床上表现为失忆以及丧失行动、语言能力等[1]。国际老年痴呆协会颁布的《2016 全球阿尔茨海默症报告》指出,2050 年,全球 AD 的患病人数将从现在的 4 700 万增加到 1.32 亿。报告表明该疾病发展迅速且将造成严重后果[2]。AD 的患病原因尚不明确且病程不可逆,尚没有药物可以治愈 AD 或者完全阻止病情恶化。因此,AD 的早期诊断对于研发新型药物和措施以减缓病情发展具有重要意义。
轻度认知障碍(mild cognitive impairment,MCI)是一种介于 AD 和正常老化(healthy controls,HC)之间的状态,可以细分为会转化为 AD 的轻度认知障碍(MCI patients who will convert to AD,MCIc)和不会转化为 AD 的轻度认知障碍(MCI patients who will not convert to AD,MCInc)。研究表明,MCI 患者比之前没有患过 MCI 的人更有可能发展成 AD[3],当前诸多研究者都希望尽早诊断出患者的 MCIc 状态,然后通过有效措施防止病情的进一步恶化。如何准确检测患者当前所处的病症阶段成为 AD 早期诊断的研究重点。
随着神经影像技术的飞速发展,磁共振成像(magnetic resonance imaging,MRI)技术被广泛用于 AD 诊断。近年来,使用机器学习方法分析 MRI 图像来预测患者病症阶段取得了较好的效果,如随机森林[4](random forest,RF)、支持向量机[5](support vector machine,SVM)、boosting 算法[6]等,对 MRI 的分析起到了很重要的作用。但是在以往基于机器学习方法的研究中,常常需要先人工勾选出 AD 患者中变化较明显的大脑区域,如海马、杏仁核、颞叶等感兴趣区域(region of interest,ROI),然后利用机器学习方法对从这些 ROI 中提取到的特征进行分析,获得对患者状态的预测结果。这种方法虽然也能取得不错的效果,但仍存在很大的局限性。首先,人工提取 ROI 是根据已有的临床或实验经验,选取那些在 AD 被试与 HC 被试中存在较大差异的区域,由于 AD 的生物标志物目前尚不明确,人工选取 ROI 可能会漏掉一些目前还没发现的有用区域;其次,人工特征提取可能会受到人为因素干扰而产生疏漏,影响 AD 早期诊断结果;另外,人工划分 ROI 需要耗费大量时间成本和人力成本。
深度学习的概念源于人工神经网络的研究,通过组合低层特征形成更加抽象的高层表示(属性类别或特征),以发现数据的分布式特征表示[7]。深度学习模型包括栈式自编码器[8](stacked autoencoder,SAE)、深度置信网络[9](deep belief network,DBN)和卷积神经网络[10](convolutional neural network,CNN)等。其中,CNN 模型可以直接输入图像,能利用相邻像素点之间的空间信息,并通过局部感受野、权重共享和子采样三种机制有效减少模型参数,已被广泛用于图像分类[11]、图像分割[12]、物体检测[13]等领域。本文采用深度学习方法,利用被试的大量 MRI 切片训练 CNN,让 CNN 自动学习图像特征,避免了人工提取,然后根据这些特征对输入图像进行分类,获得被试状态的分类结果。本文使用的基础 CNN 结构是文献[14]中提出的 8 层 CNN 网络结构,在此基础上构建了三轴多切片集成分类模型。
1. 方法
1.1. 基本概念
1.1.1. 卷积神经网络
CNN 是近年发展起来,并引起广泛重视的一种高效图像识别方法。20 世纪 60 年代,Hubel 和 Wiesel 在研究猫脑皮层中关于局部敏感和方向选择的神经元时,发现其独特的网络结构可以有效地降低反馈神经网络的复杂性,继而提出了 CNN。作为神经网络领域的一个重要研究分支,CNN 的特点在于其每一层的特征都由上一层的局部区域通过共享权值的卷积核激励得到。这一特点使得 CNN 相比于其他神经网络方法更适合应用于图像特征的学习与表达[15]。
一般地,CNN 的基本结构(卷积层)包括两层。其一为特征提取层,每个神经元的输入与前一层的局部感受域相连,并提取该局部的特征。一旦该局部特征被提取后,它与其他特征间的位置关系也随之确定下来。其二是特征映射层,网络的每个计算层由多个特征映射组成,每个特征映射是一个平面,平面上所有神经元的权值相等。由于一个映射面上的神经元共享权值,因而有效减少了网络自由参数的个数。CNN 中的每一个卷积层都紧跟着一个用来求取局部平均或二次提取的池化层,这种特有的两次特征提取结构减小了特征分辨率。CNN 卷积层与池化层的基本结构如图 1 所示。
图 1.

Basic structure of CNN convolutional layer and pooling layer
CNN 卷积层与池化层基本结构
CNN 主要用来识别位移、缩放及其他形式扭曲不变性的二维图形,该部分功能主要由池化层实现。由于 CNN 可以通过训练数据进行自适应学习,所以在使用 CNN 时,避免了显式的特征抽取,能够隐式地从训练数据中学习到特征;再者由于同一特征映射面上的神经元权值相同,使得网络可以并行学习,这也是卷积网络相对于全连接网络的一大优势。CNN 以其局部权值共享的特殊结构在语音识别和图像处理方面有着独特的优越性,其布局更接近于实际的生物神经网络,权值共享降低了网络的复杂性。典型的 CNN 如图 2 所示。
图 2.

Typical convolutional neural network structure
典型的 CNN 结构
1.1.2. 集成学习
集成学习(ensemble learning)的主要思路是先通过一定的规则生成多个基学习机(在本文中,即指基分类器),再采用某种集成策略进行组合,最后通过综合判断来输出最终结果。具有代表性的集成学习方法有 Bagging[16]、Boosting[17]和随机森林[18],集成学习能够显著提高学习系统的泛化能力。目前,常见的用于生成基学习机的方法可以粗略分为两大类:一类是将不同类型的学习算法应用于同一数据集上,这种方法得到的基学习机通常被称为是异质类型的(heterogeneous);另一类是将同一学习算法应用于不同的训练集,这种方法得到的基学习机被称为是同质类型的(homogeneous)[19]。
本文模型得到的基学习机是同质类型的。本模型将同一种 CNN 分类器结构应用于不同切片上,产生出各自的基分类器,然后让筛选出的基分类器表决出测试样例的输出结果。
1.2. 数据集和预处理
1.2.1. ADNI 数据库
本文使用的实验数据来自阿尔茨海默病神经影像学倡议(Alzheimer’s Disease Neuroimaging Initiative,ADNI)数据库(http://adni.loni.usc.edu)。ADNI 是由美国国立老年研究所(National Institute on Aging,NIA)、国家生物医学成像和生物工程研究所(National Institute of Biomedical Imaging and Bioengineering,NIBIB)、美国食品药品监督管理局(Food and Drug Administration,FDA)及一些民营医药企业和非盈利组织于 2003 年创建的。该数据库公开提供一系列测试对象的 MRI、正电子发射计算机断层扫描(positron emission tomography,PET)、基因数据以及其他生物标记和相关诊断信息,成为研究 AD 的一套比较标准的研究数据。本文的实验数据是根据文献[20]的附录所提供的 ImageID 从 ADNI 数据库中下载得到的。该文献所用到的 MRI 图像数据包含 137 例 AD、76 例 MCIc、134 例 MCInc 和 162 例 HC。509 名被试详细信息见表 1。
表 1. Information on train set and test set subjects.
训练集和测试集被试详细信息
| 被试分组 | 男/女 | 年龄/岁 | 体重/kg | MMSE | CDR | GDS |
| 注:MMSE:简易智力状态检查量表(Mini-mental State Examination);CDR:临床痴呆评定量表(Clinical Dementia Rating);GDS:老年抑郁量表(Geriatric Depression Scale) | ||||||
| AD(n = 137) | 67/70 | 76.00 ± 7.28 | 70.90 ± 13.97 | 23.21 ± 2.00 | 0.75 ± 0.25 | 1.59 ± 1.32 |
| MCIc(n = 76) | 43/33 | 74.78 ± 7.31 | 72.71 ± 14.34 | 26.47 ± 1.84 | 0.50 ± 0.00 | 1.38 ± 1.14 |
| MCInc(n = 134) | 84/50 | 74.47 ± 7.20 | 76.22 ± 12.89 | 27.19 ± 1.71 | 0.50 ± 0.00 | 1.52 ± 1.37 |
| HC(n = 162) | 86/76 | 76.28 ± 5.36 | 73.77 ± 13.58 | 29.18 ± 0.96 | 0.00 ± 0.00 | 0.80 ± 1.08 |
另外,由于本模型需要一部分数据作为验证集来筛选出用于集成学习的优秀基分类器,于是,我们又从 ADNI 中下载了 100 例 AD、100 例 HC、39 例 MCIc 和 39 例 MCInc 患者的 MRI 图像作为验证集。这些图像与前面下载的图像均来自于不同被试。这样保证了测试集始终不参与基分类器的训练与筛选过程,防止数据泄露。278 名验证集被试详细信息见表 2。
表 2. Information on validation set subjects.
验证集被试详细信息
| 被试分组 | 男/女 | 年龄/岁 | 体重/kg | MMSE | CDR | GDS |
| AD(n = 100) | 60/40 | 74.24 ± 7.82 | 76.04 ± 15.83 | 23.84 ± 2.08 | 0.82 ± 0.24 | 1.81 ± 1.56 |
| MCIc(n = 39) | 23/16 | 74.15 ± 7.10 | 73.59 ± 14.14 | 27.05 ± 1.59 | 0.50 ± 0.00 | 1.92 ± 1.35 |
| MCInc(n = 39) | 29/10 | 76.02 ± 7.00 | 78.35 ± 12.99 | 27.56 ± 1.83 | 0.50 ± 0.00 | 1.79 ± 1.45 |
| HC(n = 100) | 45/55 | 73.36 ± 5.70 | 76.16 ± 15.66 | 28.92 ± 1.25 | 0.00 ± 0.00 | 0.83 ± 1.34 |
1.2.2. 图像预处理
从 ADNI 数据库下载的图像都为.nii 格式,实验利用 SPM12 软件的 CAT12 工具包(http://dbm.neuro.uni-jena.de/cat/)进行图像预处理,包括去头骨、配准到 MNI 标准空间(使用 MNI152 模板)以及图像平滑(平滑核大小 2*2*2),预处理步骤参数使用 CAT12 工具包的默认参数。经过 SPM12 预处理后,所有图像大小均为 121*145*121,空间分辨率为 1.5 mm。随后对每个 MRI 图像进行灰度归一化,在保留具有诊断价值的灰度差异的同时,减小医学成像因素造成的不同组织在图像灰度信息上的绝对值差异,使深度学习模型更容易收敛。因为每个 MRI 体素最小值都为 0,归一化时用当前值除以该 MRI 中的体素最大值即可将每个体素值归一化到到 0~1 之间。
实验使用二维切片作为训练数据,所以需要对三维 MRI 进行切片处理。为了方便描述,本实验将三维 MR 图像的矢状面、冠状面、横断面三个方向分别用 X、Y、Z 表示,三个轴上的坐标范围分别为[1,121]、[1,145]、[1,121]。对于每个 MRI 图像,理论上本实验从 X、Y、Z 三个方向进行切片分别可得到 121、145、121 张二维切片,但考虑到每个方向的切片中,靠近坐标轴两端的一些切片几乎没有脑组织,这些切片包含的有效信息少,训练价值低,故舍去。另外,考虑到两个相邻切片的变化不是很大,故为了提升基分类器的训练效率,本文实验采用间隔选取切片方法。最终,对于每张 MRI 图像,本文实验在 X 轴[20,100]坐标范围中间隔选取 40 张切片(X20,X22,
,X98),在 Y 轴[24,124]坐标范围中间隔选取 50 张切片(Y24,Y26,
,Y122),在 Z 轴[30,96]坐标范围中间隔选取 33 张切片(Z30,Z32,
,Z94),这样,从每张三维 MRI 影像中,最终提取出来自三个轴向的 123 个切片作为基分类器的训练数据。
由于配准后的 MRI 大小为 121*145*121,本实验从 X、Y、Z 三轴进行切片,得到的二维切片大小分别为 145*121、121*121、121*145,为了保证基分类器的输入图像大小一致,本实验将这些切片统一成 145*145 的尺寸大小(保持图像中心点不变,边缘填充值为 0 的像素点)。预处理总体流程如图 3 所示。
图 3.

Flow of preprocess
预处理流程
1.3. 实验
1.3.1. 数据集划分
本文实验共从 ADNI 数据库下载了 787 个被试的 787 张 MRI 图像,每个被试只有一张 MRI 图像。其中,509 个 MRI 图像用作训练集和测试集,278 个 MRI 图像用做验证集。本实验采用五折交叉验证方法,每组分类实验均进行 5 次。每次实验都是从“训练集&&测试集”中按照类别比例分层选取 4/5 作训练集,1/5 作测试集。验证集不参与 CNN 基分类器的训练过程,仅当对训练得到的基分类器进行集成时,才使用验证集来筛选这些基分类器。
每次实验,从每张 MRI 图像中按照上述方法可以提取出来自 X、Y、Z 三个轴向的共计 123 张二维切片。选取来自不同 MRI 图像的相同坐标位置的切片作为一组,训练基分类器,共需训练 123 个基分类器,即基分类器是与切片一一对应的。以 AD vs. HC 实验在 X = 20 切片(后面简称 X20 切片)上训练基分类器为例,训练该基分类器时,先从 137 张 AD 类的 MRI 和 162 张 HC 类的 MRI 中,各选出 1/5 作为测试集(不能整除时向下取整),剩下的作为训练集,将训练集中所有 MRI 图像中的 X20 切片提取出来作为该基分类器的训练数据,测试集中所有 MRI 的 X20 切片提取出来留作测试数据。其他基分类器训练时数据集划分与此类似。
1.3.2. 数据扩充
CNN 需要大量图片进行训练才能达到较好的效果,如果直接用原始切片训练 CNN 基分类器,数据量是远远不够的。本实验对切片进行了数据扩充(data augmentation,DA),通过旋转、平移、伽马校正、随机噪声、缩放、随机仿射变换六个操作从原始切片生成新的切片。本实验在数据扩充时,不同类别的原始切片生成新切片的数量是不同的,原始切片较少的那类在数据扩充时会生成更多新切片,使得数据扩充后两种类别的切片数量基本相同,这样可以缩小数据集不平衡的影响。例如在 MCIc vs. HC 的分类实验中,HC 有 162 例,MCIc 有 76 例,HC 的原始切片数约为 MCIc 的 2.1 倍,因此在用六种数据扩充操作生成新切片时,每种操作中每张 HC 切片生成 10 张新切片,每张 MCIc 切片生成 10*2.1 张新切片,数据扩充后两类切片比例约为 1∶1。MCIc vs. HC 实验中数据扩充后切片数详情如表 3 所示,其他分类实验数据扩充方法与此相同,不再列出。
表 3. Details of data augmentation on MCIc vs. HC.
MCIc vs. HC 数据扩充详细信息
| 扩充方式 | HC | MCIc | 总计 |
| 原始切片 | 162 | 76 | 238 |
| 旋转 | 1 620 | 1 596 | 3 216 |
| 平移 | 1 620 | 1 596 | 3 216 |
| 伽马校正 | 1 620 | 1 596 | 3 216 |
| 随机噪声 | 1 620 | 1 596 | 3 216 |
| 缩放 | 1 620 | 1 596 | 3 216 |
| 随机仿射变换 | 1 620 | 1 596 | 3 216 |
| 数据扩充后切片总数 | 9 882 | 9 652 | 19 534 |
1.3.3. 基分类器
本文提出的 AD 早期诊断模型主要目的是尽早诊断出 AD 和 MCIc 状态的被试。本实验将被试状态分为了 AD、MCIc、MCInc、HC 四种状态,由于多分类的训练效果往往不如二分类好,本课题组参照其他 AD 早期诊断研究者常用的实验方案,将 AD 早期诊断拆分为三个不同的二分类问题:AD vs. HC、MCIc vs. HC、MCIc vs. MCInc。针对这三个二分类问题,本文一共训练了三个分类器,每个分类器由三个部分组成:基分类器、单轴集成分类器、三轴集成分类器。本文提出的多切片集成分类模型总体结构如图 4 所示,整个实验的流程图如图 5 所示。
图 4.

The overall structure of the proposed multi-slice integrated classification model
本文提出的多切片集成分类模型总体结构
图 5.

Experimental flow chart
实验流程图
其中基分类器的结构为文献[14]中提到的 8 层 CNN 分类器,它由 6 个卷积层(convolution layer,conv)和两个全连接层(fully connected layer,FC)组成,最后一个全连接层只有两个节点,采用 softmax 函数实现二分类,其网络结构如图 6 所示,具体参数见表 4。每个 CNN 基分类器训练 30 个 epoch,经过测试,30 个 epoch 足够使基分类器收敛,使基分类器在训练集原始切片上分类准确率达到 100%。所有卷积层激活函数采用 LReLU[21],梯度更新算法采用 Adam[22],学习率设为 0.000 1,每批次输入切片张数(batchsize)设为 200。
图 6.
Base classifier structure
基分类器结构
表 4. Detailed parameters of each base classifier.
基分类器详细参数
| 层序号 | 层名称 | 卷积核/池化单元大小 | 卷积核/池化单元移动步长 | 输入通道数 | 输出通道数 |
| 1 | conv1 | 3*3 | 3 | 1 | 32 |
| 2 | conv2 | 3*3 | 3 | 32 | 64 |
| pool | 3*3 | 1 | N/A | N/A | |
| 3 | conv3 | 3*3 | 3 | 64 | 128 |
| pool | 3*3 | 1 | N/A | N/A | |
| 4 | conv4 | 1*1 | 1 | 128 | 256 |
| pool | 3*3 | 1 | N/A | N/A | |
| 5 | conv5 | 1*1 | 1 | 256 | 512 |
| pool | 3*3 | 1 | N/A | N/A | |
| 6 | conv6 | 1*1 | 1 | 512 | 1 024 |
| pool | 3*3 | 3 | N/A | N/A | |
| 7 | FC1 | N/A | N/A | 4 096 | 100 |
| 8 | FC2 | N/A | N/A | 100 | 2 |
1.3.4. 集成学习
本文提出的模型使用了两阶段集成学习方案:第一阶段是对每个坐标轴(X,Y,Z)方向的多切片基分类器进行集成以获得三个单轴集成分类器,该阶段简称单轴集成;第二阶段是对三个单轴集成分类器进行集成,最终获得一个三轴集成分类器,该阶段简称多轴集成。
当每个切片的基分类器训练完后,X 轴切片一共得到 40 个基分类器,Y 轴切片得到 50 个基分类器,Z 轴切片得到 33 个基分类器。此时,使用验证集对每轴每个切片得到的基分类器进行测试,选出分类测试效果最好的 5 个基分类器,然后,对每轴选取的 5 个基分类器的结果进行集成以获得单轴集成分类器。集成时采用投票法对基分类器分类结果进行表决(即取 5 个基分类器分类结果中出现较多的那类作为最终分类结果),每轴最终可得到一个投票表决后的分类结果。
经过单轴集成后,每个坐标轴上选取的 5 个基分类器会构建出一个单轴集成分类器,三个坐标轴共可构建出三个单轴集成分类器。此时,再对这三个单轴集成分类器进行集成,以构建出一个三轴集成分类器,使用投票法得到最终的分类结果(即取 3 个单轴分类器分类结果中出现较多的那类作为最终分类结果)。
2. 结果与讨论
2.1. 基分类器筛选结果
我们对基分类器 5 次实验在同一验证集上的平均分类准确率进行排序,选出各轴基分类器平均分类准确率最高的 5 个基分类器坐标如表 5 所示。
表 5. Top-5 base classifiers of each axis.
各轴分类表现最好的 5 个基分类器坐标
| 实验 | 准确率排序 | X 轴 | Y 轴 | Z 轴 |
| AD vs. HC | TOP-1 | 76 | 82 | 34 |
| TOP-2 | 74 | 74 | 32 | |
| TOP-3 | 72 | 76 | 36 | |
| TOP-4 | 48 | 70 | 38 | |
| TOP-5 | 80 | 80 | 42 | |
| MCIc vs. HC | TOP-1 | 72 | 76 | 38 |
| TOP-2 | 74 | 80 | 32 | |
| TOP-3 | 70 | 78 | 44 | |
| TOP-4 | 78 | 64 | 34 | |
| TOP-5 | 48 | 82 | 30 | |
| MCIc vs. MCInc | TOP-1 | 30 | 76 | 34 |
| TOP-2 | 50 | 90 | 36 | |
| TOP-3 | 32 | 84 | 86 | |
| TOP-4 | 24 | 32 | 32 | |
| TOP-5 | 28 | 62 | 30 |
2.2. 分类准确率
本实验采用 5 折交叉验证方法,最终三组实验的分类准确率均值分别为:AD vs. HC 81%,MCIc vs. HC 79%,MCIc vs. MCInc 62%。本文与另外两种 AD 早期诊断模型进行了对比,详细实验结果见表 6。表 6 中 PCA + SVM 代表文献[20]提出的基于主成分分析(principal component analysis,PCA)和 SVM 的诊断模型;二维卷积神经网络(two- dimensional convolutional neural network,2DCNN)代表文献[14]提出的使用单切片训练的 2DCNN 诊断模型;2DCNN + Ensemble 代表本文提出的基于 2DCNN 和 Ensemble 的多切片集成诊断模型。三组实验均使用前面提到的 509 名被试的 MRI 图像进行训练和测试,具有可比性。
表 6. Comparison of classification accuracy.
分类准确率对比
| 实验 | 模型 | ||
| PCA + SVM | 2DCNN | 2DCNN +
Ensemble |
|
| AD vs. HC | 0.76 ± 0.11 | 0.77 ± 0.07 | 0.81 ± 0.03 |
| MCIc vs. HC | 0.72 ± 0.12 | 0.74 ± 0.07 | 0.79 ± 0.04 |
| MCIc vs. MCInc | 0.66 ± 0.16 | 0.55 ± 0.09 | 0.62 ± 0.06 |
与基于 PCA + SVM 的诊断模型相比,本文提出的模型和在 AD vs. HC、MCIc vs. HC 两组实验中的分类准确率比文献[20]基于 PCA + SVM 的模型要高,MCIc vs. MCInc 实验的结果比基于 PCA 和 SVM 的模型实验结果略低。但更为重要的是,本文模型三组实验中 5 次重复实验的标准差分别为:AD vs. HC 0.03,MCIc vs. HC 0.04,MCIc vs. MCInc 0.06,都比文献[20]对应实验的标准差减小了三分之二左右,表明模型的稳定性有了极大提升。另外,本文模型不需要对 MRI 进行灰质、白质分割,不需要用其他方法预选分类特征。特征提取及通过提取到的特征训练分类器都由 CNN 的自适应学习自动完成,简化了实验流程,避免了人工选取特征带来的人工成本和潜在疏漏。使用 CNN 还可以更有效地利用 MRI 中各体素点的空间位置所包含的隐藏信息,而 PCA + SVM 模型只用到体素点的灰度值。
本文模型与文献[20]提出的只使用单切片训练的 2DCNN 模型相比,三组分类实验的分类准确率均有较大提升,且 5 次实验结果的标准差更小,表明使用集成学习集成多个 2DCNN 基分类器可以有效提升 AD 早期诊断模型的准确率和稳定性。本文模型中的每一个基分类器即是文献[14]中提出的 2DCNN 模型。本文模型从 X、Y、Z 轴选取所有有效切片训练基分类器,然后对这些基分类器进行排序筛选,这比使用先验知识只选取穿过海马体的一个切片训练 CNN 模型要更合理。用优化算法选出不同被试组中差异最大的切片可以摆脱已有经验的束缚,充分利用 MRI 包含的信息。通过集成学习将挑选出的各优秀基分类器集成起来共同对整个 MRI 的类别进行决策,使得最终的集成模型比单个 CNN 基分类器具有更高的分类准确率和稳定性。本文提出的三轴集成分类器建模方法对于其他脑病的分类预测研究同样具有参考价值,如帕金森病(Parkinson’s disease,PD)和 AD 临床前期主观认知下降(subjective cognitive decline,SCD)。
3. 结论
本文提出了一种基于 CNN 和集成学习的用于 AD 的早期诊断模型,对疾病的计算机辅助诊断具有一定的临床应用价值。本文模型主要有以下几个特点:
(1)本模型采用了 6 种数据扩充方法对原始 MRI 切片进行数据扩充,大大增加了训练样本数量,并且针对不同类别图像的样本量不平衡性,每类图像扩充数量也相应变化,使得扩充后的数据集中,两类图像的样本量基本一致。
(2)一般基于 2DCNN 的 AD 早期诊断模型只选取了 MRI 图像中的一个特定切片进行训练,切片的选取位置是根据经验人工设定,这强烈依赖于领域知识,具有很大的局限性。本模型采用多切片进行训练,切片选取不需要根据领域知识特意指定某些位置,而是按顺序选取,可以由程序自动完成。
(3)一般基于 2DCNN 的 AD 早期诊断模型只从一个方向选取切片,而本文模型从冠状面、矢状面、横断面三个方向都选取了切片。同一脑区从不同方向观察一般会有完全不同的形态,将来自多个方向的切片信息结合起来进一步提升了模型的分类准确率和稳定性。
(4)本模型基于二维切片进行训练,对硬件资源的要求比直接使用三维图像低得多,且各个基分类器训练时是相互独立的,这样就大大提升了训练效率,并使该模型具有很好的分布式并行处理的可扩展性。
通过与 PCA + SVM 诊断模型、单切片 2DCNN 诊断模型进行对比实验,发现本文模型在分类准确率和稳定性上都有很大优势。但模型仍存在一些不足,例如在 MCIc vs. MCInc 这组样本差异性较小的实验中没有取得较好的分类结果。在今后的研究中,将继续对模型结构和基分类器优选方法进行改进,以期进一步提高模型分类准确率,并尝试寻找 AD 的 MR 生物标志物。
致谢:本项目的数据收集和共享由阿尔茨海默病神经成像倡议(ADNI)(美国国家卫生研究院授权 U01AG024904)和 DoDADNI(美国国防部奖励编号 W81xWH-12-2-0014)供资。ADNI 由美国国家老龄化研究所、美国国家生物医学影像和生物工程研究所提供资金,并由下列机构提供慷慨捐助:AbbVie,Alzheimer’s Association;Alzheimer’s Drug Discovery Foundation;Araclon Biotech;BioClinica,Inc.;Biogen;Bristol-Myers Squibb Company;CereSpir,Inc.;Cogstate;Eisai Inc.;Elan Pharmaceuticals,Inc.;Eli Lilly and Company;EuroImmun;F. Hoffmann-La Roche Ltd and its affiliated company Genentech,Inc.;Fujirebio;GE Healthcare;IXICO Ltd.;Janssen Alzheimer Immunotherapy Research & Development,LLC.;Johnson & Johnson Pharmaceutical Research & Development LLC.;Lumosity;Lundbeck;Merck & Co.,Inc.;Meso Scale Diagnostics,LLC.;NeuroRx Research;Neurotrack Technologies;Novartis Pharmaceuticals Corporation;Pfizer Inc.;Piramal Imaging;Servier;Takeda Pharmaceutical Company;and Transition Therapeutics。加拿大卫生研究院正在提供资金,以支持在加拿大境内的 ADNI 临床站点。美国国家卫生研究院基金会为私营部门的捐助提供了便利(www.fnih.org)。受捐赠机构是北加利福尼亚研究和教育研究所,这项研究由南加州大学的阿尔茨海默症治疗研究所负责协调。ADNI 数据由南加州大学神经影像实验室发布。
利益冲突声明:本文全体作者均声明不存在利益冲突。
Funding Statement
国家自然科学基金项目(61976058,61772143,61300107);广东省自然科学基金项目(S2012010010212);广州市科技计划项目(201601010034,201804010278);广东省大数据分析与处理重点实验室开放基金项目资助(201801)
References
- 1.吕鸿蒙, 赵地, 迟学斌 基于增强 AlexNet 的深度学习的阿尔茨海默症的早期诊断. 计算机科学. 2017;44(S1):50–60. [Google Scholar]
- 2.Prince M, Wimo A, Guerchet M, et al. World Alzheimer Report 2015: The Global Impact of Dementia. London: Alzheimer’s Disease International (ADI), 2015.
- 3.Liu Siqi, Liu Sidong, Cai Weidong, et al. Early diagnosis of Alzheimer's disease with deep learning// 2014 IEEE 11th International Symposium on Biomedical Imaging (ISBI). Beijing: IEEE, 2014: 1015-1018.
- 4.Tripoliti E E, Fotiadis D I, Argyropoulou M A supervised method to assist the diagnosis and monitor progression of Alzheimer's disease using data from an fMRI experiment. Artif Intell Med. 2011;53(1):35–45. doi: 10.1016/j.artmed.2011.05.005. [DOI] [PubMed] [Google Scholar]
- 5.Van Leemput K, Maes F, Vandermeulen D, et al Automated model-based tissue classification of MR images of the brain. IEEE Trans Med Imaging. 1999;18(10):897–908. doi: 10.1109/42.811270. [DOI] [PubMed] [Google Scholar]
- 6.Hinrichs C, Singh V, Mukherjee L, et al Spatially augmented LPboosting for AD classification with evaluations on the ADNI dataset. Neuroimage. 2009;48(1):138–149. doi: 10.1016/j.neuroimage.2009.05.056. [DOI] [PMC free article] [PubMed] [Google Scholar]
- 7.孙志军, 薛磊, 许阳明, 等 深度学习研究综述. 计算机应用研究. 2012;29(8):2806–2810. doi: 10.3969/j.issn.1001-3695.2012.08.002. [DOI] [Google Scholar]
- 8.Vincent P, Larochelle H, Lajoie I, et al Stacked denoising autoencoders: Learning useful representations in a deep network with a local denoising criterion. J Mach Learn Res. 2010;11:3371–3408. [Google Scholar]
- 9.Hinton G E Deep belief networks. Scholarpedia. 2009;4(5):5947. doi: 10.4249/scholarpedia.5947. [DOI] [Google Scholar]
- 10.Lecun Y, Bottou L, Bengio Y, et al Gradient-based learning applied to document recognition. Proceedings of the IEEE. 1998;86(11):2278–2324. doi: 10.1109/5.726791. [DOI] [Google Scholar]
- 11.Krizhevsky A, Sutskever I, Hinton G E. ImageNet classification with deep convolutional neural networks// Advances in neural information processing systems. Lake Tahoe: Curran Associates Inc, 2012: 1097-1105.
- 12.Long J, Shelhamer E, Darrell T Fully convolutional networks for semantic segmentation. IEEE Trans Pattern Anal Mach Intell. 2014;39(4):640–651. doi: 10.1109/TPAMI.2016.2572683. [DOI] [PubMed] [Google Scholar]
- 13.Girshick R, Donahue J, Darrell T, et al. Rich feature hierarchies for accurate object detection and semantic segmentation// Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. Columbus: IEEE, 2014: 580-587.
- 14.Wang S H, Phillips P, Sui Y, et al Classification of Alzheimer's disease based on eight-layer convolutional neural network with leaky rectified linear unit and max pooling. J Med Syst. 2018;42(5):85. doi: 10.1007/s10916-018-0932-7. [DOI] [PubMed] [Google Scholar]
- 15.李彦冬, 郝宗波, 雷航 卷积神经网络研究综述. 计算机应用. 2016;36(9):2508–2515, 2565. doi: 10.11772/j.issn.1001-9081.2016.09.2508. [DOI] [Google Scholar]
- 16.Breiman L Bagging predictors. Mach Learn. 1996;24(2):123–140. [Google Scholar]
- 17.Freund Y, Schapire R E A decision-theoretic generalization of on-line learning and an application to boosting. J Comput Syst Sci. 1997;55(1):119–139. doi: 10.1006/jcss.1997.1504. [DOI] [Google Scholar]
- 18.Breman L Random forest. Mach Learn. 2001;45(1):5–32. doi: 10.1023/A:1010933404324. [DOI] [Google Scholar]
- 19.张春霞, 张讲社 选择性集成学习算法综述. 计算机学报. 2011;34(8):1399–1410. [Google Scholar]
- 20.Salvatore C, Cerasa A, Battista P, et al Magnetic resonance imaging biomarkers for the early diagnosis of Alzheimer's disease: a machine learning approach. Front Neurosci. 2015;9:307. doi: 10.3389/fnins.2015.00307. [DOI] [PMC free article] [PubMed] [Google Scholar]
- 21.Liew S S, Khalil-Hani M, Bakhteri R Bounded activation functions for enhanced training stability of deep neural networks on visual pattern recognition problems. Neurocomputing. 2016;216:718–734. doi: 10.1016/j.neucom.2016.08.037. [DOI] [Google Scholar]
- 22.Kingma D P, Ba J. Adam: A method for stochastic optimization. arXiv preprint arXiv, 2014: 1412. 6980.

