Abstract
针对多参数流式细胞数据分析过程复杂、自动化程度不高、要求操作者具有一定专业背景等问题,本文提出了一种基于核主成分分析算法(KPCA)进行多参数流式细胞数据分群的方法。利用 KPCA 对多参数流式细胞数据进行非线性变换,降低数据的维度,得到主成分特征变量下的散点图分群结果,并使用改进的 K-means 聚类算法实现不同亚群的自动设门。以人体外周血淋巴细胞样本检测结果为实验数据,分别对其进行传统分群、主成分分析(PCA)分群、KPCA 分群处理,并对特征参数的选取进行了探索。结果表明,KPCA 方法能够较好地应用于多参数流式细胞数据分析中,与传统细胞分群方法相比,该方法无需操作者具备专业知识,即可实现快速准确的自动分群,能够提高流式细胞仪临床诊断分析的效率。
Keywords: 核主成分分析, 主成分分析法, 流式细胞术, 细胞分群
Abstract
The process of multi-parametric flow cytometry data analysis is complicate and time-consuming, which requires well-trained professionals to operate on. To overcome this limitation, a method for multi-parameter flow cytometry data processing based on kernel principal component analysis (KPCA) was proposed in this paper. The dimensionality of the data was reduced by nonlinear transform. After the new characteristic variables were obtained, automatical clustering can be achieved using improved K-means algorithm. Experimental data of peripheral blood lymphocyte were processed using the principal component analysis (PCA)-based method and KPCA-based method and then the influence of different feature parameter selections was explored. The results indicate that the KPCA can be successfully applied in the multi-parameter flow cytometry data analysis for efficient and accurate cell clustering, which can improve the efficiency of flow cytometry in clinical diagnosis analysis.
Keywords: kernel principal component analysis, principal component analysis, flow cytometry, cell clustering
引言
流式细胞术(flow cytometry)是一种能够对悬浮的细胞或者其他微粒进行多参数、快速分析或分选的技术。随着精准医疗和基因生物学的发展,流式细胞仪(flow cytometer)已成为进行生物研究及临床诊断最重要的工具之一,广泛应用于生物学和生物医学研究中[1-4]。
流式细胞数据分析是流式细胞术中的难点之一,其主要目的是识别和划分样本中的亚群细胞[5-6]。在进行多参数流式细胞数据分析时,传统的数据分析方法通常使用能够显示两个测量通道参数的二维散点图,以人工设门的方式对数据进行分析,二维散点图的坐标轴参数可以为前向散射光(forward scattering,FSC)、侧向散射光(side scattering,SSC)或各通道的荧光信号(fluorescence channel,FL)[7]。随着流式细胞术的发展,能够检测的参数成倍增加,传统流式数据分析方法在细胞分群方面存在的不足也越来越明显:
(1)过程繁琐、效率低。由于二维散点图每次只能显示两个维度的参数,若流式数据参数个数为 m,利用传统方法随机选择两个参数作为横、纵坐标,可能需要绘制的散点图数目为
,从而导致分析效率低、耗时长且浪费资源。
(2)对操作者的要求较高。通常情况下,在随机选择坐标轴参数绘制的散点图中,细胞亚群的区分并不明显,需要操作者具备较高水平的专业知识,并采用多个散点图组合的方式才能获得理想的分群结果。
(3)分群结果具有主观性,容易受到操作者经验的影响,可重复性差[2, 8]。
近年来,很多学者针对流式细胞数据的自动分析方法进行了探索,但是大部分分析方法侧重于实现细胞的自动设门。一些聚类算法如 K-means 算法、高斯混合模型等被最早提出应用于流式细胞数据自动分析中 [9-10]。Zeng 等 [11]提出了特征引导(feature-guided,FG)聚类算法,该算法由筛选器从多个维度的直方图中提取出峰值点,通过对比类群的中心位置与峰值位置是否匹配,确定细胞类群的数目,最终利用 K-means 算法实现设门。Zare 等[12]首次尝试应用谱聚类方法对流式细胞数据进行处理,实现了细胞的自动设门,但其缺点是要对流式数据进行采样,造成了一些数据特征的损失。Sugar 等[13]开发了一种新的无监督密度轮廓聚类算法,该算法基于渗流理论有效分析了流式细胞数据,通过寻找数据直方图的峰值位置确定每个类群,实现了数据的快速分析。Ge 等[14]将混合模型和直方图相结合,利用混合模型密度函数得到类群数目,结合 K-means 算法实现了细胞的快速识别。王先文等[5]提出了基于偏斜 t 分布的混合模型聚类方法,通过有限混合模型的形式,以概率论的方法对数据进行统计分析,实现了细胞的自动设门,具有较好的鲁棒性。以上研究虽然通过不同的方法实现了细胞的自动设门,但是在设门之前,仍需要操作者根据相关背景知识和样本染色策略手动设置散点图的坐标轴参数,未实现真正意义上的自动分群。
在对流式细胞数据进行自动分群的研究方面,为了简化人工选取坐标轴绘制散点图的过程,普度大学Grégori 等[15]利用主成分分析法(principal component analysis,PCA)处理光谱流式细胞仪的多维实验数据,以贡献度最高的两个主成分作为横、纵坐标自动绘制散点图,实现了对光谱流式细胞数据的自动分群。这一方法对非光谱流式细胞仪的多维流式数据处理有借鉴作用,Costa 等[16]曾提出了一种基于 PCA 的方法进行 B 细胞慢性淋巴增殖性疾病的分类,与传统方法相比,效率有所提高。然而 PCA 方法虽然无需人工选定坐标轴就能够实现自动分群,但是在对某些样本(如骨髓样本)进行分析时,PCA 方法也会使同一个细胞群(如成熟的中性粒细胞)内部的差异性增大[17]。
针对以上问题,本文以实现流式细胞数据的自动分群为目标,提出基于核主成分分析(kernel principal component analysis,KPCA)的流式细胞数据自动分群方法。与 PCA 相比,KPCA 更适合对数据的非线性特征进行提取,能够更大程度获得数据的特征信息。KPCA 算法具有性能良好、计算复杂度低等特点,目前已被广泛应用于模式识别、故障监测等方面[18-19]。本文提出将 KPCA 应用于多参数流式细胞数据分群中,在最大化保留数据特征信息的基础之上,对多参数流式细胞数据进行降维,得到核主成分变量,使用最能体现不同亚群细胞之间差别的主成分变量作为坐标轴,绘制二维或三维散点图。在自动设门方面,由于 K-means 算法简单高效,且在流式细胞数据分析中的应用较为成熟,因此本文使用改进后的 K-means 算法实现样本的自动设门。通过将基于 KPCA 方法得到的分群结果与基于 PCA 方法得到的分群结果进行对比,结果表明,基于 KPCA 的流式细胞分群方法实现方式简单、无需人工干预,所得自动分群结果与传统分群结果一致,提高了流式细胞数据的分群效率。
1. 原理及方法
淋巴细胞按照表面标志的不同可分为 T 淋巴细胞(表面分化抗原 CD3+)、B 淋巴细胞(表面分化抗原 CD3–CD19+)和自然杀伤细胞(naturalkillercell,NK)(表面分化抗原 CD3–CD56+),分别用异硫氰酸荧光素(fluorescein isothiocyanate,FITC)、藻红蛋白(p-phycoerythrin,PE)、异藻蓝蛋白(allophy-cocyanin,APC)标记,其表面分化抗原特异性结合如图 1 所示。
图 1.
Dyeing clustering strategy of lymphocyte
淋巴细胞染色分群策略
经过荧光染料标记的细胞在激发光源的照射下能够发射出代表细胞体积大小及粒度的散射光信号及代表细胞生化性质的特异性荧光信号。光信号经过光电探测器转换为电脉冲信号,检测系统对电脉冲信号进行测量并提取信号的脉冲高度(height,H)、脉冲面积(area,A)和脉冲宽度(width,W)等特征参数[3]。单个细胞被激发后产生的散射光和荧光信号以单个事件的形式被记录下来,所有的事件汇聚成被测细胞群完整的流式数据[5]。脉冲信号及其参数如图 2 所示。
图 2.
Schematic diagram of pulse parameters
脉冲参数示意图
以下将分别对流式细胞数据传统分群方法、PCA 分群方法、KPCA 分群方法及基于 K-means 聚类算法的设门方法进行介绍。
1.1. 传统分群方法
传统的流式细胞分群方法是根据细胞检测得到的散射光及荧光信号脉冲参数的特点对细胞进行区分。以免疫表型分析为例,T 淋巴细胞表面抗原 CD3 与 FITC 标记的 CD3 抗体特异性结合,FITC 荧光信号较强的亚群可判断为 T 淋巴细胞;NK 细胞表面抗原 CD56 与 PE 标记CD56 抗体特异性结合,PE 荧光信号较强的亚群可判断为 NK 细胞;B 淋巴细胞表面抗原 CD19 与 APC 标记的 CD19 抗体特异性结合,APC 荧光信号较强的亚群可判断为 B 淋巴细胞,依此实现三个亚群的区分。
传统分群方法步骤如下:
步骤 1:从流式数据中选取两个参数作为坐标轴(如FITC-A与APC-A),绘制散点图;
步骤 2:对多个散点图或峰图进行联合分析,根据专业知识对亚群细胞进行人工判定;
步骤 3:手动进行目标亚群的设门。
1.2. PCA 分群方法
PCA 是一种常用的多元统计分析技术,它根据方差最大化原理,通过线性变换选出较少的重要变量代替原始的多个变量,降低了数据维度并最大化保存数据的有效信息量[20-22]。
PCA 算法首先对样本矩阵 X 进行标准化,得到标准化矩阵 X*;然后求出其相关系数矩阵并进行特征分解,得到特征值 λ1,λ2,
,λp和其对应的特征向量 d1,d2,
,dp;接下来根据主成分方差贡献率确定主成分的个数 k;最后,根据前k个主成分对应的特征向量 U=[λ1,λ2,
,λk],得到样本数据对 k 个主成分向量构成的特征向量矩阵 W=X*U。
PCA 方法通过降低流式细胞数据的维度及冗余信息,选取主成分变量作为新的特征变量,绘制散点图,实现自动分群。
1.3. KPCA 分群方法
核方法是解决非线性模型分析问题的最优途径,其关键技术是利用核函数替代非线性映射的内积来解决非线性问题,通过核代入方法将数据隐含地映射到高维特征空间中。KPCA 的主要思路是利用核方法拓展 PCA,提取数据中的非线性特征。基于 KPCA 的流式细胞数据处理方法基本思想是通过引入 Mercer 核函数,将流式细胞数据非线性映射到高维的 Mercer 特征空间中,在特征空间下再利用 PCA 方法对数据进行处理,最终输出结果是对流式细胞数据的非线性特征提取[18, 23]。该过程无需明确知道映射函数,只需要在原空间计算核函数,大大降低了计算的复杂度。
假设 x1,x2,
,xn 为样本,KPCA 先对样本 x 进行非线性变换
(x),
(x)将 x 映射到高维空间中。对于新的样本空间,协方差矩阵为:
![]() |
1 |
由特征值 λ 和特征向量 ν 满足Cν=λν可知当 λ≠0 时,ν 在
(xi)(i=1,2,
,n)张成的空间中,即存在 αi(i=1,2,
,n)满足
对 Cν=λν 两边同时与
(xk)做内积得:
![]() |
2 |
定义 n×n 核矩阵 K 为:K=[
(xi)·
(xj)],则式(2)可变为:
![]() |
3 |
其中 α=(α1,α2,
,αn)’,nλ 和 α 是对应于 K 的特征值和特征向量。特征空间的主元方向为 ν,k 为保留的主元个数,则得到样本在特征向量空间的投影为:
![]() |
4 |
最终,将得到的非线性主元分量作为样本的特征进行分析。
本文基于 KPCA 的细胞分群方法主要步骤如下:
步骤 1:对流式细胞样本矩阵 X 进行标准化处理;
步骤 2:选定径向基核函数K(xi, x) = exp(—‖x—xi‖2/2δ2)中的参数,计算出核矩阵 K;
步骤 3:计算核矩阵 K 的特征值 λ1,λ2,
,λn 和其对应的特征向量 d1,d2,
,dn;
步骤 4:确定主成分个数 k,并对前 k 个非零特征值对应的特征向量进行规范化;
步骤 5:在高维特征空间对流式数据进行特征向量上的投影,将得到的主分量作为新的特征参数,并将其设置为散点图的坐标轴,实现自动分群。
1.4. K-means 聚类算法
K-means 算法是典型的基于距离进行聚类的算法 [24],该算法快速、简单、效率高。本文利用改进后的 K-means 算法实现细胞的自动设门。算法的改进主要表现在两个方面:首先是初始聚类中心的确定,本文根据贝叶斯准则(bayesian information criterion,BIC)方法对聚类过程中的类群数目 q 进行确定;其次是初始化聚类中心位置的确定,传统的 K-means 聚类算法常常随机选择 q 个数据作为初始聚类中心,导致聚类结果不稳定。本文方法为:先确定一个数据点作为第一个初始聚类中心,然后选取与第一个聚类中心距离最大的数据点作为第二个聚类中心,接下来选取距离前两个聚类中心距离最大的数据点为第三个聚类中心,以此类推,最终确定了 q 个初始聚类中心;最后进一步对各个数据点到初始聚类中心的距离进行迭代运算,最终实现聚类。
2. 实验结果及分析
本文实验数据由北京宣武医院提供,来自于健康志愿者的外周血淋巴细胞样本,该样本采集于受试者上肢前臂的静脉外周血。实验仪器为美国 BD 公司(Becton,Dickinson and Company)的FACSCalibur 流式细胞仪,荧光染料为 FITC、PE 和 APC。该样本包含 4 811 个细胞以及 3 种表面标记分子(CD3、CD19和CD56)。流式数据包括 11 个参数,分别为脉冲高度(FITC-H,PE-H,APC-H),脉冲面积(FSC-A,SSC-A,FITC-A,PE-A,APC-A)和脉冲宽度(FITC-W,PE-W,APC-W)。在实验数据分析处理方面,PCA、KPCA、K-means 聚类分析等,均由 MATLAB R2014a 编程实现。
2.1. 传统分群结果
传统分群方法通过人工选取流式细胞数据中的不同参数作为横、纵坐标,绘制二维散点图,并根据参数特征判断各个亚群细胞的种类。但是如何从多参数流式细胞数据中选取两个最合适的特征参数作为散点图的横、纵坐标,需要已知细胞亚群的染色策略,同时需要借助相关医学背景和实际经验,对操作者的要求较高。在操作者不具备相关先验知识的前提下,若随机选取坐标轴参数绘制散点图,大部分散点图的分群效果并不理想,如图 3 所示。为了便于对比,先对三种亚群细胞做不同标记,可以看出通过随机选取坐标轴绘制的单幅散点图无法区分三种细胞亚群。
图 3.

Results of traditional scatter clustering
传统的散点图分群结果
为了区分不同的细胞亚群,此时需要对多幅散点图进行联合分析。如 图 3 所示,观察 PE-A 与 APC-A 为坐标轴绘制的散点图中,绿色细胞群处于 APC 阳性区域,则确定其为 B 淋巴细胞;观察 FSC-A 与 FITC-A 为坐标轴绘制的散点图,蓝色细胞群处于 FITC 阳性区域,则确定其为 T 淋巴细胞,最终实现样本的分群,但分析过程繁琐、耗时长。
2.2. 基于 KPCA 的细胞分群
为了验证 KPCA 对多参数流式细胞数据特征提取及分群能力,本文分别采用 PCA 和 KPCA 对数据进行处理,并对分群结果进行了对比。PCA及KPCA 处理后得到的前 5 个主成分(principal component,PC)(记为PC1~PC5)的累计贡献率如表 1 所示。
表 1. Cumulative contribution rates of PC1~PC5 based on PCA and KPCA .
PCA 和 KPCA 得到的前五个主成分的累计贡献率
| PCA处理的
主成分 |
累计
贡献率 |
KPCA处理的
主成分 |
累计
贡献率 |
| PC1 | 31.18% | PC1 | 51.57% |
| PC2 | 50.89% | PC2 | 71.81% |
| PC3 | 69.24% | PC3 | 89.86% |
| PC4 | 77.19% | PC4 | 93.16% |
| PC5 | 84.64% | PC5 | 96.15% |
可以看出,PCA 和 KPCA 均能够在保证特征信息最大化保留的情况下降低数据的维度。与 PCA 相比,KPCA 处理后得到的主成分的累计贡献率更大,更能代表样本的特征信息。以 PCA 和 KPCA 得到的主成分变量为坐标轴绘制二维及三维散点图,分群结果如图 4、图 5 所示。
图 4.

Clustering results based on PCA
基于 PCA 的分群结果
图 5.

Clustering results based on KPCA
基于 KPCA 的分群结果
如图 4、图 5 所示,样本均被明显区分为 3 个亚群。与传统分群方法相比较,基于 PCA 和 KPCA 的流式细胞分群方法通过自动设置散点图的坐标轴参数,实现了自动分群,无需人工进行坐标轴的选取,降低了对操作者专业知识的要求,提高了分群效率。相比二维散点图,三维散点图由于引入了 PC3 对数据进行进一步的区分,原二维散点图中的流式数据在 PC3 坐标轴上也被展开,在三维空间呈立体分布的结构,因此分群结果更加直观、准确,更有利于亚群的识别和设门。
如图 4、图 5 的二维散点图分群结果所示,基于 KPCA 方法得到的分群结果更好,亚群之间的区分更明显。为了验证 PCA 和 KPCA 分群结果的准确性,以传统分群结果为参考标准,计算三种亚群分群结果的准确率。具体思路如下:将传统分群得到的三种细胞亚群的事件分别记录在 T、B、NK 3 个细胞集合中;对基于 PCA 与 KPCA 方法得到自动分群结果进行统计分析,分别将三种细胞亚群中的事件记录在 PCA-T、PCA-B、PCA-NK 和 KPCA-T、KPCA-B、KPCA-NK 共 6 个集合中,分别求集合 T、B、NK 与集合 PCA-T、PCA-B、PCA-NK 及集合 KPCA-T、KPCA-B、KPCA-NK 的交集,将交集个数除以传统分群得到的集合总数,得到分群准确率如表 2 所示。与传统分群结果相比较,PCA 和KPCA 处理得到的三种亚群的分群平均准确率分别为 96.43% 和 97.81%。
表 2. Accuracies of cell clustering results based on PCA and KPCA.
PCA 和 KPCA 分群准确率
| 亚群集合 | PCA准确率 | KPCA准确率 |
| T 淋巴细胞 | 97.14% | 98.23% |
| B 淋巴细胞 | 95.71% | 96.48% |
| NK细胞 | 96.44% | 98.72% |
| 平均 | 96.43% | 97.81% |
结果表明,KPCA 方法能够较好地应用于流式细胞分群中,通过自动设置散点图坐标轴,得到准确的细胞分群结果,无需对多个散点图进行联合分析,提高了细胞分群的效率。而且,基于 KPCA 方法的细胞分群结果较基于 PCA 的细胞分群结果更好,分群准确率更高。分析其原因是由于 PCA 是一种线性映射方法,处理后的得到的数据是由线性映射生成的,忽略了流式细胞各参数数据之间的非线性关系,因此得到的主成分特征参数并不一定是最优的,而 KPCA 方法可以有效提取出流式细胞数据的非线性特征信息,所得到的主分量能够最大限度包含数据的特征信息。
2.3. 分群参数优化
为了探索流式细胞数据中不同的参数对细胞分群的影响并对分群效果进行优化,选取实验数据中不同的参数组合进行基于 KPCA 的流式细胞数据分群处理,并对其散点图分群效果进行比较。通过对比,发现去除各荧光通道的 W 参数后,得到的散点图分群效果最佳。
去除各荧光通道的 W 参数后,实验数据参数变为FSC-A、SSC-A、FITC-A、FITC-H、PE-A、PE-H、APC-A、APC-H,对其进行 KPCA 处理,得到的散点图分群结果如图 6 所示。与图 5 相比,图 6中同一种亚群内细胞散点图分布更聚集,亚群之间间隔更大、更易区分,分群结果更好。
图 6.

Clustering results based on KPCA (removal of W)
基于 KPCA 的分群结果(去除 W 参数)
去除 W 参数后进行 KPCA 处理得到的主成分PC1~PC5 的累计贡献率如表 3 所示,与未去除荧光通道的 W 参数时得到的主成分贡献率相比,该情况下各主成分贡献率均有提高,其中主成分 PC1 的贡献率提高了 10.16%。
表 3. Cumulative contribution rates of PC1-PC5 based on KPCA (removal of W) .
KPCA 处理得到的各主成分累计贡献率(去除 W 参数)
| KPCA处理的主成分 | 累计贡献率 |
| PC1 | 61.73% |
| PC2 | 81.32% |
| PC3 | 93.46% |
| PC4 | 96.83% |
| PC5 | 98.77% |
将去除 W 参数后进行 KPCA 处理得到的细胞分群结果与传统分群结果进行对比,得到各亚群的分群准确率结果如表 4 所示。与未去除W参数情况下的分群结果相比,KPCA 分群准确率从 97.81% 提高到了 98.97%。
表 4. Accuracies of clustering results based on KPCA (removal of W).
基于 KPCA 的分群准确率(去除 W 参数)
| 亚群集合 | KPCA准确率 |
| T 淋巴细胞 | 98.84% |
| B 淋巴细胞 | 98.61% |
| NK细胞 | 99.45% |
| 平均 | 98.97% |
实验结果显示,去除 W 参数后,KPCA 处理得到同种细胞亚群的分布更聚集,分群效果更好,准确率更高。其原因主要在于各荧光通道的 W 参数通常表示待测细胞通过激光束的时间,与整形后的激光光斑的大小有关,一般用来区分双联体细胞或粘连细胞。在本实验数据中,各荧光通道的 W 参数并没有提供待测样本的特异性信息,可以认为其在 KPCA 分群中贡献不大,有时甚至造成了一定的负影响。
3. 结论与展望
本文提出将 KPCA 应用于多参数流式细胞数据的分群中,利用得到的主成分变量绘制散点图,采用改进后的 K-means 算法辅助实现细胞亚群的自动设门。通过将基于本文方法的分群结果与传统分群结果进行对比,成功验证了 KPCA 算法在流式细胞数据分群中的可行性与高准确性。实验结果表明本文方法能够使操作者在不具备专业知识的前提下实现细胞的自动分群,无需人工选取坐标轴,具有方法简单、效率高、操作便捷等优点,能够提高流式细胞仪临床诊断分析的效率,具有较好的应用前景。通过与基于 PCA 方法的分群结果进行对比,可以看出本文方法较 PCA 方法在处理流式细胞数据上有更大的优势,能够保留原始数据更多的特征信息,分群效果更好。通过对比不同参数组合情况下的分群效果,发现荧光信号的 W 参数在本组淋巴细胞的分群中是无关参数,去除 W 参数能够对分群结果进行进一步优化,这可为今后处理多参数流式细胞数据时提供参考。此外,由于基于 KPCA 的方法获得的分群结果易受到核函数中参数选择的影响,在下一步的工作中可进一步对核函数的优化选择进行研究,提高 KPCA 对流式细胞数据特征的提取能力,进一步改善分群效果、提高分群效率。
Funding Statement
教育部长江学者和创新团队发展计划资助项目(IRT1212);国家重大科学仪器设备开发专项基金资助项目(2011YQ030134) ;北京市市属高等学校创新团队建设提升计划资助项目(IDHT20130518)
References
- 1.RobinsonJ P, RoedererM Flow cytometry strikes Gold. Science. 2015;350(6262):739–740. doi: 10.1126/science.aad6770. [DOI] [PubMed] [Google Scholar]
- 2.BrieD, KlotzR, MironS Joint analysis of flow cytometry data and fluorescence spectra as a non-negative array factorization problem. Chemometrics and Intelligent Laboratory Systems. 2014;137(23):21–32. [Google Scholar]
- 3.张文昌, 祝连庆, 娄小平 基于灰色预测恢复算法的流式细胞仪多参数提取. 仪器仪表学报. 2015;36(7):1660–1665. [Google Scholar]
- 4.KrutzikP O, IrishJ M, NolanG P Analysis of protein phosphorylation and cellular signaling events by flow cytometry: techniques and clinical applications. Clin Immunol. 2004;110(3):206–221. doi: 10.1016/j.clim.2003.11.009. [DOI] [PubMed] [Google Scholar]
- 5.王先文, 陈锋, 程智 基于偏斜t混合模型的流式数据自动聚类方法研究. 电子学报. 2014;12(12):2527–2535. [Google Scholar]
- 6.王先文. 基于偏斜 t 混合模型的流式数据细胞类群自动识别算法研究. 北京: 中国人民解放军军事医学科学院, 2015.
- 7.BashashatiA, BrinkmanR R A survey of flow cytometry data analysis methods. Advance in Bioinformatics. 2009:584603. doi: 10.1155/2009/584603. [DOI] [PMC free article] [PubMed] [Google Scholar]
- 8.AghaeepourN, FinakG, HoosH Critical assessment of automated flow cytometry data analysis techniques. Nat Methods. 2013;10(3):228–238. doi: 10.1038/nmeth.2365. [DOI] [PMC free article] [PubMed] [Google Scholar]
- 9.WilkinsM F, HardyS A, BoddyL Comparison of five clustering algorithms to classify phytoplankton from flow cytometry data. Cytometry. 2001;44(3):210–217. doi: 10.1002/1097-0320(20010701)44:3<210::aid-cyto1113>3.0.co;2-y. [DOI] [PubMed] [Google Scholar]
- 10.ChanC, FengFeng, OttingerJ Statistical mixture modeling for cell subtype identification in flow cytometry. Cytometry A. 2008;73(8):693–701. doi: 10.1002/cyto.a.20583. [DOI] [PMC free article] [PubMed] [Google Scholar]
- 11.ZengQ T, PrattJ P, PakJ Feature-guided clustering of multi-dimensional flow cytometry datasets. J Biomed Inform. 2007;40(3):325–331. doi: 10.1016/j.jbi.2006.06.005. [DOI] [PubMed] [Google Scholar]
- 12.ZareH, ShooshtariP, GuptaA Data reduction for spectral clustering to analyze high throughput flow cytometry data. BMC Bioinformatics. 2010;11(1):1–16. doi: 10.1186/1471-2105-11-403. [DOI] [PMC free article] [PubMed] [Google Scholar]
- 13.SugarI P, SealfonS C Misty mountain clustering:application to fast unsupervised flow cytometry gating. BMC Bioinformatics. 2010;11(3):2277–2289. doi: 10.1186/1471-2105-11-502. [DOI] [PMC free article] [PubMed] [Google Scholar]
- 14.GeYongchao, SealfonS C flowPeaks: a fast unsupervised clustering for flow cytometry data via k-means and density peak finding. Bioinformatics. 2012;28(15):2052–2058. doi: 10.1093/bioinformatics/bts300. [DOI] [PMC free article] [PubMed] [Google Scholar]
- 15.GrégoriG, PatsekinV, RajwaB Hyperspectral cytometry at the single-cell level using a 32-channel photodetector. Cytometry A. 2012;81(1):35–44. doi: 10.1002/cyto.a.21120. [DOI] [PubMed] [Google Scholar]
- 16.CostaE S, PedreiraC E, BarrenaS Automated pattern-guided principal component analysis versus expert-based immunophenotypic classification of hematological malignancies:a step forward in the standardization of clinical immunophenotyping. Leukemia. 2010;24:1927–1933. doi: 10.1038/leu.2010.160. [DOI] [PMC free article] [PubMed] [Google Scholar]
- 17.PedreiraC E, CostaE S, LecrevisseQ Overview of clinical flow cytometry data analysis: recent advances and future challenges. Trends Biotechnol. 2013;31(7):415–425. doi: 10.1016/j.tibtech.2013.04.008. [DOI] [PubMed] [Google Scholar]
- 18.唐勇波 改进特征样本方法的KPCA变压器故障检测模型. 计算机工程与应用. 2014;50(21):4–7. [Google Scholar]
- 19.刘嵩 结合DCT与KPCA的人脸识别. 计算机工程与应用. 2012;48(27):186–188, 205. [Google Scholar]
- 20.周鹏, 李向新, 张翼 基于主成分分析和支持向量机的睡眠分期研究. 生物医学工程学杂志. 2013;30(6):1176–1179. [PubMed] [Google Scholar]
- 21.AbdiH, WilliamsL J Principal component analysis. Wiley Interdisciplinary Review Computational Statics. 2010;2(4):433–459. [Google Scholar]
- 22.徐佳琳, 左国坤 基于互信息与主成分分析的运动想象脑电特征选择算法. 生物医学工程学杂志. 2016;33(2):201–207. [PubMed] [Google Scholar]
- 23.杜卓明, 屠宏, 耿国华 KPCA方法过程研究与应用. 计算机工程与应用. 2010;46(7):8–10. [Google Scholar]
- 24.HartiganJ A, WongM A A K-means clustering algorithm. Appl Stat. 2013;28(1):100–108. [Google Scholar]






