Abstract
华法林作为经典口服抗凝药物,其有效治疗窗狭窄、个体剂量需求差异显著,临床剂量调整困难,易引发出血或血栓等不良事件。为此,本研究基于国际华法林药物基因组学联盟(IWPC)数据库的真实数据,创新性地运用LASSO-proj算法进行高精度特征选择,进而构建了一个结构精简的多层感知机(MLP)模型用于华法林剂量预测。该模型在测试集上表现出色,模型决定系数(R2)高达0.456,平均绝对误差(MAE)低至8.92 mg/周,并且有48.522%的预测值落在实际稳定治疗剂量的±20%范围内。通过DeepExplainer分析,研究明确识别出VKORC1基因等关键遗传特征,以及体重、年龄和种族等非遗传变量在剂量预测中的重要影响。综上,基于LASSO-proj算法的可解释MLP模型,不仅保持了较高的准确性,同时显著提升了模型的可解释性。
Keywords: 华法林, 剂量预测, 深度学习, 人工智能
Abstract
Warfarin, a classic oral anticoagulant, is characterized by a narrow therapeutic window and considerable interindividual variability in dosing requirements. This makes precise dose adjustment challenging in clinical practice and increases the risk of bleeding or thrombosis. To improve dose prediction, this study developed a streamlined multilayer perceptron (MLP) model using real-world data from the International Warfarin Pharmacogenomics Consortium (IWPC) database. The LASSO-proj algorithm was applied for high-precision feature selection prior to model construction. The resulting model demonstrated strong predictive performance on the test set, achieving a coefficient of determination (R2) of 0.456, a mean absolute error (MAE) of 8.92 mg/week, and 48.522% of its predictions falling within ±20% of the actual stable therapeutic dose. Through SHAP-based interpretation using DeepExplainer, key features influencing warfarin dosing were identified, including the VKORC1 genotype, body weight, age, and ethnicity. The interpretable MLP framework incorporating LASSO-proj not only maintains high predictive accuracy, but also significantly enhances model transparency, providing a valuable tool for guiding warfarin therapy.
Keywords: Warfarin, Dose prediction, Deep learning, Artificial intelligence
0. 引言
华法林作为经典抗凝药物,通过抑制维生素K依赖的凝血因子,降低血栓形成和卒中的风险[1]。然而,华法林的治疗窗狭窄,且受患者的年龄、体重、饮食习惯、酒精摄入、药物相互作用以及遗传因素等多重变量影响[2],使精准实现个体化给药成为关键的临床挑战。传统的华法林剂量预测方法主要基于临床经验和简化的剂量计算公式[3],往往难以充分反映患者的个体差异,导致疗效不足或出血风险增加。因此,开发更高精度的华法林剂量预测方法对于提高治疗安全性与有效性具有重要意义。
近年来,人工智能和机器学习技术在医疗领域的应用日益增多,其在复杂数据分析和模式识别方面的独特优势已得到充分验证[4]。针对华法林的剂量预测,研究表明机器学习模型能够整合遗传学信息、生化指标、临床特征等多维患者数据,显著提升预测精度[5]。但是,尽管已有多个基于机器学习的模型被用于预测不同族群的稳定华法林剂量,但研究多集中于不同算法的比较,相对忽略了特征选择在其中的重要作用。特征选择不仅能提升预测准确性、降低数据冗余,更能增强模型可解释性,这对临床应用至关重要,唯有医护人员充分理解模型的决策逻辑,方能对之建立临床信任并有效用于诊疗实践的指导。
本研究构建了一个用于预测华法林剂量的神经网络模型,通过LASSO-proj算法实现高精度特征选择,并应用DeepExplainer解释特征贡献。本研究旨在开发结构精简的神经网络架构,在保证预测准确性的情况下增强模型透明度,以满足临床医生对精准和可解释的华法林剂量预测的双重需求。
1. 研究方法
1.1. 研究对象
本研究采用的数据集源自国际华法林药物基因组学联盟(International Warfarin Pharmacogenomics Consortium,IWPC)数据库[6]。该数据库汇集了由22个研究团队共同收集的6 256名长期使用华法林患者的详尽数据。数据内容涵盖了患者详细的人口统计信息、临床特征以及基因型数据。所有这些数据均通过药物基因组学知识库(Pharmacogenomics Knowledge Base,PharmGKB)的官方渠道获取。
1.2. 研究方法
1.2.1. 数据预处理
本研究采用基于Python的Warfit-learn预处理模块[7]进行数据预处理。针对IWPC数据集的缺失值问题,执行分类型填补策略。对于基因型缺失病例,严格遵循IWPC的种族和连锁不平衡公式进行填补;而对于身高、体重等连续型临床指标缺失,则构建多元线性回归模型进行预测填补(身高通过体重、种族和性别回归建模,体重通过身高、种族和性别回归建模)。异常值/无效数据过滤采用双层临床有效性过滤机制:首先排除未达到稳定目标国际标准化比值(international normalized ratio,INR)范围(2.0~3.0)的患者,其次剔除关键参数(年龄、CYP2C9/VKORC1基因型等)缺失的无效记录。
完成数据清洗后,将数据随机分为训练集、验证集和测试集,比例为6∶2∶2,并对训练数据进行标准化处理。
1.2.2. 特征选择
本研究采用LASSO-proj引导的双阶段特征选择框架以优化华法林剂量预测模型输入。首先采用LASSO算法进行特征初筛,并运用十折交叉验证确定最优正则化参数。LASSO[8]是一种结合L1正则化的回归方法,旨在最小化残差平方和及回归系数的绝对值总和,公式表示为:
![]() |
1 |
其中λ控制模型的稀疏程度,当λ增大时,更多的系数被缩减至零,从而实现特征选择。技术实现层面,本研究采用基于R语言的glmnet工具包,调用cv.glmnet函数[9]执行正则化路径计算(设置alpha = 1以启用LASSO)。通过10折交叉验证选择最小验证误差对应的
构建最终的回归模型,该过程可以自动保留具有非零系数的显著特征。
为攻克LASSO正则化导致的系数偏差问题,本研究采用LASSO-proj后选择推断框架[10]严格验证特征统计显著性。该方法通过构造投影矩阵对初筛的稀疏LASSO估计量进行分布校正。具体实施步骤如下:首先基于节点LASSO算法求解Huber协方差矩阵,消除因L1惩罚项引入的渐进偏差;接着,通过线性投影调整初始系数估计值获得无偏估计量
,公式表示为:
![]() |
2 |
随后依据标准误差计算每个系数对应的t统计量,进而得出相应的P值,为了控制假阳性率,对全体特征P值施加Benjamini-Hochberg FDR校正,最终保留校正后P < 0.05的特征。
1.2.3. 模型架构与优化方法
基于神经网络在非线性回归任务中的显著优势[11],本研究选用多层感知机(multilayer perceptron,MLP)构建华法林剂量预测模型。MLP属于全连接前馈神经网络,由输入层、一个或多个隐藏层以及输出层组成。每层内的神经元均与其后一层的所有神经元相连,连接强度由可学习的权重决定。参数优化过程通过最小化均方误差损失实现,并结合AdamW优化器[12]的解耦权重衰减机制(本质为L2正则化)有效抑制过拟合。关键超参数(学习率、衰减系数、批大小)通过Optuna框架自动调优,最终形成兼顾预测精度与泛化能力的剂量预测模型。
1.2.4. 模型评估
本研究采用平均绝对误差(mean absolute error,MAE)、均方误差(mean squared error,MSE)和决定系数(coefficient of determination,R2)作为主要评估指标[13]。此外,将预测华法林剂量处于实际稳定治疗剂量±20%范围内的患者比例(percentage of patients within 20% of predicted dose,PW20%)纳入评估体系[14],以此衡量模型的临床重要性,确保预测精度与实际应用价值。
1.2.5. 可解释性分析
为了解释MLP模型的黑盒特性,本研究采用基于博弈论Shapley值的SHAP框架[15]。DeepExplainer将SHAP理论与DeepLIFT算法结合,专门用于解释深度神经网络模型的输出[16]。能够通过递归传递DeepLIFT乘数来近似计算Shapley值,从而高效地评估复杂模型的特征重要性。
2. 研究结果
2.1. 患者一般特征
在对IWPC数据集进行预处理后,共有5741名患者被纳入分析。IWPC队列的患者人口统计和临床特征参见附件1。
2.2. 特征选择
在训练集上,本研究通过LASSO回归结合10折交叉验证对预处理特征进行精炼,初步识别出26个非零系数特征(正则化路径可见图1)。进一步采用LASSO-proj后选择推断法进行统计学验证,排除7个未达显著性阈值(校正P ≥ 0.05)的特征,最终保留19个最优特征(完整列表见表1)。通过皮尔逊相关系数矩阵热力图分析(见图2)及方差膨胀因子诊断,这些特征间既无强相关性,亦无多重共线性风险,因而可全部整合为最终预测模型的输入变量。
图 1.

LASSO feature selection
LASSO特征选择
表 1. Results of significant feature selection.
重要特征选择结果
| 特征 | P值 | 矫正P值 | 相关系数(95%置信区间) |
| Weight__kg_ | 6.04e-49 | 1.45e-47 | 0.17(0.15,0.19) |
| Amiodarone__Cordarone_ | 3.48e-13 | 6.26e-12 | –7.41(–9.38,–5.44) |
| Carbamazepine__Tegretol_ | 1.09e-10 | 1.75e-09 | 18.84(13.06,24.36) |
| Rifampin_or_Rifampicin | 1.30e-14 | 2.47e-13 | 57.87(43.03,72.11) |
| Current_Smoker | 1.04e-04 | 1.25e-03 | 3.11(1.54,4.64) |
| Race__OMB__White | 1.61e-04 | 1.77e-03 | 2.85(1.47,4.39) |
| Age_10___19 | 5.01e-03 | 4.01e-02 | 12.24(3.97,20.86) |
| Age_20___29 | 2.16e-11 | 3.68e-10 | 10.22(7.23,13.14) |
| Age_30___39 | 2.89e-26 | 6.05e-25 | 12.13(9.94,14.37) |
| Age_40___49 | 7.00e-28 | 1.54e-26 | 9.03(7.44,10.64) |
| Age_50___59 | 7.69e-23 | 1.54e-21 | 6.44(5.20,7.74) |
| Age_60___69 | 7.90e-05 | 1.11e-03 | 2.41(1.25,3.61) |
| CYP2C9_consensus__1__1 | 4.67e-33 | 1.07e-31 | 9.33(7.78,10.79) |
| CYP2C9_consensus__1__2 | 2.18e-04 | 2.18e-03 | 3.50(1.65,5.31) |
| CYP2C9_consensus__2__3 | 1.90e-05 | 2.85e-04 | –9.11(–13.19,–4.95) |
| CYP2C9_consensus__3__3 | 9.49e-05 | 1.23e-03 | –13.41(–20.18,–6.88) |
| CYP2C9_consensus_Unknown | 7.15e-04 | 6.44e-03 | 5.82(2.42,9.07) |
| Imputed_VKORC1_A_A | 8.40e-162 | 2.18e-160 | –19.39(–20.78,–18.01) |
| Imputed_VKORC1_A_G | 1.31e-81 | 3.27e-80 | –10.62(–11.70,–9.55) |
图 2.

Correlation heat map of the optimal features
最优特征的相关性热图
2.3. MLP模型构建与评估
本研究系统评估了三种特征选择策略对MLP模型预测性能的影响(见图3),包括无特征选择、LASSO回归特征选择以及LASSO-proj特征选择。结果显示,LASSO-proj策略显著提升了模型精度和临床适用性,模型MAE为8.921 mg/周,MSE降至156.087 mg2/周2,R2升至0.456,最为关键的是,PW20%达到了48.522%,优于无选择特征(MAE = 8.913 mg/周,MSE = 160.434 mg2/周2,R2 = 0.453,PW20% = 45.953%)与LASSO选择(MAE = 8.965 mg/周,MSE = 161.514 mg2/周2,R2 = 0.449,PW20% = 45.605%)。由此可见,LASSO-proj驱动的特征筛选通过排除7个噪声变量,使模型聚焦于VKORC1/CYP2C9核心基因变异和年龄等关键临床因子,不仅降低了均方误差,并将超出临床安全阈值的患者比例压缩至更低水平,为个体化抗凝治疗提供了可靠性更高的决策支持。
图 3.

Model performance comparison under different feature selection methods
不同特征选择方法下模型的损失与预测性能对比
为进一步评估模型拟合优度和预测可靠性,本研究进行了残差分析(见图4)。右侧直方图显示模型的残差基本遵从正态分布规律,佐证模型无系统性偏差。左侧散点图中残差均匀分布在零点上下,无显著趋势性模式,表明模型在治疗剂量全区间预测稳定性良好。但散点图中仍存在个别离群点,需后期溯源特殊临床场景(如罕见基因型组合),进一步提升模型鲁棒性。
图 4.
Model residual diagnostics
模型残差诊断
在训练与验证华法林剂量预测模型的过程中,我们运用DeepExplainer(见图5)深入探讨了模型的决策机制。通过分析SHAP值,我们发现VKORC1基因型对剂量预测具有主导性影响,具体而言,VKORC1_A/A、VKORC1_A/G代表高值的红点落于负值区,即具有VKORC1_A/A、VKORC1_A/G基因型的患者需要更少的华法林剂量。此外,体重、年龄、种族等非遗传因素也对剂量预测产生了重要影响,其中体重与预测剂量呈正相关,而种族、年龄则有较复杂的影响模式。在此调控机制基础上,药物相互作用同样值得注意,针对胺碘酮的效应分析显示,该药物代表高值的红点显著密集分布于负值区,驱动模型系统性降低剂量预测值,精准吻合该药物通过竞争性抑制CYP2C9酶活性而延缓华法林代谢的经典药理通路。
图 5.

SHAP feature impact plot
SHAP值特征影响分析图
3. 讨论
在精准医疗蓬勃发展的时代背景下,华法林的个体化剂量调整已然成为临床实践领域的一项关键课题。由于受到多元临床因素与遗传因子复杂交互作用的影响[17],传统给药方案面临出血、血栓风险双控失效的临床困境。本研究提出了一种融合可解释性机制的神经网络架构,通过双阶段特征筛选与SHAP决策解析,在确保预测精度的同时,为临床医师提供多维度剂量调整依据,助力复杂变量场景下的精准给药决策。
相较于传统的特征选择方法,LASSO-proj的L1正则化稀疏约束与后选择统计推断机制能够高效识别出对响应变量影响最为显著的特征[18],不仅提升了模型的准确性,也增强了决策路径的可追溯性。通过这一方法,我们成功剔除7个非显著噪声特征,仅保留19个关键变量,在特征维度压缩81.3%的背景下反而提升了预测效能(PW20%达48.522%),并赋予关键生物标志物贡献度可视化的能力,使剂量调整决策具备药理机制可追溯性。值得关注的是,模型的鲁棒性同样突出,尤其在面对数据质量波动和异常值频繁出现的情况下,它依然能稳定输出可靠的预测结果,为真实世界数据质量波动下的稳定应用奠定基础。与以往基于IWPC数据集的华法林剂量预测研究相比(见表2[19-21]),本研究融合了经典MLP与LASSO-proj的现代特征选择方法,在临床预测效能上实现显著突破。模型PW20%达48.522%,较Liu等[19]最优算法MARS提升3.3个百分点,较Wang等[20]的Gated Attention Pooling模型提升6.5个百分点;临床风险控制方面,MAE降至8.921 mg/周,较IWPC标准方程(11.34 mg/周)降低21.3%,使超窗患者出血风险显著降低。
表 2. Comparison of algorithms.
算法比较
| 文献 | 模型 | MAE/(mg/周) | PW20% | R 2 |
| [21] | DNN | — | 36.4% | — |
| [20] | XGBoost | 8.979 | — | 0.420 |
| LightGBM | 9.495 | — | 0.327 | |
| CatBoost | 8.773 | — | 0.427 | |
| Fully Connected Layer | 8.742 | — | 0.405 | |
| Mean Pooling | 8.626 | — | 0.418 | |
| Att. Pooling | 8.639 | — | 0.426 | |
| Gated Att. Pooling | 8.580 | — | 0.424 | |
| Max Pooling | 8.471 | 0.437 | ||
| [19] | SVR | 8.96 | 45.88% | — |
| ANN | 9.82 | 41.27% | — | |
| RT | 9.57 | 43.04% | — | |
| MLR | 9.28 | 43.97% | — | |
| RFR | 9.05 | 45.34% | — | |
| BRT | 8.95 | 45.57% | — | |
| MARS | 8.84 | 46.95% | — | |
| LAR | 9.28 | 43.95% | — | |
| BART | 8.87 | 46.03% | — |
4. 结论
总而言之,利用LASSO-proj技术开发的神经网络框架在华法林剂量预测上取得了重大进展。本模型不仅预测精度高,还能有效辨识影响华法林用量的各种因素。随着研究的不断深化,该模型有望成为指导临床决策的强大工具,赋能临床医师制定基因导向的精细化给药方案,通过规避剂量不足或过量风险,最终实现出血/血栓事件率降低及患者生存质量提升的精准医疗目标。
重要声明
利益冲突声明:本文全体作者均声明不存在利益冲突。
作者贡献声明:本研究的设计与方法论构建由钟晨露、朱业和顾翔共同完成。模型开发与验证由钟晨露和朱业承担。结果分析与论文撰写由钟晨露负责。全体作者均参与了论文的审阅与修改。
本文附件见本刊网站的电子版本(biomedeng.cn)。
Funding Statement
国家自然科学基金青年科学基金(81800250);中国博士后科学基金第71批次面上资助二等(2022M711417);江苏省中医药科技发展计划项目(MS2023137);徐州医科大学附属医院发展基金项目(XYFY202401);江苏省苏北人民医院临床研究专项项目(SBLC23002)
References
- 1.Hart R G, Pearce L A, Aguilar M I Meta-analysis: antithrombotic therapy to prevent stroke in patients who have nonvalvular atrial fibrillation. Ann Intern Med. 2007;146(12):857–867. doi: 10.7326/0003-4819-146-12-200706190-00007. [DOI] [PubMed] [Google Scholar]
- 2.Turen S, Turen S Determination of factors affecting time in therapeutic range in patients on warfarin therapy. Biol Res Nurs. 2023;25(1):170–178. doi: 10.1177/10998004221127977. [DOI] [PubMed] [Google Scholar]
- 3.张进华, 刘茂柏, 蔡铭智, 等 模型引导的华法林精准用药: 中国专家共识(2022版) 中国临床药理学与治疗学. 2022;27(11):1201–1212. [Google Scholar]
- 4.Tan O, Wu J Z, Yeo K K, et al Building a predictive model for warfarin dosing via machine learning. Eur Heart J. 2020;41(Suppl 2):ehaa946.3491. [Google Scholar]
- 5.Tao Y, Chen Y J, Fu X, et al Evolutionary ensemble learning algorithm to modeling of warfarin dose prediction for Chinese. IEEE J Biomed Health Inform. 2019;23(1):395–406. doi: 10.1109/JBHI.2018.2812165. [DOI] [PubMed] [Google Scholar]
- 6.International Warfarin Pharmacogenetics Consortium; Klein T E, Altman R B, et al Estimation of the warfarin dose with clinical and pharmacogenetic data. N Engl J Med. 2009;360(8):753–764. doi: 10.1056/NEJMoa0809329. [DOI] [PMC free article] [PubMed] [Google Scholar]
- 7.Truda G, Marais P Evaluating warfarin dosing models on multiple datasets with a novel software framework and evolutionary optimisation. J Biomed Inform. 2021;113:103634. doi: 10.1016/j.jbi.2020.103634. [DOI] [PubMed] [Google Scholar]
- 8.Tibshirani R Regression shrinkage and selection via the lasso. J R Stat Soc Ser B. 1996;58(1):267–288. doi: 10.1111/j.2517-6161.1996.tb02080.x. [DOI] [Google Scholar]
- 9.Friedman J, Hastie T, Tibshirani R Regularization paths for generalized linear models via coordinate descent. J Stat Softw. 2010;33(1):1–22. [PMC free article] [PubMed] [Google Scholar]
- 10.Meinshausen N, Bühlmann P Stability selection. J R Stat Soc Ser B. 2010;72(4):417–473. doi: 10.1111/j.1467-9868.2010.00740.x. [DOI] [Google Scholar]
- 11.LeCun Y, Bengio Y, Hinton G Deep learning. Nature. 2015;521(7553):436–444. doi: 10.1038/nature14539. [DOI] [PubMed] [Google Scholar]
- 12.Tivnan M, Gang G J, Wang W, et al Tunable neural networks for CT image formation. J Med Imaging (Bellingham) 2023;10(3):033501. doi: 10.1117/1.JMI.10.3.033501. [DOI] [PMC free article] [PubMed] [Google Scholar]
- 13.Chicco D, Jurman G The advantages of the Matthews correlation coefficient (MCC) over F1 score and accuracy in binary classification evaluation. BMC Genomics. 2020;21(1):6. doi: 10.1186/s12864-019-6413-7. [DOI] [PMC free article] [PubMed] [Google Scholar]
- 14.Yan M, Liu H, Xu Q, et al Development and validation of a prediction model for in-hospital death in patients with heart failure and atrial fibrillation. BMC Cardiovasc Disord. 2023;23(1):505. doi: 10.1186/s12872-023-03521-3. [DOI] [PMC free article] [PubMed] [Google Scholar]
- 15.Lundberg S M, Lee S I. A unified approach to interpreting model predictions// Advances in Neural Information Processing Systems 30. Long Beach: Curran Associates, 2017: 4765-4774.
- 16.Abusitta A, Li M Q, Fung B C M Survey on explainable AI: techniques, challenges and open issues. Expert Syst Appl. 2024;255(C):124710. [Google Scholar]
- 17.Jonas D E, McLeod H L Genetic and clinical factors relating to warfarin dosing. Trends Pharmacol Sci. 2009;30(7):375–386. doi: 10.1016/j.tips.2009.05.001. [DOI] [PubMed] [Google Scholar]
- 18.Zou H, Hastie T Regularization and variable selection via the elastic net. J R Stat Soc Ser B. 2005;67(2):301–320. doi: 10.1111/j.1467-9868.2005.00503.x. [DOI] [Google Scholar]
- 19.Liu R, Li X, Zhang W, et al Comparison of nine statistical model based warfarin pharmacogenetic dosing algorithms using the racially diverse International Warfarin Pharmacogenetic Consortium cohort database. PLoS One. 2015;10(8):e0135784. doi: 10.1371/journal.pone.0135784. [DOI] [PMC free article] [PubMed] [Google Scholar]
- 20.Wang Z, Poon J, Yang J, et al. Warfarin dose estimation on high-dimensional and incomplete data// Proceedings of the 54th Hawaii International Conference on System Sciences. Maui: University of Hawaii, 2021: 3455-3463.
- 21.Jahmunah V, Chen S, Oh S L, et al Automated warfarin dose prediction for Asian, American, and Caucasian populations using a deep neural network. Comput Biol Med. 2023;153:106548. doi: 10.1016/j.compbiomed.2023.106548. [DOI] [PubMed] [Google Scholar]



