Skip to main content
Journal of Southern Medical University logoLink to Journal of Southern Medical University
. 2026 Feb 20;46(2):353–361. [Article in Chinese] doi: 10.12122/j.issn.1673-4254.2026.02.13

饮茶对胃肠道疾病风险的双重作用:基于可解释机器学习与大语言模型的联合预测辅助模型

Dual role of tea consumption in gastrointestinal disease risks: analysis using a risk prediction model integrating interpretable machine learning and large language model

CHEN Junyao 1,2,4, CHEN Zeyu 2,3,4, LIN Zhaojie 1, FANG Menghao 1, SHEN Chaoying 3, XU Qi 4, ZHANG Xiaoyi 5, LU Lu 1,
PMCID: PMC12867652  PMID: 41633692

Abstract

Objective

To explore the correlation of tea consumption with risks of gastrointestinal diseases using a risk prediction model integrating interpretable machine learning and a large language model.

Methods

A survey was conducted among the patients undergoing both gastroscopy and 13C-urea breath testing at Gastrointestinal Endoscopy Center of Anxi Hospital of Traditional Chinese Medicine. Univariate analysis was performed to determine the suitability of feature selection. The collected data were randomly divided into training and testing sets in a 7:3 ratio. Support Vector Machine (SVM), K-Nearest Neighbors (KNN), Logistic Regression (LR), Random Forest (RF), Extreme Gradient Boosting (XGB), and Deep Neural Network (DNN) were applied to identify the best classifier for predicting high-risk gastrointestinal conditions. Bayesian optimization algorithm was used to obtain the optimal hyperparameter combinations for the 6 models. After Model fitting, the interpretability of the best models was analyzed using SHapley Additive exPlanations (SHAP). The DeepSeek-R1 base language model was fine-tuned with gastrointestinal disease dataset and Chinese medical online consultation data to obtain the final model.

Results

The study included 503 participants. All the selected features showed association with gastrointestinal diseases, but only age exhibited a significant linear correlation (β=0.023, SE=0.008, t=2.942, P=0.003). DNN model performed the best with a good accuracy (0.68), precision (0.68), recall rate (0.85), F1 Score (0.75), and AUC (0.74). The top 3 important features were age, DOB value, and smoking history. The large language model constructed provided recommendations consistent with those of professional physicians based on gastroscopy results.

Conclusion

DNN model is effective for predicting gastrointestinal disease risk and offers reliable support for clinical risk assessment and decision-making regarding endoscopy. Smoking cessation, moderate alcohol consumption, and reasonable tea intake may help prevent gastrointestinal diseases.

Keywords: gastrointestinal diseases, helicobacter pylori, machine learning, risk prediction, large language model


幽门螺杆菌(H. p)是一种定植于胃黏膜的微需氧螺旋杆菌,被世界卫生组织列为Ⅰ类致癌原1。全球约一半人口感染该菌,发展中国家感染率超过70%2H. p是慢性胃炎、消化性溃疡、胃癌等胃肠疾病的关键致病因子3。近年来,除遗传、卫生条件等传统因素外,吸烟、饮酒、饮茶等行为习惯对其感染与治疗的影响受到广泛关注4,这些行为习惯不仅影响感染风险,还与胃肠疾病发生密切相关56。目前,13C尿素呼气试验作为检测H. p的金标准已广泛应用,但胃肠疾病的诊断仍多依赖侵入式胃镜检查,检查过程复杂、体验较差,导致部分患者拒绝接受7,也加重了医疗负担。因此,亟需基于行为数据构建便捷、准确的风险预测模型,为临床筛查提供辅助。

胃肠疾病的发生机制复杂,涉及多种变量的非线性与交互作用,传统统计方法在处理此类复杂关系时能力有限8。近年来,机器学习与深度学习技术因其强大的非线性建模与自动特征提取能力,在疾病风险预测中表现出巨大潜力。特别是大语言模型在胃肠病学中的应用已初见成效,研究显示其可为胃肠道疾病提供高质量问答与健康指导9-11。本文基于DeepSeek模型12,融合饮食、作息、用药等行为信息,探索为患者生成个性化建议的智能方法,以支持H. p感染的早期干预与管理。

本研究提出一种融合多源数据、机器学习与大语言模型的胃肠道疾病预测与知识推荐系统,主要包括融合人口与行为数据进行特征构建、基于多模型对比与超参数优化实现风险预测、并且结合大语言模型生成个性化、可操作的健康建议,提升临床应用价值。

1. 资料和方法

1.1. 研究对象

选取2025年3~5月在安溪县中医院消化内镜中心同时进行胃镜检查与13C尿素呼气试验的患者进行非干预性调查研究。纳入标准:年龄≥18岁;首次进行13C尿素呼气试验;可以理解问卷内容并完成;检查前抗生素、铋剂以及具有抗菌作用的中药停药4周以上,抑酸剂(如PPI等)停药2周以上,粘膜保护剂类药物(如铝碳酸镁等)停药1周以上。排除标准:孕妇、处于哺乳期和妊娠期的女性;患有精神疾病或有精神疾病病史;患有非消化系统严重疾病;对尿素胶囊过敏。本研究已通过安溪县中医院伦理委员会审批(伦理批号:AZY-2025-J02-002),所有患者知情同意。

1.2. 方法

1.2.1. 检测方法

胃镜检查:所有胃镜检查均由具有10年以上临床经验医师进行,患者在检查前保持禁食8 h,禁饮2 h。使用胃镜(奥林巴斯CV290)对患者食管、胃部和十二指肠初段进行检查,检查结束后医生出具检测报告,内容包括胃镜所见与诊断结果。

13C尿素呼气试验:患者在检测前保持空腹或禁食2 h以上,收集患者正常情况和饮用含13C试剂30 min后呼出气体,获得2次呼出气体中 13CO2的变量化DOB值。最终检测结果DOB值≥4.0%则判定为H. p感染阳性,反之为阴性。所用设备与试剂均购自北京华亘安邦科技有限公司。

1.2.2. 基础信息与问卷调查

患者脱敏基础信息,包括年龄、性别由医院病历系统直接导出。其余信息通过调查问卷进行收集。其中,对于是否饮酒、抽烟和喝茶的定义为:平均进行次数≥1次/周。参照likert五点评分量表设计调查问卷13,烟龄与茶龄分为<3年、3~4年、5~6年、7~9年和10年及以上5个级别;饮茶频率分为每日多次(7次/周以上)、1次/d(每周7次)、4~6次/周、2~3次/周和1次/周,共5个级别。

1.2.3. 特征提取编码与预处理

对于胃镜检查报告进行整理归纳,提取慢性胃炎、消化性溃疡、胃食管反流病、胃肠道出血、消化道癌症几类常见且对患者影响严重的胃肠疾病,当存在其中一种疾病则认为存在疾病。对所有分类数据进行特征值转化,疾病方面,患胃肠道疾病=1,未患有胃肠道疾病=0;H. p感染结果方面,阳性=1,阴性=0;是否饮酒、抽烟和喝茶生活习惯方面,有该习惯=1,无该习惯=0;对于烟龄、茶龄与茶频,采用最小值进行特征值转化(表1)。13C尿素呼气试验DOB值以百分比数值结果保留,如DOB=4.0%,保留为DOB=4.0。最终获得“性别、年龄、是否抽烟、烟龄、是否饮酒、是否饮茶、饮茶时间、饮茶频率、是否患有疾病、DOB值、H. p是否感染”共11个特征。

表1.

部分数据预处理特征赋值

Tab.1 Assignment of a part of data preprocessing features

Features Assignment
Duration of smoking <3 years=1,3-5 years=3,5-7 years=5,7-10 years=7,>10 years=10
Duration of tea drinking <3 years=1,3-5 years=3,5-7 years=5,7-10 years=7,>10 years=10
Frequency of tea drinking Once a week=1,2-3 times a week=2,4-6 times a week=6,Once a day=7,Several times a day =10

缺失值处理:由于各变量缺失率较低,数据整体完整性较高,因此采用行删除法,完全剔除包含缺失值的样本记录,以保证数据质量。类别不平衡处理:结局变量的类别分布相对均衡,胃肠道高风险病症比例为58.0%,因此未进行过采样或欠采样等重采样操作。

1.2.4. 统计学方法

采用MATLAB软件进行统计处理。采用Spearman相关分析检验各变量间相关性,保留P<0.05的显著相关性连接,利用R 4.5.0软件中igraph包绘制相关性连接可视化图,连接的边的定义为edge=1-|r|,使得连接图中连节点距离越近相关性越强,其中r为两变量间的相关系数。利用单因素方差分析,探究各变量间的线性关系,以P<0.05为差异有统计学意义。以是否患有疾病为因变量,将其他因素作为自变量,进行多因素Logistic回归分析,探究各变量与最终结果之间的线性关系,以P<0.05为差异有统计学意义。

1.2.5. 模型构建与调优

将数据集按7∶3的比例随机划分为训练集和测试集。模型构建在训练集上完成,模型性能评估则在测试集上进行。本研究采用6种机器学习算法:支持向量机(SVM)、K近邻(KNN)、逻辑回归(LR)、随机森林(RF)、极限梯度提升(XGB)以及深度神经网络(DNN),旨在筛选最优的胃肠道高风险病症预测模型。运用贝叶斯优化(BO)算法为上述6种模型确定最优的超参数组合。

1.2.6. 模型的验证与评价

采用五折交叉验证评估模型的预测性能,以控制过拟合风险。模型性能的评价指标包括:准确率、精确率、召回率、F1分数、布里尔评分以及受试者工作特征(ROC)曲线下面积(AUC)。

1.3. 智能化肠胃问诊大模型

为向患者提供更加高效、经济的治疗方案,本研究面向特定疾病场景进行定向微调,构建了更契合临床实际需求的大语言模型。本研究选用 DeepSeek-R1-Distill-Qwen-7B(DeepSeek 7B)作为基础语言模型。该模型具备强大的中文语言理解与生成能力,特别适用于医疗场景下的中文问答与健康建议生成。考虑到本研究面向肠胃疾病的诊疗辅助任务,进一步采用参数高效微调策略,通过 Low-Rank Adaptation (LoRA) 技术,在保持原始模型参数不变的前提下,注入少量新增参数,实现了对任务的快速、低成本、稳定适配。最终胃肠疾病早期风险预测和辅助问诊大模型整体架构构建(图1)。

图1.

图1

胃肠疾病早期风险预测和辅助问诊大模型整体架构

Fig.1 Overall architecture of large model for early risk prediction and assisted questioning of gastrointestinal diseases.

1.3.1. 数据集构建

本项目训练所用数据集由以下两部分组成:

自建胃病数据集:人工整理肠胃科问诊记录、医疗文献与问答平台,涵盖典型肠胃疾病症状、诊断、治疗、饮食建议、作息调整等内容,经过医疗背景人员审核,确保准确性与专业性(表2)。

表2.

自建胃病数据集

Tab.2 Self-constructed gastric disease dataset

Disease name Gastroscopy findings Common symptoms Medical recommendations
Gastric antral ulcer (Stage A2) The gastric antral ulcer shows a thinner coating, with reduced hyperemia and edema in the surrounding mucosa, and clearer margins compared to stage A1. Postprandial abdominal pain has somewhat subsided,but symptoms of indigestion persist. Diet and schedule remain the same as in Stage A1; Continue medication therapy, with dosage adjustments as needed; Surgery is generally not required, but the condition should be closely monitored.
Gastric antral ulcer (Stage H1) The gastric antral ulcer has shrunk and become shallower, with a thin coating. Inflammation of the surrounding mucosa has subsided, and regenerative epithelium is present. Postprandial abdominal pain is significantly reduced, and symptoms of indigestion are improved. Dietary intake may be appropriately diversified; maintain regular schedule; continue medication as prescribed, with adjustments based on condition; surgery is generally not required.
Gastric antral ulcer (Stage S1) The gastric antral ulcer has healed, leaving a red scar. No obvious symptoms, with occasional dull pain in the upper abdomen. Maintain a regular diet and eating schedule; adhere to a consistent sleep routine; medication may be discontinued for observation, with periodic endoscopic follow-ups; surgery is generally not required.

中文医疗在线问诊数据集:中文医疗在线问诊数据集ChatMed_Consult_Dataset的50w+在线问诊作为训练集,内容包括饮食营养、合理用药、术前术后指导等,构成模型医学常识与通识的支撑。所有数据以问答对格式统一,并进行了清洗、去重、脱敏与格式标准化处理(表3)。

表3.

公开卫生健康指导数据集

Tab.3 Open health guidance dataset

Query Response
My husband has always had a weak stomach and is prone to diarrhea. Lately, he experiences stomach pain within half an hour of eating dinner every night, followed by loose stools. I'd like to ask whether he should get checked at the hospital or if it's okay to just buy some medicine for him to take. Hello, based on the symptoms you described, your husband may be experiencing gastrointestinal issues. We recommend first observing the duration and severity of the symptoms. If they persist for an extended period or become severe, it is advisable to seek medical attention promptly for relevant examinations to rule out serious conditions. If symptoms are mild, you may try self-care measures such as avoiding spicy or irritating foods, drinking plenty of water, and increasing intake of fruits and vegetables. You may also purchase over-the-counter antacids or anti-inflammatory medications from a pharmacy, but always follow the instructions carefully. If symptoms persist or worsen, please seek medical attention promptly.
When I wake up in the morning, I have to cough for a while. Lately, there's been blood in the phlegm I cough up! Hello, this situation requires prompt medical attention. Coughing up blood-tinged sputum may indicate conditions affecting the respiratory or digestive tracts. It is advisable to seek medical evaluation as soon as possible to determine the cause and receive timely treatment. While awaiting medical care, ensure adequate rest, avoid smoking and exposure to pollutants, maintain clean indoor air, drink plenty of water, and adhere to a healthy diet.

1.3.2. 诊断标准引入机制

为提升模型在诊断与建议环节的医学规范性与可控性,模型在每次响应用户前均会自动调用并引用2个结构化知识文件。《肠胃疾病.txt》:包含常见肠胃疾病(如胃溃疡、慢性胃炎等)的定义、症状特征、建议治疗方案。

《功能性肠胃疾病罗马III诊断标准.txt》:依据国际公认的功能性胃肠疾病诊断标准(Rome III),提供判断是否符合“功能性”疾病的临床准。

调用方式采用前置注入机制,即在用户输入内容前,将上述知识文件内容按摘要或重点格式附加进 prompt,实现模型调用显式医学知识进行推理。两文件内容均为字数较少的短文本,因此采用全部引用方式。

1.3.3. 微调训练过程

本研究基于DeepSeek 7B语言模型,采用参数高效的 LoRA方法进行监督微调,以提升模型在胃肠疾病场景下的问答能力。微调使用LLaMA-Factory工具链完成,训练数据包括3个自建胃病问答数据集及一个公开健康指导数据集,统一转换为指令–回复格式,总量约为6万条。LoRA 通过插入可训练的低秩矩阵A和B,在冻结原始模型参数的前提下实现高效微调;训练中设定秩为6,缩放因子为12,目标模块为全参数层,并使用AdamW优化器配合Cosine学习率调度策略(初始学习率为5e-5)以提升训练稳定性与收敛效果。

训练在NVIDIA A10上执行,单卡batch size为2,通过梯度累积实现等效batch size为16,同时启用bfloat16混合精度训练降低资源消耗,并结合FlashAttention提升自注意力计算效率。整个训练周期设为1个epoch,旨在构建一个具备饮食、作息、用药及手术建议生成能力的胃病问答模型。

2. 结果

2.1. 基本情况

本研究共发放调查问卷541份,回收问卷502份,有效回收率为92.8%。纳入的502例患者中,男性249例,女性253例;年龄50.1±14.0岁;患有胃肠道疾病291例(58.0%)。共收集特征变量11个。

2.2. 标量分析

2.2.1. 变量间相关性分析与网络可视化

相关性分析发现疾病指标拥有极高的节点度,所提取特征与疾病指标都存在直接或间接相关性。同时抽烟、饮茶、饮酒3种生活习惯与是否H. p感染并不直接相关(图2)。

图2.

图2

相关性连接结果图

Fig.2 Result of correlation connection. D-S: Duration of smoking; D-T: Duration of tea drinking; F-T: Frequency of tea drinking.Blue edge: Negative correlation; Red edge: Positive correlation.

2.2.2. 单因素方差分析与多因素Logistic回归分析

除去年龄与DOB值两连续变量特征,以剩余每一个分类特征,共9个特征为因变量,其他剩余10特征为自变量,进行单因素方差分析,获得一个9×11的p值矩阵(图3)。

图3.

图3

单因素方差分析结果图

Fig.3 Result of one-way ANOVA.

以疾病为因变量的情况下,大多数特征如抽烟(P<0.001)、饮茶(P=0.038)等差异都具有统计学意义,证明各类特征在是否患有消化道疾病上具有一定的可分性,可用以后续机器学习方法预测。在以H. p是否感染为因变量的情况下,各类生活习惯特征差异都无统计学意义,与皮尔逊相关系数分析结果相符。

以是否患有疾病为因变量,将其他因素作为自变量,进行多因素Logistic回归分析,发现仅有年龄具有显著性差异(β=0.023,SE=0.008,t=2.942,P=0.003),各类特征与最终预测疾病指标不存在显著线性关系,综合皮尔逊相关性分析与单因素方差分析,其可能为非线性关系,有待进一步分析。

2.3. 机器学习预测与评估

2.3.1. 模型的预测

以“性别、年龄、是否抽烟、烟龄、是否饮酒、是否饮茶、饮茶时间、饮茶频率、检查结果、DOB” 10个特征作为特征变量,“是否存在胃肠道高风险病症”作为结局变量用于模型构建。使用SVM、KNN、LR、RF、XGB、DNN共6种机器学习方法对训练集数据进行模型构建。检查结果特征与DOB值特征高度重合,DOB值在各模型中贡献均大于检查结果,故剔除检查结果特征,保留其余9个特征。在6种机器学习模型中,DNN模型具有最好的区分度,准确率为0.68、精确性为0.68、召回率为0.85、F1值为0.75、AUC为0.74,因此选择该模型为最佳预测模型(表4图4)。

表4.

机器学习模型预测性能比较

Tab.4 Comparison of machine learning model prediction performance

Model Accuracy Precision Recall F1 Score Brier Score AUC
SVM 0.67±0.046 0.68±0.058 0.80±0.081 0.74±0.047 0.23±0.011 0.68±0.048
KNN 0.60±0.046 0.64±0.030 0.69±0.083 0.66±0.053 0.25±0.020 0.66±0.041
LR 0.69±0.039 0.68±0.036 0.85±0.061 0.76±0.037 0.21±0.017 0.74±0.063
RF 0.58±0.033 0.61±0.036 0.73±0.037 0.66±0.027 0.25±0.012 0.63±0.030
XGB 0.58±0.030 0.63±0.016 0.68±0.077 0.65±0.044 0.24±0.016 0.63±0.039
DNN 0.68±0.047 0.68±0.038 0.85±0.087 0.75±0.052 0.21±0.016 0.74±0.053
图4.

图4

6种机器学习ROC曲线图

Fig.4 Receiver-operating characteristic curves of the 6 machine learning models.

2.3.2. 模型的可解释性分析

使用Shapley加法解释(SHAP)方法对最佳预测模型进行可解释性分析。SHAP特征重要性矩阵图可以反映每个特征变量对于模型预测结果的贡献程度,9个特征变量重要性从高到低依次是:年龄、DOB、烟龄、饮茶时间、饮茶频率、性别、是否抽烟、是否饮茶、是否饮酒(图5)。Shapley加法解释图显示,DOB、年龄和是否饮酒与结局变量之间呈现非单调关系,通过与其他变量的交互效应影响结局,如年龄与结局变量之间的关系可能在不同的生活习惯下有所不同。饮茶频率与结局变量存在负相关关系。烟龄、饮茶时间、性别、是否抽烟、是否饮茶与结局变量存在正相关关系(图6)。

图5.

图5

SHAP特征重要性矩阵图

Fig.5 SHAP feature importance matrix.

图6.

图6

Shapley 加法解释图

Fig. 6 Shapley addition interpretation diagram.

2.4. 大模型的问答结果

大模型微调训练共进行15 h,在完成微调后,对模型在肠胃疾病问答任务上的表现进行评估。结果表明,微调后的 DeepSeek 7B 模型能够较为准确地理解患者输入的症状信息,并生成具有医学指导意义的建议,包括饮食调控、作息安排、用药推荐及手术干预判断等方面,展现出较强的泛化能力和实用价值。

为验证模型实际效果,我们设计了包括标准化问答测试集和开放式用户模拟问询集在内的评估机制。在标准化测试中,模型在回答准确性、专业性和上下文理解能力方面均优于未经微调的基线模型,尤其在复杂症状组合的处理上表现更加稳健。经过本研究方案微调后的大型语言模型在给出诊疗建议方面,与实际专业医师根据胃镜检查结果所提供的建议大体一致(图7)。

图7.

图7

问答模型输出结果与专业医生建议对比图

Fig.7 Comparison of Q&A model output results with professional doctor's recommendations.

3. 讨论

本研究通过多种统计分析方法揭示了变量之间的内在联系及其在疾病预测中的潜力。Spearman相关性分析与网络可视化显示,疾病变量在网络中具有显著中心性,表明其与多个特征存在直接或间接的显著关联,体现出所选特征在建模中的潜在价值。然而,在多因素Logistic回归中,仅有年龄表现出显著性,反映出该方法在处理复杂或非线性关系时的局限。相比之下,单因素方差分析进一步验证了多数特征在区分健康与患病人群中的区分能力,说明这些变量在预测中具有参考意义。以H. p感染为因变量时,各类生活方式特征未表现出显著性差异,提示其传播机制可能更依赖生物因素而非行为因素。研究结果表明,胃肠道疾病风险因素间存在复杂的非线性关系,采用更适应高维非线性特征结构的模型进行建模分析具有较好的结果。

随着信息化时代的到来,人工智能技术凭借其卓越的数据处理能力,为胃肠道高风险病症患者风险评估提供了新视角。本研究基于年龄、DOB、饮茶频率、是否抽烟、烟龄、饮茶时间、性别、是否饮酒、是否饮茶分别使用SVM、KNN、LR、RF、XGB、DNN等6种机器学习方法进行模型构建。对6个模型的预测性能进行比较,发现DNN模型在准确率、精确性、召回率、F1值、AUC等指标上均表现最佳。虽然本模型的AUC(0.74)低于文献中某些针对特定单一疾病的模型14-16,但考虑到其纳入的特征较为简洁,且更符合临床快速筛查的实际需求,因此具有较强的实际应用价值。

根据SHAP分析显示,是否饮茶与是否饮酒在本研究的结果中对于胃肠道疾病风险影响较小。其中饮茶方面特征被细分为饮茶时间与饮茶频率,皆与是否饮茶特征高度相关,因此是否饮茶特征SHAP值较低。与以往的研究517不同,本研究发现饮酒与胃肠道疾病风险并非完全正相关,特定的饮酒习惯对于胃肠道疾病的发生有一定的保护作用。这一差异的可能原因为:首先,本研究对“是否饮酒”定义为每周饮酒1次以上,对于饮酒的酒类品种及单次引用量均不做限制。相关研究表明,特定的发酵酒类(如红酒、米酒)含有机酸(如琥珀酸),可以增强促消化效果,同时少量酒精可通过诱导前列腺素合成,强化胃黏膜屏障,提高对刺激的耐受性1819。值得注意的是,本研究所在地区(安溪县)的饮酒文化以红曲酒(红粬酒)为主。该酒以红曲和糯米为主要原料发酵而成,其特定的成分构成(可能包含上述有益物质)很可能是本研究中观察到饮酒习惯产生保护作用的重要背景因素,有待进一步实验分析验证。

在具有较高SHAP值的特征中,总体来看,DOB、年龄与胃肠道风险之间并不呈现简单的单调关系,而是通过与其他变量的交互效应影响结局,如DOB与结局变量之间的关系可能在不同的生活习惯下有所不同。但关注个体时,较大的DOB值和年龄仍会有较高的胃肠道疾病风险;在性别上,男性患有胃肠疾病的风险要比女性较高;在生活习惯上,抽烟的人群患有胃肠疾病的风险更大,且烟龄越长,患有胃肠道疾病的风险越大;有趣的是,在饮茶方面,饮茶频率与饮茶时间对于胃肠疾病有着截然不同的影响,更高的饮茶频率可以降低胃肠疾病发生的风险,而更长的饮茶时间则会使得胃肠道疾病风险上升。

本研究中,DOB值与年龄为胃肠疾病感染风险的最主要因素,当DOB值较高,即H. p感染浓度更高时,患胃肠道疾病风险更高,与以往研究结果相符13,较低的DOB值也会大大降低胃肠道疾病的风险,因此H. p的根治是十分必要的。而老年人生理功能衰退、免疫功能下降等原因,年龄越大,胃肠病发病率越高,特别是50岁以上的中老年人更为多见,年龄每增长10岁,其发病率平均递增约14%20。总体的非单调关系表明生活习惯对于胃肠道疾病预防的重要性,良好的生活习惯可以有效降低H. p感染人群和老年人群的胃肠道疾病风险,同时也建议年轻人和非感染人群需要注意自身生活习惯。

与以往研究结果相似521,吸烟将通过各种机制显著提高患有胃肠道疾病的风险,同时烟龄越久,患有胃肠道疾病风险大幅提升。在性别上,男性的患病风险相较于女性更高,在以往的研究中也有相似的结论22。结合本研究中,抽烟与较长的茶龄会显著提升患胃肠疾病风险,而男性在抽烟人数、平均烟龄和平均茶龄均显著高于女性,因此在本研究人群中,男性有更高的胃肠道疾病感染风险,其主要原因还是男女在生活习惯上的差异。

在本研究中,饮茶两个不同维度的特征对胃肠疾病表现出了不同的影响。当饮茶频率较高时,胃肠道疾病感染风险将会减小,这可能是因为饮茶对于胃肠的保护作用需要达到一定阈值2324,同时较高频的适量饮茶可稳定提供有益成分,避免单次过量刺激,间接改善消化环境。在本研究所在地(安溪县)饮用茶类多为铁观音,属于半发酵的乌龙茶,相较于以往研究中常见的绿茶2526,更加温和,对胃部刺激较小,在养生保健方面具有良好功效27,可以较高频的饮用。但当饮茶时间较长时,胃肠道疾病风险上升,主要的可能原因为老一辈人的饮茶习惯和机体适应导致。本研究中,茶龄较长者(茶龄≥7年)共有318人,其中50岁以上196人(61.6%),而在研究所在地(安溪县)传统的饮茶文化中,多爱饮浓茶、热茶,对胃肠道刺激较大,容易损伤消化道黏膜28。同时,以往卫生健康意识较为薄弱,在茶具的消杀等方面可能存在不足,增加了消化道疾病口-口传播和感染的风险。除此之外,长期饮茶可能改变肠道菌群结构6或降低黏膜对活性成分的敏感性,导致保护作用减弱,而刺激性反应增强,进而增加胃肠道疾病风险。该结果提示模型可能捕获了行为模式的复杂交互,有待进一步分组验证模型价值,但本研究中茶龄较长但饮茶频率低与茶龄较短但饮茶频率高的样本量较低,有待后续补充样本量进行进一步分析验证。为了保持良好的胃肠道健康状况,建议戒烟少酒、合理饮茶,同时老人和H. p感染患者等高危人群需要尤其注意自己生活习惯。

本研究存在一定局限性。第一,问卷内容简单。如对于饮酒、饮茶的品类、单次饮用量都未做具体划分,存在较多未知变量,从而导致特征对于结局预测的贡献较差。第二,关键临床特征的缺失影响了模型的完整性。目前,模型仅纳入了基本的人口学和生活习惯变量(如年龄、烟酒茶史),而缺乏反映病理生理机制的相关指标(如血清生物标志物、内镜检查结果、家族遗传史)及环境暴露因素(如饮食结构、药物使用史)。这可能削弱了模型捕捉胃肠道高风险病症的深层生物学关联的能力,从而限制了其预测精度的提升空间。第三,由于本文纳入的生活习惯变量具有较强的地域性,因此仅在研究所在地(安溪县)开展了单中心研究,同时只进行了内部验证,缺乏外部独立序列的验证,这可能导致模型捕获了某些地域特性特征,降低了模型的普适性和泛化能力。在后续的研究中,将尝试修改纳入生活习惯变量,进行多地多中心研究,构建普适性更强的模型。

综上所述,本文探讨了肠道高风险疾病与H. p感染和生活习惯的相关性,并通过机器学习方法建立了风险预测模型,该预测模型表现出较好的性能,可以较好的预测肠道高风险疾病发生的风险,可为临床鉴定肠胃疾病高发人群提供科学依据,并为临床是否进行胃肠镜检查或手术提供意见指导。同时,基于此研究数据,我们进行了面向特定疾病场景的定向微调,构建了更契合临床实际需求的大语言模型,该模型具备较强的实用性与可靠性,能够在进行胃镜检查的前,为患者提供科学、合理的诊疗参考,为胃镜检查的是否必要提供可靠参考,提升医疗服务的可及性与便捷性。

基金资助

深圳市医疗卫生三名工程项目(SZSM202411032)

参考文献

  • 1. Pellicano R, Ianiro G, Fagoonee S, et al. Review: extragastric diseases and Helicobacter pylori [J]. Helicobacter, 2020, 25(Suppl 1): e12741. doi: 10.1111/hel.12741 [DOI] [PubMed] [Google Scholar]
  • 2. Bashir SK, Khan MB. Overview of Helicobacter pylori infection, prevalence, risk factors, and its prevention[J]. Adv Gut Microbiome Res, 2023, 2023: 9747027. doi: 10.1155/2023/9747027 [DOI] [Google Scholar]
  • 3. Duan YT, Xu YH, Dou Y, et al. Helicobacter pylori and gastric cancer: mechanisms and new perspectives[J]. J Hematol Oncol, 2025, 18(1): 10. doi: 10.1186/s13045-024-01654-2 [DOI] [PMC free article] [PubMed] [Google Scholar]
  • 4. Ogihara A, Kikuchi S, Hasegawa A, et al. Relationship between Helicobacter pylori infection and smoking and drinking habits[J]. J Gastroenterol Hepatol, 2000, 15(3): 271-6. doi: 10.1046/j.1440-1746.2000.02077.x [DOI] [PubMed] [Google Scholar]
  • 5. Xue F, Xue J, Zhao B, et al. The associations of tobacco, alcohol, and coffee consumption with upper and lower gastrointestinal disease risk: a mendelian randomization study[J]. Gut Liver, 2025, 19(5): 715-24. doi: 10.5009/gnl240440 [DOI] [PMC free article] [PubMed] [Google Scholar]
  • 6. 储思远, 钱利生, 陈海敏. 茶成分对肠道菌群的调控作用及其健康效应的研究进展 [J]. 天然产物研究与开发, 2024, 36(02): 357-67. [Google Scholar]
  • 7. Yu X, Deng H, Xiong Z, et al. A scale to measure the worry level in Gastrointestinal Endoscopy with sedation: Development, reliability, and validity[J]. Int J Clin Health Psychol, 2023, 23(4): 100410. doi: 10.1016/j.ijchp.2023.100410 [DOI] [PMC free article] [PubMed] [Google Scholar]
  • 8. Cox DR. The regression analysis of binary sequences[J]. J R Stat Soc Ser B Stat Methodol, 1958, 20(2): 215-32. doi: 10.1111/j.2517-6161.1958.tb00292.x [DOI] [Google Scholar]
  • 9. Omiye JA, Gui H, Rezaei SJ, et al. Large language models in medicine: the potentials and pitfalls: a narrative review[J]. Ann Intern Med, 2024, 177(2): 210-20. doi: 10.7326/m23-2772 [DOI] [PubMed] [Google Scholar]
  • 10. Alberts IL, Mercolli L, Pyka T, et al. Large language models (LLM) and ChatGPT: what will the impact on nuclear medicine be?[J]. Eur J Nucl Med Mol Imag, 2023, 50(6): 1549-52. doi: 10.1007/s00259-023-06172-w [DOI] [PMC free article] [PubMed] [Google Scholar]
  • 11. Berry P, Dhanakshirur RR, Khanna S. Utilizing large language models for gastroenterology research: a conceptual framework[J]. Therap Adv Gastroenterol, 2025, 18: 17562848251328577. doi: 10.1177/17562848251328577 [DOI] [PMC free article] [PubMed] [Google Scholar]
  • 12. Guo D, Yang D. DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning [J]. ArXiv, 2025, abs/2501.12948. [Google Scholar]
  • 13. Jebb AT, Ng V, Tay L. A review of key likert scale development advances: 1995-2019[J]. Front Psychol, 2021, 12: 637547. doi: 10.3389/fpsyg.2021.637547 [DOI] [PMC free article] [PubMed] [Google Scholar]
  • 14. 王淑玉, 杜红阳, 赵晨昊, 等. 基于深度学习和机器学习的胃癌预测模型构建及评估 [J]. 青岛大学学报(医学版), 2025, 61(01): 54-8. [Google Scholar]
  • 15. 刘界宇, 黄继华, 李泗云, 等. 机器学习预测急性上消化道出血患者干预及再出血的风险价值 [J]. 广西医科大学学报, 2024, 41(05): 748-55. [Google Scholar]
  • 16. Park B, Kim CH, Jun JK, et al. A machine learning risk prediction model for gastric cancer with SHapley additive exPlanations[J]. Cancer Res Treat, 2025, 57(3): 821-9. doi: 10.4143/crt.2024.843 [DOI] [PMC free article] [PubMed] [Google Scholar]
  • 17. Bode C, Bode JC. Alcohol’s role in gastrointestinal tract disorders[J]. Alcohol Health Res World, 1997, 21(1): 76-83. [PMC free article] [PubMed] [Google Scholar]
  • 18. Franke A, Singer MV. 59 the effect of beer and its non-alcoholic ingredients on secretory and motoric function of the stomach [M]. San Diego, Academic Press: Beer in Health and Disease Prevention, 2009: 581-6. doi: 10.1016/b978-0-12-373891-2.00059-6 [DOI] [Google Scholar]
  • 19. Feick P, Gerloff A, Singer MV. The effect of beer and its non-alcoholic constituents on the exocrine and endocrine pancreas as well as on gastrointestinal hormones[M]//Beer in Health and Disease Prevention. Amsterdam: Elsevier, 2009: 587-601. doi: 10.1016/b978-0-12-373891-2.00060-2 [DOI] [Google Scholar]
  • 20. Yang H, Zhang M, Li H, et al. Prevalence of common upper gastrointestinal diseases in Chinese adults aged 18–64 years[J]. Sci Bull, 2024, 69(24): 3889-98. doi: 10.1016/j.scib.2024.07.048 [DOI] [PubMed] [Google Scholar]
  • 21. Sapkota AR, Berger S, Vogel TM. Human pathogens abundant in the bacterial metagenome of cigarettes[J]. Environ Health Perspect, 2010, 118(3): 351-6. doi: 10.1289/ehp.0901201 [DOI] [PMC free article] [PubMed] [Google Scholar]
  • 22. Tan R, Zhao D, Zhang X, et al. Gender and age differences in the global burden of peptic ulcers: an analysis based on GBD data from 1990 to 2021[J]. Front Med: Lausanne, 2025, 12: 1586270. doi: 10.3389/fmed.2025.1586270 [DOI] [PMC free article] [PubMed] [Google Scholar]
  • 23. Martimianaki G, Alicandro G, Pelucchi C, et al. Tea consumption and gastric cancer: a pooled analysis from the stomach cancer pooling (StoP) project consortium[J]. Br J Cancer, 2022, 127(4): 726-34. doi: 10.1038/s41416-022-01856-w [DOI] [PMC free article] [PubMed] [Google Scholar]
  • 24. Bond T, Derbyshire E. Tea compounds and the gut microbiome: findings from trials and mechanistic studies[J]. Nutrients, 2019, 11(10): E2364. doi: 10.3390/nu11102364 [DOI] [PMC free article] [PubMed] [Google Scholar]
  • 25. 俞顺章, 张作风, 俞国培, 等. 饮绿茶对胃癌、慢性胃炎发病影响的流行病学调查 [J]. 中国癌症杂志, 2001, (01): 42-6. [Google Scholar]
  • 26. Boyanova L, Ilieva J, Gergova G, et al. Honey and green/black tea consumption may reduce the risk of Helicobacter pylori infection[J]. Diagn Microbiol Infect Dis, 2015, 82(1): 85-6. ancer, 2025,, 132(7): 652-9. doi: 10.1016/j.diagmicrobio.2015.03.001 [DOI] [PubMed] [Google Scholar]
  • 27. Kang H, Zhou H, Ye Y, et al. Tieguanyin oolong tea extracts alleviate behavioral abnormalities by modulating neuroinflammation in APP/PS1 mouse model of Alzheimer’s disease[J]. Foods, 2021, 11(1): 81. doi: 10.3390/foods11010081 [DOI] [PMC free article] [PubMed] [Google Scholar]
  • 28. Inoue-Choi M, Ramirez Y, O’Connell C, et al. Hot beverage intake and oesophageal cancer in the UK Biobank: prospective cohort study[J]. British J Cancer, 2025, 132(7): 652-9. doi: 10.1038/s41416-025-02953-2 [DOI] [PMC free article] [PubMed] [Google Scholar]

Articles from Journal of Southern Medical University are provided here courtesy of Editorial Department of Journal of Southern Medical University

RESOURCES