消化

提前16年就能“算”出会得克罗恩病?9种血浆蛋白+AI,破解肠道炎症的“隐形信号”

作者:医学论坛网 来源:医学论坛网 日期:2026-02-27
导读

         在消化内科临床实践中,克罗恩病(CD)始终是令人棘手的难题——这种慢性炎症性肠病以病因不明、症状隐匿、病程迁延为特征,全球发病率已攀升至每10万人29.3例,尤其青睐青壮年群体,严重影响患者的职业发展与生活质量。更令人困扰的是,其临床前期缺乏典型症状,多数患者确诊时病情已进展至中重度,错失了最佳干预时机。而当前,尚无可靠的早期识别工具能精准预判该病的发生。

关键字:  克罗恩病 

        在消化内科临床实践中,克罗恩病(CD)始终是令人棘手的难题——这种慢性炎症性肠病以病因不明、症状隐匿、病程迁延为特征,全球发病率已攀升至每10万人29.3例,尤其青睐青壮年群体,严重影响患者的职业发展与生活质量。更令人困扰的是,其临床前期缺乏典型症状,多数患者确诊时病情已进展至中重度,错失了最佳干预时机。而当前,尚无可靠的早期识别工具能精准预判该病的发生。

        临床困局:

        克罗恩病的诊疗痛点

        克罗恩病作为炎症性肠病的主要类型之一,其病变可累及消化道全层,临床表现涵盖腹痛、腹泻、肠梗阻等多种症状,且病情易反复,目前尚无根治方案。临床诊疗的核心痛点集中在两个关键环节:一是早期诊断困难,疾病前期的肠道免疫紊乱、菌群失衡等病理变化难以通过常规检查察觉,导致诊断延迟数月甚至数年;二是缺乏有效的风险分层工具,无法精准识别高危人群并实施针对性预防。

        传统的预测模型多依赖临床风险因素(如年龄、BMI、吸烟史等)、血清学指标或肠道微生物组分析,但这些方法存在明显局限。此前的美国PREDICTS研究虽发现51种蛋白质生物标志物可预测5年内克罗恩病风险,但受限于样本量小、随访时间短(仅5年)及人群单一(以男性军人为主),难以推广应用;而基于血液生化指标的预测模型在发病前9年的AUC值仅为0.503,实用价值有限。这些现状迫切需要更精准、更具前瞻性的预测技术突破。

        重大突破:

        9种血浆蛋白构建16年长效预警体系

        ▌万人队列验证:蛋白质组学的“精准捕捉”

        由广东医科大学附属医院等机构联合开展的研究,依托英国生物银行(UKB)的52,896名受试者数据,进行了长达13.6年的中位随访(最长随访时间16.6年),最终确诊139例新发克罗恩病患者。研究团队对2736种血浆蛋白进行系统筛选,通过Cox比例风险回归模型校正年龄、性别、生活方式等多重混杂因素后,发现44种蛋白与克罗恩病发病风险显著相关,其中35种关联在多因素模型中依然稳定。

        进一步通过特征重要性排序与SHAP值分析,研究团队锁定了9种核心生物标志物,分别是CD274、CHI3L1、REG1B、ITGAV、PRSS8、ITGA11、GDF15、DEFA1_DEFA1B和IL6。这些蛋白在免疫炎症反应、细胞因子受体相互作用、TNF信号通路等生物学过程中扮演关键角色,例如CD274编码的PD-L1蛋白是维持黏膜耐受的重要免疫检查点,其表达异常已被证实与炎症性肠病的发病机制密切相关;而CHI3L1作为炎症与组织重塑的关键分子,在克罗恩病患者肠道黏膜中呈高表达,与疾病活动度密切相关。

        值得关注的是,GDF15和IL6表现出最强的关联强度,其中GDF15的风险比(HR)高达2.16(P=8.86×10-9),提示这些蛋白可能是克罗恩病发生发展的核心调控因子。

        ▌AI赋能:预测模型的多维度验证与性能突破

        研究团队采用四种机器学习算法(LGBM、XGBoost、随机森林、Extra Trees)构建预测模型,其中XGBoost算法表现最优。在地理分布独立的UK生物银行验证队列(13,262人)中,9种蛋白模型的AUC值达0.76;在EPIC-Norfolk外部验证队列(2944人)中AUC值为0.73;而在华南地区横断面队列(74人)中,该模型区分克罗恩病患者与健康对照的AUC值更是高达0.79,展现出良好的泛化能力。

        更令人振奋的是,当将这9种蛋白与临床风险因素(人口学特征、血清学指标、多基因风险评分)相结合后,模型的预测性能进一步提升,AUC值达到0.78,且在发病前16年仍能保持稳定的预测效力。风险分层分析显示,被模型判定为高风险的人群,其克罗恩病发病风险是低风险人群的4.23倍(P=3.26×10-5),这一结果为临床筛选高危人群提供了明确的量化标准。

        与此前的PREDICTS研究相比,该模型在预测长期风险方面优势显著,当将PREDICTS研究的51种蛋白标志物应用于相同人群时,其AUC值仅为0.68,远低于本研究的0.76,充分证明了9种核心蛋白模型的优越性。

        技术互补:

        深度学习解码肠道微生物组的预测价值

        如果说血浆蛋白模型是从全身炎症反应角度构建预警体系,那么基于肠道微生物组的深度学习模型则从疾病发源地,肠道微生态入手,提供了另一种精准预测路径。发表于Computational Biology and Chemistry的研究指出,肠道菌群失衡是克罗恩病发病的关键诱因,而16S rRNA基因序列作为肠道微生物组的“指纹”,蕴含着丰富的疾病预测信息。

        ▌数据增强:破解样本不平衡的技术瓶颈

        克罗恩病样本收集困难导致的数据不平衡问题,一直是制约预测模型性能的关键因素。研究团队创新性地提出“随机噪声单热编码”数据增强方法,在传统单热编码基础上加入最大绝对值为0.2的随机噪声,既保留了原始基因序列的核心信息,又有效扩充了样本量,同时避免了传统编码中参数更新缓慢的问题,显著提升了模型的训练效率与稳定性。

        ▌深度特征提取:SCAN-SVM模型的精准分类

        研究构建的序列卷积注意力网络(SCAN)结合支持向量机(SVM)的深度学习框架,展现出强大的特征提取与分类能力。SCAN通过三层卷积子网络与注意力模块,从16S rRNA基因的时间序列数据中提取深层特征,有效降低了特征维度复杂度;随后引入自适应加法间隔损失函数,将特征映射到球面空间,扩大不同类别特征间的边界距离,进一步提升了特征区分度。

        在Gevers等人的数据集(含1359个样本的V4高变区测序数据)上,该模型表现优异:经过5折交叉验证,分类准确率达到0.80,Kappa值为0.76,显著优于逻辑回归、随机森林、高斯朴素贝叶斯等传统机器学习方法。ROC曲线分析显示,SCAN模块的加入使模型AUC值从0.57提升至0.72,证实了序列卷积注意力机制在提取基因序列时序特征中的独特优势。

        结语

        克罗恩病的诊疗正迎来从“被动应对”到“主动预警”的转变。血浆蛋白AI模型实现了发病前16年的超长周期预警,肠道微生物组深度学习模型则提供了精准的病因层面预测,两种技术路径相互补充,构建起多维度、多层次的克罗恩病预测体系。这些研究不仅破解了克罗恩病早期诊断的临床困局,更推动了炎症性肠病诊疗模式的革新。现部分高风险人群的“无病生存”。

        参考文献

        [1]TIAN H, TANG R.Prediction of Crohn's disease based on deep feature recognition[J]. Comput Biol Chem,2024;113:108231.DOI:10.1016/j.compbiolchem.2024.108231.

        [2]FENG J, CHEN S, LI Q,et al. Plasma proteomic profiles identify biomarkers predicting Crohn's disease up to 16 years before onset[J]. Nat Commun,2025;16(1):11481.DOI:10.1038/s41467-025-66483-4.

        “医学论坛网”发布医学领域研究成果和解读,供专业人员科研参考,不作为诊疗标准,使用需根据具体情况评估。

分享:

相关文章

评论

我要跟帖
发表
回复 小鸭梨
发表

copyright©医学论坛网 版权所有,未经许可不得复制、转载或镜像

京ICP证120392号  京公网安备110105007198  京ICP备10215607号-1  (京)网药械信息备字(2022)第00160号
//站内统计 //百度统计 //谷歌统计 //站长统计
*我要反馈: 姓    名: 邮    箱: